Accueil > 02 - Livre Deux : SCIENCES > Questions de sciences > Mille et un pourcents de mensonges statistiques

Mille et un pourcents de mensonges statistiques

lundi 10 avril 2017, par Robert Paris

« Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques. »

Mark Twain

« Il y a trois sortes de mensonges : le mensonge ordinaire, le parjure et les statistiques. »

Le Premier ministre britannique (sous la Reine Victoria) Benjamin Disraeli

« Je ne crois aux statistiques que lorsque je les ai moi-même falsifiées. « 

Winston Churchill

« Faites attention, la statistique est toujours la troisième forme du mensonge. »

Le Nouvel Observateur - 16 Juin 1980 - Jacques Chirac

« Les faits sont têtus. Il est plus facile de s’arranger avec les statistiques ».

Mark Twain

Mille et un pourcents de mensonges statistiques

On connaît tous des exemples absurdes utilisant les statistiques, ou prétendant le faire en raisonnant de travers, et dans lesquels on « démontre », chiffres soi-disant à l’appui, que les ouvriers gagnent plus et moins que les cadres, que les agriculteurs consomment davantage de pommes de terre que l’ensemble des Français, mais en consomment moins que les autres en moyenne et autre balivernes.

Il y a plusieurs type d’erreurs, des mauvaises manières de poser les problèmes ou de manipuler les moyennes aux inversions d’interactions et aux corrélations prises pour des réactions de cause à effet.

On se souvient de l’exemple connu :

« Il est prouvé que fêter les anniversaires est bon pour la santé. Les statistiques montrent que les personnes qui en fêtent le plus deviennent les plus vieilles »
.
Den Hartog

Dans statistiques, "Stat" signifie Etat.

Il s’agit donc au départ de chiffres de l’Etat...

C’est dire que cela prétend être sérieux mais que ce n’est nullement fiable car la neutralité de l’Etat est un mythe.

Disraeli, le premier ministre britannique du XIXe siècle, avait déclaré : "il y a trois sortes de mensonges : les petits mensonges, les gros mensonges et les statistiques !" Statistiques, enquêtes, sondages, moyennes, indices... sont diffusés à longueur de colonnes dans les journaux écrits et télévisés. Ces travaux sont souvent, mais pas toujours, scientifiquement rigoureux. Les médias s’en font l’écho sous des formes très discutables : les illustrations graphiques relèvent parfois de la pure fantaisie. L’usage de la statistique devient abusif. Le grand public reste perplexe et en conclut : "on fait dire ce que l’on veut aux chiffres".

La statistique est d’un point de vue théorique une science, une méthode et une technique.

Les statistiques sont le produit des analyses reposant sur l’usage de la statistique.

La statistique comprend :

* la collecte des données ;

* le traitement des données collectées, aussi appelé la statistique descriptive ;

* l’interprétation des données, aussi appelée l’inférence statistique, qui s’appuie sur la théorie des sondages et la statistique mathématique.

* la présentation afin de rendre les données compréhensibles par tous

Ce domaine des mathématiques ne doit pas être confondu avec une statistique qui est un nombre calculé à partir d’observations. Pour un article (plus technique) sur une statistique consultez l’article statistique.

Cette distinction ne consiste pas à définir plusieurs domaines étanches. En effet, le traitement et l’interprétation des données ne peuvent se faire que lorsque celles-ci ont été collectées. La statistique a des règles et des méthodes sur la collecte des données, pour que celles-ci puissent être correctement interprétées.

John Tukey disait qu’il y a deux approches en statistiques, entre lesquelles on jongle constamment : les statistiques exploratoires et les statistiques confirmatoires (exploratory and confirmatory statistics) :

* on explore d’abord les données pour avoir une idée qualitative de leurs propriétés ;

* puis on fait des hypothèses de comportement que l’on confirme ou infirme en recourant à d’autres techniques statistiques

Quelques erreurs proviennent d’erreur de compréhension dans les calculs de proportion et de pourcentage sont à la source de multiples erreurs de raisonnement statistique.

Par exemple, la plupart des gens, y compris des statisticiens, sont persuadés à tort :

qu’une quantité, qui augmente de 80% puis diminue de 80%, n’aurait en fait pas changé ! C’est totalement faux : il a diminué de 64% !!!

 qu’une quantité, qui augmente de 80% puis encore de 80%, aurait finalement augmenté de 80%. C’est totalement faux : il a augmenté de 224% !

qu’une quantité qui augmente dix fois de suite de 80% aura finalement augmenté de 800%. C’est totalement faux : il a augmenté de 35700% !!!!

Ces erreurs de pourcentage proviennent du fait qu’on additionne des pourcentages qui ne sont pas des parties de la même quantité ou d’une quantité qui elle-même varie.

Il y a d’autres types d’erreurs statistiques, liés à l’a priori du continu. On suppose qu’une évolution, démographique par exemple, va continuer de manière linéaire. Du coup, on prévoit que la population du globe va croitre exponentiellement et c’est faux…

Ainsi, les démographes des années 70 ont raisonné sur les chiffres mondiaux de 60-70 qui donnaient une croissance démographique mondiale de 2% et ils ont supposé que cela resterait à 2%... En 2006, le taux d’accroissement démographique de la population mondiale serait de 1,14% annuellement.

Une des utilisations des mensonges statistiques sur la démographie a été la "réforme des retraites". Le gouvernement affirme que « la véritable cause du déséquilibre de nos régimes de retraites est la démographie ». C’est doublement faux. Le Conseil d’orientation des retraites a indiqué dans son rapport d’avril 2010 que la principale raison de l’aggravation des déficits sociaux était la crise financière : en 2006, donc avant la crise, le déficit de l’ensemble du système de retraite était de 2,2 milliards d’euros ; en 2008, il atteignait 10,9 milliards et il devrait être de 32,2 milliards en 2010.

D’autre part, l’allongement de l’espérance de vie ne devient une catastrophe que si on refuse de mettre en débat la richesse produite, sa nature, son évolution et la manière dont elle est répartie.

En climatologie, on va également fonder des analyses sur des statistiques de température, alors que cette dernière n’est pas une cause mais un effet. Les prévisions actuelles des experts fondées sur ces moyennes et ces statistiques ont une marge d’erreur de 300% : la dernière fourchette en date proposée par le GIEC pour l’augmentation de la température au XXIe siècle se situe entre 1,4 et 5,8 °C, soit 300% d’incertitude...

La première erreur classique en statistiques consiste à souligner une corrélation qui ne comprend aucun lien de causalité entre les deux faits. Ou encore une corrélation qui est absurde d’un point de vue logique.
Exemple du premier cas : des gens d’un quartier mangent plus de frites que ceux d’un autre. Ils prennent aussi moins de médicaments contre l’obésité. Conclusion statistique fausse : les frites protègent contre l’obésité. Il a des chances que le premier quartier soit plus pauvre et qu’il consomme moins de médicaments de toutes sortes, y compris ceux qui n’ont rien à voir avec l’obésité. Les apparences statistiques sont trompeuses.

Exemple du deuxième cas : les élèves de premier cycle réussissent moins bien en moyenne que les élèves de deuxième cycle. Solution : faire passer directement les élèves en deuxième cycle ! Bien entendu, les élèves ont été sélectionnés entre les deux cycles et donc les meilleurs restent...

Il en va de même dans les statistiques de réussite des établissements scolaires : le premier établissement a meilleur réputation. On vérifie l’année suivante : il réussit mieux. Nécessairement ! Son recrutement est meilleur puisqu’il est bien classé. Donc il recrute les bons élèves !

Parmi les grandes escroqueries statistiques, l’inflation en Argentine est entrée dans les annales. L’inflation devient galopante en 2006, conséquence d’une politique monétaire particulièrement expansionniste. Or, l’indice des prix sert d’étalon pour revaloriser les pensions retraites ou les salaires.

Pour la contrôler, le gouvernement subventionne alors certains produits et encadre l’évolution des prix d’autres. Mais rien n’y fait, l’inflation flirte avec les 12% courant 2006. C’est alors que la solution est trouvée : la prise de contrôle de de l’INDEC, (c’est l’équivalent de l’INSEE), licenciement des personnes en charge du calcul et de la publication de l’inflation et modification de son calcul. On commence à comprendre. Le taux d’inflation repart à la baisse pour passer très vite sous les 10%.

Mais cela exaspère la population et les économistes indépendants... qui publient leur propre indice. Et là pas de miracle : l’inflation double. La réplique ne tarde pas : en février 2011, les économistes ou institutions publiant leurs propres estimations de l’inflation sont menacés de sanctions financières, voire de peines de prison. Il fallait oser. L’histoire prend fin quand le FMI menace à son tour l’Argentine d’exclusion de l’institution, une première. Un nouvel indice des prix est calculé, étrangement plus proche de l’officieux que de l’officiel.

Wikileaks avait révélé il y a quelques années un propos de Li Keqiang, l’actuel Premier ministre, selon qui les chiffres du PIB chinois étaient entièrement faits « à la main ». On veut croire que les méthodes ont évolué depuis, mais il reste qu’un chiffre-clé pour l’analyse de l’économie mondiale est entaché de sérieux doutes sur sa qualité. Deuxième exemple, l’Argentine. En 2011, le gouvernement de Cristina Kirchner avait mis à l’amende pour l’équivalent de 100.000 dollars des organismes privés publiant des chiffres d’inflation deux à trois fois supérieurs aux chiffres officiels. Troisième exemple, la Grèce. Des années durant, ce pays a trafiqué ses comptes publics. C’est d’ailleurs ainsi qu’il a pu se qualifier à l’euro. On sait trop aujourd’hui ce que ce mensonge a coûté, aux Grecs et à leurs créanciers.

A agir ainsi, on risque de jeter le discrédit sur toute la statistique. La blogosphère économique relaie de nombreuses théories complotistes. Aux Etats-Unis existe un site prétendant révéler les manipulations des données gouvernementales (shadowstats.com). Le « vrai » taux de chômage serait à 23% et non 5,4%. C’est dix ou vingt fois par jour que le blog financier ZeroHedge (zerohedge.com) pointe les prétendues manipulations des statisticiens.

Il y en a effectivement mille et un… mensonges

Mensonges et statistiques

Pièges et erreurs statistiques

Messages

  • pourquoi un site révolutionnaire se préoccuperait de statistiques ? parfois le parti pris universaliste de ce site m’étonne !

  • Ce n’est pas aussi étonnant qu’il y paraît. Sais-tu, cher lecteur critique, que Karl Marx est l’un des premiers à avoir expliqué que l’économie et la sociologie avaient un grand besoin de cette nouvelle science des statistiques (nouvelle à son époque). C’est au milieu du XIXe siècle que le statisticien belge Adolphe Quételet a proposé les statistiques comme mode d’étude des évolutions sociales et humaines dans un ouvrage de 1835 intitulé « Sur l’homme et sur le développement de ses facultés », où il suggérait que les statistiques pouvaient s’appliquer utilement à la criminalité. Remarquons qu’il y déclarait : « La société prépare le crime et les coupables ne sont que les instruments de son exécution. » !!! Il comparait également ce qu’il appelait la « physique sociale » à la thermodynamique. C’est en 1842 que Karl Marx découvrait cet ouvrage et adoptait immédiatement le point de vue statistique. En 1869, dans une lettre à Ludwig Kugelmann, Marx écrivait : « Quételet a rendu d’éminents services en démontrant que même les incidents apparemment aléatoires de la vie sociale possèdent une nécessité interne de par leur récurrence périodique et leur incidence moyenne… En revanche, Quételet n’a jamais été en mesure d’interpréter cette nécessité. Il n’a pas progressé sr ce point, se contentant de développer le matériel qui lui permettait d’améliorer ses observations et calculs. » Dans « Le Capital », Karl Marx faisait explicitement référence à Quételet et à l’emploi de la méthode statistique.

  • comment peuvent-ils utiliser la statistique pour faire passer des mensonges pour des vérités ?

  • La première méthode consiste à poser des questions orientées.

    Par exemple, un statisticien cite ce genre de résultats :

     à la question « les différences de revenus sont nécessaires au pays », il y a 62% de réponses défavorables.

     à la question « les inégalités ne bénéficient qu’aux riches et aux puissants », il y a 80% de réponses favorables.

     à la question « les inégalités sont nécessaires à la communauté », il y a 57% de personnes défavorables.

     à la question « les inégalités sont inévitables », il y a 43% de réponses défavorables.

    Pourtant, on pourrait croire que ce sont à peu près les mêmes résultats que l’on devrait trouver, celles des gens défavorables aux inégalités mais les résultats aux questions posées différemment varient de 43% à 80% !

  • Un autre exemple de faux raisonnement consiste à souligner une corrélation qui ne correspond pas à un véritable lien de causalité.

    Par exemple, on effectue la statistique comparée des personnes ayant une grande pointure de chaussures et celle des personnes condamnées pour faits graves et on remarque que les personnes ayant une très grande pointure de chaussures correspondent à un pourcentage plus important de délinquants ou de criminels. C’est une corrélation mais pas un lien causal. Par exemple, cela provient du fait que les femmes ont des pieds plus petits et qu’il y a moins de femmes que d’hommes parmi les personnes arrêtées pour délits ou crimes. La véritable relation causale n’est donc pas révélée par la statistique.

  • Les Européens ont toujours su manger trop et être gros mais ils n’avaient pas un grand nombre d’obèse car l’obésité est un signe de détraquement du métabolisme et pas de grosse bouffe…

    C’est les USA qui ont démarré la vague d’obésité dans le monde occidental car ils ont les premiers développé la nourriture industrielle.

    La malbouffe industrielle capitaliste contient des produits qui cassent le métabolisme et provoquent des grossissements très particuliers, même pour ceux qui ne mangent pas trop en quantité mais trop mal en qualité.

  • « Il est prouvé que fêter les anniversaires est bon pour la santé. Les statistiques montrent que les personnes qui en fêtent le plus deviennent les plus vieilles » . Den Hartog

    J’adore !
    Quel humour génial !
    Merci.

Un message, un commentaire ?

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par les responsables.

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.