Bulletin Vert n°469
mars — avril 2007
Statistiques, méfiez-vous
par Nicolas Gauvrit
Éd. Ellipses
nouvelle brochure en co-diffusion APMEP sous le numéro 977, ISBN : 978-2-7298-3070-0
204 pages en 16,5 × 24. Très claire présentation. Bonne « bibliographie légère », de
cinq titres, commentée. Pas d’index, mais table des matières assez détaillée.
Sept chapitres :
- Pourcentages et moyennes (28 pages).
- Indices (26 pages).
- Représentations graphiques (40 pages).
- Causalité, corrélation (38 pages).
- Statistique inférentielle et sondages (22 pages).
- Statistiques multivariées (22 pages).
- Quelques exemples récapitulatifs (12 pages).
De lecture plus qu’agréable et roboratif à souhait, ce livre multiplie les mises en garde contre les pièges ou les utilisations frauduleuses des statistiques.
Nous connaissons les plus classiques, par exemple :
- les illusions relatives aux moyennes,- les tromperies sur les cumuls de pourcentages, celles avec des graphiques « mal » référencés, des corrélations illusoires,
- les exploitations de la sensibilité, aux valeurs extrêmes, des droites de régression ;
- les comparaisons, de fait mensongères, donnant à voir des aires ou des volumes alors qu’elles devraient montrer des longueurs (d’où un remplacement caché d’un facteur k par les multiplicateurs k2 ou k3),
- le paradoxe de Simpson : situations où, de deux intervenants A et B sur deux sous-ensembles, A est majoritaire dans leur réunion alors qu’il est minoritaire dans chacun (la première fois où ce paradoxe m’est apparu je n’en croyais pas mes yeux !),
- les marges des sondages et des estimations,
Mais ce livre les démonte excellemment, à partir d’exemples pertinents et aguichants. Il ne se limite ensuite pas à ces « classiques » et propose bien d’autres sujets de réflexion, par exemple :
- « diagrammes insensés » avec deux exemples, l’un issu de la revue de la MGEN et l’autre de la police nationale (les graphiques paraissent très clairs, très probants, alors qu’ils « ne signifient rien » !).
- « heuristiques de lecture » manipulatrices par nos interprétations automatiques pavloviennes de diagrammes « en ajoutant nous-mêmes des éléments qui ne se trouvent pas sur la représentation brute », ajouts et compléments « presque inconscients » et « résistants à la logique ». Suivent deux exemples sur l’espérance de vie et sur une prétendue supériorité du libéralisme.
- démystification de corrélations surprenantes, des « variables de confusion ». Parmi les exemples, celui d’une épreuve de dictée dans toute une école primaire : l’évaluation montre une corrélation entre les nombres d’erreurs par élèves et leurs pointures des pieds !
- de deux variables réellement corrélées, où est le « sens de la causalité » ? De quoi s’interroger avec un bel exemple sur taux de chômage et croissance.
- « régression vers la moyenne », qui justifierait que « plus une note est mauvaise, plus il est probable que la prochaine sera meilleure ».
- paradoxes d’affirmations contraires toutes deux « vraies », ainsi à propos de l’effet des responsabilités sur la satisfaction au travail.
- « puissance observée » (« probabilité d’avoir raison en supposant qu’on a raison »), inférence bayésienne (« qui permet de définir la probabilité pour que telle conclusion soit juste »), statistiques multivariées.
Ce livre n’est pas le premier à démystifier « les statistiques », i.e. leur usage !
Mais il me semble, avec des exemples attrayants, particulièrement complet. Les situations traitées sont puisées dans des affirmations récentes des sciences humaines, sociales ou politiques. On y trouve même des échos de la course de ce printemps à la Présidence de notre République, avec un choix de l’auteur très manifeste… (Sans doute, le souci d’une parution rapide du livre a-t-il laissé subsister d’évitables erreurs d’orthographe ou d’accords !).
Voici les « Quelques exemples récapitulatifs » du dernier chapitre :
- La délinquance et Sarkozy.
- Le carton est-il cancérigène ? (Texte qui vaut son pesant d’or, i.e. de désintoxication !)
- Les bus bondés.
Ils donnent bien le ton de l’ouvrage. Je n’ai qu’un regret : ne pas être capable de bien vous en faire percevoir l’intérêt, la richesse, le dynamisme et … une communicative éclatante santé.
Qui n’oublie pas les classiques citations, toujours si amusantes, sur les statistiques.
Ainsi : « Leur raison d’être, c’est de vous donner raison » ou « … Fêter ses propres anniversaires est bon pour la santé. Les statistiques montrent que les personnes qui en fêtent le plus deviennent les plus vieilles ».
À votre santé !