Bulletin Vert n°503
mars — avril 2013
Raisonnez probabilités sans vous faire piéger !
par Pierre Spagnou
Ellipses, novembre 2012
208 p. en 16,5 × 24, prix : 17,58 €, ISBN 978-2-7298-75657
Longtemps laissée à l’écart à cause de son utilisation de probabilités subjectives, la statistique Bayésienne centrée sur la détermination de probabilités des causes à partir de probabilités a priori ou conditionnelles, reprend le devant de la scène avec le développement de la capacité et de la rapidité des ordinateurs et donc de leur efficacité pour traiter des quantités gigantesques de données afin d’en déduire des diagnostics ou des jugements fiables. Des travaux de recherche récents lui sont consacrés.
Cet ouvrage est centré sur la construction et l’utilisation des réseaux bayésiens, graphes orientés sans cycles dont les arcs représentent une dépendance de cause à effet et les nœuds des événements dont on évalue ou fixe la probabilité en utilisant la formule de Bayes.
Les six chapitres du livre sont consacrés à des exemples tirés de l’actualité et empruntés à des domaines variés :
- Deux simples devinettes pour ébranler nos certitudes : test du sida, test ADN et culpabilité d’un assassin.
- Faisons connaissance avec les réseaux bayésiens : l’arrosage du jardin.
- La cigogne et le cerceau : effet cigogne (corrélation mais pas causalité entre le nombre de cigognes et le nombre de bébés dans une même ville), effet cerceau (préjugé et conviction).
- Voyage-découverte en terrain miné : comparaison de la dangerosité du deltaplane et de l’équitation, coïncidences des dates d’anniversaire dans une même famille, crash d’avion, échec scolaire et délinquance, pornographie et viols, piratages sur la toile, filiation non reconnue, mort subite du nourrisson, caissière féministe, marche sur la lune ou canular ?
- Rendons justice aux probabilités : erreurs de l’accusation, de la défense, de l’Inquisition, de la preuve supplémentaire, du meurtre de la femme battue, de l’observation du jury d’assises, de la preuve ADN, de l’affaire d’Outreau ; comment pourrait-on rationaliser les pratiques judiciaires ? Denis Poisson se posait déjà la question il y a 200 ans.
- Raisonnons sur la vie dans l’univers : l’erreur des absolus, le principe anthropique, le calendrier cosmique, mauvais temps pour les probabilités, l’hypothèse « Terre rare », les ovnis, le paradoxe de Fermi, le rasoir d’Occam, l’équation de Drake.
L’annexe A, beaucoup plus philosophique, est consacrée aux « Intelligences machiniques », à ne pas confondre avec l’intelligence artificielle (que Woody Allen définit comme le contraire de la bêtise humaine) : test de Turing, Théorème de Gödel, dualisme esprit-corps, dualisme raison-émotions, origine de la conscience : émoi et moi.
L’annexe B apporte quelques compléments sur les défauts logiciels, l’identification ami/ennemi, le diagnostic médical de la démence vasculaire et de la maladie d’Alzheimer. Elle compare ensuite le réseau bayésien au système à base de règles (si A, alors B) et au réseau de neurones : le réseau bayésien permet l’apprentissage en présence de données incomplètes, utilise une approche mixte (données + expertise), intègre des données d’origine diverses et se montre donc beaucoup plus flexible ; toutefois l’introduction de probabilités subjectives soulève encore des difficultés.
Un index des principales idées fausses traitées dans ce livre rappelle, en les résumant avec humour, une vingtaine d’erreurs et d’effets indésirables rencontrés au fil de la lecture.
Une Petite bibliographie improbable, donne une vingtaine de titres classiques qui permettent de comparer les points de vue sur des questions tant philosophiques que scientifiques que posent un diagnostic ou une décision.
Destiné à un large public, ce livre agréable à lire et très riche par la variété et l’opportunité des exemples met justement en garde face aux erreurs et aux pièges d’une utilisation simpliste des techniques statistiques. Il rendra de grands services à l’enseignant de mathématiques pour présenter l’inférence bayésienne sur des situations simples et des exemples élémentaires, variés et paradoxaux.
Il pourra être le point de départ de travaux interdisciplinaires avec des collègues philosophes, historiens ou biologistes.
Le statisticien précisera sans peine quand c’est parfois nécessaire la distinction entre événement, variable aléatoire et probabilité et pourra consulter des ouvrages plus spécialisés pour y trouver une description mathématique précise des réseaux bayésiens et de la modélisation des processus de décision.