Bulletin Vert n°513
mars — avril 2015
Méthodes robustes en statistique
par Jean-Jacques Droesbeke, Gilbert Saporta et Christine Thomas-Agnan
Éditions TECHNIP, janvier 2015
210 p. en 16 × 24, prix : 35 €, ISBN : 978-2-7108-1149-7
Suivant une tradition remontant à 1984, cet ouvrage collectif rassemble dix contributions aux journées organisées en 2012 par la Société Française de Statistique pour la quinzième fois, avec comme objectif d’explorer un domaine particulier de la statistique et de publier un ouvrage destiné non seulement aux participants de ces journées mais aussi à la communauté des utilisateurs et des enseignants intéressés par le thème retenu.
En statistique, descriptive ou inférentielle, une méthode est robuste si elle reste valide pour de petites déviations du modèle. S’il en est ainsi, on peut décrire et synthétiser le comportement de la majorité des observations et détecter celles qui sont aberrantes.
Les dix chapitres déclinent cette entrée pour l’ensemble des méthodes statistiques :
- 1. La médiane et ses petits frères
une croissance difficile malgré leur robustesse
Jean- Jacques Droesbeke, Gilbert Saporta et Christine Thomas-Agnan - 2. Mesures de robustesse
Christophe Croux, Catherine Dehon et Anne -Ruiz-Gazen - 3. Analyse multivariée
Christophe Croux et Gentiane Haesbroeck - 4. Analyse en composantes principales robuste
application à la problématique des classements d’universités : Catherine Dehon -* 5. Classification robuste
Christel Ruwet et Gentiane Haesbroeck - 6. Régression linéaire robuste
Eva Cantoni et Catherine Dehon - 7. Le modèle linéaire généralisé (GLM) robuste
William Aeberhard et Eva Cantoni - 8. Régularisation robuste de matrices de variances-covariances
Gentiane Haesbroeck - 9. Mesures d’influence et robustesse en sondages
Jean-François Beaumont, David Haziza et Anne Ruiz-Gazen - 10. Détection graphique de valeurs atypiques pour donnés dépendantes
Anne -Ruiz-Gazen
Les 200 ouvrages que cite la bibliographie permettent de se plonger dans l’histoire de la statistique du XVIIe siècle à nos jours.
La contribution de plusieurs auteurs à un même chapitre et celle d’un même auteur à plusieurs chapitres assurent l’unité et la cohérence de l’ensemble.
Les exemples utilisant des données réelles sont empruntés aux domaines les plus variés : géodésie, publications scientifiques, groupements d’étoiles, classement des universités, éruptions de geyser, créativité versus originalité des enfants, psychologie expérimentale, choix de l’allaitement, sondages, logements vacants, conflits africains, délits sur les propriétés et sur les personnes. Les méthodes utilisent les librairies du logiciel R.
Un ouvrage très clair et très complet, illustré par de nombreux graphiques, qui peut se lire soit globalement pour voir ce qu’apporte la prise en compte de la robustesse, soit chapitre par chapitre si on veut entrer dans le détail des calculs autour d’une application.