Bulletin Vert n°491
novembre — décembre 2010
La démarche statistique
par Bernard Prum
Cépaduès, mars 2010
348 p. en 15 × 21, ISBN : 978-2-85428-920-6
Depuis une trentaine d’années, l’auteur enseigne la statistique à des étudiants se destinant aux métiers du vivant : médecine, biologie, génomique ; il en présente ici une synthèse couvrant à la fois tous les outils créés et mis en œuvre tout au long du vingtième siècle et les avancées récentes par rapport aux consultations de tables que permet l’informatique et en particulier le logiciel R.
Détaillons le contenu :
- Modèles statistiques
inférence, lois empiriques, modèles statistiques, vraisemblance.
- Premiers éléments d’inférence statistique
modèle binomial, estimation, démarche du test, niveau et puissance, tests unilatères et bilatères.
- Rapport de vraisemblance
Neyman-Pearson, hypothèses simples, rapport monotone, familles exponentielles.
- Vraisemblance, Information
dérivées de la vraisemblance, information de Fisher, exemples (Poisson, Gauss, Gamma).
- Estimation
estimateur, biais, consistance, borne de Cramer-Rao, Maximum de vraisemblance, théorème de Blackwell-Rao.
- Les trois tests
tests du score, de Wald, du rapport de vraisemblance.
- Modèles multiparamétriques
théorèmes, tests, modèle linéaire, lois de Student et de Fisher-Snedecor, droite de régression.
- Test d’une hypothèse composée
tests unilatères, lien avec le rapport de vraisemblance monotone, tests bilatères, paramètre multidimensionnel.
- Régions de confiance
intervalles : pari, non rejet, confiance.
- Les cinq points de vue de la démarche statistique
test, degré de significativité, puissance, taille d’échantillon, intervalle de confiance.
- Tests du $\chi^2$
bases probabilistes, test d’ajustement, tests d’indépendance.
- Tests non paramétriques
tests de rangs sur un et deux échantillons, Kolmogorov- Smirnov.
- Taille d’échantillon
tests séquentiels.
- Choix de modèle
modèles emboîtés, choix de la pénalisation, validation croisée.
- Multi-tests
multi-tests d’une même hypothèse, test d’une hypothèse multiple, exemples.
- Approches stochastiques
ré-échantillonnage, bootstrap, Jackknife.
- Approche bayésienne
estimateur bayésien,
bayésien séquentiel, loi non informative.
Dans un envoi final, l’auteur donne une liste des procédures et résultats qu’il n’a pu présenter ici : séries chronologiques, chaînes de Markov, statistique des processus, planification d’expériences, statistiques descriptives, valeurs extrêmes, grandes déviations.
Deux Annexes contiennent des Rappels de probabilités et Quelques programmes en R.
Les quatre pages de bibliographie rappellent à la fois les grands classiques du dernier demi-siècle et les ouvrages récents ; un index rassemble les noms propres et les concepts.
De nombreuses notes de bas de page montrent le souci de préciser un point de calcul ou une référence historique pleine d’humour. Innovation louable pour un livre universitaire, de nombreuse figures sont en couleur, ce qui rend lumineuses les réflexions et mises en place qu’elles suggèrent.
L’auteur suggère que chaque lecteur choisisse sa démarche pour parcourir le volume en fonction de ses connaissances préalables et de ses intérêts. Peut-être regrettera-t-on qu’il ne puisse manifester davantage d’initiative en résolvant quelques exercices.
En tout cas le fil directeur est très clair et l’exposé mathématique est rigoureux, éclairé de nombreux exemples, articulé sur une solide charpente, ce qui fait de son étude un rare plaisir.