Bulletin Vert n°485
novembre — décembre 2011
Études de cas en statistique décisionnelle
par Stéphane Tufféry
TECHNIP, mai 2009
378 p. en 17 × 24, prix : 31 €, ISBN : 978-2-7108-0936-4
J’ai rendu compte dans le Bulletin n° 462, p. 157 de l’ouvrage du même auteur et du même éditeur Data mining et statistique décisionnelle paru en 2005 et réédité depuis. Il s’agissait d’un traité de cours, tandis que le présent volume présente une étude de cas réalisée intégralement à partir d’un même jeu de données et peut être considéré comme un recueil de travaux pratiques destiné à satisfaire les étudiants qui veulent comprendre la démarche du statisticien et la mettre en œuvre avec un logiciel. Les deux problèmes traités ici s’appuient sur une très riche base de données sur 5 822 assurés. Le premier consiste à établir une segmentation de cette clientèle, le second à utiliser cette segmentation ; c’est le volet descriptif de l’étude de cas qui précise l’interprétation et la description des segments construits.
Ce volet descriptif fait l’objet du premier chapitre, Data mining descriptif (100 pages).
Le second construit un « score d’appétance » attribuant à chaque client une note donnant la probabilité de souscrire un produit ou un service, il est développé dans le second chapitre Data mining prédictif (250 pages).
Ces deux chapitres sont complétés par deux annexes :
- A : Explication de la segmentation de clientèle par un arbre de décision,
- B : Macro-programme de discrétisation des variables,
- et par une rapide bibliographie en deux parties : ouvrages et sites internet ainsi qu’un index des procédures SAS.
Ce gros volume, très technique pour un non-spécialiste a le mérite de montrer sur une étude de cas minutieuse et détaillée, la variété des modèles et des outils utilisables aujourd’hui sur un ensemble gigantesque de données grâce au développement des ressources informatiques.
S’adressant aux spécialistes il leur est bien adapté mais tous ceux qui veulent comprendre sur un exemple ce qu’est la statistique aujourd’hui pourront s’y plonger et le suivre pas à pas sur un ordinateur ; en ce qui concerne les outils de base, ils pourront consulter le livre : Probabilités, analyse des données et statistique de Gilles Saporta, Technip 2006.