Bulletin Vert no 436
novembre — décembre 2001
Simulation statistique courrier des lecteurs
Une réponse à une question de notre collègue Bernard EGGER (Bulletin n°434, p. 308) : un drôle de pays décide que les familles ont quatre enfants au plus, de l’un des types suivants : un garçon, une fille et un garçon, deux filles et un garçon, trois filles et un garçon ou quatre filles. La question est : Excel peut-il nous aider à savoir si une telle population favorise ou non un déséquilibre entre les sexes ?
La réponse est non. On ne peut répondre sans la théorie des probabilités comme le dit Bernard EGGER lui-même. Cette théorie permet de modéliser la situation ainsi :
- la probabilité des familles de type « un garçon » est 0,5.
- la probabilité des familles de type « une fille et un garçon » est 0,25.
- la probabilité des familles de type « deux filles et un garçon » est 0,125.
- la probabilité des familles de type « trois filles et un garçon » est 0,062 5.
- la probabilité des familles de type « quatre filles » est 0,062 5.
Dans un ensemble de 10 000 familles, le nombre moyen de garçons est donc :
$$ 10 000 (0,5 + 0,25 + 0,125 + 0,062 5) = 937,5$$
et celui des filles est :
$$10 000 (0,25 + 2 \times 0,125 + 3 \times 0,062 5 + 4 \times 0,062 5) = 937,5$$
Alors, maintenant, quid de la contribution d’Excel ? Il faut alors faire appel à la théorie des tests pour savoir si la simulation donne un résultat acceptable au regard de la théorie, c’est à dire, ayant observé dans un ensemble de 10 000 familles 882 filles et 955 garçons, il faut tester l’hypothèse : il y a le même nombre de filles et de garçons contre l’hypothèse alternative. Il est clair que cette théorie, assez délicate, n’est pas abordable en classe de lycée. Mais il me semble que si l’on doit présenter le programme préconisé par le GTD, on doit être formé à la fois à la théorie des probabilités et à celle des tests statistiques. Dans le cas contraire, les enseignants risquent trop facilement d’être amenés à des interprétations inexactes, à une mauvaise utilisation de la statistique, y compris dans la vie courante, contrairement aux objectifs affectés par le GTD.