Bulletin Vert n°500
septembre — octobre 2012
Statistiques et probabilités Ressources pédagogiques pour les classes de Première générale et technologique
Ce document de 75 pages en 21 × 29,7 est paru successivement début mai 2011 sous la signature de l’inspection générale de mathématiques puis courant juin sous celle de la DGESCO et peut être téléchargé et utilisé hors exploitation commerciale.
Cet ouvrage riche et foisonnant présente de nombreux éclairages de la partie statistiques et probabilités des nouveaux programmes de première générale et technologique, centrés sur la notion de variable aléatoire, la découverte de la loi binomiale et la démarche de prise de décision pour une taille d’échantillon quelconque.
Dans la première partie, le lecteur trouvera en sept chapitres des compléments théoriques et un ensemble de situations développées dans le cadre du programme officiel.
Dans la seconde, sept annexes donnent des compléments d’information pour le professeur qui ne sont pas des attendus du programme.
Les activités pédagogiques présentées ouvrent des pistes susceptibles d’être exploitées en classe après un travail d’adaptation.
Ce document se révèlera donc très utile aux enseignants de mathématiques et pourra servir de point de départ à des débats entre collègues, mais aussi avec les spécialistes de sciences expérimentales ou sociales.
Malheureusement il présente de nombreuses faiblesses ou omissions.
Tout d’abord il ne comporte aucune bibliographie faisant état des travaux de la commission inter-irem statistique et probabilités, de statistix, des dossiers du Bulletin de l’APMEP.
De même, les références historiques, pourtant riches en piste de travail, sont trop sommaires.
Je détaille maintenant mes réserves, mes observations et mes critiques, mais aussi mes suggestions en suivant le texte pas à pas.
- I. Introduction (1 page)
Parmi les notions nouvelles des programmes de première, le document place la répétition d’expériences identiques et indépendantes.
Le concept d’ expérience , joue un rôle clef en Sciences et il faudrait qu’il soit précisé, analysé et commenté en commun par les enseignants de mathématiques et par ceux de physique, chimie, biologie, géologie, psychologie, philosophie, … En général, les expérimentateurs se placent dans un cadre déterministe, où les conditions initiales impliquent un état final, ce qu’on vérifie par de nombreuses répétitions à l’identique .
Le probabiliste, quant à lui, s’intéresse à des événements ou variables aléatoires dont la réalisation ou la valeur n’est pas prévisible, mais dont on peut seulement préciser la probabilité ou la distribution.
D’ailleurs, si on poursuit l’analyse en augmentant la précision des mesures, toute expérience est peu ou prou aléatoire .
En pratique on ne se limite pas à des répétitions à l’identique ; par exemple dans la roue de loterie (p. 11), la position initiale de chaque coup est la position finale du coup précédent ; le modèle d’une répartition uniforme n’est légitime que si l’impulsion donnée à la roue est assez grande (de même pour le lancer d’un dé ou d’une pièce). - II. Statistique descriptive, analyse des données (1 page)
Cette courte page présente les diagrammes en boite (à moustaches), sans signaler que la définition des quartiles n’est pas symétrique comme on le voit sur une série dont le nombre des valeurs est un multiple de quatre. Il serait intéressant d’expliciter un exemple de comparaison pertinente de plusieurs séries statistiques. - III. Variables aléatoires discrètes (2,5 pages)
L’attention du lecteur pourrait être attirée sur le fait que X n’est pas le numéro observé.
Faire remarquer sur les trois figures que la « convergence » de l’espérance, de la variance et de la probabilité ne sont pas monotones (alors que beaucoup de débutants croient que convergence implique monotonie).
Tout au long du document, mais cela est flagrant page 6, le mot loi est employé dans deux sens différents : loi de Bernoulli, loi faible des grands nombres ; et cela peut gêner les débutants ; ne pourrait-on parler de distribution ou de répartition quant on se réfère à une variable aléatoire ?
Page 6 note 3 préciser moyenne arithmétique. - IV. Utilisation des arbres pondérés (5 pages)
À vouloir tout préciser, on s’égare : les boules pourraient être indiscernables au toucher, mais l’urne transparente. Pourquoi ne pas dire simplement : les conditions du tirage sont telles que les prélèvements sont équiprobables ? Par définition, les six cartes ne sont pas identiques ; ce sont leurs dos qui le sont et qui sont seuls présentés au tireur.
Les cinq figures sont tronquées et certaines sont illisibles. - V. La loi géométrique tronquée (12 pages)
Si l’on souhaite se limiter à des variables aléatoires prenant un nombre fini de valeurs, il faut tronquer la loi géométrique, ce qui complique les calculs ; le résultat dépend du choix de la valeur de $X$ quand aucun succès n’est obtenu ; l’auteur choisit $X = 0,$ mais on aurait des calculs plus simples avec le choix plus naturel : $X = {n + 1/p}$.
Approche de la loi : la simulation qui conduit au tableau de la page 13 n’est précisée que plus loin ; le nombre de décimales de l’écart type est beaucoup trop grand. Il est abusif d’écrire qu’un algorithme (déterministe !) génère un nombre aléatoire ; il serait plus correct de dire pseudo-aléatoire.
Représentation graphique (p. 16) : lorsque ${n}$ devient grand les histogrammes ont des allures semblables : pourrait-on préciser ?
Le paradoxe de Saint-Pétersbourg (p. 22) : en toute rigueur, il faudrait distinguer le problème de la ruine des joueurs traité ici et le paradoxe qui s’énonce ainsi :
On lance une pièce de monnaie jusqu’à l’apparition de Face ; si c’est au n-ièmecoup, la banque verse au joueur $2^i $euros. Quelle doit être la mise initiale du joueur pour que le jeu soit équitable ?
Dans le mémoire cité, paru en 1738, Daniel Bernoulli propose que l’avantage d’un gain soit fonction de la fortune du joueur. La question sera débattue pendant plus de deux siècles. - VI. Loi binomiale (13 pages dont deux blanches)
Exemple 2 : préciser dépend linéairement et que cette éventualité désigne on obtient bleu.
Coefficients binomiaux : est-il bien nécessaire d’utiliser une calculatrice ou un tableur pour calculer ${n(n - 1)/2}$ ? Par contre c’est judicieux pour calculer la suite des 2 parmi $n$.
Page 30 : Le tableau du haut comporte plusieurs coquilles.
La distinction entre grandes et petites binomiales est curieuse (Pourquoi pas des petites grosses et des grandes maigres ?) et en tout cas n’est pas respectée dans la figure du bas ; il faudrait rajouter page suivante des figures mettant en évidence la symétrie et la dispersion maximale dans le cas ${p} = 0,5$
C. Exemples d’activités.
1. Le quorum : est-il clair pour tout le monde que le quorum est atteint équivaut à la moitié au moins des adhérents assiste ?
2. Le QCM : cet énoncé met en évidence que le verbe espérer n’a pas le même sens dans la vie courante ou en calcul des probabilités où il vaut mieux ne pas l’employer : rien n’interdit à l’élève d’espérer un total de 20 points (si se réalise un événement de probabilité ${1/4}^{20}$) alors que l’espérance de son gain est de 5 points. - VII. Échantillonnage et prise de décision (10 pages)
A. Intervalle de fluctuation avec la loi binomiale.
Le style de ce paragraphe est lourd par exemple : « la variable aléatoire qui à tout échantillon de taille $n$ associe la fréquence observée dans l’échantillon prélevé ».
Le jeu sur les inégalités et les schémas qui l’illustrent en haut de la page 39 sont loin d’être clairs et des figures utilisant la représentation graphique de la fonction de répartition de X auraient été plus convaincants
C. Détermination de l’intervalle de fluctuation à l’aide d’un algorithme.
La phrase l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise revient au moins cinq fois (p. 41, 42, 44, 66, 73) dans le document et laisse le lecteur sur sa faim s’il ne se contente pas d’un argument d’autorité ou d’importance .
Or, il aurait été possible de consacrer un chapitre, ou au moins une annexe à la distribution (hypergéométrique) du nombre de succès dans une suite de tirages sans remise en suivant exactement la démarche du chapitre VI pour la loi binomiale, puis de comparer les deux distributions, leurs moyennes et leurs variances.
D. Exemples d’activités :
6 : nombres pseudo-aléatoires.
E. Lien avec l’intervalle de fluctuation : dans le graphique central p. 48 une des droites n’a pas été tracée - Annexe 1. Couples d’indicateurs et problèmes de minimisation (2 pages)
Dans les trois exemples, il y a existence mais pas unicité dans le second, il faudrait écrire : on s’intéresse aux points M de la droite d’équation y = x qui sont les plus proches de A. Lire $R^n$ et non Rn. - Annexe 2. Loi faible des grands nombres (1 page)
Les trois dernières lignes sur le théorème de la limite centrale en disent trop ou trop peu. Quant au nom, c’est la traduction française correcte de Zentraler Grenzversatz, expression allemande introduite par G. Polya en 1920. - Annexe 3. Espérance de la loi géométrique tronquée : approches expérimentales. (2,5 pages)
- Annexe 4. Loi géométrique (2 pages)
Les calculs de $E(X)$ et de $V(X)$ pourraient être explicités en passant par $E(X(X - 1))$. Préciser limite pour $n$ tendant vers l’infini de l’espérance de la loi géométrique tronquée. - Annexe 5. Quelques outils de calcul avec la loi binomiale (3 pages)
L’algorithme page 58 affiche seulement la n-ième ligne du triangle de Pascal. - Annexe 6. Coefficients binomiaux et quadrillage (6 pages)
Page 60, la première figure est un arbre, la seconde un graphe, mais pas un arbre.
Il faudrait citer les deux articles parus dans le Bulletin n°482, p. 371-374 et 386-392, et dans le n° 492, p. 11-16.
Page 63, historiquement, le problème des pilules a été formulé sous le nom de boites d’allumettes de Banach par H. Steinhaus, dans un hommage humoristique à S. Banach, fumeur invétéré.
Page 64, les encadrés de la figure sont tronqués. - Annexe 7. Compléments sur la prise de décision (10 pages)
Page 66, il faudrait préciser le sens des mots significatif et normale . De nombreuse figures sont illisibles (p. 68, 72, 74, et 75). Les calculs de C cartes de contrôle sont à revoir.
En conclusion :
Ce document très varié pourrait facilement être amélioré pour faciliter sa lecture et accroître son lectorat. Il doit être le point de départ de nombreux ateliers laissant à chacun la liberté de préciser, développer et contester tel ou tel point.