TP : adéquation à une loi équirépartie
Fiche –- élève
Rappels : Une variable aléatoire $X$, pouvant prendre $n$ valeurs $1$ ,…, $x$, $X$ suit une loi équirépartie si la probabilité de chaque valeur est $\dfrac{1}{n}$.
$f(1)$,…,$f(n)$ étant les fréquences des valeurs de $1$,…,$x$ $n$ dans une expérience, on pose $d^2= \sum_{i=1}^{n}\left(f_i - \frac{1}{n}\right)^2$.
Si la loi est bien équirépartie, dans 95 cas sur 100, $d^2$ est inférieure ou égale à une certaine valeur, notée $d^2_max$.
Si, dans une expérience, $d^2$ est strictement supérieure à $d^2_max$ , on affirmera, avec un risque d’erreur inférieur à 5 %, que la loi n’est pas équirépartie.
Ici l’expérience simulée est le lancer d’un dé à 6 faces (n=6).
1re partie : détermination expérimentale de $d^2_max$
A. Préparation de la feuille
la colonne A est réservée aux titres : entrer en A1 : "frequence du 1", en A2 : "frequence du 2", etc jusqu’en A6 ; entrer en A9 : "d²=". Les valeurs correspondantes apparaîtront dans les cellules voisines.
B. Simulation d’une série de 2000 lancers, et calcul de $d^2$
- Entrer en B11 la formule qui simule le résultat du lancer d’un dé parfait (à 6 faces)
- Recopier cette formule jusqu’en B2010
- Entrer en B1 la formule qui donne la fréquence de la face 1, dans une série de 2000 lancers
- De même entrer en B2,…,B6 les formules qui donnent les fréquences des faces 2,…,6
- Entrer en B9 la formule nécessaire pour obtenir la valeur de d².
- Insérer dans la feuille une représentation graphique des fréquences des six faces.
C. Simulation de 100 séries de 2000 lancers, et détermination de $d^2_max$
- Recopier la colonne B dans les colonnes C à CW : on a ainsi 100 colonnes représentant chacune 2000 lancers.
- Examiner attentivement la ligne 9, où figurent les 100 valeurs de d² ; repérer les 6 plus grandes valeurs.
- Conclure : donner une valeur approchée (expérimentale) de d²max.
2e partie : utilisation du test
Introduire dans l’ordinateur la disquette ou le CD qui vous est fourni ; ouvrir le fichier "dé à tester". Chaque appui sur F9 simule 2 000 lancers d’un dé à 6 faces, dont on ignore s’il est parfait ou truqué.
Faire les manipulations nécessaires, puis répondre, en expliquant, à la question : « Peut-on affirmer, avec un risque d’erreur inférieur à 5 %, que ce dé est truqué ? »
Commentaires
a) Lors de la 1re préparation de ce TP, l’enseignant explique pas à pas toutes les manipulations, il donne (éventuellement après avoir laissé chercher) les différentes formules (ici pour Excel, à adapter selon le tableur utilisé) :
En B11 : =ENT(ALEA()*6)+1
En B1 : =NB.SI(B11:B2010 ;1)/2000 , en B2 : =NB.SI(B11:B2010 ;2)/2000, etc
En B9 : =(B1-1/6)²+ (B2-1/6)²+ (B3-1/6)²+ (B4-1/6)²+ (B5-1/6)²+ (B6-1/6)²
Les adresses de cellules indiquées correspondent au fichier Excel joint, elles n’ont évidemment rien d’obligatoire.
L’enseignant explique également comment insérer un graphique, et quel type de graphique choisir.
b) Lors d’une autre séance, l’élève sera laissé autonome, avec le recours à l’enseignant en cas de nécessité ; on y fera varier les données : nombre de faces du dé (on peut par exemple prendre 2 faces, et assimiler l’expérience au jeu de pile ou face) ; nombre de lancers (500, ou 1000,…, mais éviter les séries trop courtes, non significatives, ou trop longues, qui bloquent la machine) ; risque (10%, ou 1%, au lieu de 5)
c) La deuxième partie est beaucoup moins coûteuse en temps que la 1ère, et n’offre guère de difficulté, mais elle est indispensable pour donner du sens à la première partie.
d) La disquette ou le CD distribué ( après que l’élève ait traité la partie 1) contient le fichier tel que l’élève a dû le réaliser, avec la différence qu’en B11, au lieu de =ENT(ALEA()*6)+1, on a préalablement mis une formule du type : =SI(Z1<0,2 ;1 ;SI(Z1<0,4 ;2 ;SI(Z1<0,6 ;3 ;SI(Z1<0,8 ;4 ;SI(Z1<0,9 ;5 ;6))))), et en Z1 : =ALEA() (recopié jusqu’en Z2000) ; en jouant sur les valeurs à mettre à la place de 0,2 , 0,4, etc, on aura des simulations de dés assimilables ou non à un dé parfait ; on pourra varier ces nombres selon les exemplaires, de sorte que certains élèves trouvent le dé parfait, d’autres non.
Dans le classeur Excel joint, la feuille 1 correspond à ce qui est attendu de l’élève, la feuille 2 est un exemple de fichier "dé à tester", à donner à l’élève pour la 2ème partie.
Remarque : la réponse n’est (évidemment) pas toujours certaine ; ainsi, avec 2000 lancers, j’ai trouvé pour d² max une fois 7,63.10 -4 , une autre fois 7,83.10 -4 ; le dé légèrement truqué de la feuille 2 donne parfois d²> d² max , mais pas toujours ! L’important pour l’évaluation est la cohérence des réponses avec les résultats aléatoires obtenus.
Intérêt pédagogique
C’est essentiellement de faire toucher du doigt, sur un exemple, la différence entre les notions de fréquence (expérimentale) et de probabilité (théorique), en même temps que le rapport étroit qu’il y a entre les deux. On peut y voir plus généralement une approche du concept de modèle mathématique.
Modalités d’évaluation
L’évaluation devrait être faite au fur et à mesure de l’épreuve : l’examinateur, après un temps raisonnable, note si chaque étape a été franchie ; si nécessaire il donne des indications, voire la réponse, pour éviter le blocage et permettre la recherche des questions suivantes. A titre indicatif, chaque tâche, en cas de réalisation sans aide, pourrait donner les points suivants (en cas de réalisation avec aide, on pourra donner une fraction des points) :
formule de simulation du dé (B.a) : 0,5 point
formule donnant les fréquences (B.c et d) : 0,5 point
formule donnant d² (B.e) : 0,5 point
savoir-faire général sur le tableur (copie des formules, etc) (A, B.b, C.a) : 0,5 point
insertion représentation graphique (B.f) : 0,5 point
détermination de d²max (C.b et c) : 0,5 point
2e partie, utilisation du test : manipulation : 0,5 point
conclusion bien rédigée : 0,5 point
Le total (sur 4 points) sera arrondi, en tenant compte de l’activité du candidat, de ses éventuelles recherches, fausses pistes, etc.