Dans le programme de première et de terminale apparaît la notion d’écart type. C’est la dernière partie des statistiques, l’indicateur le plus complexe qui est vu dans la scolarité de l’élève dans l’enseignement professionnel. Les statistiques sont vues dès le collège avec les diagrammes, l’étendue, la moyenne et la médiane. Elles sont reprises au collège en classe de seconde avec les quartiles et la boîte à moustache.
Et là, c’est le drame. Mes élèves de première qui ont vécu semble-t-il dans des grottes durant les 16 à 17 dernières années n’ont jamais entendu parler de la notion de quartiles…
La médiane et la moyenne
Soit un ensemble de valeur 1 – 2 – 8 – 5 – 9 – 10 – 5 – 3
Le calcul de la moyenne se fait de la façon suivante :
Pour réaliser le calcul de la médiane, on va trier les valeurs dans l’ordre croissant :
1 – 2 – 3 – 5 – 5 – 8 – 9 – 10. La médiane est la valeur qui sépare l’effectif en deux parties égales. Il y a 8 valeurs, donc 4 et 4. Soit 1 – 2 – 3 – 5 – 5 – 8 – 9 – 10. On voit qu’on est entre 5 et 5. La médiane est de 5. Je rappelle que si on n’avait pas eu 5 et 5 mais 5 et 6, ça aurait été 5.5 car entre 5 et 6 c’est 5.5. Si par contre j’avais eu 5 et 19, c’est plus difficile de voir la valeur si bien qu’on fait :
Si j’ai par contre un nombre impair de valeur comme 1 – 3 – 5 – 7 – 15. Je vois que j’ai 5 valeurs, le centre est à 2.5 si bien qu’on a ceci : 1 – 3 – 5 – 7 – 15. La médiane est de 5.
Il est important de comprendre que la médiane représente 50% des valeurs. Dans les deux cas précédents, 50% des valeurs sont en dessous de 5.
Les quartiles, premier cas
Quartiles, comme quart. La définition est un peu différente de celle de la médiane. Alors que la médiane c’est 50%, le premier quartile c’est au moins 25%. Ainsi dans notre premier cas :
1 – 2 – 3 – 5 – 5 – 8 – 9 – 10
Nous avons donc 8 valeurs, le premier quart se situe à 8÷4=2. Il s’agira de la deuxième valeur alors 2. On notera Q1=2. Cela signifie 25% des valeurs sont inférieures ou égales à 2.
La définition du troisième quartile est similaire, il s’agit d’au moins 75%. C’est ici que ça se complique. Si un quart vaut deux, alors trois quarts valent trois fois 2. Soit 3×2=6. Le troisième quartile sera la sixième valeur, soit Q3=8.
Les quartiles, second cas
Si on regarde ce qui précède, j’ai pris un cas qui tombe juste puisque 8 est un multiple de 4. Imaginons désormais la suite de nombres suivants que j’ai mis dans l’ordre croissant pour aller plus vite.
1 – 3 – 4 – 5 – 7 – 9 – 10 – 10 – 11 – 12 – 15. Il y a 11 valeurs. Je vais adopter le raisonnement précédent. Je suis en recherche du premier quart, je fais donc 11÷4=2.75. Ce n’est pas un nombre entier, alors la question : est-ce que je prends la valeur numéro 2 ou est-ce que je prends la valeur numéro 3 ? La réponse se trouve dans la définition. Je dois avoir au moins 25%, cela signifie que si je suis en dessous ce n’est pas bon. Or, si je prends 2, je suis sous les 25%. Il faut prendre la troisième valeur. On retiendra alors que je prends l’entier supérieur quand j’ai un nombre à virgule. Cela veut dire que si j’ai 4.25 c’est la cinquième valeur, si 7.5 c’est la huitième valeur.
Ainsi dans mon exemple précédent, j’ai trouvé 2.75, je dois prendre la troisième valeur. Q1=4. Si un quart est égal à 2.75 alors trois quarts c’est 3×2.75=8.25. Sur la même définition que ce qui précède, je dois prendre l’entier au-dessus pour avoir au moins 75% soit la neuvième valeur. Q3=9
En résumé et boîte à moustaches.
Soit la suite de nombres suivants triés dans l’ordre croissant pour aller plus vite :
1 – 3 – 3 – 4 – 4.5 – 5 – 5 – 6 – 7 – 8 – 9 – 9.5 – 10 – 11 – 16
Nous avons 15 valeurs. Soit très rapidement
- 15÷4=3.75 ce qui veut dire que Q1 se trouve à la quatrième place. Soit Q1=4
- 15÷2=7.5 la médiane Me est à la huitième valeur. Soit Me=6.
- 3.75×3=11.25. Q3 se trouve en douzième position soit Q3=9.5
Pour synthétiser l’ensemble de ces valeurs, on a fait une représentation graphique qui s’appelle la boîte à moustache. Pour l’exemple précédent, elle ressemble à ceci :
J’ai utilisé la calculatrice Numworks qui est capable de faire ce diagramme. Avec un peu d’imagination, on peut y voir une moustache. Bon d’accord, beaucoup d’imagination.
On voit que l’on va de 1 à 16, c’est-à-dire le minimum et le maximum de la série. On peut rapidement en déduire l’étendue 16-1=15.
Le début de la boîte est 4, c’est la valeur du premier quartile. Le trait blanc, c’est la médiane à 6, la boîte se ferme à 9.5 sur le dernier quartile.
Ce diagramme simple permet d’avoir l’ensemble des valeurs statistiques de position.