Les statistiques servent à résumer une série de données par quelques nombres bien choisis. On commence par compter (effectifs, fréquences), puis on cherche un nombre qui représente le « centre » de la série (moyenne, médiane) et un nombre qui mesure son amplitude (étendue).
Effectifs et fréquences
Effectif et effectif total
Quand on étudie une série de données, l’effectif d’une valeur est le nombre de fois où elle apparaît ; on le note ni. L’effectif total N est le nombre total de données : c’est la somme de tous les effectifs, N=∑ni.
Fréquence
La fréquence d’une valeur est la proportion qu’elle représente dans la série :
fi=Nni
C’est un nombre compris entre 0 et 1. Pour l’exprimer en pourcentage, on le multiplie par 100. La somme de toutes les fréquences vaut 1 (soit 100%).
Calculer une fréquence en pourcentage
- Repérer l’effectif ni de la valeur et l’effectif total N.
- Calculer le quotient Nni.
- Multiplier par 100 pour obtenir le pourcentage.
Exemple : 9 élèves sur 25 ont eu 14. La fréquence est 259=0,36, soit 0,36×100=36%.
Moyenne
Calculer une moyenne pondérée
- Multiplier chaque valeur xi par son effectif (ou son coefficient) ni.
- Additionner tous ces produits : on obtient ∑nixi.
- Diviser par la somme des effectifs ∑ni.
Les effectifs (ou coefficients) servent de poids : une valeur de poids élevé compte davantage dans la moyenne.
Médiane
Médiane
La médiane M est une valeur qui partage la série ordonnée en deux moitiés de même effectif : au moins la moitié des données lui sont inférieures ou égales, et au moins la moitié lui sont supérieures ou égales. On range toujours la série dans l’ordre croissant avant de la chercher.
Trouver la médiane
- Ranger la série dans l’ordre croissant et compter l’effectif total N.
- Si N est impair : la médiane est la valeur de rang 2N+1 (la valeur du milieu).
- Si N est pair : la médiane est la demi-somme des valeurs de rangs 2N et 2N+1 (les deux valeurs centrales).
Étendue
Comparer deux séries
Deux séries peuvent avoir la même moyenne mais des étendues différentes : la série dont l’étendue est la plus petite est la plus régulière (ses valeurs sont plus proches les unes des autres). La moyenne seule ne suffit donc pas à décrire une série : il faut aussi regarder la dispersion.
Les pièges classiques
- Toujours ranger la série dans l’ordre croissant avant de chercher la médiane : sur une série non triée, le résultat est faux.
- La médiane n’est pas la moyenne : sur 0, 0, 0, 0, 100, la moyenne vaut 20 mais la médiane vaut 0.
- Pour une moyenne pondérée, on divise par la somme des effectifs ∑ni, jamais par le nombre de valeurs distinctes.
- L’étendue est une différence xmax−xmin, pas un intervalle : c’est un seul nombre.