Aller au contenu
Rêves Vision

Première ST2S · Chapitre 3

Statistiques descriptives : indicateurs de position et de dispersion

Cours de Première ST2S sur les statistiques descriptives : moyenne, médiane, quartiles, étendue, écart interquartile, écart-type et diagramme en boîte. Exercices corrigés en santé.

8 exercices corrigés · Première ST2S - mathématiques (programme 2019) · Mis à jour en juin 2026

En santé publique comme en épidémiologie, on recueille souvent beaucoup de données : les âges des patients d’un service, les durées d’hospitalisation, les IMC d’une population. Les statistiques descriptives servent à les résumer par quelques nombres bien choisis : des indicateurs de position qui disent où se situe le centre de la série, et des indicateurs de dispersion qui disent à quel point les valeurs sont étalées.

Ce que tu sauras faire

  • Je sais calculer une moyenne simple et une moyenne pondérée.
  • Je sais déterminer la médiane, le premier quartile Q1Q_{1} et le troisième quartile Q3Q_{3} par la méthode des rangs.
  • Je sais calculer l’étendue et l’écart interquartile Q3Q1Q_{3} - Q_{1}, et lire l’écart-type à la calculatrice.
  • Je sais construire et lire un diagramme en boîte, et comparer deux séries en contexte santé-social.

À quoi ça sert ?

Imagine que tu travailles dans un service hospitalier. À la fin du mois, tu as l’âge de chaque patient admis et le nombre de jours passé par chacun à l’hôpital. Tu ne peux pas raisonner sur toute la liste : tu as besoin de résumés. La moyenne te donne le niveau global ; la médiane te donne le patient « central » sans te laisser tromper par un séjour exceptionnellement long ; l’écart-type te dit si les durées de séjour sont régulières ou très inégales. Ces indicateurs sont le langage de base de l’épidémiologie, de la veille sanitaire et des études de population.

Indicateurs de position

Moyenne (simple et pondérée)

La moyenne d’une série de valeurs xix_i affectées des effectifs nin_i est : xˉ=nixini\bar{x} = \frac{\sum n_i\, x_i}{\sum n_i} On multiplie chaque valeur par son effectif, on additionne tous les produits, puis on divise par l’effectif total N=niN = \sum n_i. Si chaque valeur n’apparaît qu’une seule fois, on retrouve la moyenne simple xˉ=x1+x2++xNN\bar{x} = \dfrac{x_1 + x_2 + \dots + x_N}{N}.

Calculer une moyenne pondérée

  1. Multiplier chaque valeur xix_i par son effectif nin_i.
  2. Additionner tous ces produits : on obtient nixi\sum n_i\, x_i.
  3. Diviser par la somme des effectifs ni\sum n_i, jamais par le nombre de valeurs distinctes.

Les effectifs jouent le rôle de poids : un âge partagé par beaucoup de patients pèse davantage dans la moyenne.

Âge moyen d'un groupe de patients

Dans un service, l’âge de 1010 patients (en années) est : 52; 58; 61; 63; 65; 67; 70; 72; 78; 84.52\,;\ 58\,;\ 61\,;\ 63\,;\ 65\,;\ 67\,;\ 70\,;\ 72\,;\ 78\,;\ 84. La somme vaut 52+58+61+63+65+67+70+72+78+84=670.52 + 58 + 61 + 63 + 65 + 67 + 70 + 72 + 78 + 84 = 670. L’âge moyen est donc xˉ=67010=67\bar{x} = \dfrac{670}{10} = 67 ans.

Médiane

La médiane MM partage la série rangée dans l’ordre croissant en deux moitiés de même effectif : au moins la moitié des données lui sont inférieures ou égales, et au moins la moitié lui sont supérieures ou égales. On range toujours la série avant de la chercher.

Trouver la médiane (méthode des rangs)

  1. Ranger la série dans l’ordre croissant et compter l’effectif total nn.
  2. Si nn est impair : la médiane est la valeur de rang n+12\dfrac{n+1}{2} (la valeur du milieu).
  3. Si nn est pair : la médiane est la demi-somme des valeurs de rangs n2\dfrac{n}{2} et n2+1\dfrac{n}{2}+1 (les deux valeurs centrales).

Premier et troisième quartiles

Le premier quartile Q1Q_{1} est la plus petite valeur de la série telle qu’au moins 25%25\,\% des données lui sont inférieures ou égales. Le troisième quartile Q3Q_{3} est la plus petite valeur telle qu’au moins 75%75\,\% des données lui sont inférieures ou égales. Entre Q1Q_{1} et Q3Q_{3} se trouve donc la moitié centrale de la série.

Déterminer Q1 et Q3 (méthode des rangs)

  1. Ranger la série dans l’ordre croissant et compter l’effectif total nn.
  2. Rang de Q1Q_{1} : le plus petit entier supérieur ou égal à n4\dfrac{n}{4}.
  3. Rang de Q3Q_{3} : le plus petit entier supérieur ou égal à 3n4\dfrac{3n}{4}.

Quand le quotient n’est pas entier, on arrondit à l’entier supérieur (par exemple un rang de 3,253{,}25 donne le 4e4^\text{e} terme). Quand il est entier, on garde ce rang.

Indicateurs de dispersion

Étendue et écart interquartile

L’étendue mesure l’amplitude totale de la série : eˊtendue=xmaxxmin\text{étendue} = x_{\max} - x_{\min} L’écart interquartile mesure l’amplitude de la moitié centrale des données : eˊcart interquartile=Q3Q1\text{écart interquartile} = Q_{3} - Q_{1} L’étendue est sensible aux valeurs extrêmes (un patient très âgé, un séjour très long) ; l’écart interquartile, qui ignore les 25%25\,\% les plus bas et les 25%25\,\% les plus hauts, est beaucoup plus robuste.

Écart-type (à la calculatrice)

L’écart-type, noté σ\sigma, mesure la dispersion des valeurs autour de la moyenne : plus il est petit, plus les valeurs sont resserrées autour de xˉ\bar{x} ; plus il est grand, plus elles sont dispersées. En ST2S, on le lit directement à la calculatrice en mode statistiques (touche σx\sigma_x), après avoir saisi les valeurs et leurs effectifs.

Obtenir moyenne et écart-type à la calculatrice

  1. Entrer en mode statistiques (menu STAT ou STATS).
  2. Saisir les valeurs xix_i dans une liste et leurs effectifs nin_i dans une autre.
  3. Lancer le calcul des statistiques à une variable : la calculatrice affiche xˉ\bar{x} (moyenne) et σx\sigma_x (écart-type).
  4. Vérifier que l’effectif total nn affiché correspond bien à la somme attendue.

Diagramme en boîte

Diagramme en boîte

Le diagramme en boîte (ou boîte à moustaches) résume une série par cinq nombres : le minimum xminx_{\min}, le premier quartile Q1Q_{1}, la médiane MM, le troisième quartile Q3Q_{3} et le maximum xmaxx_{\max}. La boîte s’étend de Q1Q_{1} à Q3Q_{3} (elle contient la moitié centrale des données), une barre marque la médiane à l’intérieur, et deux moustaches rejoignent le minimum et le maximum.

Construire un diagramme en boîte

  1. Calculer les cinq nombres : xminx_{\min}, Q1Q_{1}, MM, Q3Q_{3}, xmaxx_{\max}.
  2. Tracer un axe gradué adapté à la série.
  3. Dessiner la boîte de Q1Q_{1} à Q3Q_{3} et tracer le trait de la médiane MM à l’intérieur.
  4. Prolonger par deux moustaches jusqu’à xminx_{\min} et xmaxx_{\max}.

Lire un diagramme en boîte (durées d'hospitalisation)

Pour les durées de séjour (en jours) dans un service, on lit sur le diagramme : xmin=1x_{\min} = 1, Q1=3Q_{1} = 3, M=5M = 5, Q3=8Q_{3} = 8, xmax=21x_{\max} = 21. On en déduit : l’étendue vaut 211=2021 - 1 = 20 jours, l’écart interquartile vaut 83=58 - 3 = 5 jours. La moustache de droite est très longue : la moitié centrale des patients reste entre 33 et 88 jours, mais quelques séjours exceptionnellement longs (jusqu’à 2121 jours) tirent l’étendue vers le haut.

Comparer deux séries

Comparer position et dispersion

Pour comparer deux populations (deux services, deux années, deux groupes de patients), on regarde deux choses à la fois :

  • la position (moyenne ou médiane) : quelle série a le centre le plus élevé ?
  • la dispersion (écart interquartile ou écart-type) : quelle série est la plus régulière ?

À position égale, la série dont la dispersion est la plus faible est la plus homogène (valeurs proches les unes des autres). La position seule ne suffit jamais : il faut aussi la dispersion.

Les pièges classiques

  • FAUX : diviser une moyenne pondérée par le nombre de valeurs distinctes. VRAI : on divise par la somme des effectifs ni\sum n_i.
  • FAUX : chercher la médiane ou les quartiles sur une série non triée. VRAI : on range d’abord dans l’ordre croissant.
  • FAUX : pour un rang non entier, arrondir à l’entier le plus proche. VRAI : pour Q1Q_{1} et Q3Q_{3}, on arrondit toujours à l’entier supérieur.
  • FAUX : confondre étendue et écart interquartile. VRAI : l’étendue est xmaxxminx_{\max} - x_{\min} ; l’écart interquartile est Q3Q1Q_{3} - Q_{1} (la moitié centrale seulement).
  • FAUX : décrire une population avec la seule moyenne. VRAI : la moyenne peut cacher une forte dispersion ou être tirée par une valeur extrême ; on l’accompagne toujours d’un indicateur de dispersion (et souvent de la médiane).

Exercices corrigés

Du plus simple au plus exigeant. Cherche d'abord seul, puis déroule le corrigé détaillé.

Gratuit · corrigé

Calculer l'étendue de durées d'hospitalisation

Dans un service hospitalier, on note la durée de séjour (en jours) de 1010 patients admis dans la semaine : 2; 3; 3; 5; 6; 7; 9; 12; 14; 18.2\,;\ 3\,;\ 3\,;\ 5\,;\ 6\,;\ 7\,;\ 9\,;\ 12\,;\ 14\,;\ 18. Calculer l'étendue de cette série et interpréter le résultat.

Voir l'exercice corrigé
Gratuit · corrigé

Calculer l'IMC moyen d'un groupe

Lors d'un bilan de santé, on relève l'indice de masse corporelle (IMC) de 88 adultes : 19,5; 21; 22,5; 24; 26; 27; 28,5; 31,5.19{,}5\,;\ 21\,;\ 22{,}5\,;\ 24\,;\ 26\,;\ 27\,;\ 28{,}5\,;\ 31{,}5. Calculer l'IMC moyen de ce groupe.

Voir l'exercice corrigé
Gratuit · corrigé

Déterminer l'âge médian d'une population (effectif pair)

Une infirmière relève l'âge (en années) des 1212 patients présents un matin dans un service : 58; 47; 69; 42; 75; 60; 51; 80; 63; 54; 71; 66.58\,;\ 47\,;\ 69\,;\ 42\,;\ 75\,;\ 60\,;\ 51\,;\ 80\,;\ 63\,;\ 54\,;\ 71\,;\ 66. 1) Ranger la série dans l'ordre croissant. 2) Déterminer l'âge médian et interpréter.

Voir l'exercice corrigé
Gratuit · corrigé

Nombre moyen de médicaments par résident

Dans un EHPAD, l'infirmière coordonnatrice relève le nombre de médicaments pris chaque jour par chacun des 5050 résidents. Les résultats sont regroupés dans le tableau suivant : 00 médicament pour 44 résidents, 11 pour 99 résidents, 22 pour 1212 résidents, 33 pour 1515 résidents, 44 pour 88 résidents et 55 pour 22 résidents. Calculer le nombre moyen de médicaments pris par résident.

Voir l'exercice corrigé
Gratuit · corrigé

Quartiles et écart interquartile d'une glycémie

Lors d'un dépistage, on mesure la glycémie à jeun (en mg/dL) de 1111 personnes. La série, déjà rangée dans l'ordre croissant, est : 76; 82; 88; 91; 95; 99; 104; 110; 118; 126; 140.76\,;\ 82\,;\ 88\,;\ 91\,;\ 95\,;\ 99\,;\ 104\,;\ 110\,;\ 118\,;\ 126\,;\ 140. 1) Déterminer le premier quartile Q1Q_{1} et le troisième quartile Q3.Q_{3}. 2) En déduire l'écart interquartile.

Voir l'exercice corrigé
Gratuit · corrigé

Temps d'attente médian aux urgences

Aux urgences d'un hôpital, on relève le temps d'attente (en minutes) avant la prise en charge de 1313 patients : 34; 12; 47; 25; 19; 52; 8; 41; 30; 16; 60; 23; 38.34\,;\ 12\,;\ 47\,;\ 25\,;\ 19\,;\ 52\,;\ 8\,;\ 41\,;\ 30\,;\ 16\,;\ 60\,;\ 23\,;\ 38. 1) Ranger la série dans l'ordre croissant. 2) Déterminer le temps d'attente médian et interpréter.

Voir l'exercice corrigé
Bonus

Comparer deux services avec des diagrammes en boîte (problème)

Un cadre de santé compare la durée de séjour (en jours) des patients de deux services, A et B, qui ont chacun accueilli 1010 patients dans la semaine. Service A : 2; 3; 4; 5; 5; 6; 7; 8; 9; 11.2\,;\ 3\,;\ 4\,;\ 5\,;\ 5\,;\ 6\,;\ 7\,;\ 8\,;\ 9\,;\ 11. Service B : 1; 2; 3; 4; 4; 6; 8; 10; 16; 26.1\,;\ 2\,;\ 3\,;\ 4\,;\ 4\,;\ 6\,;\ 8\,;\ 10\,;\ 16\,;\ 26. 1) Pour chaque service, calculer la durée moyenne de séjour. 2) Pour chaque service, déterminer les cinq nombres du résumé : xminx_{\min}, Q1Q_{1}, médiane MM, Q3Q_{3}, xmax.x_{\max}. 3) Comparer les deux services en termes de position et de dispersion, puis dire lequel a les durées de séjour les plus régulières.

Débloquer l'exercice
Gratuit · corrigé

Comparer la fréquence cardiaque de deux groupes

Dans une étude de santé, on mesure la fréquence cardiaque au repos (en battements par minute) de deux groupes de 1111 personnes : un groupe sédentaire et un groupe sportif. Les deux séries sont déjà rangées dans l'ordre croissant. Groupe sédentaire : 62; 66; 68; 70; 72; 74; 76; 78; 80; 84; 84.62\,;\ 66\,;\ 68\,;\ 70\,;\ 72\,;\ 74\,;\ 76\,;\ 78\,;\ 80\,;\ 84\,;\ 84. Groupe sportif : 50; 52; 54; 56; 58; 58; 60; 60; 62; 64; 64.50\,;\ 52\,;\ 54\,;\ 56\,;\ 58\,;\ 58\,;\ 60\,;\ 60\,;\ 62\,;\ 64\,;\ 64. À la calculatrice, on a obtenu une moyenne de 7474 et un écart-type de 6,96{,}9 pour le groupe sédentaire, une moyenne de 5858 et un écart-type de 4,44{,}4 pour le groupe sportif. 1) Pour chaque groupe, déterminer les cinq nombres du résumé : xminx_{\min}, Q1Q_{1}, médiane MM, Q3Q_{3}, xmax.x_{\max}. 2) Calculer l'étendue et l'écart interquartile de chaque groupe. 3) Comparer les deux groupes en termes de position et de dispersion, puis dire lequel a les fréquences cardiaques les plus homogènes.

Voir l'exercice corrigé

Teste-toi

Quiz : 6 questions auto-corrigées

Vérifie en quelques minutes que tu as compris ce chapitre. Correction expliquée, score et points à la clé.

Commencer le quiz

Questions fréquentes

Quelle est la différence entre un indicateur de position et un indicateur de dispersion ?
Un indicateur de position (moyenne, médiane, quartiles) résume où se situe le centre de la série : il donne une valeur représentative, par exemple l'âge médian d'une population. Un indicateur de dispersion (étendue, écart interquartile, écart-type) mesure à quel point les valeurs sont étalées autour de ce centre. Deux groupes de patients peuvent avoir le même âge moyen mais des dispersions très différentes : c'est pour cela qu'on a besoin des deux types d'indicateurs pour décrire correctement une série en santé publique.
Comment déterminer le premier et le troisième quartile par la méthode des rangs ?
On range d'abord la série dans l'ordre croissant et on note n l'effectif total. Le premier quartile Q indice 1 est la valeur dont le rang est le plus petit entier supérieur ou égal à n divisé par 4. Le troisième quartile Q indice 3 est la valeur dont le rang est le plus petit entier supérieur ou égal à 3 fois n divisé par 4. Quand le quotient n'est pas entier, on arrondit toujours à l'entier supérieur.
À quoi sert le diagramme en boîte en santé-social ?
Le diagramme en boîte (ou boîte à moustaches) résume une série à l'aide de cinq nombres : le minimum, le premier quartile, la médiane, le troisième quartile et le maximum. La boîte centrale contient la moitié des données (entre Q indice 1 et Q indice 3) et sa largeur correspond à l'écart interquartile. Il permet de comparer rapidement plusieurs populations (durées d'hospitalisation, âges, IMC de deux services) sur un même graphique.