Aller au contenu
Rêves Vision

Terminale STMG · Chapitre 2

Statistiques à deux variables : nuage de points, point moyen et ajustement affine

Cours de Terminale STMG : statistiques à deux variables, nuage de points, point moyen, ajustement affine, droite de régression, interpolation et extrapolation. Exercices corrigés.

8 exercices corrigés · Terminale STMG - mathématiques (programme 2019) · Mis à jour en juin 2026

Jusqu’ici, une série statistique portait sur une seule grandeur (des notes, des tailles…). En statistiques à deux variables, on étudie deux grandeurs mesurées ensemble sur les mêmes individus, par exemple l’année et le chiffre d’affaires d’une entreprise. Le but est de voir s’il existe un lien entre elles et, si oui, de le résumer par une droite qui permet de faire des prévisions.

Ce que tu sauras faire

  • Je sais représenter une série à deux variables par un nuage de points.
  • Je sais calculer les coordonnées du point moyen G(xˉ;yˉ)G(\bar{x}\,;\,\bar{y}).
  • Je sais obtenir l’équation de la droite de régression y=ax+by = ax + b à la calculatrice.
  • Je sais m’en servir pour interpoler et extrapoler une valeur.
  • Je sais expliquer pourquoi une extrapolation lointaine est risquée.

À quoi ça sert ?

Une entreprise note son chiffre d’affaires chaque année. En portant ces données sur un graphique, on voit souvent les points presque alignés : c’est une tendance. Si tu traces la droite qui « colle » le mieux à ces points, tu peux estimer le chiffre d’affaires de l’an prochain, ou retrouver une valeur manquante. C’est exactement ce que font les services marketing pour relier un budget publicitaire aux ventes qu’il génère, et décider combien investir.

Série à deux variables et nuage de points

Série à deux variables et nuage de points

Une série statistique à deux variables associe à chaque individu un couple de valeurs (xi;yi)(x_i\,;\,y_i) : xx et yy sont les deux variables étudiées.

En représentant chaque couple par un point de coordonnées (xi;yi)(x_i\,;\,y_i) dans un repère, on obtient le nuage de points de la série. Sa forme renseigne sur le lien entre xx et yy : si les points sont presque alignés, on peut résumer la tendance par une droite.

Le point moyen

Point moyen G

Le point moyen du nuage est le point GG dont les coordonnées sont les moyennes des deux variables : G(xˉ;yˉ)avecxˉ=xinetyˉ=yinG(\bar{x}\,;\,\bar{y}) \quad \text{avec} \quad \bar{x} = \frac{\sum x_i}{n} \quad \text{et} \quad \bar{y} = \frac{\sum y_i}{n}nn est le nombre de couples. Le point moyen est en quelque sorte le « centre de gravité » du nuage : il appartient toujours à la droite de régression.

Calculer les coordonnées de G

  1. Calculer la moyenne des abscisses : xˉ=xin\bar{x} = \dfrac{\sum x_i}{n}.
  2. Calculer la moyenne des ordonnées : yˉ=yin\bar{y} = \dfrac{\sum y_i}{n}.
  3. Écrire le point moyen G(xˉ;yˉ)G(\bar{x}\,;\,\bar{y}).

Vérifie toujours que tu divises par le même nombre nn de couples pour les deux moyennes.

La droite de régression

Ajustement affine et droite de régression

Quand le nuage est presque aligné, on l’ajuste par une droite : c’est l’ajustement affine. La droite de régression de yy en xx a pour équation : y=ax+by = ax + b On l’obtient à la calculatrice par la méthode des moindres carrés : c’est la droite qui rend la somme des carrés des écarts entre les points et la droite la plus petite possible. C’est donc la droite qui « colle » le mieux au nuage. Elle passe par le point moyen GG.

Obtenir y = ax + b à la calculatrice

  1. Entrer les valeurs de xx dans une première liste, celles de yy dans une seconde liste (même ordre).
  2. Choisir le calcul de régression linéaire (souvent noté ax+bax+b).
  3. Lire les coefficients aa (le coefficient directeur) et bb (l’ordonnée à l’origine).
  4. Arrondir aa et bb à la précision demandée, puis écrire l’équation y=ax+by = ax + b.

Pense à vérifier ton équation : en remplaçant xx par xˉ\bar{x}, tu dois retrouver (à l’arrondi près) la valeur yˉ\bar{y}, car la droite passe par GG.

Exemple : chiffre d'affaires d'une entreprise

Une entreprise relève son chiffre d’affaires (en milliers d’euros) selon le rang de l’année xx (année 1 = 11, etc.) :

Rang xix_i1122334455
CA yiy_i (k€)32323535393942424747

Point moyen. xˉ=1+2+3+4+55=155=3\bar{x} = \dfrac{1+2+3+4+5}{5} = \dfrac{15}{5} = 3 et yˉ=32+35+39+42+475=1955=39.\bar{y} = \dfrac{32+35+39+42+47}{5} = \dfrac{195}{5} = 39. Donc G(3;39).G(3\,;\,39).

Droite de régression. La calculatrice donne y=3,7x+27,9y = 3{,}7x + 27{,}9 (coefficients arrondis au dixième). On vérifie : pour x=3x = 3, y=3,7×3+27,9=11,1+27,9=39y = 3{,}7 \times 3 + 27{,}9 = 11{,}1 + 27{,}9 = 39, soit bien yˉ\bar{y} : la droite passe par GG.

Prévision (extrapolation). Pour l’année de rang x=6x = 6 : y=3,7×6+27,9=22,2+27,9=50,1.y = 3{,}7 \times 6 + 27{,}9 = 22{,}2 + 27{,}9 = 50{,}1. On estime le chiffre d’affaires à environ 50,150{,}1 k€, soit 5010050\,100 €.

Interpolation et extrapolation

Interpoler ou extrapoler avec la droite

Une fois la droite y=ax+by = ax + b obtenue, on l’utilise pour estimer une valeur :

  • Interpolation : on estime yy pour un xx situé à l’intérieur de la plage des données observées (entre la plus petite et la plus grande abscisse). L’estimation est en général fiable.
  • Extrapolation : on estime yy pour un xx situé en dehors de cette plage (par exemple plusieurs années plus tard). L’estimation est plus risquée.

Dans les deux cas, on remplace xx par sa valeur dans l’équation et on calcule yy.

Les limites de l'extrapolation

Un ajustement affine ne reflète qu’une tendance observée sur une période donnée. Rien ne garantit qu’elle se poursuive : un marché peut se saturer, une crise peut tout changer. Plus on s’éloigne de la plage des données, moins l’estimation est fiable. L’extrapolation lointaine donne donc un ordre de grandeur, à interpréter avec prudence, jamais une certitude.

Le repère « dedans / dehors »

Pour savoir si tu interpoles ou extrapoles, repère les valeurs extrêmes de xx dans le tableau. Si le xx demandé est entre ces deux bornes, c’est une interpolation (fiable). S’il est avant la première ou après la dernière, c’est une extrapolation (prudence). Une phrase de bon sens : « j’estime à l’intérieur de ce que j’ai mesuré, je devine à l’extérieur ».

Les pièges classiques

  • FAUX : « le point moyen, c’est le point le plus haut du nuage ». VRAI : GG a pour coordonnées les moyennes xˉ\bar{x} et yˉ\bar{y} ; ce n’est pas forcément un point du nuage.
  • FAUX : annoncer une prévision lointaine comme une certitude. VRAI : une extrapolation n’est qu’une estimation, d’autant moins fiable qu’on s’éloigne des données.
  • FAUX : confondre aa et bb dans y=ax+by = ax + b. VRAI : aa est le coefficient directeur (multiplie xx), bb est l’ordonnée à l’origine (terme constant).
  • FAUX : utiliser l’année complète (20242024) comme xx si l’énoncé donne un rang (1,2,3...1, 2, 3...). VRAI : reprends exactement la variable xx utilisée pour construire la droite.

Exercices corrigés

Du plus simple au plus exigeant. Cherche d'abord seul, puis déroule le corrigé détaillé.

Gratuit · corrigé

Abonnés TikTok : estimer avec la droite de régression

Un créateur de contenu suit le nombre d'abonnés (en milliers) de son compte TikTok au fil des semaines. La variable xx est le rang de la semaine et les données vont de la semaine 11 à la semaine 1010. La calculatrice donne la droite de régression d'équation y=1,4x+8,5.y = 1{,}4x + 8{,}5. a. Estimer le nombre d'abonnés à la semaine de rang 66. b. Estimer le nombre d'abonnés à la semaine de rang 1414, et préciser s'il s'agit d'une interpolation ou d'une extrapolation.

Voir l'exercice corrigé
Gratuit · corrigé

Calculer les coordonnées du point moyen

Un magasin relève son chiffre d'affaires annuel (en milliers d'euros) selon le rang de l'année. On obtient la série de couples (xi;yi)(x_i\,;\,y_i) suivante : (1;18)(1\,;\,18), (2;21)(2\,;\,21), (3;25)(3\,;\,25), (4;28)(4\,;\,28), (5;33)(5\,;\,33), où xx est le rang de l'année et yy le chiffre d'affaires. Déterminer les coordonnées du point moyen GG de cette série.

Voir l'exercice corrigé
Gratuit · corrigé

Utiliser une droite de régression pour estimer une valeur

Une entreprise a étudié le lien entre son budget publicitaire xx (en milliers d'euros) et ses ventes yy (en milliers d'euros). Les données vont d'un budget de 11 à un budget de 1010 (en milliers d'euros). La calculatrice donne la droite de régression d'équation y=2,5x+30.y = 2{,}5x + 30. a. Estimer les ventes pour un budget de 88 milliers d'euros. b. Estimer les ventes pour un budget de 1515 milliers d'euros, et préciser s'il s'agit d'une interpolation ou d'une extrapolation.

Voir l'exercice corrigé
Gratuit · corrigé

Budget publicitaire et ventes : interpolation et extrapolation

Le service marketing d'une marque compare son budget publicitaire xx (en milliers d'euros) et ses ventes yy (en milliers d'euros) sur 55 mois : (1;55)(1\,;\,55), (2;62)(2\,;\,62), (3;70)(3\,;\,70), (4;78)(4\,;\,78), (5;85)(5\,;\,85). La calculatrice donne la droite de régression y=7,6x+47,2y = 7{,}6x + 47{,}2 (coefficients arrondis au dixième). a. Calculer les coordonnées du point moyen GG. b. Estimer les ventes pour un budget de 4,54{,}5 milliers d'euros (interpolation). c. Estimer les ventes pour un budget de 99 milliers d'euros, et indiquer pourquoi cette estimation doit être prise avec prudence.

Voir l'exercice corrigé
Gratuit · corrigé

Food truck : point moyen et prévision du chiffre d'affaires

Un food truck installé près d'un lycée suit son chiffre d'affaires hebdomadaire (en euros) selon le rang de la semaine xx, sur ses 55 premières semaines d'activité : (1;210)(1\,;\,210), (2;235)(2\,;\,235), (3;255)(3\,;\,255), (4;282)(4\,;\,282), (5;308)(5\,;\,308). La calculatrice donne la droite de régression y=24,3x+185,1y = 24{,}3x + 185{,}1 (coefficients arrondis au dixième). a. Calculer les coordonnées du point moyen GG. b. Vérifier que la droite de régression passe par GG. c. Estimer le chiffre d'affaires à la semaine de rang 4,54{,}5. d. Estimer le chiffre d'affaires à la semaine de rang 77, et indiquer pourquoi cette estimation doit être prise avec prudence.

Voir l'exercice corrigé
Gratuit · corrigé

Point moyen puis interpolation du chiffre d'affaires

Une librairie suit son chiffre d'affaires annuel (en milliers d'euros) sur 55 ans, selon le rang de l'année xx : (1;24)(1\,;\,24), (2;27)(2\,;\,27), (3;31)(3\,;\,31), (4;35)(4\,;\,35), (5;38)(5\,;\,38). La calculatrice donne la droite de régression y=3,6x+20,2y = 3{,}6x + 20{,}2 (coefficients arrondis au dixième). a. Déterminer les coordonnées du point moyen GG. b. Vérifier que la droite de régression passe par GG. c. Estimer le chiffre d'affaires de l'année de rang x=3,5x = 3{,}5.

Voir l'exercice corrigé
Bonus

Étude complète du chiffre d'affaires d'une start-up (problème)

Une start-up suit son chiffre d'affaires annuel (en milliers d'euros) sur ses 55 premières années, selon le rang de l'année xx : (1;150)(1\,;\,150), (2;165)(2\,;\,165), (3;182)(3\,;\,182), (4;196)(4\,;\,196), (5;212)(5\,;\,212). La calculatrice donne la droite de régression y=15,5x+134,5y = 15{,}5x + 134{,}5 (coefficients arrondis au dixième). a. Calculer les coordonnées du point moyen GG et vérifier que la droite passe par GG. b. Estimer le chiffre d'affaires de la 4e4^\text{e} année et demie (x=4,5x = 4{,}5). c. Estimer le chiffre d'affaires de la 8e8^\text{e} année. d. Le dirigeant en déduit qu'à la 20e20^\text{e} année, le chiffre d'affaires dépassera 440440 k€. Que penser de cette affirmation ?

Débloquer l'exercice
Gratuit · corrigé

Revente de sneakers : étude complète et seuil à atteindre

Un lycéen revend des paires de sneakers en ligne et suit le nombre de paires vendues chaque mois selon le rang du mois xx, sur ses 55 premiers mois : (1;40)(1\,;\,40), (2;52)(2\,;\,52), (3;61)(3\,;\,61), (4;73)(4\,;\,73), (5;84)(5\,;\,84). La calculatrice donne la droite de régression y=10,9x+29,3y = 10{,}9x + 29{,}3 (coefficients arrondis au dixième). a. Calculer les coordonnées du point moyen GG et vérifier que la droite passe par GG. b. Estimer le nombre de paires vendues au mois de rang 2,52{,}5. c. Estimer le nombre de paires vendues au mois de rang 88. d. En supposant la tendance maintenue, déterminer à partir de quel rang de mois le nombre de paires vendues dépasserait 150150. e. Ce lycéen affirme : « à ce rythme, je vendrai plus de 150150 paires par mois. » Que penser de cette affirmation ?

Voir l'exercice corrigé

Teste-toi

Quiz : 6 questions auto-corrigées

Vérifie en quelques minutes que tu as compris ce chapitre. Correction expliquée, score et points à la clé.

Commencer le quiz

Questions fréquentes

Comment calculer les coordonnées du point moyen G ?
Le point moyen G a pour abscisse la moyenne des valeurs de x et pour ordonnée la moyenne des valeurs de y. On note G de coordonnées x barre et y barre. Par exemple, si les abscisses ont pour moyenne 3 et les ordonnées pour moyenne 25, alors G a pour coordonnées (3 ; 25). Le point moyen appartient toujours à la droite de régression.
Quelle est la différence entre interpolation et extrapolation ?
Interpoler, c'est utiliser la droite de régression pour estimer une valeur à l'intérieur de la plage des données observées. Extrapoler, c'est l'utiliser pour estimer une valeur en dehors de cette plage, par exemple plusieurs années après les dernières données. L'extrapolation est beaucoup moins fiable, car rien ne garantit que la tendance se prolonge.
Comment obtient-on la droite de régression à la calculatrice ?
On entre les valeurs de x et de y dans deux listes, puis on demande la régression linéaire (parfois notée a x plus b ou régression linéaire). La calculatrice applique la méthode des moindres carrés et affiche les coefficients a et b de la droite d'équation y égale a x plus b. On arrondit ensuite a et b selon la précision demandée.