Aller au contenu
Rêves Vision

Première pro · Chapitre 1

Statistique à deux variables

Cours de Première pro : nuage de points, droite d'ajustement affine par les moindres carrés au tableur, interpolation, extrapolation et coefficient de détermination. Exercices corrigés.

8 exercices corrigés · Première professionnelle - mathématiques · Mis à jour en juin 2026

Le budget de publicité d’une boutique influence-t-il vraiment son chiffre d’affaires ? Plus on embauche de vendeurs, plus on vend ? Pour répondre, on ne se contente plus d’une seule série de chiffres : on étudie deux variables en même temps. On les place dans un repère pour obtenir un nuage de points, on trace la droite qui passe au plus près de ce nuage, et on s’en sert pour estimer et prévoir. C’est l’outil de base de tous les métiers du commerce et de la gestion.

Ce que je dois savoir faire

À la fin de ce chapitre, je sais :

  • représenter un nuage de points au tableur à partir d’un tableau de valeurs ;
  • lire une information sur un nuage de points déjà tracé ;
  • obtenir l’équation y=ax+by = ax + b de la droite d’ajustement affine avec un outil numérique (tableur, calculatrice) ;
  • interpoler (estimer une valeur à l’intérieur des données) et extrapoler (prévoir au delà) ;
  • lire le coefficient de détermination R2R^2 et juger si un ajustement affine est pertinent.

À quoi ça sert dans ton futur métier

Imagine que tu gères une boutique de sneakers. Chaque mois, tu notes combien tu dépenses en publicité et combien tu vends. Ton responsable te demande : « Si on met 400 €400\ \text{€} de pub le mois prochain, on peut espérer combien de chiffre d’affaires ? ».

Tu ne vas pas répondre au hasard. Tu vas placer tes mois passés sous forme de points, tracer la droite de tendance, puis lire ou calculer la prévision sur cette droite. La statistique à deux variables, c’est exactement ça : transformer un historique de chiffres en une prévision chiffrée sur laquelle on peut s’appuyer pour décider.

Série à deux variables et nuage de points

On étudie une série statistique à deux variables quand on relève deux nombres pour chaque individu : une valeur xx pour la première variable et une valeur yy pour la seconde. On obtient ainsi des couples (x ; y)(x \ ; \ y).

Le nuage de points est la représentation de tous ces couples dans un repère : pour chaque couple, on place le point d’abscisse xx et d’ordonnée yy.

Par exemple, si en mars le budget pub est 300 €300\ \text{€} et le chiffre d’affaires 25 000 €25\ 000\ \text{€}, on place le point (300 ; 25)(300 \ ; \ 25) (le chiffre d’affaires étant compté en milliers d’euros).

Tracer un nuage de points au tableur

  1. Saisir les données dans deux colonnes : une colonne pour les valeurs de xx, une colonne pour les valeurs de yy, en respectant l’ordre (chaque ligne est un couple).
  2. Sélectionner les deux colonnes de nombres.
  3. Insérer un graphique de type nuage de points (aussi appelé « XY (dispersion) » ou « nuage de points seuls », sans relier les points par des segments).
  4. Titrer les axes (la grandeur et son unité) pour que le graphique soit lisible.

Le premier critère pour choisir un nuage de points plutôt qu’une courbe : les points ne doivent pas être reliés, car chaque mois est une mesure indépendante.

Ajustement affine et droite des moindres carrés

Quand les points d’un nuage sont à peu près alignés, on peut les résumer par une droite : on parle d’ajustement affine. Cette droite a une équation de la forme :

y=ax+by = ax + b

aa est le coefficient directeur (la pente) et bb l’ordonnée à l’origine.

Parmi toutes les droites possibles, on retient celle qui passe au plus près de l’ensemble des points : la droite d’ajustement par la méthode des moindres carrés. On la détermine avec un outil numérique (tableur ou calculatrice), jamais à la main à ce niveau.

Obtenir l'équation de la droite d'ajustement au tableur

  1. Tracer d’abord le nuage de points (deux colonnes, graphique XY).
  2. Faire un clic droit sur un point du nuage, puis choisir « Ajouter une courbe de tendance ».
  3. Sélectionner le type « linéaire » (c’est l’ajustement affine).
  4. Cocher les options « Afficher l’équation » et « Afficher le coefficient de détermination R2R^2 ».
  5. Lire l’équation affichée, de la forme y=ax+by = ax + b, et arrondir les coefficients comme demandé (souvent au dixième ou au centième).

On utilise ensuite cette équation pour estimer un yy à partir d’un xx, ou l’inverse.

Interpolation et extrapolation

Une fois l’équation y=ax+by = ax + b obtenue, on remplace une valeur dans l’équation pour en estimer une autre. On distingue deux situations :

  • l’interpolation : on estime une valeur à l’intérieur de la plage des données connues (entre la plus petite et la plus grande valeur mesurée) ;
  • l’extrapolation : on estime une valeur en dehors de cette plage (par exemple le mois suivant, une valeur plus grande que toutes celles mesurées).

L’interpolation est fiable. L’extrapolation est plus risquée : rien ne garantit que la tendance observée se poursuive de la même manière.

Interpoler puis extrapoler sur un exemple

Une boutique a relevé le chiffre d’affaires yy (en milliers d’euros) selon le nombre xx de vendeurs. Le tableur donne la droite d’ajustement :

y=12,9x+8,4y = 12{,}9 \, x + 8{,}4

Interpolation (estimer pour x=5x = 5 vendeurs, valeur comprise entre celles mesurées) : y=12,9×5+8,4=64,5+8,4=72,9 milliers d’euros.y = 12{,}9 \times 5 + 8{,}4 = 64{,}5 + 8{,}4 = 72{,}9 \text{ milliers d'euros.}

Extrapolation (prévoir pour x=9x = 9 vendeurs, au delà des données) : y=12,9×9+8,4=116,1+8,4=124,5 milliers d’euros.y = 12{,}9 \times 9 + 8{,}4 = 116{,}1 + 8{,}4 = 124{,}5 \text{ milliers d'euros.}

Cette dernière valeur est une prévision : on la donne avec prudence.

Le coefficient de détermination

Le coefficient de détermination, noté R2R^2, est un nombre compris entre 00 et 11 fourni par le tableur ou la calculatrice. Il mesure à quel point les points du nuage sont proches de la droite d’ajustement.

0R210 \leq R^2 \leq 1

  • Plus R2R^2 est proche de 11, mieux les points sont alignés : l’ajustement affine est pertinent, les estimations sont fiables.
  • Plus R2R^2 est proche de 00, plus les points sont dispersés : une droite est mal adaptée pour résumer les données.

Juger la pertinence d'un ajustement affine

On regarde la valeur de R2R^2 pour décider si l’on a le droit de se fier à la droite d’ajustement :

  • R2R^2 proche de 11 (par exemple 0,950{,}95) : le nuage est bien aligné, l’ajustement affine est justifié ;
  • R2R^2 proche de 00 (par exemple 0,300{,}30) : le nuage est trop dispersé, l’ajustement affine n’est pas pertinent, et une prévision faite avec cette droite serait peu fiable.

Pour comparer deux jeux de données, on choisit comme « mieux ajustable » par une droite celui dont le R2R^2 est le plus proche de 11.

Le réflexe du coup d'oeil

Avant même de regarder R2R^2, observe le nuage : si les points dessinent grossièrement une bande allongée qui monte (ou descend) régulièrement, une droite a du sens. S’ils sont éparpillés en tous sens, aucune droite ne les résumera bien, et le tableur te confirmera un R2R^2 faible.

Les pièges à éviter

  • Relier les points du nuage. On joint les points par des segments comme pour une courbe. FAUX. Dans un nuage de points, chaque mesure est indépendante : on laisse les points seuls, sans les relier. C’est la droite d’ajustement, et elle seule, qui traverse le nuage.
  • Confondre aa et bb dans l’équation. On lit y=8,4x+12,9y = 8{,}4\,x + 12{,}9 alors que le tableur affiche y=12,9x+8,4y = 12{,}9\,x + 8{,}4. FAUX. Le coefficient directeur aa est le nombre multiplié par xx ; l’ordonnée à l’origine bb est le nombre seul. Une inversion fausse toutes les estimations.
  • Croire qu’extrapoler est aussi sûr qu’interpoler. Une estimation à l’intérieur des données est fiable ; une prévision au delà reste une hypothèse : la tendance peut changer (saturation du marché, saison…).
  • Conclure sans regarder R2R^2. Une droite peut toujours être tracée par le tableur, même sur un nuage en désordre. Tant que R2R^2 n’est pas proche de 11, l’ajustement affine n’est pas justifié et les prévisions sont à prendre avec des pincettes.

Exercices corrigés

Du plus simple au plus exigeant. Cherche d'abord seul, puis déroule le corrigé détaillé.

Gratuit · corrigé

Lire et interpréter le nuage de points d'un food-truck

Un food-truck installé sur un marché note, chaque midi pendant 66 jours, la température xx (en degrés Celsius) et le nombre yy de boissons fraîches vendues. On a tracé le nuage de points correspondant aux couples (x ; y)(x \ ; \ y) suivants :

| Température xx (°C) | 1212 | 1515 | 1818 | 2222 | 2626 | 3030 |
| --- | --- | --- | --- | --- | --- | --- |
| Boissons fraîches yy | 2424 | 3333 | 4141 | 5252 | 6363 | 7474 |

1. Donner les coordonnées des points correspondant au jour le plus froid et au jour le plus chaud.
2. Sans aucun calcul, en observant la forme du nuage, dire si les deux variables semblent liées et si une droite d'ajustement aurait du sens.

Voir l'exercice corrigé
Gratuit · corrigé

Lire un chiffre d'affaires sur un nuage déjà tracé

Sur le graphique d'une boutique, on a tracé le nuage de points (budget publicitaire xx en euros, chiffre d'affaires yy en milliers d'euros) ainsi que sa droite d'ajustement affine. Cette droite passe par les points (100 ; 12)(100 \ ; \ 12) et (500 ; 36)(500 \ ; \ 36), repérables sur le quadrillage.

1. En lisant sur la droite, estimer le chiffre d'affaires correspondant à un budget publicitaire de 300 €300\ \text{€}.
2. S'agit-il d'une interpolation ou d'une extrapolation ?

Voir l'exercice corrigé
Gratuit · corrigé

Tracer le nuage de points d'une boutique au tableur

Une boutique de vêtements relève chaque mois son budget publicitaire xx (en euros) et son chiffre d'affaires yy (en milliers d'euros) pendant 88 mois.

| Mois | Janv. | Févr. | Mars | Avril | Mai | Juin | Juil. | Août |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| Budget pub xx (€) | 200200 | 250250 | 300300 | 350350 | 400400 | 450450 | 500500 | 550550 |
| Chiffre d'affaires yy (k€) | 1818 | 2121 | 2525 | 2626 | 3131 | 3333 | 3636 | 4040 |

1. Expliquer comment saisir ces données et tracer le nuage de points au tableur.
2. Donner les coordonnées des points correspondant aux mois de mars et de juin.
3. Le nuage suggère-t-il un lien entre le budget publicitaire et le chiffre d'affaires ?

Voir l'exercice corrigé
Gratuit · corrigé

Prévoir les ventes de sneakers du mois prochain

Un magasin suit le nombre de paires de sneakers d'un nouveau modèle vendues chaque mois depuis sa sortie. Le mois est noté xx (x=1x = 1 pour le premier mois) et le nombre de paires vendues est noté yy.

| Mois xx | 11 | 22 | 33 | 44 | 55 | 66 |
| --- | --- | --- | --- | --- | --- | --- |
| Paires vendues yy | 5858 | 6767 | 7979 | 8888 | 101101 | 110110 |

Le tableur fournit la droite d'ajustement affine (coefficients arrondis au dixième) :
y=10,6x+46,7.y = 10{,}6 \, x + 46{,}7.

1. Estimer le nombre de paires qui seront vendues le 7e7^\text{e} mois.
2. Cette estimation est-elle une interpolation ou une extrapolation ? Avec quelle prudence faut-il la considérer ?

Voir l'exercice corrigé
Gratuit · corrigé

Retrouver le nombre de vidéos à publier pour un objectif d'abonnés

Une créatrice de contenu suit l'évolution de sa chaîne. Chaque mois, elle note le nombre xx de vidéos publiées et le nombre yy de nouveaux abonnés gagnés (en centaines).

| Vidéos publiées xx | 88 | 1212 | 1616 | 2020 | 2424 | 2828 |
| --- | --- | --- | --- | --- | --- | --- |
| Nouveaux abonnés yy (centaines) | 5858 | 7272 | 7979 | 9191 | 9898 | 112112 |

Le tableur fournit la droite d'ajustement affine (coefficients arrondis au dixième) :
y=2,5x+40.y = 2{,}5 \, x + 40.

1. Combien de nouveaux abonnés (en centaines) peut-elle espérer en publiant 1818 vidéos dans le mois ?
2. Elle s'est fixé un objectif de 115115 centaines de nouveaux abonnés (soit 11 50011\ 500 abonnés). Combien de vidéos doit-elle publier d'après la droite d'ajustement ? S'agit-il d'une interpolation ?

Voir l'exercice corrigé
Gratuit · corrigé

Trouver la droite d'ajustement vendeurs / chiffre d'affaires et interpoler

Le responsable d'une enseigne compare ses magasins. Pour chacun, il note le nombre xx de vendeurs et le chiffre d'affaires mensuel yy (en milliers d'euros).

| Nombre de vendeurs xx | 22 | 33 | 44 | 66 | 77 | 88 |
| --- | --- | --- | --- | --- | --- | --- |
| Chiffre d'affaires yy (k€) | 3434 | 4848 | 5959 | 8787 | 9898 | 112112 |

Le tableur, après ajustement affine, affiche l'équation de la droite des moindres carrés (coefficients arrondis au dixième) :
y=12,9x+8,4.y = 12{,}9 \, x + 8{,}4.

1. Que représentent les nombres 12,912{,}9 et 8,48{,}4 dans cette équation ?
2. À l'aide de cette droite, estimer le chiffre d'affaires d'un magasin de 55 vendeurs. S'agit-il d'une interpolation ?

Voir l'exercice corrigé
Gratuit · corrigé

Budget de publicité et joueurs actifs : étude complète

Un studio indépendant lance un jeu sur une plateforme en ligne. Chaque semaine, il fait varier le budget xx consacré à la publicité (en euros) et relève le nombre yy de joueurs actifs (en milliers).

| Budget pub xx (€) | 100100 | 200200 | 300300 | 400400 | 500500 | 600600 |
| --- | --- | --- | --- | --- | --- | --- |
| Joueurs actifs yy (milliers) | 2626 | 4343 | 5555 | 7474 | 8686 | 103103 |

Le tableur, après ajustement affine, affiche :
y=0,15x+12avecR20,96.y = 0{,}15 \, x + 12 \qquad \text{avec} \qquad R^2 \approx 0{,}96.

1. Interpréter le coefficient directeur 0,150{,}15 et juger, grâce à R2R^2, si l'ajustement affine est pertinent.
2. Estimer le nombre de joueurs actifs pour un budget de 350 €350\ \text{€}. Interpolation ou extrapolation ?
3. Le studio envisage un budget exceptionnel de 800 €800\ \text{€}. Prévoir le nombre de joueurs actifs et préciser avec quelle prudence considérer ce résultat.
4. Le studio vise 9090 milliers de joueurs actifs. Quel budget publicitaire faut-il prévoir d'après la droite d'ajustement ?

Voir l'exercice corrigé
Bonus

Comparer deux jeux de données avec le coefficient de détermination

Une responsable d'enseigne veut savoir laquelle de deux dépenses justifie le mieux un ajustement affine pour prévoir le chiffre d'affaires yy (en milliers d'euros). Elle teste deux jeux de données portant chacun sur 55 relevés.

Jeu A - budget publicité xx (en milliers d'euros) :

| xx | 11 | 22 | 33 | 44 | 55 |
| --- | --- | --- | --- | --- | --- |
| yy | 2020 | 3232 | 3838 | 5252 | 5858 |

Jeu B - nombre de publications sur les réseaux xx :

| xx | 11 | 22 | 33 | 44 | 55 |
| --- | --- | --- | --- | --- | --- |
| yy | 3535 | 2828 | 5252 | 4040 | 6060 |

Pour chaque jeu, le tableur affiche la droite d'ajustement et son coefficient de détermination :
- Jeu A : y=9,6x+11,2y = 9{,}6 \, x + 11{,}2 avec R20,98R^2 \approx 0{,}98 ;
- Jeu B : y=6,2x+24,4y = 6{,}2 \, x + 24{,}4 avec R20,58R^2 \approx 0{,}58.

1. Rappeler ce que mesure le coefficient de détermination R2R^2 et entre quelles valeurs il se situe.
2. Pour chaque jeu, dire si l'ajustement affine est pertinent.
3. Conclure : lequel des deux jeux justifie le mieux un ajustement affine ? La responsable peut-elle se fier à une prévision faite à partir du jeu B ?

Débloquer l'exercice

Teste-toi

Quiz : 6 questions auto-corrigées

Vérifie en quelques minutes que tu as compris ce chapitre. Correction expliquée, score et points à la clé.

Commencer le quiz

Questions fréquentes

Qu'est-ce qu'un nuage de points en statistique à deux variables ?
Quand on relève deux nombres pour chaque individu, par exemple le budget publicitaire d'un mois et le chiffre d'affaires de ce même mois, on obtient des couples de valeurs. Chaque couple se représente par un point dans un repère : l'abscisse est la première variable, l'ordonnée est la seconde. L'ensemble de tous ces points forme le nuage de points. Il permet de voir d'un coup d'oeil s'il existe un lien entre les deux variables et si ce lien ressemble à une droite.
Quelle est la différence entre interpoler et extrapoler ?
Interpoler, c'est utiliser la droite d'ajustement pour estimer une valeur située à l'intérieur de la plage des données déjà connues, par exemple entre le premier et le dernier mois mesurés. Extrapoler, c'est au contraire estimer une valeur en dehors de cette plage, par exemple prévoir le mois suivant. L'interpolation est en général fiable, alors que l'extrapolation est plus risquée car rien ne garantit que la tendance se poursuive de la même façon.
À quoi sert le coefficient de détermination ?
Le coefficient de détermination, noté R deux, est un nombre compris entre 0 et 1 calculé par le tableur ou la calculatrice. Il mesure à quel point les points du nuage sont proches de la droite d'ajustement. Plus il est proche de 1, plus le nuage est bien aligné et plus l'ajustement affine est pertinent et digne de confiance pour faire des estimations. Plus il est proche de 0, moins une droite est adaptée pour résumer les données.