Une boutique relève ses ventes chaque année, une chaîne de streaming compte ses abonnés chaque mois : on obtient à chaque fois deux séries de nombres liées. En les plaçant sur un graphique, on forme un nuage de points. Tout l’enjeu de ce chapitre est de résumer ce nuage par une courbe simple - une droite quand c’est possible - pour ensuite prévoir une valeur manquante ou future. Et quand le nuage est trop courbé pour une droite, un changement de variable permet de se ramener malgré tout à un ajustement affine.
Mes objectifs
À la fin de ce chapitre, je sais :
- lire et interpréter un nuage de points ajusté pour interpoler ou extrapoler une valeur ;
- choisir, au tableur, l’ajustement le plus adapté à la forme d’un nuage (affine, exponentiel…) ;
- réaliser un changement de variable (X=lnx, Y=lny ou X=x1) pour me ramener à un ajustement affine ;
- comparer deux ajustements grâce au coefficient de détermination R2 et juger de la fiabilité d’une prévision.
À quoi ça sert ?
Imagine que ta boutique en ligne a vendu pour 8000 €, puis 10000 €, puis 13000 € sur trois ans. Combien viseras-tu l’an prochain pour ton stock et ta trésorerie ? Tu ne vas pas répondre au hasard : tu traces le nuage, tu repères la tendance, et tu la prolonges. C’est exactement ce que font les commerciaux, les gestionnaires de stock ou les responsables de production pour anticiper. Savoir ajuster un nuage, c’est transformer un tableau de chiffres en une prévision que tu peux défendre.
1. Nuage de points et ajustement
Série statistique à deux variables, nuage de points
On étudie deux grandeurs mesurées sur les mêmes individus : une variable x (par exemple l’année) et une variable y (par exemple le chiffre d’affaires). Chaque couple (xi;yi) se représente par un point dans un repère. L’ensemble de ces points forme le nuage de points de la série.
Ajuster un nuage
Ajuster un nuage, c’est trouver une fonction simple dont la courbe passe « au plus près » de tous les points. Cette courbe d’ajustement résume la série et sert ensuite à faire des prévisions.
- Si les points sont à peu près alignés, on choisit un ajustement affine : la courbe est une droite d’équation y=ax+b.
- Si les points dessinent une courbe (montée de plus en plus rapide, ou au contraire qui s’aplatit), un ajustement affine n’est pas adapté : on cherche un autre modèle (par exemple exponentiel, y=k×qx).
Choisir la forme de l'ajustement
Avant tout calcul, regarde la forme du nuage :
- les points montent (ou descendent) en ligne presque droite → ajustement affine ;
- les points montent de plus en plus vite (la pente s’accentue) → ajustement exponentiel (y=k×qx) ;
- les points montent puis s’aplatissent (croissance qui ralentit) → ajustement par un logarithme ou par une fonction en x1.
Le bon réflexe : tracer d’abord le nuage, décider de la forme, puis seulement faire calculer l’ajustement par le tableur.
Interpolation et extrapolation
Une fois la courbe d’ajustement obtenue, on s’en sert pour estimer une valeur de y à partir d’une valeur de x :
- interpoler : estimer y pour un x situé à l’intérieur de la plage des données connues (entre deux valeurs déjà observées) ;
- extrapoler : estimer y pour un x situé en dehors de cette plage (avant la première donnée ou, le plus souvent, après la dernière, pour prévoir l’avenir).
Estimer une valeur avec l'ajustement
On connaît l’équation de l’ajustement, par exemple y=1500x+6500 (où x est le rang de l’année).
- Repérer le rang x correspondant à l’année cherchée.
- Remplacer x par sa valeur dans l’équation.
- Calculer y et conclure par une phrase, avec l’unité.
Exemple : pour le rang x=5, on a y=1500×5+6500=7500+6500=14000. On estime donc le chiffre d’affaires à environ 14000 € pour cette année.
Interpoler ou extrapoler : le repère mental
Range tes données connues sur une ligne, de la plus petite à la plus grande valeur de x.
- La valeur cherchée tombe entre deux données → tu interpoles (estimation plutôt sûre).
- La valeur cherchée tombe au-delà de la dernière donnée → tu extrapoles (estimation à prendre avec prudence).
Le piège de l'extrapolation lointaine
FAUX : « L’ajustement donne une équation, donc je peux prévoir les ventes dans 20 ans avec la même fiabilité que l’an prochain. »
VRAI : plus on s’éloigne des données connues, moins la prévision est fiable. Un ajustement décrit la tendance sur la période observée ; rien ne garantit qu’un marché continue de croître au même rythme (concurrence, mode qui passe, saturation). On extrapole sur un horizon court et on précise toujours que le résultat est une estimation qui suppose que la tendance se maintienne.
3. Le coefficient de détermination
Coefficient de détermination $R^2$
Le coefficient de détermination, noté R2, est un nombre compris entre 0 et 1 qui mesure la qualité de l’ajustement : il indique à quel point la courbe colle aux points du nuage.
- R2 proche de 1 : l’ajustement est très bon, les points sont presque tous sur la courbe.
- R2 proche de 0 : l’ajustement est mauvais, la courbe résume mal le nuage.
Comparer deux ajustements
Quand plusieurs modèles sont possibles (par exemple un ajustement affine et un ajustement exponentiel), on les compare grâce à leur coefficient de détermination : on retient celui dont R2 est le plus proche de 1.
Au tableur, on affiche R2 avec la courbe de tendance (option « Afficher le coefficient de détermination ») : il suffit de lire et de comparer les deux valeurs.
Ce que $R^2$ ne dit pas
FAUX : « R2=0,99, donc ma prévision pour dans 10 ans est forcément juste. »
VRAI : un R2 proche de 1 signifie seulement que le modèle colle bien aux données déjà connues. Il ne garantit pas que la tendance se prolongera dans le futur. Un excellent R2 justifie le choix du modèle, pas la fiabilité d’une extrapolation lointaine.
4. Changement de variable
Quand le nuage est trop courbé pour une droite, on ne renonce pas à l’ajustement affine : on transforme les données pour redresser le nuage.
Principe du changement de variable
Un changement de variable consiste à remplacer x ou y par une nouvelle quantité (souvent lnx, lny ou x1) de façon que le nouveau nuage soit, lui, presque aligné. On peut alors lui appliquer un ajustement affine, puis revenir à la variable de départ.
Croissance exponentielle : poser $Y = \ln y$
Si une grandeur y croît de façon exponentielle (y=k×qx, par exemple un nombre d’abonnés qui augmente d’un pourcentage fixe chaque mois), alors la suite des valeurs Y=lny est, elle, à peu près alignée en fonction de x.
On réalise donc l’ajustement affine Y=ax+b, c’est-à-dire lny=ax+b.
Ajuster après changement de variable
On dispose d’un tableau (x;y) dont le nuage est courbé (montée de plus en plus rapide).
- Créer une nouvelle ligne Y=lny : calculer lny pour chaque valeur (à la calculatrice ou au tableur).
- Tracer le nuage (x;Y) et vérifier qu’il est maintenant presque aligné.
- Ajuster ce nouveau nuage par une droite : Y=ax+b (équation donnée par le tableur).
- Utiliser cette droite pour interpoler ou extrapoler une valeur de Y, puis revenir à y si besoin (en repassant de lny à y).
Un changement de variable sur des abonnés
Une chaîne compte ses abonnés (en milliers) au fil des mois (x = rang du mois) :
| x | 1 | 2 | 3 | 4 |
|---|
| y | 20 | 30 | 45 | 68 |
Le nuage monte de plus en plus vite : pas de droite possible directement. On pose Y=lny :
| x | 1 | 2 | 3 | 4 |
|---|
| Y=lny | 3,00 | 3,40 | 3,81 | 4,22 |
Cette fois, Y augmente d’environ 0,40 à chaque mois : le nuage (x;Y) est presque aligné. On peut donc l’ajuster par une droite Y=ax+b et travailler sur les abonnés transformés.
Autre cas fréquent : poser $X = \frac{1}{x}$
Lorsqu’une grandeur y diminue puis s’aplatit quand x augmente (par exemple un coût unitaire qui baisse quand on produit plus), le changement de variable X=x1 rend souvent le nuage (X;y) presque aligné. On ajuste alors par une droite y=aX+b, c’est-à-dire y=a×x1+b.
Ne pas oublier de revenir à la variable de départ
FAUX : après avoir trouvé Y=0,40x+2,60 avec Y=lny, répondre « le nombre d’abonnés au mois 6 est Y=0,40×6+2,60=5,00 ».
VRAI : 5,00 est la valeur de Y=lny, pas celle de y ! Il faut revenir à y en utilisant y=eY. Ici y=e5,00≈148, soit environ 148 milliers d’abonnés. Tant que tu travailles avec lny, ton résultat est un logarithme, pas la grandeur réelle.
Quel changement de variable choisir ?
- Nuage qui monte de plus en plus vite (croissance par pourcentage) → pose Y=lny.
- Nuage qui descend et s’aplatit quand x grandit → pose X=x1.
Dans les deux cas, l’objectif est le même : obtenir un nuage aligné pour pouvoir faire un ajustement affine, qui est le plus simple à exploiter.