En STI2D, tu mesures sans arrêt deux grandeurs qui varient ensemble : la résistance d’un capteur selon la température, la tension aux bornes d’une LED selon sa luminosité, la puissance d’un signal selon la longueur de câble. Les statistiques à deux variables servent à résumer ces mesures par une droite et à prédire une valeur que tu n’as pas mesurée. C’est l’outil de base de l’étalonnage d’un capteur.
Ce que tu sauras faire
- Je sais représenter un nuage de points à partir d’un tableau de mesures.
- Je sais calculer et placer le point moyen G(xˉ;yˉ).
- Je sais obtenir l’équation de la droite des moindres carrés y=ax+b à la calculatrice.
- Je sais m’en servir pour prédire une valeur (interpolation ou extrapolation).
- Je sais interpréter le coefficient de corrélation r pour juger la qualité d’un ajustement.
À quoi ça sert ?
Un capteur ne te donne jamais directement la grandeur que tu veux : il sort une tension, une résistance, un courant. Pour t’en servir, il faut l’étalonner, c’est-à-dire trouver la relation entre ce qu’il mesure et ce qu’il affiche. Cette relation est très souvent affine, et la droite des moindres carrés est exactement ce qui la résume. Ensuite, quand le capteur t’envoie une valeur, tu remontes à la grandeur réelle. Même logique quand tu regardes les vues d’une chaîne qui montent semaine après semaine : tu peux estimer la tendance et prévoir la suite.
1. Nuage de points et point moyen
Une série statistique à deux variables associe, à chaque individu (ici chaque mesure), un couple de valeurs (x;y). La variable x est en abscisse, la variable y en ordonnée.
Nuage de points
On considère n couples de mesures (x1;y1),(x2;y2),…,(xn;yn).
Le nuage de points est l’ensemble des points M1,M2,…,Mn de coordonnées (xi;yi) placés dans un repère.
Il permet de voir la forme de la relation : si les points sont à peu près alignés, un ajustement affine (une droite) est pertinent.
Point moyen
Le point moyen du nuage, noté G, a pour coordonnées les moyennes de chaque variable :
xˉ=nx1+x2+⋯+xnetyˉ=ny1+y2+⋯+yn.
On le note G(xˉ;yˉ). C’est le centre de gravité du nuage : il indique sa position d’ensemble.
Calculer un point moyen
On relève la résistance R (en Ω) d’un capteur pour différentes températures T (en °C) :
| T (°C) | 0 | 10 | 20 | 30 | 40 | 50 |
|---|
| R (Ω) | 100 | 104 | 108 | 112 | 116 | 120 |
Il y a n=6 mesures.
Tˉ=60+10+20+30+40+50=6150=25 °C.
Rˉ=6100+104+108+112+116+120=6660=110 Ω.
Le point moyen est donc G(25;110). On le place dans le nuage : il tombe bien au centre des points.
2. Ajustement affine : la droite des moindres carrés
Quand le nuage a une forme allongée, on cherche la droite qui le résume le mieux. Le critère retenu est celui des moindres carrés.
Droite des moindres carrés (droite d'ajustement)
Pour chaque point Mi du nuage, on appelle résidu l’écart vertical entre le point et la droite. La droite des moindres carrés de y en x est la droite
y=ax+b
qui rend minimale la somme des carrés de tous ces résidus. C’est la « meilleure » droite d’ajustement au sens des moindres carrés.
La droite passe par le point moyen
La droite des moindres carrés d’équation y=ax+b passe toujours par le point moyen G(xˉ;yˉ) :
yˉ=axˉ+b.
C’est un excellent moyen de contrôler ton équation : remplace x par xˉ, tu dois retrouver yˉ.
Obtenir l'équation à la calculatrice
En STI2D, on ne calcule pas a et b à la main : on utilise le mode statistique de la calculatrice.
- Entrer les abscisses dans une liste (par exemple L1) et les ordonnées dans une autre (L2).
- Lancer une régression linéaire (menu « stat », « calc », option ax+b ou « LinReg »).
- Lire les coefficients : la machine affiche a (coefficient directeur, ou pente) et b (ordonnée à l’origine).
- Écrire l’équation y=ax+b en arrondissant raisonnablement, et la contrôler en vérifiant qu’elle passe par G.
Garde assez de décimales pour a et b : c’est seulement le résultat final d’une prévision que l’on arrondit, pas les coefficients eux-mêmes.
Faire une prévision avec la droite
Une fois l’équation y=ax+b obtenue :
- Prévoir un y à partir d’un x donné : on remplace x par sa valeur et on calcule.
- Prévoir un x à partir d’un y donné : on résout l’équation y=ax+b, donc x=ay−b.
Toujours indiquer l’unité et vérifier que le résultat a un ordre de grandeur plausible.
Une prévision pas à pas
Pour un capteur, la calculatrice donne la droite d’ajustement y=0,402x+99,87, où x est la température (en °C) et y la résistance (en Ω).
Quelle résistance prévoir à 45 °C (température comprise entre les mesures) ?
On remplace x par 45 :
y=0,402×45+99,87=18,09+99,87=117,96.
On prévoit donc une résistance d’environ 117,96 Ω à 45 °C.
Interpolation et extrapolation
On utilise la droite d’ajustement pour estimer une valeur.
- Interpoler : estimer une valeur à l’intérieur de la plage des mesures (entre le plus petit et le plus grand x observés). C’est en général fiable.
- Extrapoler : prolonger la droite au-delà de la plage des mesures. C’est plus risqué : rien ne garantit que la relation reste affine loin des valeurs observées (un capteur peut saturer, un composant changer de comportement…).
Coefficient de corrélation linéaire
La calculatrice affiche aussi un nombre r (parfois sous la forme r2), le coefficient de corrélation linéaire. Il mesure à quel point les points sont alignés :
- r est toujours compris entre −1 et 1 ;
- plus ∣r∣ est proche de 1, plus les points sont alignés et meilleur est l’ajustement affine ;
- r>0 : quand x augmente, y a tendance à augmenter (corrélation positive) ; r<0 : y a tendance à diminuer ;
- r proche de 0 : pas de relation affine nette, l’ajustement par une droite n’a pas de sens.
Lire la qualité d'un ajustement
En pratique, pour des mesures physiques, on considère souvent qu’un ajustement affine est de bonne qualité lorsque ∣r∣ est très proche de 1 (par exemple ∣r∣≥0,95). On peut alors utiliser la droite en confiance pour interpoler.
Si r2 est donné (toujours entre 0 et 1), il s’interprète de la même façon : plus il est proche de 1, meilleur est l’alignement.
Le bon réflexe
Avant de calculer quoi que ce soit : trace ou regarde le nuage. S’il est allongé et bien aligné, l’ajustement affine est justifié. S’il est en arc, en courbe ou éparpillé, une droite n’est pas le bon modèle, même si la calculatrice accepte de la calculer. Le nuage décide, pas la machine.
Les pièges à éviter
- Confondre corrélation et causalité : un r proche de 1 dit que deux grandeurs varient ensemble, pas que l’une cause l’autre. C’est FAUX de conclure « x provoque y » à partir du seul coefficient. Ce qui est VRAI : r mesure seulement l’intensité de l’alignement.
- Arrondir les coefficients trop tôt : si tu remplaces a=0,4017 par 0,4 dès le départ, ta prévision finale peut être faussée. On garde les décimales et on n’arrondit qu’à la fin.
- Extrapoler sans précaution : prolonger la droite très loin des mesures (« la résistance à 500 °C ») donne un nombre, mais ce nombre n’est pas fiable. Toujours préciser si l’on interpole (sûr) ou si l’on extrapole (à discuter).
- Inverser x et y : la droite « de y en x » n’est pas la même que celle « de x en y ». On ajuste la grandeur que l’on veut prédire (y) en fonction de celle que l’on connaît (x).