La pertinence d’un ajustement affine des variables X et Y peut être évaluée par le calcul de leur coefficient de corrélation linéaire. On peut alors envisager d’autres ajustements.
I. Coefficient de corrélation linéaire
Définition : Le coefficient de corrélation linéaire des variables X et Y est :
r=σxyσxσy
Comme pour σxy et σx , on définit σy=1n∑i=1nyi2−y¯2.
Interprétation : r est compris entre − 1 et 1. Il mesure la « qualité » d’une régression linéaire entre X et Y. Plus précisément :
si |r| est proche de 1 (r proche de 1 ou de − 1), la relation linéaire entre X et Y est forte, un ajustement linéaire est pertinent ;
si |r| = 1, les points du nuage sont alignés ; si r = 0, il n’existe pas de relation linéaire entre X et Y, mais il peut exister une autre relation ;
si r > 0, la droite d’ajustement a un coefficient directeur positif ; si r < 0, ce coefficient directeur est négatif.
À noter
Une corrélation entre X et Y n’est pas une « relation de cause à effet ». Souvent, X et Y sont corrélées parce qu’elles ont une cause commune.
II. Ajustements se ramenant à un ajustement affine
Si les points du nuage semblent proches d’une hyperbole d’équation y=1ax+b, on pose, pour tout i, zi=1yi. On détermine l’équation z = ax + b d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi) et on ajuste le nuage (xi ; yi ) par la courbe d’équation y=1ax+b.
Si les points du nuage semblent proches d’une courbe exponentielle, on pose, pour tout i, zi = ln(yi). On détermine l’équation z = Ax + B d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi) et on ajuste le nuage (xi ; yi) par la courbe d’équation y = beAx, avec b = eB.
Mot-clé
En posant zi=1yi ou zi = ln(yi), on fait un changement de variable.
Méthode
Réaliser un ajustement non linéaire d’un nuage de points
Le tableau ci-dessous donne l’évolution de la production d’énergie d’origine éolienne en France de 2000 à 2007 (exprimée en milliers de tonnes d’équivalent pétrole, ktep). Source : INSEE, avril 2008.
a. Calculer le coefficient de corrélation linéaire de X et Y. Un ajustement linéaire paraît-il approprié ?
b. Représenter le nuage de points associé à la série et justifier la pertinence d’un ajustement non linéaire.
c. Réaliser un ajustement exponentiel du nuage précédent.
Conseils
c. Calculez, pour tout entier i, le nombre zi = ln(yi) et déterminer l’équation réduite d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi).
a. D’après la calculatrice, le coefficient de corrélation linéaire de X et Y est r = 0,843 en arrondissant au millième.
|r| n’est pas très proche de 1, un ajustement affine ne semble pas approprié.
b. Les points du nuage ci-contre semblent proches d’une courbe exponentielle, un ajustement exponentiel paraît plus approprié qu’un ajustement affine.
c. Pour tout i, on pose zi = ln(yi).
D’après la calculatrice, en arrondissant les coefficients au centième, la droite des moindres carrés ajustant le nuage formé des points de coordonnées (xi ; zi) a pour équation z = 0,54x + 1,92.
Or e1,92 = 6,82 (arrondi au centième).
Donc le nuage initial peut être ajusté par la courbe exponentielle d’équation y = 6,82 × e0,54x (en pointillés sur le graphique).