Coefficient de corrélation linéaire – Autres ajustements

Signaler
La pertinence d’un ajustement affine des variables X et Y peut être évaluée par le calcul de leur coefficient de corrélation linéaire. On peut alors envisager d’autres ajustements.

I. Coefficient de corrélation linéaire


Définition : Le coefficient de corrélation linéaire des variables X et Y est : r=σxyσxσyr = \dfrac{\sigma_{xy}}{\sigma_x \sigma_y}
Comme pour σxy\sigma_{xy} et σx\sigma_x, on définit σy=1ni=1nyi2yˉ2\sigma_y = \sqrt{\frac{1}{n} \sum_{i=1}^n y_i^2 - \bar{y}^2}

Interprétation : rr est compris entre 1-1 et 11. Il mesure la « qualité » d’une régression linéaire entre X et Y. Plus précisément :
\circ\quad si r|r| est proche de 11 (rr proche de 11 ou de 1-1), la relation linéaire entre X et Y est forte, un ajustement linéaire est pertinent ;
\circ\quad si r=1|r| = 1, les points du nuage sont alignés ; si r=0r = 0, il n’existe pas de relation linéaire entre X et Y, mais il peut exister une autre relation ;
\circ\quad si r > 0, la droite d’ajustement a un coefficient directeur positif ; si r < 0, ce coefficient directeur est négatif.

À noter
Une corrélation entre X et Y n’est pas une « relation de cause à effet ». Souvent, X et Y sont corrélées parce qu’elles ont une cause commune.

II. Ajustements se ramenant à un ajustement affine


\circ\quad Si les points du nuage semblent proches d’une hyperbole d’équation y=1ax+by = \dfrac{1}{a x + b}, on pose, pour tout ii, zi=1yiz_i = \dfrac{1}{y_i}. On détermine l’équation z=ax+bz = a x + b d’une droite d’ajustement du nuage formé des points de coordonnées (xi;zi)(x_i ; z_i) et on ajuste le nuage (xi;yi)(x_i ; y_i) par la courbe d’équation y=1ax+by = \dfrac{1}{a x + b}.

\circ\quad Si les points du nuage semblent proches d’une courbe exponentielle, on pose, pour tout ii, zi=ln(yi)z_i = \ln(y_i). On détermine l’équation z=Ax+Bz = A x + B d’une droite d’ajustement du nuage formé des points de coordonnées (xi;zi)(x_i ; z_i) et on ajuste le nuage (xi;yi)(x_i ; y_i) par la courbe d’équation y=beAxy = b e^{A x}, avec b=eBb = e^B.


Mot-clé
En posant zi=1yiz_i = \dfrac{1}{y_i} ou zi=ln(yi)z_i = \ln(y_i), on fait un changement de variable.

Méthode : réaliser un ajustement non linéaire d’un nuage de points
Le tableau ci-dessous donne l’évolution de la production d’énergie d’origine éolienne en France de 2000 à 2007 (exprimée en milliers de tonnes d’équivalent pétrole, ktep). Source : INSEE, avril 2008.
372f28c9-ecf2-43f2-81e4-8e0c8ddc0b39
a. Calculer le coefficient de corrélation linéaire de XX et YY. Un ajustement linéaire paraît-il approprié ?
b. Représenter le nuage de points associé à la série et justifier la pertinence d’un ajustement non linéaire.
c. Réaliser un ajustement exponentiel du nuage précédent.

Conseils
c. Calculez, pour tout entier ii, le nombre zi=ln(yi)z_i = \ln(y_i) et déterminez l’équation réduite d’une droite d’ajustement du nuage formé des points de coordonnées (xi;zi)(x_i ; z_i).
a. D’après la calculatrice, le coefficient de corrélation linéaire de XX et YY est r=0,843r = 0,843 en arrondissant au millième.
r|r| n’est pas très proche de 11, un ajustement affine ne semble pas approprié.
b. Les points du nuage ci-contre semblent proches d’une courbe exponentielle, un ajustement exponentiel paraît plus approprié qu’un ajustement affine.
c. Pour tout ii, on pose zi=ln(yi)z_i = \ln(y_i).

D’après la calculatrice, en arrondissant les coefficients au centième, la droite des moindres carrés ajustant le nuage formé des points de coordonnées (xi;zi)(x_i ; z_i) a pour équation z=0,54x+1,92z = 0,54x + 1,92.
Or e1,92=6,82e^{1,92} = 6,82 (arrondi au centième).
Donc le nuage initial peut être ajusté par la courbe exponentielle d’équation y=6,82×e0,54xy = 6,82 \times e^{0,54x} (en pointillés sur le graphique).
c7c308b1-b67e-4947-9ad1-58a008eac74f