Coefficient de corrélation linéaire – Autres ajustements

Signaler

La pertinence d’un ajustement affine des variables X et Y peut être évaluée par le calcul de leur coefficient de corrélation linéaire. On peut alors envisager d’autres ajustements.

I. Coefficient de corrélation linéaire

Définition : Le coefficient de corrélation linéaire des variables X et Y est :

r=σxyσxσy

Comme pour σxy et σx , on définit ​σy=1n∑i=1nyi2−y¯2.

Interprétation : r est compris entre − 1 et 1. Il mesure la « qualité » d’une régression linéaire entre X et Y. Plus précisément :

si |r| est proche de 1 (r proche de 1 ou de − 1), la relation linéaire entre X et Y est forte, un ajustement linéaire est pertinent ;

si |r| = 1, les points du nuage sont alignés ; si r = 0, il n’existe pas de relation linéaire entre X et Y, mais il peut exister une autre relation ;

si r > 0, la droite d’ajustement a un coefficient directeur positif ; si r < 0, ce coefficient directeur est négatif.

À noter

Une corrélation entre X et Y n’est pas une « relation de cause à effet ». Souvent, X et Y sont corrélées parce qu’elles ont une cause commune.

II. Ajustements se ramenant à un ajustement affine

Si les points du nuage semblent proches d’une hyperbole d’équation y=1ax+b, on pose, pour tout i, zi=1yi. On détermine l’équation zaxb d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi) et on ajuste le nuage (xi ; yi ) par la courbe d’équation y=1ax+b.

Si les points du nuage semblent proches d’une courbe exponentielle, on pose, pour tout i, zi = ln(yi). On détermine l’équation zAxB d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi) et on ajuste le nuage (xi ; yi) par la courbe d’équation y = beAx, avec b = eB.

Mot-clé

En posant zi=1yi ou zi = ln(yi), on fait un changement de variable.

Méthode

Réaliser un ajustement non linéaire d’un nuage de points

Le tableau ci-dessous donne l’évolution de la production d’énergie d’origine éolienne en France de 2000 à 2007 (exprimée en milliers de tonnes d’équivalent pétrole, ktep). Source : INSEE, avril 2008.

372f28c9-ecf2-43f2-81e4-8e0c8ddc0b39

a. Calculer le coefficient de corrélation linéaire de X et Y. Un ajustement linéaire paraît-il ­approprié ?

b. Représenter le nuage de points associé à la série et justifier la pertinence d’un ajustement non linéaire.

c. Réaliser un ajustement exponentiel du nuage précédent.

Conseils

c. Calculez, pour tout entier i, le nombre zi = ln(yi) et déterminer l’équation réduite d’une droite d’ajustement du nuage formé des points de coordonnées (xi ; zi).

a. D’après la calculatrice, le coefficient de corrélation linéaire de X et Y est r = 0,843 en arrondissant au millième.

|r| n’est pas très proche de 1, un ajustement affine ne semble pas approprié.

b. Les points du nuage ci-contre semblent proches d’une courbe exponentielle, un ajustement exponentiel paraît plus approprié qu’un ajustement affine.

c. Pour tout i, on pose zi = ln(yi).

D’après la calculatrice, en arrondissant les coefficients au centième, la droite des moindres carrés ajustant le nuage formé des points de coordonnées (xi ; zi) a pour équation z = 0,54x + 1,92.

Or e1,92 = 6,82 (arrondi au centième).

Donc le nuage initial peut être ajusté par la courbe exponentielle d’équation y = 6,82 × e0,54x (en pointillés sur le graphique).

c7c308b1-b67e-4947-9ad1-58a008eac74f