Nuage de points et ajustement affine

Signaler

On représente une série statistique à deux variables par un nuage de points et on cherche une droite passant « le plus près ­possible » des points du nuage.

X et Y sont deux variables statistiques numériques dont les valeurs relevées sont respectivement x1, x2, …, xn et y1, y2, …, yn.

I. Nuage de points et point moyen

Définition : Dans le plan muni d’un repère orthogonal, le nuage de points ­associé à la série statistique est l’ensemble des points Mi(xi ; yi), i entier entre 1 et n.

Définition : Le point moyen est G(x¯  ;  y¯), où x¯ et y¯ sont les moyennes des ­séries :

x¯=x1+x2+…+xnn et y¯=y1+y2+…+ynn

II. Ajustement affine

1) Droite de Mayer

On répartit, par abscisses croissantes, les points en deux sous-nuages de même effectif, éventuellement à une unité près ; G1 et G2 sont les points moyens des deux sous-nuages. La droite (G1G2) est appelée droite de Mayer.

2) Droite de régression de y en x ou droite des moindres carrés

La somme des carrés des distances de chaque point du nuage au point de même abscisse de la droite de regression de y en x est minimale.

d054d0a6-0a8e-4334-bb05-5e2bba465ea2

Cette droite, déterminée par la méthode des moindres carrés, passe par le point moyen G et a pour équation réduite y ax b, avec :

a=σxyσx2 et b=y¯−ax¯

où  σxy=1n∑i=1 n(xi−x¯)(yi−y¯) et  σx=1n∑i=1nxi2−x¯2

Application : Si yaxb est l’équation réduite d’une droite d’ajustement du nuage, on peut faire une estimation de la valeur v de Y associée à une valeur u de X autre que x1x2, …, xn en posant vaub.

Méthode

Déterminer deux ajustements affines d’une série statistique à deux variables

Le tableau ci-dessous donne l’évolution du nombre de PACS (pacte civil de solidarité), en milliers, conclus en France entre 2004 et 2010.

d93522e6-a376-4b26-90fd-f2e8181f9652

Tous les résultats numériques seront arrondis au centième.

a. Représenter le nuage de points associé à cette série. Calculer les coordonnées de son point moyen G et placer G sur le graphique.

b. Déterminer, à l’aide de la calculatrice, l’équation réduite de la droite de ­régression D obtenue par la méthode des moindres carrés et tracer cette droite sur le graphique.

c. Déterminer l’équation réduite de la droite de Mayer D′ et tracer cette droite sur le graphique.

d. Vérifier que les droites D et D′ passent par G.

Conseils

c. Déterminez les coordonnées des points moyens de deux sous-nuages.

d. Montrez que les coordonnées de G, déterminées à la question a., vérifient les équations de D et de D′.

a. G a pour coordonnées (3,17 ; 121,45).

b. D’après la calculatrice, D a pour équation y = 27,92x + 33,05. Elle est tracée en bleu sur le graphique.

c. On partage le nuage en deux sous-nuages de 3 points chacun ; le premier a pour point moyen G1(1,33 ; 67,53), le deuxième a pour point moyen G2(5 ; 175,37). La droite de Mayer D′ est (G1G2). Elle a pour équation y = 29,38x + 28,45 ; elle est tracée en rouge sur le graphique.

d. Avec l’équation y = 27,92x + 33,05, pour x = 3,17, on a y = 121,55, valeur voisine de l’ordonnée de G.

Avec l’équation y = 29,38x + 28,45, pour x = 3,17, on a y = 121,58, valeur voisine de l’ordonnée de G.

e4c6466e-5273-4f7f-ab18-b8a584ab9d58