On représente une série statistique à deux variables par un nuage de points et on cherche une droite passant « le plus près possible » des points du nuage.
et sont deux variables statistiques numériques dont les valeurs relevées sont respectivement et .
et sont deux variables statistiques numériques dont les valeurs relevées sont respectivement et .
I. Nuage de points et point moyen
Définition : Dans le plan muni d’un repère orthogonal, le nuage de points associé à la série statistique est l’ensemble des points , entier entre et .
Définition : Le point moyen est , où et sont les moyennes des séries :
et
II. Ajustement affine
Droite de Mayer
On répartit, par abscisses croissantes, les points en deux sous-nuages de même effectif, éventuellement à une unité près ; et sont les points moyens des deux sous-nuages. La droite est appelée droite de Mayer.
Droite de régression de en ou droite des moindres carrés
La somme des carrés des distances de chaque point du nuage au point de même abscisse de la droite de régression de en est minimale.
On répartit, par abscisses croissantes, les points en deux sous-nuages de même effectif, éventuellement à une unité près ; et sont les points moyens des deux sous-nuages. La droite est appelée droite de Mayer.
Droite de régression de en ou droite des moindres carrés
La somme des carrés des distances de chaque point du nuage au point de même abscisse de la droite de régression de en est minimale.
Cette droite, déterminée par la méthode des moindres carrés, passe par le point moyen et a pour équation réduite , avec : et
où et
Application : Si est l’équation réduite d’une droite d’ajustement du nuage, on peut faire une estimation de la valeur de associée à une valeur de autre que en posant .
Méthode
Application : Si est l’équation réduite d’une droite d’ajustement du nuage, on peut faire une estimation de la valeur de associée à une valeur de autre que en posant .
Méthode
Déterminer deux ajustements affines d’une série statistique à deux variables
Le tableau ci-dessous donne l’évolution du nombre de PACS (pacte civil de solidarité), en milliers, conclus en France entre 2004 et 2010.
Tous les résultats numériques seront arrondis au centième.
a. Représenter le nuage de points associé à cette série. Calculer les coordonnées de son point moyen et placer sur le graphique.
b. Déterminer, à l’aide de la calculatrice, l’équation réduite de la droite de régression obtenue par la méthode des moindres carrés et tracer cette droite sur le graphique.
c. Déterminer l’équation réduite de la droite de Mayer et tracer cette droite sur le graphique.
d. Vérifier que les droites et passent par .
Conseils
Conseils
c. Déterminez les coordonnées des points moyens de deux sous-nuages.
d. Montrez que les coordonnées de , déterminées à la question a., vérifient les équations de et de .
Solution :
Solution :
a. a pour coordonnées .
b. D’après la calculatrice, a pour équation . Elle est tracée en bleu sur le graphique.
c. On partage le nuage en deux sous-nuages de 3 points chacun ; le premier a pour point moyen , le deuxième a pour point moyen . La droite de Mayer est . Elle a pour équation ; elle est tracée en rouge sur le graphique.
d. Avec l’équation , pour , on a , valeur voisine de l’ordonnée de .
Avec l’équation , pour , on a , valeur voisine de l’ordonnée de .