Échantillon de taille n d’une loi de probabilité

Signaler
Un échantillon est généralement un sous-ensemble d’une population. Ici, un échantillon correspondra à des répétitions indépendantes d’une expérience modélisée par une même loi.

I. Taille d’un échantillon

Une loi de probabilité étant donnée, on appelle échantillon de taille nn (ou nn-échantillon) de cette loi une liste (X1,X2,,Xn)(X_1, X_2, \dots, X_n) de nn variables aléatoires indépendantes et identiques suivant cette loi.
Une suite x1,x2,,xnx_1, x_2, \dots, x_n de valeurs prises par les variables aléatoires XiX_i (1in)(1 \leq i \leq n) est une réalisation de l’échantillon.

À noter
Toute réalisation de l’échantillon peut être assimilée à une suite de tirages « avec remise » ; la « remise » entre deux tirages successifs correspond à l’indépendance des variables aléatoires X1,X2,,XnX_1, X_2, \dots, X_n.
Dans toute cette fiche, nn est un entier naturel supérieur ou égal à 22. On suppose usuellement que la taille nn de l’échantillon est « beaucoup plus petite » que celle de la population.

II. Somme et moyenne d’un échantillon

Définition de la somme et de la moyenne
Soit (X1,X2,,Xn)(X_1, X_2, \dots, X_n) un échantillon de taille nn d’une loi de probabilité.
On pose Sn=X1+X2++XnS_n = X_1 + X_2 + \dots + X_n (somme) et Mn=SnnM_n = \dfrac{S_n}{n} (moyenne).
Puisque les variables aléatoires X1,X2,,XnX_1, X_2, \dots, X_n ont la même loi, elles ont la même espérance, notée mm, la même variance, notée σ2\sigma^2, et le même écart type, noté σ\sigma.

Espérance
D’après les propriétés de l’espérance : E(Sn)=nmE(S_n) = n m et E(Mn)=mE(M_n) = m

Variance
D’après les propriétés de la variance : V(Sn)=nσ2V(S_n) = n \sigma^2 et V(Mn)=σ2nV(M_n) = \dfrac{\sigma^2}{n}
On en déduit l’écart type des variables aléatoires SnS_n et MnM_n :
σ(Sn)=nσ\sigma(S_n) = \sqrt{n} \sigma et σ(Mn)=σn\sigma(M_n) = \dfrac{\sigma}{\sqrt{n}}.

Remarque : On constate que, lorsque nn augmente, V(Mn)V(M_n) et σ(Mn)\sigma(M_n) diminuent.
La dispersion de la moyenne MnM_n diminue lorsque la taille nn de l’échantillon augmente.

Méthode : Déterminer l’espérance et la variance de la moyenne de deux variables aléatoires identiques et indépendantes
Soit X1X_1 et X2X_2 deux variables aléatoires indépendantes suivant la loi uniforme sur 2,3,6,8,11{2, 3, 6, 8, 11}. On note M2M_2 la moyenne de X1X_1 et X2X_2 : M2=X1+X22M_2 = \dfrac{X_1 + X_2}{2}.
a. Calculer l’espérance E(M2)E(M_2) et la variance V(M2)V(M_2) de M2M_2 à partir de celles de X1X_1 et X2X_2.
b. Établir la loi de M2M_2 et retrouver la valeur de son espérance.

Conseils
a. Utilisez la loi des grands nombres et la définition d’une suite convergente.
b. Considérez des événements contraires.
c. Utiliser un tableau à double entrée ou bien lister tous les couples possibles pour X1X_1 et X2X_2.

Solution
a. E(M2)=E(X1)=E(X2)=mE(M_2) = E(X_1) = E(X_2) = m, avec m=2+3+6+8+115=6m = \dfrac{2 + 3 + 6 + 8 + 11}{5} = 6.
Si on pose V(X1)=V(X2)=σ2V(X_1) = V(X_2) = \sigma^2, alors V(M2)=σ22V(M_2) = \dfrac{\sigma^2}{2}.
Ainsi, V(M2)=10,82=5,4V(M_2) = \dfrac{10,8}{2} = 5,4.

b. En listant les 2525 couples (tous équiprobables) de valeurs possibles pour X1X_1 et X2X_2, et en calculant pour chacun la moyenne des deux valeurs, on obtient la loi de M2M_2.
7440e2e3-c658-4bee-945f-6cb53998e95276e2bd76-a84c-419f-88b3-1aa9e614a1e9