Loi des grands nombres

Signaler
La loi des grands nombres formalise un résultat qui semble naturel. Elle permet de dire que plus un échantillon est grand, plus ses caractéristiques sont proches de celles de la population.

I. Loi des grands nombres

Soit XnX_n pour nNn \in \mathbb{N}^* une suite de variables aléatoires deux à deux indépendantes et de même loi. Pour tout entier n2n \geq 2, on note Mn=X1+X2++XnnM_n = \dfrac{X_1 + X_2 + \dots + X_n}{n}.
Alors, pour tout réel ε>0\varepsilon \gt 0 : limn+P(Mnμε)=0\lim\limits_{n \to +\infty} P(|M_n - \mu| \geq \varepsilon) = 0

Remarque : On dit que la suite MnM_n converge en probabilité vers μ\mu.
Pour tout entier nn supérieur ou égal à 22, X1,X2,,XnX_1, X_2, \dots, X_n est un échantillon de taille nn de la loi de probabilité, et MnM_n est la moyenne de cet échantillon.

Remarque : Si on pose Sn=X1+X2++Xn=nMnS_n = X_1 + X_2 + \dots + X_n = n M_n, alors :
P(Mnμε)=P(Snnμnε)P(|M_n - \mu| \geq \varepsilon) = P(|S_n - n\mu| \geq n\varepsilon)

À noter
La loi énoncée ici est appelée « loi faible des grands nombres ». Il existe une « loi forte des grands nombres », correspondant à une convergence « plus forte » que la convergence en probabilité, c’est-à-dire entraînant cette dernière.

II. Interprétations et conséquences

Si l’on répète une série d’épreuves identiques, indépendantes et nombreuses, modélisées par les variables aléatoires X1,X2,,Xn,X_1, X_2, \dots, X_n, \dots, il est probable que la moyenne observée des XiX_i (on l’appelle aussi moyenne empirique) soit voisine de l’espérance μ\mu des XiX_i. La probabilité que la moyenne observée s’écarte beaucoup de l’espérance est faible.
De cette loi, on déduit l’interprétation usuelle de l’espérance comme moyenne des valeurs des XiX_i sur un grand nombre d’expériences.

La loi des grands nombres fournit aussi une justification a posteriori de l’approche fréquentiste des probabilités : la probabilité d’un événement peut être approchée par la fréquence de réalisation de cet événement lors de la réalisation d’un grand nombre d’expériences (d’où le vocabulaire « loi des grands nombres »).

Méthode : Utiliser la loi des grands nombres

On lance un grand nombre de fois une pièce équilibrée.
Pour tout entier naturel n2n \geq 2, on note SnS_n la variable aléatoire égale au nombre de « pile » que l’on obtient au cours des nn premiers lancers.
a. Pourquoi peut-on affirmer qu’il existe un entier naturel NN tel que, si nNn \geq N, alors P(Snn20,1n)<0,05P(|S_n - \dfrac{n}{2}| \geq 0,1n) \lt 0,05 ?
b. Montrer que P(0,4n<Sn<0,6n)0,95P(0,4n \lt S_n \lt 0,6n) \geq 0,95 équivaut à :
P(Snn20,1n)<0,05P(|S_n - \dfrac{n}{2}| \geq 0,1n) \lt 0,05.
c. Déterminer un entier naturel NN tel que, si nNn \geq N, alors P(0,4n<Sn<0,6n)0,95P(0,4n \lt S_n \lt 0,6n) \geq 0,95.

Conseils
a. Utilisez la loi des grands nombres et la définition d’une suite convergente.
b. Considérez des événements contraires.
c. Utilisez l’inégalité de concentration.

Solution
a. Sn=X1+X2++XnS_n = X_1 + X_2 + \dots + X_n, où XiX_i est la variable de Bernoulli de paramètre 12\dfrac{1}{2} qui prend la valeur 11 si le ii-ième lancer donne « pile », la valeur 00 sinon. Les variables X1,X2,,XnX_1, X_2, \dots, X_n sont indépendantes et suivent la même loi de Bernoulli de paramètre 12\dfrac{1}{2}.Snn20,1n|S_n - \dfrac{n}{2}| \geq 0,1n équivaut à Mn120,1|M_n - \dfrac{1}{2}| \geq 0,1. D’après la loi des grands nombres, P(Mn120,1)P(|M_n - \dfrac{1}{2}| \geq 0,1) tend vers 00 quand nn tend vers ++\infty, donc il existe NN tel que, si nNn \geq N, alors P(Mn120,1)<0,05P(|M_n - \dfrac{1}{2}| \geq 0,1) \lt 0,05, et donc P(Snn20,1n)<0,05P(|S_n - \dfrac{n}{2}| \geq 0,1n) \lt 0,05.

b. 0,4n<Sn<0,6n0,4n \lt S_n \lt 0,6n équivaut à 0,1n<Sn0,5n<0,1n-0,1n \lt S_n - 0,5n \lt 0,1n, soit Snn2<0,1n|S_n - \dfrac{n}{2}| \lt 0,1n. Donc P(0,4n<Sn<0,6n)0,95P(0,4n \lt S_n \lt 0,6n) \geq 0,95 équivaut à :P(Snn2<0,1n)0,95P(|S_n - \dfrac{n}{2}| \lt 0,1n) \geq 0,95, soit P(Snn20,1n)<0,05P(|S_n - \dfrac{n}{2}| \geq 0,1n) \lt 0,05.c. D’après ce qui précède, on cherche NN tel que, si nNn \geq N, alors :P(Mn120,1)<0,05P(|M_n - \dfrac{1}{2}| \geq 0,1) \lt 0,05. Or, d’après l’inégalité de concentration :P(Mn120,1)25nP(|M_n - \dfrac{1}{2}| \geq 0,1) \leq \dfrac{2}{5n} (car V=14V = \dfrac{1}{4}).