Inégalité de Bienaymé-Tchebychev – Inégalité de concentration

Signaler
La variance d’une variable aléatoire mesure sa dispersion autour de son espérance. L’inégalité de Bienaymé-Tchebychev et toutes les inégalités de concentration apportent des précisions sur cette dispersion.

I. Inégalité de Markov

Si XX est une variable aléatoire à valeurs positives et si E(X)E(X) désigne son espérance, alors, pour tout réel aa strictement positif : P(Xa)E(X)aP(X \geq a) \leq \dfrac{E(X)}{a}
En notant μ\mu l’espérance de XX, cette inégalité est parfois écrite sous la forme :
Pour tout réel k>0k \gt 0, P(Xkμ)1kP(X \geq k\mu) \leq \dfrac{1}{k}.

On en déduit en particulier que la probabilité que XX prenne une valeur supérieure ou égale au double de son espérance est inférieure ou égale à 0,50,5.

II. Inégalité de Bienaymé-Tchebychev

L’inégalité de Bienaymé-Tchebychev permet de majorer la probabilité qu’une variable aléatoire XX s’écarte de son espérance d’une quantité supérieure ou égale à une valeur donnée.
Si XX est une variable aléatoire d’espérance μ\mu et de variance VV, alors, pour tout réel δ>0\delta \gt 0 : P(Xμδ)Vδ2P(|X - \mu| \geq \delta) \leq \dfrac{V}{\delta^2}


On peut aussi l’écrire : pour tout réel k>0k \gt 0, P(Xμk)1k2P(|X - \mu| \geq k) \leq \dfrac{1}{k^2}.

III. Une inégalité de concentration pour la moyenne

Soit nn un entier supérieur ou égal à 22 et X1,X2,,XnX_1, X_2, \dots, X_n un échantillon de taille nn d’une loi de probabilité d’espérance μ\mu et de variance VV.
On note MnM_n la moyenne de cet échantillon, c’est-à-dire Mn=X1+X2++XnnM_n = \dfrac{X_1 + X_2 + \dots + X_n}{n}.
Alors, pour tout réel δ>0\delta \gt 0 : P(Mnμδ)Vnδ2P(|M_n - \mu| \geq \delta) \leq \dfrac{V}{n \delta^2}

À noter
Ce résultat est une conséquence directe de l’inégalité de Bienaymé-Tchebychev et d’un résultat vu au chapitre précédent : la variance de MnM_n est V(Mn)=VnV(M_n) = \dfrac{V}{n}.

Méthode
Définir une taille d’échantillon en fonction de la précision et du risque choisis.
Pour une certaine variété de pois de senteur, la probabilité d’obtenir une fleur blanche est égale à 0,250,25, la probabilité d’obtenir une fleur rose ou rouge est 0,750,75.
Combien faut-il observer de fleurs de cette espèce pour que la fréquence de fleurs blanches soit comprise entre 0,20,2 et 0,30,3 avec une probabilité supérieure ou égale à 0,990,99 ?

Conseils
En appelant nn la taille de l’échantillon, c’est-à-dire le nombre de fleurs à observer, introduisez la variable aléatoire égale à la fréquence de fleurs blanches dans un échantillon de taille nn et déterminez, en fonction de nn, l’espérance et la variance de cette variable aléatoire.
Utilisez ensuite l’inégalité de Bienaymé-Tchebychev.


Solution
Soit nn le nombre de fleurs à observer, FnF_n et XnX_n les variables aléatoires donnant respectivement la fréquence et le nombre de fleurs blanches dans un échantillon de taille nn. On a Fn=XnnF_n = \dfrac{X_n}{n} et XnX_n suit la loi binomiale B(n;0,25)B(n ; 0,25).
La variance de XnX_n est V(Xn)=n×0,25×0,75=0,1875nV(X_n) = n \times 0,25 \times 0,75 = 0,1875n et celle de FnF_n est V(Fn)=V(Xn)n2=0,1875nV(F_n) = \dfrac{V(X_n)}{n^2} = \dfrac{0,1875}{n}.

0,2<Fn<0,30,2 \lt F_n \lt 0,3 équivaut à Fn0,25<0,05|F_n - 0,25| \lt 0,05.
On cherche donc nn tel que P(Fn0,25<0,05)0,99P(|F_n - 0,25| \lt 0,05) \geq 0,99.
Cette condition équivaut à 1P(Fn0,250,05)0,991 - P(|F_n - 0,25| \geq 0,05) \geq 0,99, soit :
P(Fn0,250,05)0,01()P(|F_n - 0,25| \geq 0,05) \leq 0,01 \quad (*).

Or l’inégalité de Bienaymé-Tchebychev dit que, pour tout δ>0\delta \gt 0 :
P(Fnμδ)Vδ2P(|F_n - \mu| \geq \delta) \leq \dfrac{V}{\delta^2}, avec μ=0,25\mu = 0,25, V=0,1875nV = \dfrac{0,1875}{n}, et δ=0,05\delta = 0,05, on a :
P(Fn0,250,05)0,1875n×0,052P(|F_n - 0,25| \geq 0,05) \leq \dfrac{0,1875}{n \times 0,05^2}.

On cherche nn tel que (*) soit vérifiée, il suffit donc que nn vérifie 0,1875n×0,0520,01\dfrac{0,1875}{n \times 0,05^2} \leq 0,01, soit n0,18750,01×0,052n \geq \dfrac{0,1875}{0,01 \times 0,05^2} c’est-à-dire n7,500n \geq 7,500.
Si on observe au moins 7,5007,500 fleurs, la fréquence de fleurs blanches est comprise entre 0,20,2 et 0,30,3 avec une probabilité supérieure ou égale à 0,990,99.

Remarque : 0,050,05 est la précision choisie (écart maximal par rapport à l’espérance) et 0,010,01 est le risque choisi.