Chaînes de Markov

Signaler

Les chaînes de Markov étudiées ont 2 ou 3 états et sont définies par leur état initial et par leur matrice de transition.

I. Notions de chaînes de Markov

1) Théorème et définitions

Définition : Une chaîne de Markov (homogène) à 3 états (notés 1, 2 et 3) est définie par la loi de probabilité de son état initial donné par une matrice ligne π0 \pi_0 de taille 3 et par sa matrice de transition Q Q de format 3×3 3 \times 3 .

À noter

On définit de manière analogue une chaîne de Markov à 2 états.

Soit n n un entier naturel, si Xn X_n décrit l’état du processus après n n transitions, alors π0=P(X0=1) P(X0=2) P(X0=3) \pi_0 = P(X_0 = 1) \ P(X_0 = 2) \ P(X_0 = 3) et les coefficients pij p_{ij} de la matrice Q Q sont les probabilités de transition de i i vers j j définies pour tout entier naturel n n par : pij=P(Xn=i Xn+1=j) p_{ij} = P(X_n = i \ X_{n+1} = j) .

2) Graphe pondéré d’une chaîne de Markov

Définitions : Un graphe est orienté si ses arêtes, appelées arcs, sont des couples (donc orientés) de sommets (pas forcément distincts). Une boucle est un arc reliant un sommet à lui-même. Un graphe est pondéré si chacune de ses arêtes (orienté ou non) est associée à un nombre réel appelé poids.

Le graphe associé à une chaîne de Markov admet pour sommets l’ensemble de ses états (2 ou 3) et pour arcs les couples i,j i, j pour i i et j j variant de 1 1 à 2 2 ou 3 3 pondéré par la probabilité de transition pij p_{ij} de i i vers j j .

À noter

La matrice de transition est une matrice stochastique, c’est-à-dire que sur chacune de ses lignes la somme des coefficients vaut 1.

II. État au bout de n transitions et état invariant

Théorèmes : Soit n n un entier naturel et soit une chaîne de Markov de loi de probabilité de l’état initial π0 \pi_0 et de matrice de transition Q Q .

Le coefficient de la i i -ième ligne et j j -ième colonne de Qn Q^n est P(X0=i Xn=j) P(X_0 = i \ X_n = j) .

La loi de probabilité de l’état du système à l’instant n n est définie par :
πn=P(Xn=1) P(Xn=2) P(Xn=3) \pi_n = P(X_n = 1) \ P(X_n = 2) \ P(X_n = 3) et on a πn=π0Qn \pi_n = \pi_0 Q^n .

Définition : Un état π \pi est appelé invariant (stationnaire ou stable) pour une chaîne de Markov de matrice de transition Q Q si π=πQ \pi = \pi Q .

Remarque : L’état invariant π \pi se détermine en résolvant le système

(xyz)=(xyz)Q\begin{pmatrix}x\quad y \quad z\end{pmatrix}=\begin{pmatrix}x\quad y \quad z\end{pmatrix}Q

x+y+z=1x + y + z = 1

Méthodes

1) Décrire un processus de Markov par des matrices

Une cage comporte 3 compartiments C1C_1, C2C_2, et C3C_3. On place une souris dans le compartimentC1C_1. Elle se déplace d'un compartiment à un autre en empruntant de manière équiprobable une ouverture du compartiment où elle se trouve. Modéliser le déplacement à l'aide de matrices.

picture-in-text

 

Conseils

Déterminez la matrice ligne de taille 3 décrivant l’état initial puis la matrice carrée de transition d’ordre 3 dont les coefficients sont les probabilités que la souris passe d’un compartiment à un autre.

Solution

On note Xn X_n le numéro du compartiment où se trouve la souris après n n déplacements. On a tout d’abord P(X0=1)=1 P(X_0 = 1) = 1 ; P(X0=2)=0 P(X_0 = 2) = 0 et P(X0=3)=0 P(X_0 = 3) = 0 , puisque la souris se trouve au départ dans C1 C_1 .

L’état initial est donc donné par la matrice ligne π0=(100) \pi_0 =\begin{matrix}( 1 \quad 0 \quad 0 )\end{matrix}

Ensuite, si la souris se trouve dans C1 C_1 , elle emprunte une des trois ouvertures de C1 C_1 de manière équiprobable : l’une mène dans C2 C_2 et les deux autres mènent dans C3 C_3 . Donc :
P(Xn=1 Xn+1=2)=13 P(X_n = 1 \ X_{n+1} = 2) = \dfrac{1}{3} et P(Xn=1 Xn+1=3)=23 P(X_n = 1 \ X_{n+1} = 3) = \dfrac{2}{3} .

On démontre de même que :
P(Xn=2 Xn+1=1)=12 P(X_n = 2 \ X_{n+1} = 1) = \dfrac{1}{2} et P(Xn=2 Xn+1=3)=12 P(X_n = 2 \ X_{n+1} = 3) = \dfrac{1}{2} ,
et que :
P(Xn=3 Xn+1=1)=23 P(X_n = 3 \ X_{n+1} = 1) = \dfrac{2}{3} et P(Xn=3 Xn+1=2)=13 P(X_n = 3 \ X_{n+1} = 2) = \dfrac{1}{3} .

La matrice de transition associée est donc :
Q=(013231201223130) Q = \begin{pmatrix} 0 \quad \dfrac{1}{3} \quad \dfrac{2}{3} \\ \dfrac{1}{2} \quad 0 \quad \dfrac{1}{2} \\ \dfrac{2}{3} \quad \dfrac{1}{3} \quad 0 \end{pmatrix} .

2) Décrire l’état d’un processus au bout de plusieurs étapes

La souris se déplaçant comme ci-dessus, déterminer l'arrondi au millième de la probabilité aa qu'elle soit dans le compartiment C2C_2 après 1010 déplacements;  

Conseils

Les coefficients de Q10 Q^{10} sont les probabilités qu’a la souris de se trouver dans le compartiment j j au bout de 10 déplacements sachant qu’elle était dans le compartiment i i au départ.

Solution :

D’après la calculatrice, le coefficient de la première ligne et de la deuxième colonne de Q10 Q^{10} est 0,342 0,342 arrondi au millième, donc a=0,342 a = 0,342 .