Analyse statistique de deux caractères : tableau croisé

Signaler

Depuis de nombreuses années, les données sont omniprésentes, et savoir les organiser et les interpréter est primordial. Ce cours va s'intéresser plus particulièrement à des séries statistiques à deux caractères.

I) Série statistique à un caractère : un peu de vocabulaire

Entreprendre une étude statistique revient à classer des individus d'une population en fonction d'un caractère

Un caractère est la grandeur que l'on observe sur les individus d'une population dans une étude statistique.

Exemple 1 :  classer les élèves d'une classe en fonction de leur note.

12 ; 16 ; 18 ; 4 ; 16 ; 12 ; 10 ; 5 ; 9 ; 13 ; 12 ; 10 ; 11 ; 11 ; 13.
Cela donne :

4 ; 5 ; 9 ; 10 ; 10 ; 11 ; 11 ; 12 ; 12 ; 12 ; 13 ; 13 ; 16 ; 16 ; 18.

Dans ce cas, le caractère étudié est la note

Un échantillon de taille nn est une partie de la population contenant nn individus.

Exemple 2 : lors d'une enquête d'opinion, on ne peut pas poser les questions à toutes les personnes. On va sonder un échantillon de la population, choisi de manière à ce que les résultats soient le plus fiable possible.

Quantitatif ou qualitatif ? discret ou continu ? 

Lorsque le caractère étudié prend des valeurs numériques, on dira qu'il est quantitatif, sinon il est qualitatif.

Dans le premier exemple, le caractère étant des notes, il est quantitatif.
Dans le second exemple, le caractère étant une opinion, il est qualitatif.

Un caractère quantitatif peut être discret ou continu. Il est dit discret lorsqu'il prend un nombre fini de valeurs, et continu lorsqu'il peut prendre une infinité de valeurs. 

Par exemple, le nombre de frères et soeurs est un caractère quantitatif discret, alors que la taille d'une personne sera un caractère quantitatif continu (peut prendre n'importe quelle valeur dans un intervalle).

L'effectif est le nombre d'individus ayant un caractère spécifique.

picture-in-text

La fréquence est le rapport de l'effectif d'un caractère sur l'effectif total.

freˊquence=effectifeffectif total\boxed{\text{fréquence}= \dfrac{\text{effectif}}{\text{effectif total}}}

picture-in-text

Remarque : une fréquence est toujours comprise entre 0 et 1.
La somme des fréquences est égale à 1.

II) Série statistique à deux caractères : les tableaux croisés

Intérêt des tableaux croisés :

Dans une population donnée, on peut s'intéresser à deux caractères, ou plus, simultanément. 

Par exemple, il a été demandé aux élèves de 1re d'un lycée, d'une part leur sexe (F pour fille  et G pour garçon) et d'autre part leur loisir préféré. Des élèves ont présenté les résultats sous forme d'une liste.picture-in-text D'autres ont présenté leurs résultats suivant le sexe, et ont obtenu : 

picture-in-text

Les derniers ont présenté leurs résultats en fonction du loisir préféré, et ont obtenu :

picture-in-text

Aucune de ces présentations n'est satisfaisante dans la mesure où on ne peut pas savoir combien de garçons partiquent le sport, ou combien de filles la danse, etc. 

Il est donc opportun de croiser les informations. En ligne, vont être notés les loisirs, et en colonne le sexe.

picture-in-text

Cette présentation est beaucoup plus efficace. De celle-ci, on peut déduire toutes les précédentes. Cette présentation est un tableau croisé, présentant simultanément deux caractères de la population (le sexe et le loisir de la personne interrogée).

Les effectifs totaux se lisent dans les marges du tableau (ligne « total » ou colonne « total » suivant le cas). De ce nom est tiré celui de distribution marginale lorsqu'on ne s'intéresse plus qu'à un seul caractère sur les deux étudiés.