Test d'homogénéité et hypothèse nulle

Test d'homogénéité : comparaison de plusieurs échantillons entre eux

Dans une population P,un caractère peut prendre k valeurs ou k classes. On dispose de L échantillons issues de P.

Pour tout \(\textrm{i} \in \textrm{\{ 1, ..., k}\}\), pour tout \(\textrm{j} \in\textrm{\{ 1, ..., L}\}\), on connaît Oij effectif observé de la valaur Ai dans l'échantillon Ej. L k

On note : \(\textrm{N} = \overset{L}{\underset{j = l}{\sum}}~\overset{k}{\underset{i = l}{\sum}} \textrm{Oij}\)

Hypothèse nulle

Les différences observées entre les différents échantillons sont dues aux fluctuations d'échantillonnage. Les échantillons proviennent d'une même population.

Calcul des effectifs théoriques sous l'hypothèse Ho

événements

A1

Ai

Ak

Totaux

échantillons

observés calculés

observés calculés

observés calculés

\(E_{1}\)

\(O_{11}\)

\(C_{11}\)

\(O_{i1}\)

\(C_{i1}\)

\(O_{k1}\)

\(C_{k1}\)

\(T_{1}\)

\(E_{j}\)

\(O_{1j}\)

\(C_{1j}\)

\(O_{ij}\)

\(C_{ij}\)

\(O_{kj}\)

\(C_{kj}\)

\(T_{j}\)

\(E_{L}\)

\(O_{1L}\)

\(C_{1L}\)

\(O_{iL}\)

\(C_{iL}\)

\(O_{kL}\)

\(C_{kL}\)

\(T_{L}\)

Totaux

\(S_{1}\)

\(S_{i}\)

\(S_{k}\)

\(N\)

Les L échantillons sont réunis en un seul échantillon de taille N, et la probabilité de Ai est égale à \(P_{i} = \frac {\overset{L}{\underset{j = 1}{\sum}} \textrm{Oij}}{N} = \frac{S_{i}}{N}\).

L'effectif calculé de la classe Ai pour l'échantillon Ej est alors : \(C_{ij} = P_{i} ( \overset{k}{\underset{i = 1}{\sum}} \textrm{Oij} ) = P_{i}T_{j} = \frac { S_{i}T_{j} } {N}\)

Sous l'hypothèse (Ho) : \(\chi^{2} \textrm(calcul\acute{e}) = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(O_{ij} - C_{ij})^{2}}{C_{ij}}\) suit la loi du χ2 à = (k-1)(L-1) degré de liberté.

Remarque

Pour la validité du test, il faut que Cij > 5 pour tout i et pour tout j !

Si ce n'est pas le cas, on fait :

  • soit des regroupements judicieux entre le Ai

  • soit on calcule un χ2 corrigé de Yates : \(\underset{\textrm{Yates}}{\chi^{2}} = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(|o_{ij} - c_{ij}| - 0,5)^{2}}{c_{ij}}\)

Décision

  • si χ2 calculé >= χ2α l'hypothèse (Ho) est écartée avec un risque d'erreur α.

  • si χ2calculé < χ2α l'hypothèse (Ho) ne peut être refusée avec un risque d'erreur α.