Test d'homogénéité et hypothèse nulle
Test d'homogénéité : comparaison de plusieurs échantillons entre eux
Dans une population P,un caractère peut prendre k valeurs ou k classes. On dispose de L échantillons issues de P.
Pour tout \(\textrm{i} \in \textrm{\{ 1, ..., k}\}\), pour tout \(\textrm{j} \in\textrm{\{ 1, ..., L}\}\), on connaît Oij effectif observé de la valaur Ai dans l'échantillon Ej. L k
On note : \(\textrm{N} = \overset{L}{\underset{j = l}{\sum}}~\overset{k}{\underset{i = l}{\sum}} \textrm{Oij}\)
Hypothèse nulle
Les différences observées entre les différents échantillons sont dues aux fluctuations d'échantillonnage. Les échantillons proviennent d'une même population.
Calcul des effectifs théoriques sous l'hypothèse Ho
événements | A1 | Ai | Ak | Totaux |
échantillons | observés calculés | observés calculés | observés calculés | |
\(E_{1}\) | \(O_{11}\) \(C_{11}\) | \(O_{i1}\) \(C_{i1}\) | \(O_{k1}\) \(C_{k1}\) | \(T_{1}\) |
\(E_{j}\) | \(O_{1j}\) \(C_{1j}\) | \(O_{ij}\) \(C_{ij}\) | \(O_{kj}\) \(C_{kj}\) | \(T_{j}\) |
\(E_{L}\) | \(O_{1L}\) \(C_{1L}\) | \(O_{iL}\) \(C_{iL}\) | \(O_{kL}\) \(C_{kL}\) | \(T_{L}\) |
Totaux | \(S_{1}\) | \(S_{i}\) | \(S_{k}\) | \(N\) |
Les L échantillons sont réunis en un seul échantillon de taille N, et la probabilité de Ai est égale à \(P_{i} = \frac {\overset{L}{\underset{j = 1}{\sum}} \textrm{Oij}}{N} = \frac{S_{i}}{N}\).
L'effectif calculé de la classe Ai pour l'échantillon Ej est alors : \(C_{ij} = P_{i} ( \overset{k}{\underset{i = 1}{\sum}} \textrm{Oij} ) = P_{i}T_{j} = \frac { S_{i}T_{j} } {N}\)
Sous l'hypothèse (Ho) : \(\chi^{2} \textrm(calcul\acute{e}) = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(O_{ij} - C_{ij})^{2}}{C_{ij}}\) suit la loi du χ2 à = (k-1)(L-1) degré de liberté.
Remarque :
Pour la validité du test, il faut que Cij > 5 pour tout i et pour tout j !
Si ce n'est pas le cas, on fait :
soit des regroupements judicieux entre le Ai
soit on calcule un χ2 corrigé de Yates : \(\underset{\textrm{Yates}}{\chi^{2}} = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(|o_{ij} - c_{ij}| - 0,5)^{2}}{c_{ij}}\)
Décision
si χ2 calculé >= χ2α l'hypothèse (Ho) est écartée avec un risque d'erreur α.
si χ2calculé < χ2α l'hypothèse (Ho) ne peut être refusée avec un risque d'erreur α.