Test d'homogénéité et hypothèse nulle
Test d'homogénéité : comparaison de plusieurs échantillons entre eux
Dans une population P,un caractère peut prendre k valeurs ou k classes. On dispose de L échantillons issues de P.
Pour tout , pour tout \textrm{j} \in\textrm{\{ 1, ..., L}\}, on connaît Oij effectif observé de la valaur Ai dans l'échantillon Ej. L k
On note : \textrm{N} = \overset{L}{\underset{j = l}{\sum}}~\overset{k}{\underset{i = l}{\sum}} \textrm{Oij}
Hypothèse nulle
Les différences observées entre les différents échantillons sont dues aux fluctuations d'échantillonnage. Les échantillons proviennent d'une même population.
Calcul des effectifs théoriques sous l'hypothèse Ho
événements | A1 | Ai | Ak | Totaux |
échantillons | observés calculés | observés calculés | observés calculés | |
E_{1} | O_{11} C_{11} | O_{i1} C_{i1} | O_{k1} C_{k1} | T_{1} |
E_{j} | O_{1j} C_{1j} | O_{ij} C_{ij} | O_{kj} C_{kj} | T_{j} |
E_{L} | O_{1L} C_{1L} | O_{iL} C_{iL} | O_{kL} C_{kL} | T_{L} |
Totaux | S_{1} | S_{i} | S_{k} | N |
Les L échantillons sont réunis en un seul échantillon de taille N, et la probabilité de Ai est égale à P_{i} = \frac {\overset{L}{\underset{j = 1}{\sum}} \textrm{Oij}}{N} = \frac{S_{i}}{N}.
L'effectif calculé de la classe Ai pour l'échantillon Ej est alors : C_{ij} = P_{i} ( \overset{k}{\underset{i = 1}{\sum}} \textrm{Oij} ) = P_{i}T_{j} = \frac { S_{i}T_{j} } {N}
Sous l'hypothèse (Ho) : \chi^{2} \textrm(calcul\acute{e}) = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(O_{ij} - C_{ij})^{2}}{C_{ij}} suit la loi du χ2 à = (k-1)(L-1) degré de liberté.
Remarque :
Pour la validité du test, il faut que Cij > 5 pour tout i et pour tout j !
Si ce n'est pas le cas, on fait :
soit des regroupements judicieux entre le Ai
soit on calcule un χ2 corrigé de Yates : \underset{\textrm{Yates}}{\chi^{2}} = \overset{k}{\underset{i = 1}{\sum}}~\overset{L}{\underset{j = 1}{\sum}} \frac{(|o_{ij} - c_{ij}| - 0,5)^{2}}{c_{ij}}
Décision
si χ2 calculé >= χ2α l'hypothèse (Ho) est écartée avec un risque d'erreur α.
si χ2calculé < χ2α l'hypothèse (Ho) ne peut être refusée avec un risque d'erreur α.