Test du khi-deux pour l'homogénéité

Tout le monde a déjà été confronté à cette situation : toi et ta moitié n'arrivez pas à vous mettre d'accord sur ce qu'il faut regarder pour la soirée de sortie ! Pendant que vous discutez tous les deux du film à regarder, une question surgit au fond de ton esprit : les différents types de personnes (par exemple, les hommes et les femmes) ont-ils des préférences différentes en matière de films ? La réponse à cette question, et à d'autres du même genre, peut être trouvée à l'aide d'un test spécifique du Khi-deux - le test du Khi-deuxa> pour l'homogénéité.

C'est parti

Des millions de fiches spécialement conçues pour étudier facilement

Inscris-toi gratuitement
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Un test du Khi-deux pour l'homogénéité repose sur les mêmes hypothèses de base que tout autre test du Khi-deux de Pearson :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Comme pour tout test statistique, ton plan d'analyse lors d'un test du Khi-deux pour l'homogénéité décrit comment tu utiliseras les données de l'échantillon pour accepter ou rejeter l'hypothèse nulle. Ton plan doit préciser les points suivants :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Lorsque tu fais un test du Khi-deux pour l'homogénéité, tu utilises les données de l'échantillon de ton tableau de contingence pour trouver :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Il y a __ variables dans un test du khi-deux pour l'homogénéité. Par conséquent, tu as besoin que les totaux s'additionnent dans __ dimensions.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

La valeur \(p\) d'un test du Khi-deux pour l'homogénéité est la probabilité que la statistique du test, avec \(k\) degrés de liberté, soit __ que sa valeur calculée.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Vrai ou faux ? Pour interpréter les résultats d'un test du Khi-deux pour l'homogénéité, tu compares la valeur de \(p\) au niveau de signification et tu rejettes l'hypothèse nulle si la valeur de \(p\) est inférieure au niveau de signification.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Les niveaux de signification les plus courants sont \N( 0,01, 0,05, \N) et \N( 0,10, \N), mais toute valeur comprise entre __ peut être utilisée.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Un test du Khi-deux pour l'homogénéité repose sur les mêmes hypothèses de base que tout autre test du Khi-deux de Pearson :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Comme pour tout test statistique, ton plan d'analyse lors d'un test du Khi-deux pour l'homogénéité décrit comment tu utiliseras les données de l'échantillon pour accepter ou rejeter l'hypothèse nulle. Ton plan doit préciser les points suivants :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Lorsque tu fais un test du Khi-deux pour l'homogénéité, tu utilises les données de l'échantillon de ton tableau de contingence pour trouver :

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Il y a __ variables dans un test du khi-deux pour l'homogénéité. Par conséquent, tu as besoin que les totaux s'additionnent dans __ dimensions.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

La valeur \(p\) d'un test du Khi-deux pour l'homogénéité est la probabilité que la statistique du test, avec \(k\) degrés de liberté, soit __ que sa valeur calculée.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Vrai ou faux ? Pour interpréter les résultats d'un test du Khi-deux pour l'homogénéité, tu compares la valeur de \(p\) au niveau de signification et tu rejettes l'hypothèse nulle si la valeur de \(p\) est inférieure au niveau de signification.

Afficer la réponse
  • + Add tag
  • Immunology
  • Cell Biology
  • Mo

Les niveaux de signification les plus courants sont \N( 0,01, 0,05, \N) et \N( 0,10, \N), mais toute valeur comprise entre __ peut être utilisée.

Afficer la réponse

Review generated flashcards

Inscris-toi gratuitement
Tu as atteint la limite quotidienne de l'IA

Commence à apprendre ou crée tes propres flashcards d'IA

Équipe éditoriale StudySmarter

Équipe enseignants Test du khi-deux pour l'homogénéité

  • Temps de lecture: 24 minutes
  • Vérifié par l'équipe éditoriale StudySmarter
Sauvegarder l'explication Sauvegarder l'explication
Tables des matières
Tables des matières

Sauter à un chapitre clé

    Définition du test du chi-deux pour l'homogénéité

    Lorsque tu veux savoir si deux variables catégorielles suivent la même distribution de probabilité (comme dans la question sur les préférences cinématographiques ci-dessus), tu peux utiliser le test d'homogénéité du khi-deux.

    Le test d'homogénéité du khi-deux est un test non paramétrique du khi-deux de Pearson que tu appliques à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.

    Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) ou plusieurs variables catégorielles.

    Conditions d'un test du chi carré pour l'homogénéité

    Tous les tests du khi-deux de Pearson partagent les mêmes conditions de base. La principale différence réside dans la façon dont ces conditions s'appliquent dans la pratique. Un test du Khi-deux pour l'homogénéité nécessite une variable catégorielle provenant d'au moins deux populations, et les données doivent être le nombre brut de membres de chaque catégorie. Ce test permet de vérifier si les deux variables suivent la même distribution.

    Pour pouvoir utiliser ce test, les conditions d'un test d'homogénéité du Khi-deux sont :

    • Les variables doivent être catégoriques.

      • Comme tu testes l'homogénéité des variables, elles doivent avoir les mêmes groupes. Ce test du Khi-deux utilise des tableaux croisés, en comptant les observations qui entrent dans chaque catégorie.

    Référence de l'étude : "Arrêt cardiaque extrahospitalier dans les immeubles de grande hauteur : Delays to Patient Care and Effect on Survival "1 - qui a été publiée dans le Journal de l'Association médicale canadienne (JAMC) le 5 avril 2016.

    Cette étude a comparé le mode de vie des adultes (maison ou maison de ville, appartement à \(1^{st}\) ou \(2^{nd}\) étage, et appartement à \(3^{rd}\) ou étage supérieur) avec leur taux de survie à une crise cardiaque (a survécu ou n'a pas survécu).

    Ton objectif est de savoir s'il existe une différence dans les proportions des catégories de survie (c'est-à-dire, as-tu plus de chances de survivre à une crise cardiaque selon l'endroit où tu vis ?) pour les populations de \(3\N) :

    1. les victimes de crises cardiaques qui vivent dans une maison ou une maison de ville,
    2. les victimes de crises cardiaques qui vivent au 1er ou au 2e étage d'un immeuble d'habitation, et
    3. les victimes de crises cardiaques qui vivent à l'étage (3^{rd}\) ou à un étage supérieur d'un immeuble d'habitation.
    • Les groupes doivent s'exclure mutuellement, c'est-à-dire que l'échantillon est sélectionné au hasard.

      • Chaque observation ne peut faire partie que d'un seul groupe. Une personne peut vivre dans une maison ou dans un appartement, mais elle ne peut pas vivre dans les deux.

    Table de contingence
    Mode de vieSurvécuN'a pas survécuTotal des rangées
    Maison ou maison en rangée21753145531
    Appartement au1er ou2e étage35632667
    Appartement au3ème étage ou plus4616501696
    Totaux des colonnes2987596\(n =\) 7894

    Tableau 1. Tableau de contingence, test du chi-deux pour l'homogénéité.

    • Les effectifs attendus doivent être au moins égaux à \(5\).

      • Cela signifie que la taille de l'échantillon doit être suffisamment grande, mais il est difficile de déterminer à l'avance quelle est cette taille. En général, il suffit de s'assurer qu'il y a plus de \(5\) dans chaque catégorie.

    • Les observations doivent être indépendantes.

      • Cette hypothèse est liée à la façon dont tu recueilles les données. Si tu utilises un échantillonnage aléatoire simple, il sera presque toujours statistiquement valide.

    Test du chi carré pour l'homogénéité : hypothèse nulle et hypothèse alternative

    La question sous-jacente à ce test d'hypothèse est la suivante : Ces deux variables suivent-elles la même distribution ?

    Les hypothèses sont formées pour répondre à cette question.

    • L'hypothèse nulle est que les deux variables sont issues de la même distribution.\[ \i1{align}H_{0} : p_{1,1} &= p_{2,1} \text{ AND } \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
    • L'hypothèse nulle exige que chaque catégorie ait la même probabilité entre les deux variables.

    • The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]

    • Si même une seule catégorie est différente d'une variable à l'autre, alors le test renverra un résultat significatif et fournira la preuve du rejet de l'hypothèse nulle.

    Les hypothèses nulle et alternative de l'étude sur la survie après une crise cardiaque sont les suivantes :

    La population est constituée des personnes qui vivent dans des maisons, des maisons en rangée ou des appartements et qui ont eu une crise cardiaque.

    • Hypothèse nulle\N( H_{0} : \N) Les proportions dans chaque catégorie de survie sont les mêmes pour tous les groupes de personnes.
    • Hypothèse alternative\N( H_{a} : \N) Les proportions dans chaque catégorie de survie ne sont pas les mêmes pour tous les groupes de personnes.

    Fréquences attendues pour un test du khi-deux pour l'homogénéité

    Tu dois calculer les fréquences attendues pour un test du Khi-deux pour l'homogénéité individuellement pour chaque population à chaque niveau de la variable catégorielle, comme indiqué par la formule :

    \[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]

    où ,

    • \(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\) de la variable catégorielle,

    • \(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence,

    • \(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence,

    • \(n_{r}\) est le nombre d'observations de la population \(r\),

    • \(n_{c}\) est le nombre d'observations du niveau \(c\) de la variable catégorielle, et

    • \(n\) est la taille totale de l'échantillon.

    Poursuis avec l'étude sur la survie après une crise cardiaque :

    Ensuite, tu calcules les fréquences attendues à l'aide de la formule ci-dessus et du tableau de contingence, en plaçant tes résultats dans un tableau de contingence modifié pour que tes données restent organisées.

    • \( E_{1,1} = \frac{5531 \cdot 298}{7894} = 208.795 \)
    • \( E_{1,2} = \frac{5531 \cdot 7596}{7894} = 5322.205 \N-)
    • \( E_{2,1} = \frac{667 \cdot 298}{7894} = 25.179 \N-)
    • \( E_{2,2} = \frac{667 \cdot 7596}{7894} = 641.821 \N-)
    • \N- E_{3,1} = \Nfrac{1696 \cdot 298}{7894} = 64.024 \N- E_{3,1} = \Nfrac{1696 \cdot 298}{7894} = 64.024 \N
    • \( E_{3,2} = \frac{1696 \cdot 7596}{7894} = 1631.976 \N-)

    Tableau 2. Tableau de contingence avec les fréquences observées, test du chi-deux pour l'homogénéité.

    Tableau de contingence avec les fréquences observées (O) et les fréquences attendues (E)
    Mode de vieA survécuN'a pas survécuTotal des rangées
    Maison ou maison en rangéeO1,1: 217E1,1: 208.795O1,2: 5314E1,2: 5322.2055531
    Appartement au1er ou2ème étageO2,1: 35E2,1: 25.179O2,2: 632E2,2: 641.821667
    Appartement au3ème étage ou plusO3,1: 46E3,1: 64.024O3,2: 1650E3,2: 1631.9761696
    Totaux des colonnes2987596\(n =\) 7894

    Les décimales du tableau sont arrondies à \(3\) chiffres.

    Degrés de liberté pour un test d'homogénéité du khi-deux

    Il y a deux variables dans un test du khi-deux pour l'homogénéité. Par conséquent, tu compares deux variables et tu as besoin que le tableau de contingence s'additionne dans les deux dimensions.

    Puisque tu as besoin que les lignes et les colonnes s'additionnent, les degrés de liberté se calculent comme suit :

    \[ k = (r - 1) (c - 1) \]

    où,

    • \N(k\N) est le degré de liberté,

    • \(r\) est le nombre de populations, qui est également le nombre de lignes dans un tableau de contingence, et

    • \(c\) est le nombre de niveaux de la variable catégorielle, qui est également le nombre de colonnes d'un tableau de contingence.

    Test du chi carré pour l'homogénéité : Formule

    La formule (également appelée statistique de test) d'un test du khi-deux pour l'homogénéité est :

    \[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \]

    où ,

    • \(O_{r,c}\) est la fréquence observée pour la population \(r\) au niveau \(c\), et

    • \(E_{r,c}\) est la fréquence attendue pour la population \(r\) au niveau \(c\).

    Comment calculer la statistique de test pour un test d'homogénéité du khi-deux ?

    Étape 1 : Créer un tableau

    En commençant par ton tableau de contingence, supprime la colonne "Totaux des lignes" et la ligne "Totaux des colonnes". Ensuite, sépare tes fréquences observées et attendues en deux colonnes, comme suit :

    Tableau 3. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.

    Tableau des fréquences observées et attendues
    Mode de vieStatutFréquence observéeFréquence attendue
    Maison ou maison de villeSurvivant217208.795
    N'a pas survécu53145322.205
    Appartement du1er ou du2e étageA survécu3525.179
    N'a pas survécu632641.821
    Appartement du3ème étage ou plusA survécu4664.024
    N'a pas survécu16501631.976

    Les décimales de ce tableau sont arrondies à \(3\) chiffres.

    Étape \(2\) : Soustraire les fréquences attendues des fréquences observées

    Ajoute une nouvelle colonne à ton tableau, intitulée "O - E". Dans cette colonne, inscris le résultat de la soustraction de la fréquence attendue à la fréquence observée :

    Tableau 4. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.

    Tableau des fréquences observées, attendues et O - E
    Mode de vieStatutFréquence observéeFréquence attendueO - E
    Maison ou maison de villeSurvivant217208.7958.205
    N'a pas survécu53145322.205-8.205
    Appartement du1er ou2ème étageA survécu3525.1799.821
    N'a pas survécu632641.821-9.821
    Appartement du3ème étage ou plusA survécu4664.024-18.024
    N'a pas survécu16501631.97618.024

    Les décimales de ce tableau sont arrondies à \(3\) chiffres.

    Étape \N(3\N) : Élever au carré les résultats de l'étape \N(2\N)Ajoute une nouvelle colonne à ton tableau, appelée "(O - E)2". Dans cette colonne, inscris le résultat de la mise au carré des résultats de la colonne précédente :

    Tableau 5. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.

    Tableau des fréquences observées, attendues, O - E et (O - E)2
    Mode de vieStatutFréquence observéeFréquence attendueO - E(O - E)2
    Maison ou maison de villeSurvivant217208.7958.20567.322
    N'a pas survécu53145322.205-8.20567.322
    Appartement du1er ou2ème étageSurvivant3525.1799.82196.452
    N'a pas survécu632641.821-9.82196.452
    Appartement du3ème étage ou plusSurvivant4664.024-18.024324.865
    N'a pas survécu16501631.97618.024324.865

    Les décimales de ce tableau sont arrondies à \(3\) chiffres.

    Étape \(4\) : Diviser les résultats de l'étape \(3\) par les fréquences attenduesAjoute une nouvelle colonne à ton tableau appelée "(O - E)2/E". Dans cette colonne, inscris le résultat de la division des résultats de la colonne précédente par leurs fréquences attendues :

    Tableau 6. Tableau des fréquences observées et attendues, test du chi-deux pour l'homogénéité.

    Tableau des fréquences observées, attendues, O - E, (O - E)2, et (O - E)2/E
    Mode de vieStatutFréquence observéeFréquence attendueO - E(O - E)2(O - E)2/E
    Maison ou maison de villeSurvivant217208.7958.20567.3220.322
    N'a pas survécu53145322.205-8.20567.3220.013
    Appartement du1er ou du2e étageSurvivant3525.1799.82196.4523.831
    N'a pas survécu632641.821-9.82196.4520.150
    Appartement du3ème étage ou plusSurvivant4664.024-18.024324.8655.074
    N'a pas survécu16501631.97618.024324.8650.199

    Les décimales de ce tableau sont arrondies à \(3\) chiffres.

    Étape 5 : Additionne les résultats de l'étape \N(4\N) pour obtenir la statistique du test du khi-deuxEnfin, additionne toutes les valeurs de la dernière colonne de ton tableau pour calculer la statistique de ton test du khi-deux :

    \[ \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N- \N-{r,c} - E_{r,c})^{2}}{ E_{r,c}} \N-&= 0.322 + 0.013 + 3.831 + 0.150 + 5.074 + 0.199 \N-&= 9.589.\N- end{align} \]

    La statistique du test du Khi-deux pour l'homogénéité dans l'étude sur la survie aux crises cardiaques est:

    \[ \chi^{2} = 9.589. \]

    Étapes à suivre pour effectuer un test du khi-deux pour l'homogénéité

    Pour déterminer si la statistique du test est suffisamment importante pour rejeter l'hypothèse nulle, tu compares la statistique du test à une valeur critique tirée d'une table de distribution du khi-deux. Cette comparaison est au cœur du test d'homogénéité du khi-deux.

    Suis les étapes ci-dessous pour effectuer un test d'homogénéité du khi-deux.

    Les étapes \(1, 2\) et \(3\) sont décrites en détail dans les sections précédentes : "Test du khi-deux pour l'homogénéité : hypothèse nulle et hypothèse alternative", "Fréquences attendues pour un test du khi-deux pour l'homogénéité", et "Comment calculer la statistique de test pour un test du khi-deux pour l'homogénéité".

    Étape \(1\) : Énoncer les hypothèses

    • L'hypothèse nulle est que les deux variables sont issues de la même distribution.\N-[ \N-{align}H_{0} : p_{1,1} &= p_{2,1} \N-{text{ AND }]. \\N-p_{1,2} &= p_{2,2} \N-text{ AND } \ldots \text{ AND } \\N-p_{1,n} &= p_{2,n}\N- end{align} \]
    • The alternative hypothesis is that the two variables are not from the same distribution, i.e., at least one of the null hypotheses is false.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\N-p_{1,2} &\neq p_{2,2} \text{ OR } \ldots \text{ OR } \\N-p_{1,n} &\neq p_{2,n}\N- end{align} \]

    Étape \(2\) : Calculer les fréquences attendues

    Fais référence à ton tableau de contingence pour calculer les fréquences attendues à l'aide de la formule :

    \[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]

    Étape \N(3\N) : Calculer la statistique du test du khi-deux

    Utilise la formule du test d'homogénéité du khi-deux pour calculer la statistique du test du khi-deux :

    \N[ \NChi^{2} = \Nsomme \Nfrac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \N].

    Étape \N(4\N) : Trouver la valeur critique du Khi-deux

    Pour trouver la valeur critique du khi-deux, tu peux soit :

    1. utiliser un tableau de distribution du khi-deux, ou

    2. utiliser une calculatrice de valeur critique.

    Quelle que soit la méthode choisie, tu as besoin de \(2\) informations :

    1. les degrés de liberté, \(k\), donnés par la formule :

      \[ k = (r - 1) (c - 1) \]

    2. et le niveau de signification, \(\alpha\), qui est généralement \(0,05\).

    Trouve la valeur critique de l'étude sur la survie en cas de crise cardiaque.

    Pour trouver la valeur critique :

    1. Calcule les degrés de liberté.
      • En utilisant le tableau de contingence, remarque qu'il y a \(3\) lignes et \(2\) colonnes de données brutes. Therefore, the degrees of freedom are:\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3-1) (2-1) \\&= 2 \text{ degrees of freedom}\end{align} \]
    2. Choisis un niveau de signification.
      • En général, sauf indication contraire, le niveau de signification de \( \alpha = 0,05 \) est celui que tu veux utiliser. Cette étude a également utilisé ce niveau de signification.
    3. Détermine la valeur critique (tu peux utiliser un tableau de distribution du khi-deux ou une calculatrice). Un tableau de distribution du khi-deux est utilisé ici.
      • D'après le tableau de distribution du khi-deux ci-dessous, pour \N( k = 2 \N) et \N( \Nalpha = 0,05 \N), la valeur critique est :\N[ \Nchi^{2} \Ntext{ valeur critique} = 5,99. \N].

    Tableau 7. Tableau des points de pourcentage, test du khi-deux pour l'homogénéité.

    Points de pourcentage de la distribution du khi-deux
    Degrés de liberté(k)Probabilité d'une valeur plus grande de X2; niveau de signification (α).
    0.990.950.900.750.500.250.100.050.01
    10.0000.0040.0160.1020.4551.322.713.846.63
    20.0200.1030.2110.5751.3862.774.615.999.21
    30.1150.3520.5841.2122.3664.116.257.8111.34

    Étape \(5\) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux

    La statistique de ton test est-elle suffisamment grande pour rejeter l'hypothèse nulle ? Pour le savoir, compare-la à la valeur critique.

    Compare la statistique de ton test à la valeur critique dans l'étude sur la survie des victimes de crises cardiaques :

    La statistique du test du khi-deux est : \N( \Nchi^{2} = 9,589 \N)

    La valeur critique du khi-deux est : \( 5.99 \)

    La statistique du test du khi-deux est supérieure à la valeur critique.

    Étape \(6\) : Décider de rejeter ou non l'hypothèse nulle

    Enfin, décide si tu peux rejeter l'hypothèse nulle.

    • Si la valeur du khi-deux est inférieure à la valeur critique, la différence entre les fréquences observées et attendues n'est pas significative, c'est-à-dire que p > alpha.

      • Cela signifie que tu ne rejettes pas l'hypothèse nulle.

    • Si la valeur du Khi-deux est supérieure à la valeur critique, il y a une différence significative entre les fréquences observées et les fréquences attendues, c'est-à-dire \( p < \alpha \).

      • Cela signifie que tu as suffisamment de preuves pour rejeter l'hypothèse nulle.

    Tu peux maintenant décider de rejeter l'hypothèse nulle pour l'étude sur la survie en cas de crise cardiaque :

    La statistique du test du Khi-deux est supérieure à la valeur critique, c'est-à-dire que la valeur de \(p\) est inférieure au seuil de signification.

    • Tu as donc des preuves solides que les proportions dans les catégories de survie ne sont pas les mêmes pour les groupes \(3\).

    Tu conclus qu'il y a moins de chances de survie pour les personnes victimes d'une crise cardiaque et vivant au troisième étage ou plus d'un appartement, et tu rejettes donc l'hypothèse nulle.

    Valeur P d'un test du khi-deux pour l'homogénéité

    La valeur P d'un test du Khi-deux pour l'homogénéité est la probabilité que la statistique du test, avec \(k\) degrés de liberté, soit plus extrême que sa valeur calculée. Tu peux utiliser une calculatrice de distribution du khi-deux pour trouver la valeur \(p\) d'une statistique de test. Tu peux aussi utiliser un tableau de distribution du khi-deux pour déterminer si la valeur de la statistique de ton test du khi-deux est supérieure à un certain seuil de signification.

    Test du chi-deux pour l'homogénéité VS l'indépendance

    À ce stade, tu peux te demander quelle est la différence entre un test du khi-deux pour l'homogénéité et un test du khi-deux pour l'indépendance.

    Tu utilises le test du Khi-deux pour l'homogénéité lorsque tu n'as que \(1) variable catégorielle provenant de \(2) (ou plus) populations.

    • Dans ce test, tu collectes au hasard des données d'une population pour déterminer s'il existe une association significative entre \(2\) variables catégorielles.

    Lorsque tu interroges les élèves d'une école, tu peux leur demander quelle est leur matière préférée. Tu poses la même question à des populations d'élèves différentes :

    • les étudiants de première année et
    • étudiants de première année et à ceux de terminale.

    Tu utilises un test d'homogénéité du khi-deux pour déterminer si les préférences des étudiants de première année diffèrent significativement de celles des étudiants de terminale.

    Tu utilises le test du khi-deux pour l'indépendance lorsque tu as \Ndes variables catégorielles provenant de la même population.

    • Dans ce test, tu recueilles au hasard les données de chaque sous-groupe séparément afin de déterminer si le nombre de fréquences diffère de manière significative entre les différentes populations.

    Dans une école, les élèves peuvent être classés en fonction de :

    • leur orientation (gaucher ou droitier) ou par
    • leur domaine d'études (mathématiques, physique, économie, etc.).

    Tu utilises un test d'indépendance du khi-deux pour déterminer si le fait d'être gaucher ou droitier est lié au choix des études.

    Exemple de test du khi-deux pour l'homogénéité

    En reprenant l'exemple de l'introduction, tu décides de trouver une réponse à la question suivante : les hommes et les femmes ont-ils des préférences différentes en matière de films ?

    Tu choisis un échantillon aléatoire de \(400\) étudiants de première année d'université : \N(200\N) hommes et \N(300\N) femmes. On demande à chaque personne lequel des films suivants elle préfère : The Terminator ; The Princess Bride ; ou The Lego Movie. Les résultats sont présentés dans le tableau de contingence ci-dessous.

    Tableau 8. Tableau de contingence, test du chi carré pour l'homogénéité.

    Tableau de contingence
    FilmHommesFemmesTotaux des rangées
    Le Terminator12050170
    La Princesse Mariée20140160
    Lego Movie60110170
    Totaux des colonnes200300\(n =\) 500

    Solution:

    Étape \(1\) : Énonce les hypothèses.

    • Hypothèse nulle: la proportion d'hommes qui préfèrent chaque film est égale à la proportion de femmes qui préfèrent chaque film. Ainsi,\N-[ \N-{align}H_{0} : p_{{text{hommes aiment Le Terminator}} &= p_{{text{femmes aiment Le Terminator}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment The Princess Bride} &= p_{text{femmes aiment The Princess Bride}} \text{ AND} \\N-H_{0} : p_{text{hommes aiment Le Lego Movie} &= p_{text{femmes aiment Le Lego Movie}\N- [\N-] [\N-] [\N-] [\N-] [\N-] [\N-] \]
    • Hypothèse alternative: Au moins une des hypothèses nulles est fausse. So,\[ \begin{align}H_{a}: p_{\text{men like The Terminator}} &\neq p_{\text{women like The Terminator}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment La Princesse Bride} &\neq p_{text{femmes aiment La Princesse Bride}} \text{ OR} \\N-H_{a} : p_{text{hommes aiment The Lego Movie} &\neq p_{text{femmes aiment The Lego Movie}}\end{align} \]

    Étape \(2\) : Calculer les fréquences attendues.

    • En utilisant le tableau de contingence ci-dessus et la formule des fréquences attendues :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}, \]créer un tableau des fréquences attendues.

    Tableau 9. Tableau des données pour les films, test du khi-deux pour l'homogénéité.

    FilmHommesFemmesTotaux des rangées
    Terminator68102170
    La princesse mariée6496160
    Lego Movie68102170
    Totaux des colonnes200300\(n =\) 500

    Étape \(3\) : Calcule la statistique du test du khi-deux.

    • Crée un tableau pour conserver les valeurs calculées et utilise la formule :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \]pour calculer la statistique de ton test.

    Tableau 10. Tableau des données pour les films, test du Khi-deux pour l'homogénéité.

    FilmPersonneFréquence observéeFréquence attendueO-E(O-E)2(O-E)2/E
    TerminatorHommes1206852270439.767
    Les femmes50102-52270426.510
    Princess BrideLes hommes2064-44193630.250
    Les femmes1409644193620.167
    Lego MovieLes hommes6068-8640.941
    Les femmes1101028640.627

    Les décimales de ce tableau sont arrondies à \(3\) chiffres.

    • Add all the values in the last column of the table above to calculate the Chi-square test statistic:\[ \begin{align}\chi^{2} &= 39.76470588 + 26.50980392 \\&+ 30.25 + 20.16667 \\&+ 0.9411764706 + 0.6274509804 \\&= 118.2598039.\end{align} \]

      La formule ici utilise les nombres non arrondis du tableau ci-dessus pour obtenir une réponse plus précise.

    • La statistique du test du Khi-deux est la suivante :\[ \chi^{2} = 118.2598039. \]

    Étape \N(4\N) : Trouve la valeur critique du khi-deux et la valeur \(P\)-Valeur.

    • Calculate the degrees of freedom.\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3 - 1) (2 - 1) \\&= 2\end{align} \]
    • À l'aide d'un tableau de distribution du khi-deux, regarde la ligne des degrés de liberté (2) et la colonne de la signification (0,05) pour trouver la valeur critique de 5,99.
    • Pour utiliser une calculatrice de la valeur de \(p\), tu as besoin de la statistique du test et des degrés de liberté.
      • Entre les degrés de liberté et la valeur critique du Khi-deux dans la calculatrice pour obtenir :[P(\chi^{2} > 118,2598039) = 0. \N].

    Étape \N(5\N) : Comparer la statistique du test du khi-deux à la valeur critique du khi-deux.

    • La statistique du test de \N(118.2598039\N) est significativement plus grande que la valeur critique de \N(5.99\N).
    • La valeur de \(p\) est également bien inférieure au niveau de signification.

    Étape 6 : Décider de rejeter ou non l'hypothèse nulle.

    • Parce que la statistique du test est plus grande que la valeur critique et que la valeur de \(p\)est inférieure au seuil de signification, tu as suffisamment de preuves pour rejeter l'hypothèse nulle,

    tu as suffisamment de preuves pour rejeter l'hypothèse nulle.

    Test du chi-deux pour l'homogénéité - Principaux enseignements

    • Le test du Khi-deux pour l'homogénéité est un test du Khi-deux qui s'applique à une seule variable catégorielle provenant de deux ou plusieurs populations différentes afin de déterminer si elles ont la même distribution.
    • Ce test a les mêmes conditions de base que tout autre test du chi carré de Pearson;
      • Les variables doivent être catégoriques.
      • Les groupes doivent être mutuellement exclusifs.
      • Les effectifs attendus doivent être au moins égaux à \(5\).
      • Les observations doivent être indépendantes.
    • L'hypothèse nulle est que les variables proviennent de la même distribution.
    • L'hypothèse alternative est que les variables n'appartiennent pas à la même distribution.
    • Les degrés de liberté d'un test du Khi-deux pour l'homogénéité sont donnés par la formule :\[ k = (r - 1) (c - 1) \].
    • La fréquence attendue pour la ligne \(r\) et la colonne \(c\) d'un test du Khi-deux pour l'homogénéité est donnée par la formule :\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
    • La formule (ou statistique de test) d'un test du Khi-deux pour l'homogénéité est donnée par la formule suivante :\[ \chi^{2} = \sum \frac{(O_{r,c} - E_{r,c})^{2}}{E_{r,c}} \].

    Références

    1. https://pubmed.ncbi.nlm.nih.gov/26783332/
    Questions fréquemment posées en Test du khi-deux pour l'homogénéité
    Qu'est-ce que le Test du khi-deux pour l'homogénéité?
    Le Test du khi-deux pour l'homogénéité est une méthode statistique pour vérifier si deux ou plusieurs groupes indépendants suivent la même distribution.
    Comment effectuer le Test du khi-deux pour l'homogénéité?
    Pour effectuer le test, il faut établir un tableau de contingence, calculer les fréquences attendues, trouver la statistique khi-deux et comparer avec une valeur critique.
    Quels sont les prérequis du Test du khi-deux pour l'homogénéité?
    Les prérequis incluent des échantillons indépendants, des données catégorielles, et des effectifs théoriques d'au moins 5 par cellule.
    Quand utiliser le Test du khi-deux pour l'homogénéité?
    On utilise le test lorsqu'on veut comparer les distributions de deux ou plusieurs groupes indépendants sur une même variable qualitative.
    Sauvegarder l'explication

    Teste tes connaissances avec des questions à choix multiples

    Un test du Khi-deux pour l'homogénéité repose sur les mêmes hypothèses de base que tout autre test du Khi-deux de Pearson :

    Comme pour tout test statistique, ton plan d'analyse lors d'un test du Khi-deux pour l'homogénéité décrit comment tu utiliseras les données de l'échantillon pour accepter ou rejeter l'hypothèse nulle. Ton plan doit préciser les points suivants :

    Lorsque tu fais un test du Khi-deux pour l'homogénéité, tu utilises les données de l'échantillon de ton tableau de contingence pour trouver :

    Suivant

    Découvre des matériels d'apprentissage avec l'application gratuite StudySmarter

    Lance-toi dans tes études
    1
    À propos de StudySmarter

    StudySmarter est une entreprise de technologie éducative mondialement reconnue, offrant une plateforme d'apprentissage holistique conçue pour les étudiants de tous âges et de tous niveaux éducatifs. Notre plateforme fournit un soutien à l'apprentissage pour une large gamme de sujets, y compris les STEM, les sciences sociales et les langues, et aide également les étudiants à réussir divers tests et examens dans le monde entier, tels que le GCSE, le A Level, le SAT, l'ACT, l'Abitur, et plus encore. Nous proposons une bibliothèque étendue de matériels d'apprentissage, y compris des flashcards interactives, des solutions de manuels scolaires complètes et des explications détaillées. La technologie de pointe et les outils que nous fournissons aident les étudiants à créer leurs propres matériels d'apprentissage. Le contenu de StudySmarter est non seulement vérifié par des experts, mais également régulièrement mis à jour pour garantir l'exactitude et la pertinence.

    En savoir plus
    Équipe éditoriale StudySmarter

    Équipe enseignants Mathématiques

    • Temps de lecture: 24 minutes
    • Vérifié par l'équipe éditoriale StudySmarter
    Sauvegarder l'explication Sauvegarder l'explication

    Sauvegarder l'explication

    Inscris-toi gratuitement

    Inscris-toi gratuitement et commence à réviser !

    Rejoins plus de 22 millions d'étudiants qui apprennent avec notre appli StudySmarter !

    La première appli d'apprentissage qui a réunit vraiment tout ce dont tu as besoin pour réussir tes examens.

    • Fiches & Quiz
    • Assistant virtuel basé sur l’IA
    • Planificateur d'étude
    • Examens blancs
    • Prise de notes intelligente
    Rejoins plus de 22 millions d'étudiants qui apprennent avec notre appli StudySmarter !