Statistische Definition des Chi-Quadrats (χ2)
Was ist eine Chi-Quadrat-Statistik?
Eine Chi-Quadrat- Statistik ( χ 2 ) ist ein Test, der misst, wie ein Modell mit tatsächlich beobachteten Daten verglichen wird. Die zur Berechnung einer Chi-Quadrat- Statistik verwendeten Daten müssen zufällig, roh, sich gegenseitig ausschließend, aus unabhängigen Variablen und aus einer ausreichend großen Stichprobe stammen. Zum Beispiel erfüllen die Ergebnisse des Werfens einer fairen Münze diese Kriterien.
Chi-Quadrat-Tests werden häufig beim Testen von Hypothesen verwendet. Die Chi-Quadrat-Statistik vergleicht die Größe von Abweichungen zwischen den erwarteten Ergebnissen und den tatsächlichen Ergebnissen angesichts der Größe der Stichprobe und der Anzahl der Variablen in der Beziehung. Für diese Tests werden Freiheitsgrade verwendet, um zu bestimmen, ob eine bestimmte Nullhypothese basierend auf der Gesamtzahl der Variablen und Proben innerhalb des Experiments verworfen werden kann. Wie bei jeder Statistik sind die Ergebnisse umso zuverlässiger, je größer die Stichprobe ist.
Die zentralen Thesen
- Eine Chi-Quadrat- Statistik ( χ 2 ) ist ein Maß für die Differenz zwischen der beobachteten und der erwarteten Häufigkeit der Ergebnisse einer Reihe von Ereignissen oder Variablen.
- χ 2 hängt von der Größe der Differenz zwischen tatsächlichen und beobachteten Werten, den Freiheitsgraden und der Stichprobengröße ab.
- χ 2 kann verwendet werden, um zu testen, ob zwei Variablen miteinander verwandt oder unabhängig sind, oder um die Anpassungsgüte zwischen einer beobachteten Verteilung und einer theoretischen Häufigkeitsverteilung zu testen.
Die Formel für das Chi-Quadrat lautet
Was sagt Ihnen eine Chi-Quadrat-Statistik?
Es gibt zwei Hauptarten von Chi-Quadrat-Tests: den Unabhängigkeitstest, bei dem eine Frage der Beziehung gestellt wird, z. B. „Gibt es eine Beziehung zwischen dem Geschlecht der Schüler und der Wahl des Kurses?“; und der Anpassungstest, bei dem etwa gefragt wird: „Wie gut passt die Münze in meiner Hand zu einer theoretisch fairen Münze?“
Unabhängigkeit
Bei der Betrachtung des Geschlechts der Schüler und der Wahl des Kurses könnte ein χ 2- Test für die Unabhängigkeit verwendet werden. Um diesen Test durchzuführen, sammelte der Forscher Daten zu den beiden ausgewählten Variablen (Geschlecht und ausgewählte Kurse) und verglich dann die Häufigkeit, mit der männliche und weibliche Schüler unter den angebotenen Klassen auswählen, unter Verwendung der oben angegebenen Formel und einer statistischen Tabelle χ 2.
Wenn es keine Beziehung zwischen Geschlecht und Kursauswahl gibt (dh wenn sie unabhängig sind), sollte erwartet werden, dass die tatsächliche Häufigkeit, mit der männliche und weibliche Studenten jeden angebotenen Kurs auswählen, ungefähr gleich ist oder umgekehrt dem Anteil von Männern und Frauen entspricht Studentinnen in einem ausgewählten Kurs sollten ungefähr dem Anteil männlicher und weiblicher Studenten in der Stichprobe entsprechen. Ein χ 2- Test für die Unabhängigkeit kann uns sagen, wie wahrscheinlich es ist, dass zufällige Zufälle einen beobachteten Unterschied zwischen den tatsächlichen Häufigkeiten in den Daten und diesen theoretischen Erwartungen erklären können.
Güte der Anpassung
χ 2 bietet eine Möglichkeit zu testen, wie gut eine Datenstichprobe mit den (bekannten oder angenommenen) Merkmalen der größeren Population übereinstimmt, die die Stichprobe darstellen soll. Wenn die Stichprobendaten nicht zu den erwarteten Eigenschaften der Population passen, an der wir interessiert sind, möchten wir diese Stichprobe nicht verwenden, um Schlussfolgerungen über die größere Population zu ziehen.
Stellen Sie sich zum Beispiel eine imaginäre Münze mit einer Wahrscheinlichkeit von genau 50/50 vor, Kopf oder Zahl zu landen, und eine echte Münze, die Sie 100 Mal werfen. Wenn diese echte Münze eine faire hat, hat sie auch die gleiche Wahrscheinlichkeit, auf beiden Seiten zu landen, und das erwartete Ergebnis des 100-maligen Werfens der Münze ist, dass die Köpfe 50-mal und die Schwänze 50-mal hochkommen. In diesem Fall kann χ 2 uns sagen, wie gut die tatsächlichen Ergebnisse von 100 Münzwürfen im Vergleich zum theoretischen Modell sind, dass eine faire Münze 50/50 Ergebnisse liefert. Der tatsächliche Wurf könnte 50/50 oder 60/40 oder sogar 90/10 betragen. Je weiter die tatsächlichen Ergebnisse der 100 Würfe von 50/50 entfernt sind, desto weniger gut passt diese Reihe von Würfen zur theoretischen Erwartung von 50/50 und desto wahrscheinlicher können wir den Schluss ziehen, dass diese Münze tatsächlich nicht fair ist Münze.