Chi-Quadrat (χ2) Statistische Definition
Was ist eine Chi-Quadrat-Statistik?
Eine Chi-Quadrat- Statistik ( χ 2 ) ist ein Test, der misst, wie ein Modell im Vergleich zu den tatsächlich beobachteten Daten abschneidet. Die zur Berechnung einer Chi-Quadrat- Statistik verwendeten Daten müssen zufällig, roh, sich gegenseitig ausschließen, aus unabhängigen Variablen stammen und aus einer ausreichend großen Stichprobe stammen. Zum Beispiel erfüllen die Ergebnisse des Werfens einer fairen Münze diese Kriterien.
Chi-Quadrat-Tests werden häufig bei Hypothesentests verwendet. Die Chi-Quadrat-Statistik vergleicht die Größe aller Diskrepanzen zwischen den erwarteten Ergebnissen und den tatsächlichen Ergebnissen unter Berücksichtigung der Größe der Stichprobe und der Anzahl der Variablen in der Beziehung. Für diese Tests werden Freiheitsgrade verwendet, um zu bestimmen, ob eine bestimmte Nullhypothese basierend auf der Gesamtzahl der Variablen und Stichproben innerhalb des Experiments abgelehnt werden kann. Wie bei jeder Statistik gilt: Je größer die Stichprobe, desto zuverlässiger sind die Ergebnisse.
Die zentralen Thesen
- Eine Chi-Quadrat- Statistik ( χ 2 ) ist ein Maß für die Differenz zwischen der beobachteten und der erwarteten Häufigkeit der Ergebnisse einer Reihe von Ereignissen oder Variablen.
- χ 2 hängt von der Größe der Differenz zwischen tatsächlichen und beobachteten Werten, den Freiheitsgraden und der Stichprobengröße ab.
- χ 2 kann verwendet werden, um zu testen, ob zwei Variablen zusammenhängen oder voneinander unabhängig sind, oder um die Anpassungsgüte zwischen einer beobachteten Verteilung und einer theoretischen Häufigkeitsverteilung zu testen.
Die Formel für das Chi-Quadrat ist
Was sagt Ihnen eine Chi-Quadrat-Statistik?
Es gibt zwei Hauptarten von Chi-Quadrat-Tests: den Unabhängigkeitstest, der eine Frage der Beziehung stellt, wie zum Beispiel „Gibt es einen Zusammenhang zwischen dem Geschlecht der Schüler und der Studienwahl?“; und der Passungstest, der so etwas fragt wie „Wie gut passt die Münze in meiner Hand zu einer theoretisch fairen Münze?“
Unabhängigkeit
Bei der Betrachtung des Geschlechts der Schüler und der Wahl des Kurses könnte ein χ 2- Test für die Unabhängigkeit verwendet werden. Um diesen Test durchzuführen, würde der Forscher Daten zu den beiden ausgewählten Variablen (Geschlecht und gewählte Kurse) sammeln und dann die Häufigkeiten vergleichen, mit denen männliche und weibliche Studenten unter den angebotenen Klassen mit der oben angegebenen Formel und einer statistischen Tabelle χ 2 auswählen.
Besteht kein Zusammenhang zwischen Geschlecht und Studiengangswahl (d. h. sind sie unabhängig), so ist davon auszugehen, dass die tatsächliche Häufigkeit, mit der männliche und weibliche Studierende die angebotenen Studiengänge wählen, in etwa gleich ist, oder umgekehrt der Anteil der männlichen und Studentinnen in jedem ausgewählten Studiengang sollten in etwa dem Anteil männlicher und weiblicher Studenten in der Stichprobe entsprechen. Ein χ 2 Test für die Unabhängigkeit kann uns sagen, wie wahrscheinlich es ist, dass zufällige Chance jede beobachtete Differenz zwischen den tatsächlichen Frequenzen in den Daten erklären kann und diese theoretischen Erwartungen.
Güte der Anpassung
χ 2 bietet eine Möglichkeit zu testen, wie gut eine Datenstichprobe mit den (bekannten oder angenommenen) Merkmalen der größeren Population übereinstimmt, die die Stichprobe repräsentieren soll. Wenn die Stichprobendaten nicht zu den erwarteten Eigenschaften der Grundgesamtheit passen, an der wir interessiert sind, möchten wir diese Stichprobe nicht verwenden, um Rückschlüsse auf die größere Grundgesamtheit zu ziehen.
Betrachten Sie zum Beispiel eine imaginäre Münze mit einer Chance von genau 50/50, Kopf oder Zahl zu landen, und eine echte Münze, die Sie 100 Mal werfen. Wenn diese echte Münze fair ist, hat sie auch die gleiche Wahrscheinlichkeit, auf beiden Seiten zu landen, und das erwartete Ergebnis eines 100-maligen Werfens der Münze ist, dass 50-mal Kopf und 50-mal Zahl erscheint. In diesem Fall kann uns χ 2 sagen, wie gut die tatsächlichen Ergebnisse von 100 Münzwürfen im Vergleich zum theoretischen Modell sind, dass eine faire Münze 50/50-Ergebnisse liefert. Der eigentliche Wurf kann 50/50, 60/40 oder sogar 90/10 betragen. Je weiter die tatsächlichen Ergebnisse der 100 Würfe von 50/50 entfernt sind, desto weniger passt dieser Satz von Würfen zur theoretischen Erwartung von 50/50 und desto wahrscheinlicher können wir zu dem Schluss kommen, dass diese Münze nicht wirklich fair ist Münze.