Nullhypothese
Was ist eine Nullhypothese?
Eine Nullhypothese ist ein in der Statistik verwendeter Hypothesentyp, der vorschlägt, dass es keinen Unterschied zwischen bestimmten Merkmalen einer Population (oder eines datenerzeugenden Prozesses) gibt.
Zum Beispiel kann ein Spieler daran interessiert sein, ob ein Glücksspiel fair ist. Wenn es fair ist, beträgt der erwartete Gewinn pro Spiel für beide Spieler 0. Wenn das Spiel nicht fair ist, sind die erwarteten Einnahmen für einen Spieler positiv und für den anderen negativ. Um zu testen, ob das Spiel fair ist, sammelt der Spieler Gewinndaten aus vielen Wiederholungen des Spiels, berechnet aus diesen Daten den durchschnittlichen Gewinn und testet dann die Nullhypothese, dass die erwarteten Gewinne nicht von Null verschieden sind.
Wenn der Durchschnittsverdienst aus den Stichprobendaten ausreichend weit von Null entfernt ist, wird der Spieler die Nullhypothese verwerfen und auf die Alternativhypothese schließen, nämlich dass der erwartete Gewinn pro Spiel von Null verschieden ist. Wenn der Durchschnittsverdienst aus den Stichprobendaten nahe Null liegt, wird der Spieler die Nullhypothese nicht verwerfen, sondern schlussfolgern, dass die Differenz zwischen dem Durchschnitt der Daten und 0 allein durch Zufall erklärbar ist.
Die zentralen Thesen
- Eine Nullhypothese ist eine in der Statistik verwendete Art von Vermutung, die besagt, dass es keinen Unterschied zwischen bestimmten Merkmalen einer Population oder eines datenerzeugenden Prozesses gibt.
- Die Alternativhypothese geht davon aus, dass es einen Unterschied gibt.
- Hypothesentests bieten ein Verfahren zum Zurückweisen einer Nullhypothese innerhalb eines bestimmten Konfidenzniveaus. (Nullhypothesen können jedoch nicht bewiesen werden.)
Wie eine Nullhypothese funktioniert
Die Nullhypothese, auch als Vermutung bekannt, geht davon aus, dass jede Art von Unterschied zwischen den ausgewählten Merkmalen, die Sie in einem Datensatz sehen, zufällig ist. Wenn beispielsweise die erwarteten Einnahmen für das Glücksspiel wirklich gleich 0 sind, dann ist jeder Unterschied zwischen den durchschnittlichen Einnahmen in den Daten und 0 zufällig.
Statistische Hypothesen werden in einem vierstufigen Verfahren getestet. Der erste Schritt besteht darin, dass der Analytiker die beiden Hypothesen so formuliert, dass nur eine richtig sein kann. Der nächste Schritt besteht darin, einen Analyseplan zu formulieren, der beschreibt, wie die Daten ausgewertet werden. Der dritte Schritt besteht darin, den Plan auszuführen und die Beispieldaten physikalisch zu analysieren. Der vierte und letzte Schritt besteht darin, die Ergebnisse zu analysieren und entweder die Nullhypothese abzulehnen oder zu behaupten, dass die beobachteten Unterschiede allein durch Zufall erklärbar sind.
Analysten versuchen, die Nullhypothese abzulehnen , da dies eine starke Schlussfolgerung ist. Dies erfordert starke Evidenz in Form eines beobachteten Unterschieds, der zu groß ist, um allein durch Zufall erklärt zu werden. Die Nichtverweigerung der Nullhypothese – dass die Ergebnisse allein durch Zufall erklärbar sind – ist eine schwache Schlussfolgerung, da sie zulässt, dass andere Faktoren als der Zufall am Werk sind, aber möglicherweise nicht stark genug sind, um durch den verwendeten statistischen Test nachgewiesen zu werden.
Wichtig
Analysten versuchen, die Nullhypothese abzulehnen, um den Zufall allein als Erklärung für die interessierenden Phänomene auszuschließen.
Beispiele für eine Nullhypothese
Hier ist ein einfaches Beispiel. Eine Schulleiterin behauptet, dass die Schüler ihrer Schule in Prüfungen durchschnittlich 7 von 10 Punkten erreichen. Die Nullhypothese lautet, dass der Mittelwert der Grundgesamtheit 7,0 beträgt. Um diese Nullhypothese zu testen, erfassen wir die Noten von etwa 30 Schülern (Stichprobe) aus der gesamten Schülerpopulation der Schule (etwa 300) und berechnen den Mittelwert dieser Stichprobe.
Wir können dann den (berechneten) Stichprobenmittelwert mit dem (hypothetischen) Populationsmittelwert von 7,0 vergleichen und versuchen, die Nullhypothese abzulehnen. (Die Nullhypothese hier – dass der Mittelwert der Grundgesamtheit 7,0 beträgt – kann mit den Stichprobendaten nicht bewiesen, sondern nur verworfen werden.)
Nehmen Sie ein anderes Beispiel: Die jährliche Rendite eines bestimmten Investmentfonds soll 8% betragen. Angenommen, ein Investmentfonds besteht seit 20 Jahren. Die Nullhypothese besagt, dass die durchschnittliche Rendite für den Investmentfonds 8 % beträgt. Wir ziehen eine Zufallsstichprobe der Jahresrenditen des Investmentfonds für beispielsweise fünf Jahre (Stichprobe) und berechnen den Stichprobenmittelwert. Anschließend vergleichen wir den (berechneten) Stichprobenmittelwert mit dem (behaupteten) Populationsmittelwert (8%), um die Nullhypothese zu testen.
Für die obigen Beispiele sind Nullhypothesen:
- Beispiel A: Schüler in der Schule erzielen in Prüfungen durchschnittlich 7 von 10 Punkten.
- Beispiel B: Die durchschnittliche jährliche Rendite des Investmentfonds beträgt 8% pro Jahr.
Um zu bestimmen, ob die Nullhypothese abgelehnt werden soll, wird aus Gründen der Argumentation angenommen, dass die Nullhypothese (abgekürzt H 0 ) wahr ist. Dann wird der wahrscheinliche Bereich möglicher Werte der berechneten Statistik (z. B. die durchschnittliche Punktzahl bei 30 Schülertests) unter dieser Annahme bestimmt (z. B. könnte der Bereich plausibler Mittelwerte zwischen 6,2 und 7,8 liegen, wenn der Bevölkerungsmittelwert 7,0 beträgt). Wenn der Stichprobenmittelwert außerhalb dieses Bereichs liegt, wird die Nullhypothese zurückgewiesen. Andernfalls wird der Unterschied als „allein durch Zufall erklärbar“ bezeichnet und liegt innerhalb des Bereichs, der allein durch den Zufall bestimmt wird.
Ein wichtiger Punkt ist, dass wir die Nullhypothese testen, da Zweifel an ihrer Gültigkeit bestehen. Alle Informationen, die gegen die angegebene Nullhypothese verstoßen, werden in der Alternativhypothese (H 1 ) erfasst. Für die obigen Beispiele wäre die Alternativhypothese:
- Studenten punkten einen Durchschnitt, der ist nicht gleich 7.
- Die durchschnittliche Jahresrendite des Investmentfonds beträgt nicht 8% pro Jahr.
Mit anderen Worten, die Alternativhypothese ist ein direkter Widerspruch zur Nullhypothese.
Hypothesentests für Investitionen
Nehmen wir als Beispiel in Bezug auf die Finanzmärkte an, dass Alice sieht, dass ihre Anlagestrategie höhere durchschnittliche Renditen erzielt als der bloße Kauf und Besitz einer Aktie. Die Nullhypothese besagt, dass es keinen Unterschied zwischen den beiden durchschnittlichen Renditen gibt, und Alice neigt dazu, dies zu glauben, bis sie auf widersprüchliche Ergebnisse schließen kann.
Um die Nullhypothese zu widerlegen, müsste eine statistische Signifikanz nachgewiesen werden, die mit einer Vielzahl von Tests ermittelt werden kann. Die Alternativhypothese würde besagen, dass die Anlagestrategie eine höhere durchschnittliche Rendite hat als eine traditionelle Buy-and-Hold-Strategie.
Ein Werkzeug, mit dem die statistische Signifikanz der Ergebnisse bestimmt werden kann, ist der p-Wert. Ein p-Wert stellt die Wahrscheinlichkeit dar, dass ein Unterschied, der so groß oder größer als der beobachtete Unterschied zwischen den beiden durchschnittlichen Renditen ist, ausschließlich zufällig auftreten könnte.
Ein p-Wert kleiner oder gleich 0,05 wird häufig verwendet, um anzuzeigen, ob Beweise gegen die Nullhypothese vorliegen. Wenn Alice einen dieser Tests durchführt, z. B. einen Test mit dem normalen Modell, der zu einem signifikanten Unterschied zwischen ihren Renditen und den Buy-and-Hold-Renditen führt (der p-Wert ist kleiner oder gleich 0,05), kann sie dann verwerfen Sie die Nullhypothese und schließen Sie die Alternativhypothese.