23 Juni 2021 18:54

P-Wert

Was ist der P-Wert?

In der Statistik ist der p-Wert die Wahrscheinlichkeit, Ergebnisse zu erhalten, die mindestens so extrem sind wie die beobachteten Ergebnisse eines statistischen  Hypothesentests, vorausgesetzt, die Nullhypothese ist richtig. Der p-Wert wird als Alternative zu Ablehnungspunkten verwendet, um das kleinste Signifikanzniveau bereitzustellen, bei dem die  Nullhypothese verworfen würde. Ein kleinerer p-Wert bedeutet, dass es stärkere Beweise für die alternative Hypothese gibt.

Die zentralen Thesen

  • Ein p-Wert ist ein Maß für die Wahrscheinlichkeit, dass ein beobachteter Unterschied zufällig aufgetreten sein könnte.
  • Je niedriger der p-Wert ist, desto größer ist die statistische Signifikanz des beobachteten Unterschieds.
  • Der P-Wert kann als Alternative zu oder zusätzlich zu vorgewählten Konfidenzniveaus für Hypothesentests verwendet werden.

Wie wird der p-Wert berechnet?

p-Werte werden normalerweise mit p-Wert-Tabellen oder Tabellenkalkulationen/Statistiksoftware ermittelt. Diese Berechnungen basieren auf der angenommenen oder bekannten Wahrscheinlichkeitsverteilung der spezifischen getesteten Statistik. P-Werte werden aus der Abweichung zwischen dem beobachteten Wert und einem gewählten Referenzwert berechnet, bei gegebener Wahrscheinlichkeitsverteilung der Statistik, wobei eine größere Differenz zwischen den beiden Werten einem niedrigeren p-Wert entspricht.

Mathematisch wird der p-Wert mittels Integralrechnung aus der Fläche unter der Wahrscheinlichkeitsverteilungskurve für alle Statistikwerte berechnet, die mindestens so weit vom Referenzwert entfernt sind wie der beobachtete Wert, bezogen auf die Gesamtfläche unter der Wahrscheinlichkeitsverteilungskurve. Kurz gesagt, je größer der Unterschied zwischen zwei beobachteten Werten ist, desto weniger wahrscheinlich ist es, dass der Unterschied auf einen einfachen Zufall zurückzuführen ist, was sich in einem niedrigeren p-Wert widerspiegelt.

P-Wert-Ansatz für Hypothesentests

Der p-Wert-Ansatz zum Hypothesentesten verwendet die berechnete Wahrscheinlichkeit, um zu bestimmen, ob es Hinweise gibt, die Nullhypothese abzulehnen. Die Nullhypothese, auch als Vermutung bekannt, ist die ursprüngliche Behauptung über eine Population (oder einen datengenerierenden Prozess). Die Alternativhypothese gibt an, ob sich der Populationsparameter von dem in der Vermutung angegebenen Wert des Populationsparameters unterscheidet.

In der Praxis wird das Signifikanzniveau vorab angegeben, um zu bestimmen, wie klein der p-Wert sein muss, um die Nullhypothese zu verwerfen. Da verschiedene Forscher bei der Untersuchung einer Frage unterschiedliche Signifikanzniveaus verwenden, kann ein Leser manchmal Schwierigkeiten haben, Ergebnisse aus zwei verschiedenen Tests zu vergleichen. P-Werte bieten eine Lösung für dieses Problem.

Angenommen, eine Studie zum Vergleich der Renditen von zwei bestimmten  Vermögenswerten wurde von verschiedenen Forschern durchgeführt, die dieselben Daten, aber unterschiedliche Signifikanzniveaus verwendet haben. Die Forscher könnten zu gegenteiligen Schlussfolgerungen kommen, ob sich die Vermögenswerte unterscheiden. Wenn ein Forscher ein Konfidenzniveau von 90% verwendete und der andere ein Konfidenzniveau von 95% benötigte, um die Nullhypothese abzulehnen, betrug der p-Wert der beobachteten Differenz zwischen den beiden Renditen 0,08 (entsprechend einem Konfidenzniveau von 92%)., dann wäre der erste Forscher feststellen, dass die beiden Assets einen Unterschied aufweisen, ist statistisch signifikant, während die zweite keinen statistisch signifikanten Unterschied zwischen den Renditen finden würde.

Um dieses Problem zu vermeiden, könnten die Forscher den p-Wert des Hypothesentests angeben und dem Leser ermöglichen, die statistische Signifikanz selbst zu interpretieren. Dies wird als p-Wert-Ansatz zum Testen von Hypothesen bezeichnet. Ein unabhängiger Beobachter könnte den p-Wert notieren und selbst entscheiden, ob dies einen statistisch signifikanten Unterschied darstellt oder nicht.

Beispiel für P-Wert

Ein Anleger behauptet, dass die Wertentwicklung seines Anlageportfolios der des Standard & Poor’s (S&P) 500 Index entspricht. Um dies festzustellen, führt der Anleger einen zweiseitigen Test durch. Die Nullhypothese besagt, dass die Renditen des Portfolios den Renditen des S&P 500 über einen bestimmten Zeitraum entsprechen, während die Alternativhypothese besagt, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht gleichwertig sind – wenn der Anleger einen einseitigen Test durchgeführt hat, ist die Alternative Hypothese würde besagen, dass die Renditen des Portfolios entweder kleiner oder größer als die Renditen des S&P 500 sind.

Der Test der p-Wert-Hypothese verwendet nicht unbedingt ein vorab ausgewähltes Konfidenzniveau, bei dem der Anleger die Nullhypothese, dass die Renditen gleichwertig sind, neu setzen sollte. Stattdessen liefert sie ein Maß dafür, wie viele Beweise es gibt, um die Nullhypothese abzulehnen. Je kleiner der p-Wert, desto größer die Evidenz gegen die Nullhypothese. Wenn der Anleger also feststellt, dass der p-Wert 0,001 beträgt, gibt es starke Beweise gegen die Nullhypothese, und der Anleger kann zuversichtlich schlussfolgern, dass die Renditen des Portfolios und die Renditen des S&P 500 nicht gleichwertig sind.

Dies bietet zwar keine genaue Schwelle, wann der Anleger die Nullhypothese akzeptieren oder ablehnen sollte, hat jedoch einen weiteren sehr praktischen Vorteil. Das Testen von P-Wert-Hypothesen bietet eine direkte Möglichkeit, das relative Vertrauen zu vergleichen, das der Anleger bei der Auswahl zwischen mehreren verschiedenen Arten von Anlagen oder Portfolios im Vergleich zu einer Benchmark wie dem S&P 500 haben kann.

Beispielsweise kann der Anleger bei zwei Portfolios A und B, deren Performance sich mit p-Werten von 0,10 bzw. 0,01 vom S&P 500 unterscheidet, viel zuversichtlicher sein, dass Portfolio B mit einem niedrigeren p-Wert tatsächlich zeigt durchweg unterschiedliche Ergebnisse.