Heteroskedastizität
Was ist Heteroskedastizität?
In der Statistik tritt Heteroskedastizität (oder Heteroskedastizität) auf, wenn die Standardabweichungen einer vorhergesagten Variablen, die über verschiedene Werte einer unabhängigen Variablen überwacht werden oder sich auf frühere Zeiträume beziehen, nicht konstant sind. Bei Heteroskedastizität ist das verräterische Zeichen bei der visuellen Inspektion der Restfehler, dass sie sich im Laufe der Zeit auffächern, wie in der Abbildung unten dargestellt.
Heteroskedastizität tritt oft in zwei Formen auf: bedingt und unbedingt. Bedingte Heteroskedastizität identifiziert eine nicht konstante Volatilität bezogen auf die Volatilität der Vorperiode (zB täglich). Unbedingte Heteroskedastizität bezieht sich auf allgemeine strukturelle Veränderungen der Volatilität, die nicht mit der Volatilität der Vorperiode in Verbindung stehen. Die bedingungslose Heteroskedastizität wird verwendet, wenn zukünftige Perioden mit hoher und niedriger Volatilität identifiziert werden können.
Die zentralen Thesen
- In der Statistik tritt Heteroskedastizität (oder Heteroskedastizität) auf, wenn die über einen bestimmten Zeitraum überwachten Standardfehler einer Variablen nicht konstant sind.
- Bei Heteroskedastizität ist das verräterische Zeichen bei der visuellen Inspektion der Restfehler, dass sie sich im Laufe der Zeit auffächern, wie in der Abbildung oben dargestellt.
- Heteroskedastizität ist eine Verletzung der Annahmen für die lineare Regressionsmodellierung und kann daher die Gültigkeit ökonometrischer Analysen oder Finanzmodelle wie CAPM beeinträchtigen.
Heteroskedastizität verursacht zwar keine Verzerrung der Koeffizientenschätzungen, macht sie jedoch weniger präzise; eine geringere Genauigkeit erhöht die Wahrscheinlichkeit, dass die Koeffizientenschätzungen weiter vom korrekten Populationswert entfernt sind.
Die Grundlagen der Heteroskedastizität
Im Finanzbereich wird häufig eine bedingte Heteroskedastizität in den Kursen von Aktien und Anleihen beobachtet. Die Volatilität dieser Aktien kann über keinen Zeitraum vorhergesagt werden. Unbedingte Heteroskedastizität kann verwendet werden, wenn Variablen diskutiert werden, die eine identifizierbare saisonale Variabilität aufweisen, wie etwa der Stromverbrauch.
In Bezug auf die Statistik bezieht sich Heteroskedastizität (auch Heteroskedastizität geschrieben) auf die Fehlervarianz oder Streuungsabhängigkeit innerhalb von mindestens einer unabhängigen Variablen innerhalb einer bestimmten Stichprobe. Diese Variationen können verwendet werden, um die Fehlerspanne zwischen Datensätzen wie erwarteten Ergebnissen und tatsächlichen Ergebnissen zu berechnen, da sie ein Maß für die Abweichung von Datenpunkten vom Mittelwert liefern.
Damit ein Datensatz als relevant angesehen wird, muss die Mehrheit der Datenpunkte innerhalb einer bestimmten Anzahl von Standardabweichungen vom Mittelwert liegen, wie durch den Satz von Chebyshev, auch bekannt als Chebyshev-Ungleichung, beschrieben. Dies enthält Richtlinien zur Wahrscheinlichkeit, dass eine Zufallsvariable vom Mittelwert abweicht.
Basierend auf der Anzahl der angegebenen Standardabweichungen hat eine Zufallsvariable eine bestimmte Wahrscheinlichkeit, innerhalb dieser Punkte zu existieren. Beispielsweise kann es erforderlich sein, dass ein Bereich von zwei Standardabweichungen mindestens 75 % der als gültig zu betrachtenden Datenpunkte enthält. Eine häufige Ursache für Abweichungen außerhalb der Mindestanforderung wird häufig auf Probleme mit der Datenqualität zurückgeführt.
Das Gegenteil von heteroskedastic ist homoskedastic. Homoskedastizität bezieht sich auf einen Zustand, in dem die Varianz des Restterms konstant oder nahezu konstant ist. Homoskedastizität ist eine Annahme der linearen Regressionsmodellierung. Es muss sichergestellt werden, dass die Schätzungen genau sind, dass die Vorhersagegrenzen für die abhängige Variable gültig sind und dass Konfidenzintervalle und p-Werte für die Parameter gültig sind.
Die Typen Heteroskedastizität
Bedingungslos
Die bedingungslose Heteroskedastizität ist vorhersehbar und kann sich auf Variablen beziehen, die von Natur aus zyklisch sind. Dazu können höhere Einzelhandelsumsätze gehören, die während der traditionellen Weihnachtseinkäufe gemeldet wurden, oder die Zunahme der Reparaturanrufe von Klimaanlagen in den wärmeren Monaten.
Änderungen innerhalb der Varianz können direkt mit dem Auftreten bestimmter Ereignisse oder prädiktiver Marker verknüpft werden, wenn die Verschiebungen nicht traditionell saisonabhängig sind. Dies kann mit einem Anstieg der Smartphone-Verkäufe mit der Veröffentlichung eines neuen Modells zusammenhängen, da die Aktivität je nach Ereignis zyklisch, aber nicht unbedingt saisonabhängig ist.
Heteroskedastizität kann sich auch auf Fälle beziehen, in denen sich die Daten einer Grenze nähern – wo die Varianz notwendigerweise kleiner sein muss, da die Grenze den Datenbereich einschränkt.
Bedingt
Bedingte Heteroskedastizität ist von Natur aus nicht vorhersehbar. Es gibt kein verräterisches Anzeichen dafür, dass Analysten glauben, dass die Daten zu irgendeinem Zeitpunkt mehr oder weniger verstreut sein werden. Finanzprodukte gelten häufig als bedingter Heteroskedastizität, da nicht alle Veränderungen auf bestimmte Ereignisse oder saisonale Veränderungen zurückzuführen sind.
Eine gängige Anwendung der bedingten Heteroskedastizität ist auf Aktienmärkte, wo die Volatilität von heute stark mit der Volatilität von gestern zusammenhängt. Dieses Modell erklärt Perioden mit anhaltend hoher Volatilität und niedriger Volatilität.
Besondere Überlegungen
Heteroskedastizität und Finanzmodellierung
Heteroskedastizität ist ein wichtiges Konzept in der Regressionsmodellierung, und in der Anlagewelt werden Regressionsmodelle verwendet, um die Wertentwicklung von Wertpapieren und Anlageportfolios zu erklären. Am bekanntesten ist das Capital Asset Pricing Model (CAPM), das die Wertentwicklung einer Aktie anhand ihrer Volatilität im Verhältnis zum Gesamtmarkt erklärt. Erweiterungen dieses Modells haben andere Prädiktorvariablen wie Größe, Dynamik, Qualität und Stil (Wert versus Wachstum) hinzugefügt.
Diese Prädiktorvariablen wurden hinzugefügt, weil sie die Varianz der abhängigen Variablen erklären oder erklären. Die Portfolioperformance wird durch CAPM erklärt. Entwickler des CAPM-Modells waren sich beispielsweise bewusst, dass ihr Modell eine interessante Anomalie nicht erklären konnte: Aktien hoher Qualität, die weniger volatil waren als Aktien niedriger Qualität, schnitten tendenziell besser ab als das CAPM-Modell vorhersagte. CAPM sagt, dass Aktien mit höherem Risiko besser abschneiden sollten als Aktien mit geringerem Risiko.
Mit anderen Worten, Aktien mit hoher Volatilität sollten Aktien mit niedrigerer Volatilität schlagen. Aber hochwertige Aktien, die weniger volatil sind, schnitten tendenziell besser ab als von CAPM prognostiziert.
Später erweiterten andere Forscher das CAPM-Modell (das bereits um andere Prädiktorvariablen wie Größe, Stil und Momentum erweitert wurde), um Qualität als zusätzliche Prädiktorvariable, auch als „Faktor“ bekannt, einzubeziehen. Mit diesem nun in das Modell aufgenommenen Faktor wurde der Performanceanomalie von Aktien mit geringer Volatilität Rechnung getragen. Diese als Multi-Faktor-Modelle bezeichneten Modelle bilden die Grundlage für Faktorinvestitionen und Smart Beta.