Multikollinearität
Was ist Multikollinearität?
Multikollinearität ist das Auftreten hoher Interkorrelationen zwischen zwei oder mehr unabhängigen Variablen in einem multiplen Regressionsmodell. Multikollinearität kann zu verzerrten oder irreführenden Ergebnissen führen, wenn ein Forscher oder Analyst versucht zu bestimmen, wie gut jede unabhängige Variable am effektivsten verwendet werden kann, um die abhängige Variable in einem statistischen Modell vorherzusagen oder zu verstehen.
Im Allgemeinen kann Multikollinearität zu breiteren Konfidenzintervallen führen, die weniger zuverlässige Wahrscheinlichkeiten in Bezug auf die Wirkung unabhängiger Variablen in einem Modell ergeben. Das heißt, die statistischen Schlussfolgerungen aus einem Modell mit Multikollinearität sind möglicherweise nicht zuverlässig.
Die zentralen Thesen
- Multikollinearität ist ein statistisches Konzept, bei dem unabhängige Variablen in einem Modell korreliert werden.
- Multikollinearität zwischen unabhängigen Variablen führt zu weniger zuverlässigen statistischen Schlussfolgerungen.
- Es ist besser, unabhängige Variablen zu verwenden, die nicht korreliert oder sich wiederholen, wenn mehrere Regressionsmodelle erstellt werden, die zwei oder mehr Variablen verwenden.
Multikollinearität verstehen
Statistische Analysten verwenden mehrere Regressionsmodelle, um den Wert einer angegebenen abhängigen Variablen basierend auf den Werten von zwei oder mehr unabhängigen Variablen vorherzusagen. Die abhängige Variable wird manchmal als Ergebnis, Ziel- oder Kriteriumsvariable bezeichnet.
Ein Beispiel ist ein multivariates Regressionsmodell, das versucht, Aktienrenditen basierend auf Elementen wie dem Kurs-Gewinn-Verhältnis (KGV), der Marktkapitalisierung, der Wertentwicklung in der Vergangenheit oder anderen Daten zu antizipieren. Die Aktienrendite ist die abhängige Variable und die verschiedenen Finanzdaten sind die unabhängigen Variablen.
Multikollinearität in einem multiplen Regressionsmodell weist darauf hin, dass kollineare unabhängige Variablen in irgendeiner Weise zusammenhängen, obwohl die Beziehung zufällig sein kann oder nicht. Beispielsweise könnte die Wertentwicklung in der Vergangenheit mit der Marktkapitalisierung zusammenhängen, da Aktien, die sich in der Vergangenheit gut entwickelt haben, steigende Marktwerte aufweisen. Anders ausgedrückt kann Multikollinearität vorliegen, wenn zwei unabhängige Variablen stark korreliert sind. Dies kann auch passieren, wenn eine unabhängige Variable aus anderen Variablen im Datensatz berechnet wird oder wenn zwei unabhängige Variablen ähnliche und sich wiederholende Ergebnisse liefern.
Eine der gebräuchlichsten Methoden zur Beseitigung des Problems der Multikollinearität besteht darin, zuerst kollineare unabhängige Variablen zu identifizieren und dann alle bis auf eine zu entfernen. Es ist auch möglich, Multikollinearität zu eliminieren, indem zwei oder mehr kollineare Variablen zu einer einzigen Variablen kombiniert werden. Anschließend kann eine statistische Analyse durchgeführt werden, um die Beziehung zwischen der angegebenen abhängigen Variablen und nur einer einzigen unabhängigen Variablen zu untersuchen.
Beispiel für Multikollinearität
Bei Investitionen ist Multikollinearität eine gängige Überlegung bei der Durchführung technischer Analysen, um wahrscheinliche zukünftige Preisbewegungen eines Wertpapiers wie eines Aktien- oder Rohstoff-Futures vorherzusagen.
Marktanalysten wollen mit technischen Indikatoren zu vermeiden, die kollinear sind, dass sie basieren auf sehr ähnliche oder verwandte Eingänge; sie neigen dazu, ähnliche Vorhersagen bezüglich der abhängigen Variablen der Preisbewegung zu machen. Stattdessen muss die Marktanalyse auf deutlich unterschiedlichen unabhängigen Variablen basieren, um sicherzustellen, dass sie den Markt aus verschiedenen unabhängigen analytischen Gesichtspunkten analysieren.
Ein Beispiel für ein potenzielles Multikollinearitätsproblem ist die technische Analyse, die nur mehrere ähnliche Indikatoren verwendet.
Der bekannte technische Analyst John Bollinger, Erfinder des Bollinger Bands Indikators, stellt fest, dass „eine Hauptregel für den erfolgreichen Einsatz der technischen Analyse die Vermeidung von Multikollinearität zwischen Indikatoren erfordert“. Um das Problem zu lösen, vermeiden Analysten die Verwendung von zwei oder mehr technischen Indikatoren desselben Typs. Stattdessen analysieren sie ein Wertpapier mit einem Indikatortyp, beispielsweise einem Momentum-Indikator, und führen dann eine separate Analyse mit einem anderen Indikatortyp, beispielsweise einem Trendindikator, durch.
Zum Beispiel Stochastik, der relativen Stärke – Index (RSI) und Williams% R sind alle Momentum – Indikatoren, die auf ähnliche Eingaben verlassen und werden wahrscheinlich ähnliche Ergebnisse zu erzielen. In diesem Fall ist es besser, alle Indikatoren bis auf einen zu entfernen oder einen Weg zu finden, mehrere von ihnen zu einem einzigen Indikator zusammenzuführen und gleichzeitig einen Trendindikator hinzuzufügen, der wahrscheinlich nicht stark mit dem Momentum-Indikator korreliert.