10 Juni 2021 20:55

Stichprobenauswahl-Bias

Was ist ein Stichprobenauswahl-Bias?

Stichprobenauswahl-Bias ist eine Art von Bias, die durch die Auswahl nicht zufälliger Daten für die statistische Analyse verursacht wird. Der Bias besteht aufgrund eines Fehlers im Stichprobenauswahlprozess, bei dem eine Teilmenge der Daten aufgrund eines bestimmten Attributs systematisch ausgeschlossen wird. Der Ausschluss der Teilmenge kann die statistische Signifikanz des Tests beeinflussen und die Schätzungen der Parameter des statistischen Modells beeinflussen.

Verständnis der Stichprobenauswahlverzerrung

Der Survivorship-Bias ist eine häufige Form des Stichprobenauswahl-Bias. Beim Backtesting einer Anlagestrategie für eine große Aktiengruppe kann es beispielsweise sinnvoll sein, nach Wertpapieren zu suchen, die Daten für den gesamten Stichprobenzeitraum enthalten. Wenn wir die Strategie anhand von Bestandsdaten im Wert von 15 Jahren testen würden, könnten wir geneigt sein, nach Beständen zu suchen, die vollständige Informationen für den gesamten Zeitraum von 15 Jahren enthalten. Die Eliminierung einer Aktie, die den Handel eingestellt hat oder kurzzeitig den Markt verlassen hat, würde jedoch zu einer Verzerrung in unserer Datenstichprobe führen. Da wir nur Aktien mit einer Laufzeit von 15 Jahren berücksichtigen, wären unsere endgültigen Ergebnisse fehlerhaft, da diese gut genug abschnitten, um den Markt zu überleben.

Hedgefonds Performance-Indizes sind ein Beispiel für einen Stichprobenauswahl-Bias, der dem Überlebens-Bias unterliegt. Da Hedgefonds, die nicht überleben, aufhören, ihre Performance an Indexaggregatoren zu melden, werden die resultierenden Indizes natürlich auf Fonds und Strategien ausgerichtet, die verbleiben, also „überleben“. Dies kann auch bei beliebten Meldediensten für Investmentfonds ein Problem sein.

Analysten können sich anpassen, um diese Verzerrungen zu berücksichtigen, können jedoch neue Verzerrungen in den Prozess einbringen.