Sample Selection Bias
Was ist eine Stichprobenauswahlverzerrung?
Die Stichprobenauswahlverzerrung ist eine Art von Verzerrung, die durch die Auswahl nicht zufälliger Daten für die statistische Analyse verursacht wird. Die Verzerrung besteht aufgrund eines Fehlers im Stichprobenauswahlprozess, bei dem eine Teilmenge der Daten aufgrund eines bestimmten Attributs systematisch ausgeschlossen wird. Der Ausschluss der Teilmenge kann die statistische Signifikanz des Tests beeinflussen und die Schätzungen der Parameter des statistischen Modells beeinflussen.
Grundlegendes zur Stichprobenauswahlverzerrung
Survivorship Bias ist eine häufige Art von Stichprobenauswahlbias. Wenn Sie beispielsweise eine Anlagestrategie für eine große Gruppe von Aktien erneut testen, kann es zweckmäßig sein, nach Wertpapieren zu suchen, die Daten für den gesamten Stichprobenzeitraum enthalten. Wenn wir die Strategie anhand von Bestandsdaten im Wert von 15 Jahren testen würden, könnten wir geneigt sein, nach Beständen zu suchen, die vollständige Informationen für den gesamten Zeitraum von 15 Jahren enthalten. Die Eliminierung einer Aktie, die den Handel eingestellt oder den Markt kurz verlassen hat, würde jedoch zu einer Verzerrung unserer Datenstichprobe führen. Da wir nur Aktien einbeziehen, die den Zeitraum von 15 Jahren dauerten, wären unsere Endergebnisse fehlerhaft, da diese gut genug abschnitten, um den Markt zu überleben.
Hedge-Fonds Performance-Indizes sind ein Beispiel für eine Stichprobenauswahlverzerrung, die einer Überlebensverzerrung unterliegt. Da Hedge-Fonds, die nicht überleben, ihre Wertentwicklung nicht mehr an Indexaggregatoren melden, sind die resultierenden Indizes naturgemäß auf verbleibende Fonds und Strategien ausgerichtet und überleben daher. Dies kann auch bei beliebten Berichterstattungsdiensten für Investmentfonds ein Problem sein.
Analysten können sich anpassen, um diese Verzerrungen zu berücksichtigen, können jedoch neue Verzerrungen in den Prozess einführen.