15 Juni 2021 19:34

Geschichtete Zufallsstichprobe

Was ist geschichtete Zufallsstichprobe?

Die geschichtete Zufallsstichprobe ist eine Stichprobenmethode, bei der eine Population in kleinere Untergruppen unterteilt wird, die als Schichten bezeichnet werden. Bei der geschichteten Zufallsstichprobe oder Schichtung werden die Schichten auf der Grundlage der gemeinsamen Attribute oder Merkmale der Mitglieder wie Einkommen oder Bildungsstand gebildet.

Geschichtete Zufallsstichproben werden auch als proportionale Zufallsstichproben oder Quotenzufallsstichproben bezeichnet.

Die zentralen Thesen

  • Durch geschichtete Zufallsstichproben können Forscher eine Stichprobenpopulation erhalten, die die gesamte untersuchte Population am besten repräsentiert.
  • Bei der geschichteten Zufallsstichprobe wird die gesamte Bevölkerung in homogene Gruppen unterteilt, die als Schichten bezeichnet werden.
  • Die geschichtete Zufallsstichprobe unterscheidet sich von der einfachen Zufallsstichprobe, bei der Daten aus einer gesamten Population zufällig ausgewählt werden, sodass jede mögliche Stichprobe gleich wahrscheinlich ist.

Funktionsweise der geschichteten Zufallsstichprobe

Wenn ein Forscher eine Analyse oder Forschung an einer Gruppe von Entitäten mit ähnlichen Merkmalen durchführt, stellt er möglicherweise fest, dass die Populationsgröße zu groß ist, um die Forschung abzuschließen. Um Zeit und Geld zu sparen, kann ein Analyst einen praktikableren Ansatz wählen, indem er eine kleine Gruppe aus der Bevölkerung auswählt. Die kleine Gruppe wird als Stichprobengröße bezeichnet. Hierbei handelt es sich um eine Teilmenge der Population, die zur Darstellung der gesamten Population verwendet wird. Eine Stichprobe kann auf verschiedene Weise aus einer Grundgesamtheit ausgewählt werden, von denen eine die geschichtete Zufallsstichprobenmethode ist.

Bei einer geschichteten Zufallsstichprobe wird die gesamte Bevölkerung in homogene Gruppen unterteilt, die als Schichten (Plural für Schicht) bezeichnet werden. Aus jeder Schicht werden dann Zufallsstichproben ausgewählt. Stellen Sie sich zum Beispiel einen akademischen Forscher vor, der die Anzahl der MBA-Studenten im Jahr 2007 wissen möchte, die innerhalb von drei Monaten nach Abschluss ein Stellenangebot erhalten haben.

Er wird bald feststellen, dass es in diesem Jahr fast 200.000 MBA-Absolventen gab. Er könnte beschließen, einfache Zufallsstichprobe von 50.000 Absolventen zu ziehen und eine Umfrage durchzuführen. Besser noch, er könnte die Bevölkerung in Schichten aufteilen und eine Zufallsstichprobe aus den Schichten ziehen. Zu diesem Zweck würde er Bevölkerungsgruppen erstellen, die auf Geschlecht, Altersgruppe, Rasse, Nationalitätsland und beruflichem Hintergrund basieren. Aus jeder Schicht wird eine Zufallsstichprobe in einer Zahl gezogen, die proportional zur Größe der Schicht im Vergleich zur Population ist. Diese Teilmengen der Schichten werden dann zu einer Zufallsstichprobe zusammengefasst.

[Wichtig: Die geschichtete Stichprobe wird verwendet, um Unterschiede zwischen Gruppen in einer Population hervorzuheben, im Gegensatz zur einfachen Zufallsstichprobe, bei der alle Mitglieder einer Population als gleich behandelt werden, mit der gleichen Wahrscheinlichkeit, dass eine Stichprobe erstellt wird.]

Beispiel für eine geschichtete Zufallsstichprobe

Angenommen, ein Forschungsteam möchte den GPA von College-Studenten in den USA ermitteln. Das Forschungsteam hat Schwierigkeiten, Daten von allen 21 Millionen College-Studenten zu sammeln. Es beschließt, eine Zufallsstichprobe der Bevölkerung mit 4.000 Studenten zu ziehen.

Nehmen wir nun an, dass das Team die verschiedenen Attribute der Stichprobenteilnehmer untersucht und sich fragt, ob es Unterschiede bei den GPAs und den Hauptfächern der Schüler gibt. Angenommen, 560 Studenten sind englische Hauptfächer, 1.135 sind naturwissenschaftliche Hauptfächer, 800 sind Informatik-Hauptfächer, 1.090 sind technische Hauptfächer und 415 sind mathematische Hauptfächer. Das Team möchte eine proportionale geschichtete Zufallsstichprobe verwenden, bei der die Schicht der Stichprobe proportional zur Zufallsstichprobe in der Bevölkerung ist.

Angenommen, das Team untersucht die  Demografie  von Studenten in den USA und ermittelt den Prozentsatz der Hauptfächer: 12% Hauptfach Englisch, 28% Hauptfach Naturwissenschaften, 24% Hauptfach Informatik, 21% Hauptfach Ingenieurwissenschaften und 15% Hauptfach Ingenieurwissenschaften Hauptfach Mathematik. Somit werden aus dem geschichteten Zufallsstichprobenverfahren fünf Schichten erzeugt.

Das Team muss dann bestätigen, dass die Schicht der Bevölkerung proportional zur Schicht in der Stichprobe ist. Sie stellen jedoch fest, dass die Proportionen nicht gleich sind. Das Team muss dann 4.000 Studenten aus der Bevölkerung erneut befragen und zufällig 480 Englisch, 1.120 Naturwissenschafts, 960 Informatik, 840 Ingenieur- und 600 Mathematikstudenten auswählen.

Mit diesen hat es eine proportional geschichtete Zufallsstichprobe von College-Studenten, die eine bessere Darstellung der College-Majors der Studenten in den USA bietet. Die Forscher können dann eine bestimmte Schicht hervorheben, die unterschiedlichen Studien der US-College-Studenten beobachten und die verschiedenen Notendurchschnitte beobachten.

Einfache zufällige versus geschichtete zufällige Stichproben

Einfache Zufallsstichproben  und geschichtete Zufallsstichproben sind statistische Messinstrumente. Eine einfache Zufallsstichprobe wird verwendet, um die gesamte Datenpopulation darzustellen. Eine geschichtete Zufallsstichprobe unterteilt die Bevölkerung basierend auf gemeinsamen Merkmalen in kleinere Gruppen oder Schichten.

Die einfache Zufallsstichprobe wird häufig verwendet, wenn nur sehr wenige Informationen über die Datenpopulation verfügbar sind, wenn die Datenpopulation viel zu viele Unterschiede aufweist, um in verschiedene Teilmengen unterteilt zu werden, oder wenn nur ein bestimmtes Merkmal in der Datenpopulation vorhanden ist.

Beispielsweise möchte ein Süßwarenunternehmen möglicherweise die Kaufgewohnheiten seiner Kunden untersuchen, um die Zukunft seiner Produktlinie zu bestimmen. Bei 10.000 Kunden können 100 dieser Kunden als Zufallsstichprobe ausgewählt werden. Es kann dann das, was es von diesen 100 Kunden findet, auf den Rest seiner Basis anwenden. Im Gegensatz zur Schichtung werden 100 Mitglieder rein zufällig ausgewählt, ohne Rücksicht auf ihre individuellen Merkmale.

Proportionale und unverhältnismäßige Schichtung

Durch geschichtete Zufallsstichproben wird sichergestellt, dass jede Untergruppe einer bestimmten Population in der gesamten Stichprobenpopulation einer Forschungsstudie angemessen vertreten ist. Die Schichtung kann verhältnismäßig oder unverhältnismäßig sein. Bei einer proportional geschichteten Methode ist die Stichprobengröße jeder Schicht proportional zur Populationsgröße der Schicht.

Wenn der Forscher beispielsweise eine Stichprobe von 50.000 Absolventen anhand der Altersspanne wünschte, wird die proportional geschichtete Zufallsstichprobe nach folgender Formel erhalten: (Stichprobengröße / Populationsgröße) x Schichtgröße. In der folgenden Tabelle wird eine Bevölkerungsgröße von 180.000 MBA-Absolventen pro Jahr angenommen.

Die Schichtstichprobengröße für MBA-Absolventen im Alter zwischen 24 und 28 Jahren wird mit (50.000 / 180.000) x 90.000 = 25.000 berechnet. Die gleiche Methode wird für die anderen Altersgruppen angewendet. Nachdem die Stichprobengröße der Schichten bekannt ist, kann der Forscher in jeder Schicht eine einfache Zufallsstichprobe durchführen, um seine Umfrageteilnehmer auszuwählen. Mit anderen Worten, 25.000 Absolventen aus der Altersgruppe 24-28 werden zufällig aus der Gesamtbevölkerung ausgewählt, 16.667 Absolventen aus der Altersgruppe 29-33 werden zufällig aus der Bevölkerung ausgewählt und so weiter.

In einer überproportional geschichteten Stichprobe ist die Größe jeder Schicht nicht proportional zu ihrer Größe in der Bevölkerung. Der Forscher kann beschließen, die Hälfte der Absolventen der Altersgruppe 34-37 und 1/3 der Absolventen der Altersgruppe 29-33 zu befragen.

Es ist wichtig zu beachten, dass eine Person nicht in mehrere Schichten passen kann. Jede Entität darf nur in eine Schicht passen. Überlappende Untergruppen bedeuten, dass einige Personen höhere Chancen haben, für die Umfrage ausgewählt zu werden, was das Konzept der geschichteten Stichprobe als eine Art Wahrscheinlichkeitsstichprobe vollständig negiert.



Portfoliomanager können mithilfe geschichteter Zufallsstichproben Portfolios erstellen, indem sie einen Index wie einen Anleihenindex replizieren.

Vorteile der geschichteten Zufallsstichprobe

Der Hauptvorteil der geschichteten Zufallsstichprobe besteht darin, dass wichtige Populationsmerkmale in der Stichprobe erfasst werden. Ähnlich wie bei einem gewichteten Durchschnitt erzeugt diese Stichprobenmethode Merkmale in der Stichprobe, die proportional zur Gesamtpopulation sind. Die geschichtete Zufallsstichprobe eignet sich gut für Populationen mit einer Vielzahl von Attributen, ist jedoch ansonsten unwirksam, wenn keine Untergruppen gebildet werden können.

Die Schichtung ergibt einen kleineren Schätzfehler und eine größere Genauigkeit als die einfache Zufallsstichprobenmethode. Je größer die Unterschiede zwischen den Schichten sind, desto größer ist der Präzisionsgewinn.

Nachteile der geschichteten Zufallsstichprobe

Leider kann diese Forschungsmethode nicht in jeder Studie angewendet werden. Der Nachteil der Methode besteht darin, dass mehrere Bedingungen erfüllt sein müssen, damit sie ordnungsgemäß verwendet werden kann. Die Forscher müssen jedes Mitglied einer untersuchten Population identifizieren und jedes von ihnen in eine und nur eine Subpopulation einteilen. Infolgedessen ist eine geschichtete Zufallsstichprobe nachteilig, wenn Forscher nicht jedes Mitglied der Bevölkerung sicher in eine Untergruppe einordnen können. Es  kann auch schwierig sein, eine vollständige und endgültige Liste einer gesamten  Bevölkerung zu finden.

Überlappungen können ein Problem sein, wenn es Themen gibt, die in mehrere Untergruppen fallen. Wenn eine einfache Zufallsstichprobe durchgeführt wird, werden eher diejenigen ausgewählt, die mehreren Untergruppen angehören. Das Ergebnis könnte eine falsche Darstellung oder eine ungenaue Reflexion der Bevölkerung sein.

Die obigen Beispiele machen es einfach: Studenten, Absolventen, Männer und Frauen sind klar definierte Gruppen. In anderen Situationen kann es jedoch weitaus schwieriger sein. Stellen Sie sich vor, Sie integrieren Merkmale wie Rasse, ethnische Zugehörigkeit oder Religion. Der Sortierprozess wird schwieriger, was geschichtete Zufallsstichproben zu einer ineffektiven und weniger idealen Methode macht.