Stratifizierte Zufallsstichprobe - KamilTaylan.blog
24 Juni 2021 22:08

Stratifizierte Zufallsstichprobe

Was ist geschichtete Zufallsstichprobe?

Die geschichtete Zufallsstichprobe ist eine Stichprobenmethode, bei der eine Bevölkerung in kleinere Untergruppen, sogenannte Schichten, unterteilt wird. Bei der geschichteten Zufallsstichprobe oder Schichtung werden die Schichten basierend auf den gemeinsamen Attributen oder Merkmalen der Mitglieder wie Einkommen oder Bildungsstand gebildet.

Die geschichtete Stichprobe wird auch als proportionale Stichprobe oder Quotenstichprobe bezeichnet.

Die zentralen Thesen

  • Die geschichtete Zufallsstichprobe ermöglicht es den Forschern, eine Stichprobenpopulation zu erhalten, die die gesamte untersuchte Population am besten repräsentiert.
  • Bei der geschichteten Zufallsstichprobe wird die gesamte Bevölkerung in homogene Gruppen, sogenannte Strata, aufgeteilt.
  • Die geschichtete Zufallsstichprobe unterscheidet sich von der einfachen Zufallsstichprobe, bei der Daten aus einer gesamten Grundgesamtheit zufällig ausgewählt werden, sodass jede mögliche Stichprobe mit gleicher Wahrscheinlichkeit auftritt.

So funktioniert die geschichtete Zufallsstichprobe

Wenn ein Forscher eine Analyse oder Forschung an einer Gruppe von Entitäten mit ähnlichen Merkmalen durchführt, stellt er möglicherweise fest, dass die Populationsgröße zu groß ist, um die Forschung abzuschließen. Um Zeit und Geld zu sparen, kann ein Analytiker einen praktikableren Ansatz wählen, indem er eine kleine Gruppe aus der Bevölkerung auswählt. Die kleine Gruppe wird als Stichprobengröße bezeichnet, die eine Teilmenge der Grundgesamtheit ist, die verwendet wird, um die gesamte Grundgesamtheit darzustellen. Eine Stichprobe kann auf verschiedene Weise aus einer Grundgesamtheit ausgewählt werden, eine davon ist die Methode der geschichteten Zufallsstichprobe.

Bei einer geschichteten Zufallsstichprobe wird die gesamte Bevölkerung in homogene Gruppen, die sogenannten Strata (Plural für Stratum), aufgeteilt. Aus jeder Schicht werden dann Zufallsstichproben ausgewählt. Stellen Sie sich zum Beispiel einen akademischen Forscher vor, der wissen möchte, wie viele MBA-Studenten im Jahr 2007 innerhalb von drei Monaten nach Abschluss ein Jobangebot erhalten haben.

Er wird bald feststellen, dass es in diesem Jahr fast 200.000 MBA-Absolventen gab. Er könnte sich entscheiden, einfache Zufallsstichprobe von 50.000 Absolventen zu ziehen und eine Umfrage durchzuführen. Besser noch, er könnte die Bevölkerung in Schichten aufteilen und eine Zufallsstichprobe aus den Schichten ziehen. Zu diesem Zweck würde er Bevölkerungsgruppen erstellen, die auf Geschlecht, Altersgruppe, Rasse, Nationalitätsland und beruflichem Hintergrund basieren. Aus jeder Schicht wird eine Zufallsstichprobe gezogen, die proportional zur Größe der Schicht im Vergleich zur Grundgesamtheit ist. Diese Teilmengen der Schichten werden dann zu einer Zufallsstichprobe zusammengefasst.

[Wichtig: Die geschichtete Stichprobenziehung wird verwendet, um Unterschiede zwischen Gruppen in einer Grundgesamtheit hervorzuheben, im Gegensatz zur einfachen Zufallsstichprobe, bei der alle Mitglieder einer Grundgesamtheit gleich behandelt werden, mit der gleichen Wahrscheinlichkeit, Stichproben zu erhalten.]

Beispiel für eine geschichtete Zufallsstichprobe

Angenommen, ein Forschungsteam möchte den GPA von College-Studenten in den USA ermitteln. Das Forschungsteam hat Schwierigkeiten, Daten von allen 21 Millionen College-Studenten zu sammeln. sie beschließt, eine zufällige Stichprobe der Bevölkerung unter Verwendung von 4.000 Studenten zu ziehen.

Nehmen wir nun an, das Team untersucht die unterschiedlichen Eigenschaften der Stichprobenteilnehmer und fragt sich, ob es Unterschiede zwischen den Notendurchschnitten und den Hauptfächern der Studenten gibt. Nehmen wir an, dass 560 Studenten im Hauptfach Englisch, 1.135 im Hauptfach Naturwissenschaften, 800 im Hauptfach Informatik, 1.090 im Hauptfach Ingenieurwesen und 415 im Hauptfach Mathematik sind. Das Team möchte eine proportional geschichtete Zufallsstichprobe verwenden, bei der die Schicht der Stichprobe proportional zur Zufallsstichprobe in der Grundgesamtheit ist.

Angenommen, das Team recherchiert die  Demografie  von College-Studenten in den USA und findet den Prozentsatz dessen, was Studenten als Hauptfach studieren: 12% Hauptfach Englisch, 28% Hauptfach Naturwissenschaften, 24% Hauptfach Informatik, 21% Hauptfach Ingenieurwissenschaften und 15% Hauptfach Mathematik. Somit werden aus der geschichteten Zufallsstichprobe fünf Schichten gebildet.

Das Team muss dann bestätigen, dass die Schicht der Grundgesamtheit im Verhältnis zur Schicht in der Stichprobe steht; Sie stellen jedoch fest, dass die Proportionen nicht gleich sind. Das Team muss dann 4.000 Studenten aus der Bevölkerung erneut befragen und zufällig 480 Englisch, 1.120 Naturwissenschafts, 960 Informatik, 840 Ingenieur- und 600 Mathematikstudenten auswählen.

Mit diesen verfügt es über eine proportional geschichtete Zufallsstichprobe von College-Studenten, die eine bessere Darstellung der College-Majors der Studenten in den USA bietet.

Einfache Zufallsstichproben im Vergleich zu geschichteten Zufallsstichproben

Sowohl einfache Zufallsstichproben als auch geschichtete Zufallsstichproben sind statistische Messinstrumente. Eine einfache Zufallsstichprobe wird verwendet, um die gesamte Datenpopulation darzustellen. Eine geschichtete Zufallsstichprobe teilt die Bevölkerung in kleinere Gruppen oder Schichten auf, basierend auf gemeinsamen Merkmalen.

Die einfache Zufallsstichprobe wird häufig verwendet, wenn nur sehr wenige Informationen über die Datenpopulation verfügbar sind, wenn die Datenpopulation viel zu viele Unterschiede aufweist, um sie in verschiedene Teilmengen aufzuteilen, oder wenn die Datenpopulation nur ein eindeutiges Merkmal aufweist.

Beispielsweise möchte ein Süßwarenunternehmen möglicherweise die Kaufgewohnheiten seiner Kunden untersuchen, um die Zukunft seiner Produktlinie zu bestimmen. Wenn es 10.000 Kunden gibt, kann es 100 dieser Kunden als Zufallsstichprobe verwenden. Es kann dann das, was es von diesen 100 Kunden findet, auf den Rest seiner Basis anwenden. Im Gegensatz zur Schichtung werden 100 Mitglieder rein zufällig ausgewählt, ohne Rücksicht auf ihre individuellen Merkmale.

Verhältnismäßige und unverhältnismäßige Schichtung

Die geschichtete Zufallsstichprobe stellt sicher, dass jede Untergruppe einer bestimmten Grundgesamtheit in der gesamten Stichprobenpopulation einer Forschungsstudie angemessen vertreten ist. Die Schichtung kann verhältnismäßig oder unverhältnismäßig sein. Bei einer proportional geschichteten Methode ist die Stichprobengröße jeder Schicht proportional zur Populationsgröße der Schicht.

Wenn der Forscher beispielsweise eine Stichprobe von 50.000 Absolventen anhand der Altersspanne wünschte, wird die proportional geschichtete Zufallsstichprobe nach folgender Formel erhalten: (Stichprobengröße / Populationsgröße) x Schichtgröße. Die folgende Tabelle geht von einer Bevölkerungsgröße von 180.000 MBA-Absolventen pro Jahr aus.

Die Strata-Stichprobengröße für MBA-Absolventen im Alter von 24 bis 28 Jahren berechnet sich zu (50.000/180.000) x 90.000 = 25.000. Die gleiche Methode wird für die anderen Altersgruppen angewendet. Da nun die Stichprobengröße der Schicht bekannt ist, kann der Forscher in jeder Schicht eine einfache Zufallsstichprobe durchführen, um seine Umfrageteilnehmer auszuwählen. Mit anderen Worten, 25.000 Absolventen der Altersgruppe 24-28 werden zufällig aus der gesamten Bevölkerung ausgewählt, 16.667 Absolventen der Altersgruppe 29-33 werden zufällig aus der Bevölkerung ausgewählt und so weiter.

In einer disproportional geschichteten Stichprobe ist die Größe jeder Schicht nicht proportional zu ihrer Größe in der Grundgesamtheit. Der Forscher kann entscheiden, 1/2 der Absolventen der Altersgruppe 34-37 und 1/3 der Absolventen der Altersgruppe 29-33 Jahre zu beproben.

Es ist wichtig zu beachten, dass eine Person nicht in mehrere Schichten passen kann. Jede Entität darf nur in eine Schicht passen. Überlappende Untergruppen bedeuten, dass einige Personen höhere Chancen haben, für die Umfrage ausgewählt zu werden, was das Konzept der geschichteten Stichprobe als eine Art Wahrscheinlichkeitsstichprobe vollständig negiert.



Portfoliomanager können geschichtete Zufallsstichproben verwenden, um Portfolios zu erstellen, indem sie einen Index wie einen Anleihenindex nachbilden.

Vorteile der geschichteten Zufallsstichprobe

Der Hauptvorteil der geschichteten Zufallsstichprobe besteht darin, dass sie wichtige Populationsmerkmale in der Stichprobe erfasst. Ähnlich einem gewichteten Durchschnitt führt diese Stichprobenmethode zu Merkmalen in der Stichprobe, die proportional zur Gesamtpopulation sind. Die geschichtete Zufallsstichprobe funktioniert gut für Populationen mit einer Vielzahl von Attributen, ist aber ansonsten ineffektiv, wenn keine Untergruppen gebildet werden können.

Die Schichtung ergibt einen geringeren Schätzfehler und eine größere Genauigkeit als die einfache Zufallsstichprobenmethode. Je größer die Unterschiede zwischen den Schichten sind, desto größer ist der Präzisionsgewinn.

Nachteile der geschichteten Zufallsstichprobe

Leider kann diese Forschungsmethode nicht in jeder Studie angewendet werden. Der Nachteil des Verfahrens besteht darin, dass mehrere Bedingungen erfüllt sein müssen, damit es richtig verwendet werden kann. Forscher müssen jedes Mitglied einer untersuchten Population identifizieren und jedes von ihnen in eine und nur eine Subpopulation klassifizieren. Daher ist die geschichtete Zufallsauswahl nachteilig, wenn die Forscher nicht sicher jedes Mitglied der Bevölkerung in eine Untergruppe einordnen können. Es  kann auch schwierig sein, eine vollständige und endgültige Liste einer gesamten  Bevölkerung zu finden.

Überschneidungen können ein Problem sein, wenn es Fächer gibt, die in mehrere Untergruppen fallen. Wenn eine einfache Zufallsstichprobe durchgeführt wird, ist es wahrscheinlicher, dass diejenigen ausgewählt werden, die sich in mehreren Untergruppen befinden. Das Ergebnis könnte eine falsche Darstellung oder eine ungenaue Darstellung der Bevölkerung sein.

Die obigen Beispiele machen es Ihnen leicht: Undergraduate, Graduate, Male und Female sind klar definierte Gruppen. In anderen Situationen kann es jedoch weitaus schwieriger sein. Stellen Sie sich vor, Sie integrieren Merkmale wie Rasse, ethnische Zugehörigkeit oder Religion. Der Sortierprozess wird schwieriger, was die geschichtete Zufallsstichprobe zu einer ineffektiven und nicht idealen Methode macht.