20 Juni 2021 20:55

Stichprobenverteilung

Was ist eine Stichprobenverteilung?

Eine Stichprobenverteilung ist eine Wahrscheinlichkeitsverteilung einer Statistik, die aus einer größeren Anzahl von Stichproben aus einer bestimmten Population erhalten wurde. Die Stichprobenverteilung einer bestimmten Grundgesamtheit ist die Verteilung der Häufigkeiten einer Reihe verschiedener Ergebnisse, die möglicherweise für eine Statistik einer Grundgesamtheit auftreten können.

In der  Statistik ist eine Population der gesamte Pool, aus dem eine statistische  Stichprobe  gezogen wird. Eine Population kann sich auf eine ganze Gruppe von Personen, Objekten, Ereignissen, Krankenhausbesuchen oder Messungen beziehen. Eine Population kann daher als eine aggregierte Beobachtung von Subjekten bezeichnet werden, die durch ein gemeinsames Merkmal gruppiert sind.



  • Eine Stichprobenverteilung ist eine Statistik, die durch wiederholte Stichproben aus einer größeren Population gewonnen wird.
  • Es beschreibt eine Reihe möglicher Ergebnisse einer Statistik, wie z. B. den Mittelwert oder den Modus einer Variablen, da es sich tatsächlich um eine Population handelt.
  • Die Mehrheit der von Forschern analysierten Daten stammt tatsächlich aus Stichproben und nicht aus Populationen.

Verständnis der Stichprobenverteilung

Viele Daten, die von Akademikern, Statistikern, Forschern, Vermarktern, Analysten usw. gezogen und verwendet werden, sind tatsächlich Stichproben, keine Populationen. Eine Stichprobe ist eine Teilmenge einer Population. Beispielsweise kann ein medizinischer Forscher, der das Durchschnittsgewicht aller in Nordamerika von 1995 bis 2005 geborenen Babys mit denen vergleichen wollte, die im selben Zeitraum in Südamerika geboren wurden, nicht innerhalb eines angemessenen Zeitraums die Daten für die gesamte Bevölkerung von ziehen über eine Million Geburten, die in einem Zeitraum von zehn Jahren stattfanden. Stattdessen wird er nur das Gewicht von beispielsweise 100 Babys auf jedem Kontinent verwenden, um eine Schlussfolgerung zu ziehen. Das Gewicht von 200 verwendeten Babys ist die Stichprobe und das berechnete Durchschnittsgewicht ist der Stichprobenmittelwert.

Nehmen wir nun an, anstatt nur eine Stichprobe von 100 Neugeborenengewichten von jedem Kontinent zu nehmen, zieht der medizinische Forscher wiederholt zufällige Stichproben aus der allgemeinen Bevölkerung und berechnet den Stichprobenmittelwert für jede Stichprobengruppe. Für Nordamerika zieht er also Daten für 100 Neugeborenengewichte, die in den USA, Kanada und Mexiko aufgezeichnet wurden, wie folgt zusammen: vier 100 Proben aus ausgewählten Krankenhäusern in den USA, fünf 70 Proben aus Kanada und drei 150 Datensätze aus Mexiko, insgesamt for von 1200 Gewichten von Neugeborenen in 12 Sätzen gruppiert. Er sammelt auch Stichprobendaten von 100 Geburtsgewichten aus jedem der 12 Länder in Südamerika.



Jede Stichprobe hat ihren eigenen Stichprobenmittelwert und die Verteilung der Stichprobenmittelwerte wird als Stichprobenverteilung bezeichnet.

Das für jeden Stichprobensatz berechnete Durchschnittsgewicht ist die Stichprobenverteilung des Mittelwerts. Aus einer Stichprobe kann nicht nur der Mittelwert berechnet werden. Andere Statistiken wie Standardabweichung, Varianz, Anteil und Spannweite können aus Stichprobendaten berechnet werden. Die Standardabweichung und Varianz messen die Variabilität der Stichprobenverteilung.

Die Anzahl der Beobachtungen in einer Grundgesamtheit, die Anzahl der Beobachtungen in einer Stichprobe und das Verfahren zum Ziehen der Stichprobensätze bestimmen die Variabilität einer Stichprobenverteilung. Die Standardabweichung einer Stichprobenverteilung wird als Standardfehler bezeichnet. Während der Mittelwert einer Stichprobenverteilung dem Mittelwert der Grundgesamtheit entspricht, hängt der Standardfehler von der Standardabweichung der Grundgesamtheit, der Größe der Grundgesamtheit und der Größe der Stichprobe ab.

Wenn Sie wissen, wie weit die Mittelwerte der einzelnen Stichprobensätze voneinander und vom Mittelwert der Grundgesamtheit abweichen, können Sie erkennen, wie nahe der Mittelwert der Stichprobe am Mittelwert der Grundgesamtheit liegt. Der Standardfehler der Stichprobenverteilung nimmt mit zunehmendem Stichprobenumfang ab.

Besondere Überlegungen

Eine Population oder ein Stichprobensatz von Zahlen hat eine Normalverteilung. Da eine Stichprobenverteilung jedoch mehrere Beobachtungssätze enthält, weist sie nicht unbedingt eine glockenförmige Form auf.

Nach unserem Beispiel ist das durchschnittliche Bevölkerungsgewicht von Babys in Nordamerika und Südamerika normal verteilt, da einige Babys untergewichtig (unter dem Mittelwert) oder übergewichtig (über dem Mittelwert) sind, während die meisten Babys dazwischen liegen (um den Mittelwert). ). Wenn das durchschnittliche Gewicht von Neugeborenen in Nordamerika sieben Pfund beträgt, liegt das Durchschnittsgewicht der Stichprobe in jedem der 12 für Nordamerika aufgezeichneten Probenbeobachtungssätze ebenfalls nahe bei sieben Pfund.

Wenn Sie jedoch jeden der in jeder der 1.200 Stichprobengruppen berechneten Mittelwerte grafisch darstellen, kann die resultierende Form zu einer gleichmäßigen Verteilung führen, aber es ist schwierig, mit Sicherheit vorherzusagen, wie die tatsächliche Form aussehen wird. Je mehr Stichproben der Forscher aus der Population von über einer Million Gewichtswerten verwendet, desto mehr beginnt die Grafik eine Normalverteilung zu bilden.