15 Juni 2021 4:27

Konfidenzintervall

Was ist ein Konfidenzintervall?

Ein Konfidenzintervall in der Statistik bezieht sich auf die Wahrscheinlichkeit, dass ein Populationsparameter für einen bestimmten Anteil zwischen einer Reihe von Werten liegt. Konfidenzintervalle messen den Grad der Unsicherheit oder Sicherheit bei einer Stichprobenmethode. Sie können eine beliebige Anzahl von Wahrscheinlichkeitsgrenzen annehmen, wobei die häufigste ein Konfidenzniveau von 95% oder 99% ist.

Konfidenzintervalle werden mit statistischen Methoden wie einem  t-Test durchgeführt.

Die zentralen Thesen

  • Ein Konfidenzintervall zeigt die Wahrscheinlichkeit an, dass ein Parameter zwischen einem Wertepaar um den Mittelwert liegt.
  • Konfidenzintervalle messen den Grad der Unsicherheit oder Sicherheit bei einer Stichprobenmethode.
  • Sie werden meistens mit Konfidenzniveaus von 95% oder 99% konstruiert.

Ein Konfidenzintervall verstehen

Statistiker verwenden Konfidenzintervalle, um die Unsicherheit in einer Stichprobenvariablen zu messen. Beispielsweise wählt ein Forscher verschiedene Stichproben zufällig aus derselben Population aus und berechnet für jede Stichprobe ein Konfidenzintervall, um zu sehen, wie es den wahren Wert der Populationsvariablen darstellen kann. Die resultierenden Datensätze sind alle unterschiedlich. Einige Intervalle enthalten den wahren Populationsparameter, andere nicht.

Ein Konfidenzintervall ist ein Wertebereich, der über und unter dem Mittelwert der Statistik liegt und wahrscheinlich einen unbekannten Populationsparameter enthält. Das Konfidenzniveau bezieht sich auf den Prozentsatz der Wahrscheinlichkeit oder Gewissheit, dass das Konfidenzintervall den wahren Populationsparameter enthält, wenn Sie eine Zufallsstichprobe mehrmals ziehen. Oder im Volksmund: „Wir sind zu 99% sicher ( Konfidenzniveau), dass die meisten dieser Stichproben (Konfidenzintervalle) den wahren Populationsparameter enthalten.“



Confidence Intervall und das Vertrauen Ebene sind miteinander verknüpft, aber nicht genau das gleiche.

Berechnung eines Konfidenzintervalls

Angenommen, eine Gruppe von Forschern untersucht die Höhen von Basketballspielern der High School. Die Forscher nehmen eine Zufallsstichprobe aus der Bevölkerung und stellen eine mittlere Höhe von 74 Zoll fest.

Der Mittelwert von 74 Zoll ist eine Punktschätzung des Bevölkerungsmittels. Eine Punktschätzung an sich ist von begrenztem Nutzen, da sie die mit der Schätzung verbundene Unsicherheit nicht aufzeigt. Sie haben keine Ahnung, wie weit dieser 74-Zoll-Stichprobenmittelwert vom Bevölkerungsdurchschnitt entfernt sein könnte. Was fehlt, ist der Grad der Unsicherheit in dieser einzelnen Stichprobe.

Konfidenzintervalle liefern mehr Informationen als Punktschätzungen. Durch die Erstellung eines 95% -Konfidenzintervalls unter Verwendung des Mittelwerts und der Standardabweichung der Stichprobe und die Annahme einer Normalverteilung, wie sie durch die Glockenkurve dargestellt wird, gelangen die Forscher zu einer Ober- und Untergrenze, die den wahren Mittelwert in 95% der Fälle enthält.

Angenommen, das Intervall liegt zwischen 72 und 76 Zoll. Wenn die Forscher 100 Zufallsstichproben aus der Gesamtbevölkerung der High-School-Basketballspieler entnehmen, sollte der Mittelwert in 95 dieser Stichproben zwischen 72 und 76 Zoll liegen.

Beispiele für ein Konfidenzintervall

Wenn die Forscher noch mehr Vertrauen wünschen, können sie das Intervall auf 99% Vertrauen erweitern. Dadurch wird ausnahmslos ein breiterer Bereich geschaffen, da Platz für eine größere Anzahl von Probenmitteln geschaffen wird. Wenn sie das 99% -Konfidenzintervall als zwischen 70 Zoll und 78 Zoll festlegen, können sie erwarten, dass 99 von 100 bewerteten Proben einen Mittelwert zwischen diesen Zahlen enthalten.

Ein Konfidenzniveau von 90% impliziert andererseits, dass wir erwarten würden, dass 90% der Intervallschätzungen den Populationsparameter usw. enthalten.

Besondere Überlegungen

Das größte Missverständnis in Bezug auf Konfidenzintervalle besteht darin, dass sie den Prozentsatz der Daten einer bestimmten Stichprobe darstellen, der zwischen der oberen und unteren Grenze liegt.

Beispielsweise könnte man das oben erwähnte 99% -Konfidenzintervall von 70 bis 78 Zoll fälschlicherweise so interpretieren, dass 99% der Daten in einer Zufallsstichprobe zwischen diesen Zahlen liegen. Dies ist falsch, obwohl es eine separate Methode zur statistischen Analyse gibt, um eine solche Bestimmung vorzunehmen. Dazu müssen Sie den Mittelwert und die Standardabweichung der Probe ermitteln und diese Zahlen auf einer Glockenkurve auftragen.