Vertrauensintervall
Was ist das Konfidenzintervall?
Ein Konfidenzintervall bezieht sich in der Statistik auf die Wahrscheinlichkeit, dass ein Populationsparameter für einen bestimmten Anteil zwischen einer Reihe von Werten liegt.
Die zentralen Thesen
- Ein Konfidenzintervall zeigt die Wahrscheinlichkeit an, mit der ein Parameter zwischen ein Wertepaar um den Mittelwert fällt.
- Konfidenzintervalle messen den Grad der Unsicherheit oder Gewissheit einer Stichprobenmethode.
- Sie werden am häufigsten mit Konfidenzniveaus von 95 % oder 99 % konstruiert.
Vertrauensintervall verstehen Understanding
Konfidenzintervalle messen den Grad der Unsicherheit oder Gewissheit einer Stichprobenmethode. Sie können eine beliebige Anzahl von Wahrscheinlichkeitsgrenzen annehmen, wobei die häufigste ein Konfidenzniveau von 95 % oder 99 % ist. Konfidenzintervalle werden mit statistischen Methoden wie einem t-Test durchgeführt.
Statistiker verwenden Konfidenzintervalle, um die Unsicherheit in einer Stichprobenvariablen zu messen. Ein Forscher wählt beispielsweise zufällig verschiedene Stichproben aus derselben Grundgesamtheit aus und berechnet ein Konfidenzintervall für jede Stichprobe, um zu sehen, wie sie den wahren Wert der Grundgesamtheitsvariable darstellen kann. Die resultierenden Datensätze sind alle unterschiedlich; einige Intervalle enthalten den wahren Populationsparameter und andere nicht.
Ein Konfidenzintervall ist ein Bereich von Werten, der über und unter den Mittelwert der Statistik begrenzt ist und der wahrscheinlich einen unbekannten Populationsparameter enthalten würde. Das Konfidenzniveau bezieht sich auf den Prozentsatz der Wahrscheinlichkeit oder Gewissheit, dass das Konfidenzintervall den wahren Populationsparameter enthalten würde, wenn Sie eine Zufallsstichprobe viele Male ziehen. Oder im Volksmund: „Wir sind zu 99% sicher ( Konfidenzniveau), dass die meisten dieser Stichproben (Konfidenzintervalle) den wahren Populationsparameter enthalten.“
Das größte Missverständnis in Bezug auf Konfidenzintervalle besteht darin, dass sie den Prozentsatz der Daten einer bestimmten Stichprobe darstellen, der zwischen den oberen und unteren Grenzen liegt. Beispielsweise könnte man das oben erwähnte 99%-Konfidenzintervall von 70 bis 78 Zoll fälschlicherweise so interpretieren, dass 99% der Daten in einer Zufallsstichprobe zwischen diesen Zahlen liegen. Dies ist falsch, obwohl eine separate statistische Analysemethode existiert, um eine solche Feststellung zu treffen. Dazu müssen der Mittelwert und die Standardabweichung der Stichprobe ermittelt und diese Zahlen auf einer Glockenkurve aufgetragen werden.
Confidence Intervall und das Vertrauen Ebene sind miteinander verknüpft, aber nicht genau das gleiche.
Konfidenzintervall berechnen
Angenommen, eine Gruppe von Forschern untersucht die Höhen von Basketballspielern der High School. Die Forscher ziehen eine Zufallsstichprobe aus der Bevölkerung und stellen eine durchschnittliche Körpergröße von 74 Zoll fest.
Der Mittelwert von 74 Zoll ist eine Punktschätzung des Bevölkerungsdurchschnitts. Eine Punktschätzung allein ist von begrenztem Nutzen, da sie die mit der Schätzung verbundene Unsicherheit nicht offenbart; Sie haben kein gutes Gefühl dafür, wie weit dieser 74-Zoll-Stichprobenmittelwert vom Bevölkerungsmittelwert entfernt sein könnte. Was fehlt, ist der Grad der Unsicherheit in dieser einzelnen Stichprobe.
Konfidenzintervalle liefern mehr Informationen als Punktschätzungen. Durch die Festlegung eines 95-%-Konfidenzintervalls unter Verwendung des Mittelwerts und der Standardabweichung der Stichprobe und der Annahme einer Normalverteilung, wie sie durch die Glockenkurve dargestellt wird, gelangen die Forscher zu einer oberen und unteren Grenze, die den wahren Mittelwert in 95 % der Fälle enthält.
Angenommen, das Intervall liegt zwischen 72 Zoll und 76 Zoll. Wenn die Forscher 100 zufällige Stichproben aus der Gesamtheit der High-School-Basketballspieler ziehen, sollte der Mittelwert in 95 dieser Stichproben zwischen 72 und 76 Zoll liegen.
Wenn die Forscher ein noch größeres Vertrauen wünschen, können sie das Intervall auf 99% Vertrauen erweitern. Dadurch entsteht unweigerlich ein breiterer Bereich, da Platz für eine größere Anzahl von Stichprobenmitteln geschaffen wird. Wenn sie das 99% -Konfidenzintervall als zwischen 70 Zoll und 78 Zoll festlegen, können sie erwarten, dass 99 von 100 bewerteten Proben einen Mittelwert zwischen diesen Zahlen enthalten.
Ein Konfidenzniveau von 90 % bedeutet andererseits, dass wir erwarten würden, dass 90 % der Intervallschätzungen den Populationsparameter enthalten und so weiter.
Häufig gestellte Fragen
Was verrät ein Konfidenzintervall?
Ein Konfidenzintervall ist ein Bereich von Werten, der über und unter dem Mittelwert der Statistik begrenzt ist und der wahrscheinlich einen unbekannten Populationsparameter enthalten würde. Das Konfidenzniveau bezieht sich auf den Prozentsatz der Wahrscheinlichkeit oder Gewissheit, dass das Konfidenzintervall den wahren Populationsparameter enthalten würde, wenn Sie eine Zufallsstichprobe viele Male ziehen.
Wie werden Konfidenzintervalle verwendet?
Statistiker verwenden Konfidenzintervalle, um die Unsicherheit in einer Stichprobenvariablen zu messen. Beispielsweise wählt ein Forscher zufällig verschiedene Stichproben aus derselben Population aus und berechnet für jede Stichprobe ein Konfidenzintervall, um festzustellen, wie es den wahren Wert der Populationsvariablen darstellen kann. Die resultierenden Datensätze sind alle unterschiedlich, wobei einige Intervalle den wahren Populationsparameter enthalten und andere nicht.
Was ist ein häufiges Missverständnis über Konfidenzintervalle?
Das größte Missverständnis in Bezug auf Konfidenzintervalle besteht darin, dass sie den Prozentsatz der Daten einer bestimmten Stichprobe darstellen, der zwischen den oberen und unteren Grenzen liegt. Mit anderen Worten, es wäre falsch anzunehmen, dass ein Konfidenzintervall von 99 % bedeutet, dass 99 % der Daten in einer Zufallsstichprobe zwischen diesen Grenzen liegen. Tatsächlich bedeutet dies, dass man zu 99% sicher sein kann, dass der Bereich den Mittelwert der Grundgesamtheit enthält.
Was ist ein T-Test?
Konfidenzintervalle werden mit statistischen Methoden wie einem t-Test durchgeführt. Ein t-Test ist eine Art von Inferenzstatistik, die verwendet wird, um festzustellen, ob zwischen den Mittelwerten zweier Gruppen ein signifikanter Unterschied besteht, der in bestimmten Merkmalen zusammenhängen kann. Die Berechnung eines T-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.