Empirische Regel
Was ist die empirische Regel?
Die empirische Regel, auch als Drei-Sigma-Regel oder 68-95-99,7-Regel bezeichnet, ist eine statistische Regel, die besagt, dass bei einer Normalverteilung fast alle beobachteten Daten innerhalb von drei Standardabweichungen (bezeichnet mit σ) von liegen Mittelwert oder Durchschnitt (bezeichnet mit µ).
Insbesondere sagt die empirische Regel voraus, dass 68 % der Beobachtungen innerhalb der ersten Standardabweichung (µ ± σ), 95 % innerhalb der ersten beiden Standardabweichungen (µ ± 2σ) und 99,7 % innerhalb der ersten drei Standardabweichungen (µ ± ) liegen 3σ).
Die zentralen Thesen
- Die empirische Regel besagt, dass 99,7% der beobachteten Daten nach einer Normalverteilung innerhalb von 3 Standardabweichungen vom Mittelwert liegen.
- Nach dieser Regel liegen 68 % der Daten innerhalb einer Standardabweichung, 95 % Prozent innerhalb von zwei Standardabweichungen und 99,7 % innerhalb von drei Standardabweichungen vom Mittelwert.
- Drei-Sigma-Grenzen, die der empirischen Regel folgen, werden verwendet, um die obere und untere Kontrollgrenze in statistischen Qualitätsregelkarten und in der Risikoanalyse wie dem VaR festzulegen.
Die empirische Regel verstehen
Die empirische Regel wird in der Statistik häufig zur Vorhersage von Endergebnissen verwendet. Nach der Berechnung der Standardabweichung und vor dem Sammeln genauer Daten kann diese Regel als grobe Schätzung des Ergebnisses der bevorstehenden Datensammlung und -analyse verwendet werden.
Diese Wahrscheinlichkeitsverteilung kann somit als Zwischenheuristik verwendet werden, da das Sammeln der entsprechenden Daten unter Umständen zeitaufwändig oder sogar unmöglich sein kann. Solche Überlegungen spielen eine Rolle, wenn ein Unternehmen seine Qualitätskontrollmaßnahmen überprüft oder seine Risikoexposition bewertet. So geht beispielsweise das gängige Risikoinstrument Value-at-Risk (VaR) davon aus, dass die Wahrscheinlichkeit von Risikoereignissen einer Normalverteilung folgt.
Die empirische Regel wird auch als grobe Methode verwendet, um die „Normalität“ einer Verteilung zu testen. Wenn zu viele Datenpunkte außerhalb der drei Standardabweichungsgrenzen liegen, deutet dies darauf hin, dass die Verteilung nicht normal ist und stattdessen verzerrt ist oder einer anderen Verteilung folgt.
Die empirischen Regeln sind auch als Drei-Sigma-Regel bekannt, da sich „Drei-Sigma“ auf eine statistische Verteilung von Daten innerhalb von drei Standardabweichungen vom Mittelwert einer Normalverteilung ( Glockenkurve ) bezieht, wie in der folgenden Abbildung dargestellt.
Beispiele für die empirische Regel
Nehmen wir an, dass eine Population von Tieren in einem Zoo bekanntermaßen normal verteilt ist. Jedes Tier wird im Durchschnitt 13,1 Jahre alt (Mittelwert), und die Standardabweichung der Lebensdauer beträgt 1,5 Jahre. Wenn jemand die Wahrscheinlichkeit wissen möchte, dass ein Tier länger als 14,6 Jahre lebt, könnte er die empirische Regel anwenden. Da der Mittelwert der Verteilung 13,1 Jahre alt ist, treten für jede Standardabweichung die folgenden Altersspannen auf:
- Eine Standardabweichung (µ ± σ): (13,1 – 1,5) bis (13,1 + 1,5) oder 11,6 bis 14,6
- Zwei Standardabweichungen (µ ± 2σ): 13,1 – (2 x 1,5) bis 13,1 + (2 x 1,5) oder 10,1 bis 16,1
- Drei Standardabweichungen (µ ± 3σ): 13,1 – (3 x 1,5) bis 13,1 + (3 x 1,5) oder 8,6 bis 17,6
Die Person, die dieses Problem löst, muss die Gesamtwahrscheinlichkeit berechnen, dass das Tier 14,6 Jahre oder länger lebt. Die empirische Regel zeigt, dass 68 % der Verteilung innerhalb einer Standardabweichung liegen, in diesem Fall von 11,6 bis 14,6 Jahren. Somit liegen die restlichen 32 % der Verteilung außerhalb dieses Bereichs. Die Hälfte liegt über 14,6 und die andere Hälfte liegt unter 11,6. Die Wahrscheinlichkeit, dass das Tier länger als 14,6 lebt, beträgt also 16% (berechnet als 32% geteilt durch zwei).
Nehmen wir als weiteres Beispiel an, dass ein Tier im Zoo durchschnittlich 10 Jahre alt wird, mit einer Standardabweichung von 1,4 Jahren. Angenommen, der Tierpfleger versucht herauszufinden, mit welcher Wahrscheinlichkeit ein Tier länger als 7,2 Jahre lebt. Diese Verteilung sieht wie folgt aus:
- Eine Standardabweichung (µ ± σ): 8,6 bis 11,4 Jahre
- Zwei Standardabweichungen (µ ± 2σ): 7,2 bis 12,8 Jahre
- Drei Standardabweichungen ((µ ± 3σ): 5,8 bis 14,2 Jahre
Die empirische Regel besagt, dass 95 % der Verteilung innerhalb von zwei Standardabweichungen liegen. Somit liegen 5 % außerhalb von zwei Standardabweichungen; die Hälfte über 12,8 Jahre und die Hälfte unter 7,2 Jahren. Die Wahrscheinlichkeit, länger als 7,2 Jahre zu leben, beträgt somit:
95 % + (5% / 2) = 97,5 %
Häufig gestellte Fragen
Was ist die empirische Regel?
In der Statistik besagt die empirische Regel, dass 99,7% der Daten innerhalb von drei Standardabweichungen des Mittelwerts innerhalb einer Normalverteilung auftreten. Zu diesem Zweck werden 68 % der beobachteten Daten innerhalb der ersten Standardabweichung, 95 % in der zweiten Abweichung und 97,5 % innerhalb der dritten Standardabweichung auftreten. Die empirische Regel sagt die Wahrscheinlichkeitsverteilung für eine Reihe von Ergebnissen voraus.
Wie wird die empirische Regel verwendet?
Die empirische Regel wird angewendet, um wahrscheinliche Ergebnisse in einer Normalverteilung zu antizipieren. Ein Statistiker würde dies beispielsweise verwenden, um den Prozentsatz der Fälle zu schätzen, die in jede Standardabweichung fallen. Beachten Sie, dass die Standardabweichung 3,1 beträgt und der Mittelwert 10 beträgt. In diesem Fall würde die erste Standardabweichung zwischen (10+3,2)= 13,2 und (10-3,2)= 6,8 liegen. Die zweite Abweichung würde zwischen 10 + (2 x 3,2) = 16,4 und 10 – (2 x 3,2) = 3,6 liegen, und so weiter.
Was sind die Vorteile der empirischen Regel?
Die empirische Regel ist vorteilhaft, da sie als Mittel zur Vorhersage von Daten dient. Dies gilt insbesondere für große Datensätze und solche, bei denen Variablen unbekannt sind. Insbesondere im Finanzbereich ist die empirische Regel für Aktienkurse, Preisindizes und logarithmische Werte von Devisenkursen von Bedeutung, die alle dazu neigen, über eine Glockenkurve oder eine Normalverteilung zu fallen.