Die Normalverteilungstabelle
Was ist die Normalverteilung?
Die Normalverteilungsformel basiert auf zwei einfachen Parametern – Mittelwert und Standardabweichung –, die die Eigenschaften eines bestimmten Datensatzes quantifizieren.
Während der Mittelwert den „zentralen“ oder Durchschnittswert des gesamten Datensatzes angibt, gibt die Standardabweichung die „Streuung“ oder Variation von Datenpunkten um diesen Mittelwert an.
Die zentralen Thesen
- Die Normalverteilungsformel basiert auf zwei einfachen Parametern – Mittelwert und Standardabweichung –, die die Eigenschaften eines bestimmten Datensatzes quantifizieren.
- Um eine einheitliche Standardmethode für einfache Berechnungen und Anwendbarkeit auf reale Probleme zu ermöglichen, wurde die Standardumrechnung in Z-Werte eingeführt, die Teil der Normalverteilungstabelle sind.
- Zu den Eigenschaften einer Normalverteilung gehören: die Normalkurve ist um den Mittelwert symmetrisch; der Mittelwert liegt in der Mitte und teilt die Fläche in zwei Hälften; die Gesamtfläche unter der Kurve ist gleich 1 für mean=0 und stdev=1; und die Verteilung wird vollständig durch ihren Mittelwert und stddev beschrieben.
- Normalverteilungstabellen werden im Wertpapierhandel verwendet, um Aufwärts- oder Abwärtstrends, Unterstützungs- oder Widerstandsniveaus und andere technische Indikatoren zu identifizieren.
Normalverteilungsbeispiel
Betrachten Sie die folgenden 2 Datensätze:
- Datensatz 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
- Datensatz 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Für Datensatz1 ist Mittelwert = 10 und Standardabweichung (stddev) = 0
Für Datensatz2, Mittelwert = 10 und Standardabweichung (stddev) = 2,83
Zeichnen wir diese Werte für DataSet1:
Ähnliches gilt für DataSet2:
Die rote horizontale Linie in den beiden obigen Grafiken zeigt den „Mittelwert“ oder den Durchschnittswert jedes Datensatzes (in beiden Fällen 10). Die rosa Pfeile im zweiten Diagramm zeigen die Streuung oder Abweichung der Datenwerte vom Mittelwert an. Dies wird im Fall von DataSet2 durch einen Standardabweichungswert von 2,83 dargestellt. Da bei DataSet1 alle Werte gleich sind (jeweils 10) und keine Variationen vorhanden sind, ist der stddev-Wert null, und daher sind keine rosa Pfeile anwendbar.
Der stddev-Wert hat einige wichtige und nützliche Eigenschaften, die bei der Datenanalyse äußerst hilfreich sind. Bei einer Normalverteilung sind die Datenwerte symmetrisch auf beiden Seiten des Mittelwerts verteilt. Für jeden normalverteilten Datensatz, der ein Diagramm mit stddev auf der horizontalen Achse und der Anzahl der Datenwerte auf der vertikalen Achse zeichnet, wird das folgende Diagramm erhalten.
Eigenschaften einer Normalverteilung
- Die normale Kurve ist symmetrisch zum Mittelwert;
- Der Mittelwert liegt in der Mitte und teilt die Fläche in zwei Hälften;
- Die Gesamtfläche unter der Kurve ist gleich 1 für Mittelwert = 0 und stdev = 1;
- Die Verteilung wird vollständig durch ihren Mittelwert und stddev beschrieben
Wie aus der obigen Grafik ersichtlich ist, steht stddev für Folgendes:
- 68,3 % der Datenwerte liegen innerhalb einer Standardabweichung vom Mittelwert (-1 bis +1)
- 95,4% der Datenwerte liegen innerhalb von 2 Standardabweichungen vom Mittelwert (-2 bis +2)
- 99,7 % der Datenwerte liegen innerhalb von 3 Standardabweichungen vom Mittelwert (-3 bis +3)
Die gemessene Fläche unter der Glockenkurve gibt die gewünschte Wahrscheinlichkeit für einen bestimmten Bereich an:
- kleiner als X: zB Wahrscheinlichkeit von Datenwerten kleiner als 70
- größer als X: zB Wahrscheinlichkeit, dass Datenwerte größer als 95. sind
- zwischen X 1 und X 2 : zB Wahrscheinlichkeit von Datenwerten zwischen 65 und 85
wobei X ein interessierender Wert ist (Beispiele unten).
Das Zeichnen und Berechnen der Fläche ist nicht immer bequem, da unterschiedliche Datensätze unterschiedliche Mittel- und Standardwerte haben. Um eine einheitliche Standardmethode für einfache Berechnungen und Anwendbarkeit auf reale Probleme zu ermöglichen, wurde die Standardumrechnung in Z-Werte eingeführt, die Teil der Normalverteilungstabelle sind.
Z = (X – Mittelwert) / stddev, wobei X die Zufallsvariable ist.
Grundsätzlich erzwingt diese Konvertierung, dass Mittelwert und stddev auf 0 bzw. 1 standardisiert werden, was die Verwendung eines standardmäßig definierten Satzes von Z-Werten (aus der Normalverteilungstabelle ) für einfache Berechnungen ermöglicht. Eine Momentaufnahme einer Standard-Z-Wert-Tabelle mit Wahrscheinlichkeitswerten sieht wie folgt aus:
Um die Wahrscheinlichkeit in Bezug auf den Z-Wert von 0,239865 zu ermitteln, runden Sie ihn zunächst auf 2 Dezimalstellen (dh 0,24) ab. Prüfen Sie dann die ersten 2 signifikanten Stellen (0,2) in den Zeilen und die niedrigstwertigen Stellen (verbleibende 0,04) in der Spalte. Das führt zu einem Wert von 0,09483.
Die vollständige Normalverteilungstabelle mit einer Genauigkeit von bis zu 5 Dezimalstellen für Wahrscheinlichkeitswerte (einschließlich solcher für negative Werte) finden Sie hier.
Sehen wir uns einige Beispiele aus dem wirklichen Leben an. Die Körpergröße der Individuen einer großen Gruppe folgt einem normalen Verteilungsmuster. Angenommen, wir haben einen Satz von 100 Individuen, deren Körpergröße aufgezeichnet wird und der Mittelwert und die Standardabweichung auf 66 bzw. 6 Zoll berechnet werden.
Hier sind einige Beispielfragen, die mithilfe der Z-Wert-Tabelle einfach beantwortet werden können:
Wie groß ist die Wahrscheinlichkeit, dass eine Person in der Gruppe 70 Zoll oder weniger groß ist?
Die Frage ist, den kumulativen Wert von P(X<=70) zu ermitteln, dh im gesamten Datensatz von 100, wie viele Werte zwischen 0 und 70 liegen.
Lassen Sie uns zuerst den X-Wert von 70 in den entsprechenden Z-Wert umwandeln.
Z = (X – Mittelwert)/stddev = (70-66)/6 = 4/6 = 0,66667 = 0,67 (auf 2 Dezimalstellen runden)
Wir müssen nun P (Z <= 0,67) = 0,24857 (aus der obigen Z-Tabelle) finden.
dh es besteht eine Wahrscheinlichkeit von 24,857%, dass eine Person in der Gruppe kleiner oder gleich 70 Zoll ist.
Aber warten Sie – das Obige ist unvollständig. Denken Sie daran, wir suchen nach der Wahrscheinlichkeit aller möglichen Höhen bis 70, dh von 0 bis 70. Das obige gibt Ihnen nur den Anteil vom Mittelwert zum gewünschten Wert (dh 66 bis 70). Wir müssen die andere Hälfte – von 0 bis 66 – einbeziehen, um die richtige Antwort zu erhalten.
Da 0 bis 66 den halben Anteil (dh ein Extrem bis zum Mittelwert) darstellen, beträgt seine Wahrscheinlichkeit einfach 0,5.
Daher die korrekte Wahrscheinlichkeit, dass eine Person 70 Zoll oder weniger groß ist = 0,24857 + 0,5 = 0,74857 = 74,857%
Grafisch (durch Berechnung der Fläche) sind dies die beiden summierten Regionen, die die Lösung darstellen:
Wie groß ist die Wahrscheinlichkeit, dass eine Person 75 Zoll oder höher ist?
dh Komplementäres kumulatives P(X>=75) finden.
Z = (X – Mittelwert)/stddev = (75-66)/6 = 9/6 = 1,5
P (Z >=1,5) = 1- P (Z <= 1,5) = 1 – (0,5+0,43319) = 0,06681 = 6,681%
Wie groß ist die Wahrscheinlichkeit, dass eine Person zwischen 52 Zoll und 67 Zoll liegt?
Finden Sie P(52<=X<=67).
P(52<=X<=67) = P [(52-66)/6 <= Z <= (67-66)/6] = P(-2,33 <= Z <= 0,17)
= P(Z <= 0,17) –P(Z <= -0,233) = (0,5+0,56749) – (.40905) =
Diese Normalverteilungstabelle (und Z-Werte) findet häufig Verwendung für Wahrscheinlichkeitsberechnungen zu erwarteten Kursbewegungen am Aktienmarkt für Aktien und Indizes. Sie werden im bereichsbasierten Handel verwendet, um Aufwärts oder Abwärtstrends, technische Indikatoren zu identifizieren, die auf Normalverteilungskonzepten von Mittelwert und Standardabweichung basieren.