Winsorisierte Mittelwertdefinition
Was ist der Winsorized-Mittelwert?
Winsorized-Mittelwert ist eine Methode zur Mittelwertbildung, die anfänglich die kleinsten und größten Werte durch die ihnen am nächsten liegenden Beobachtungen ersetzt. Dies geschieht, um die Auswirkungen von Ausreißern oder anormalen Extremwerten oder Ausreißern auf die Berechnung zu begrenzen. Nach dem Ersetzen der Werte wird dann die arithmetische Mittelwertformel verwendet, um den Winsorized-Mittelwert zu berechnen.
die zentralen Thesen
- Der Winsorized-Mittelwert ist eine Mittelungsmethode, bei der die kleinsten und größten Werte eines Datensatzes durch die ihnen am nächsten liegenden Beobachtungen ersetzt werden.
- Es mildert die Auswirkungen von Ausreißern, indem es durch weniger extreme Werte ersetzt wird.
- Der winsorisierte Mittelwert ist nicht identisch mit dem getrimmten Mittelwert, bei dem Datenpunkte entfernt statt ersetzt werden – obwohl die Ergebnisse der beiden tendenziell nahe beieinander liegen.
Formel für den Winsorized-Mittelwert
Winsorized-Mittelwerte werden auf zwei Arten ausgedrückt. Ein „k n „-winsorized-Mittelwert bezieht sich auf das Ersetzen der ‚k‘ kleinsten und größten Beobachtungen, wobei ‚k‘ eine ganze Zahl ist. Ein Winsorized-Mittelwert von „X%“ beinhaltet das Ersetzen eines bestimmten Prozentsatzes von Werten von beiden Enden der Daten.
Der winsorisierte Mittelwert wird durch Ersetzen der kleinsten und größten Datenpunkte, dann Summieren aller Datenpunkte und Dividieren der Summe durch die Gesamtzahl der Datenpunkte erreicht.
Was sagt Ihnen die Winsorized-Bedeutung?
Der winsorisierte Mittelwert reagiert weniger empfindlich auf Ausreißer, da er diese durch weniger extreme Werte ersetzen kann. Das heißt, es ist im Vergleich zum arithmetischen Mittel weniger anfällig für Ausreißer. Wenn eine Verteilung jedoch Fat Tails aufweist, hat der Effekt des Entfernens der höchsten und niedrigsten Werte in der Verteilung aufgrund der hohen Variabilität in den Verteilungszahlen wenig Einfluss.
Beispiel für die Verwendung von Winsorized Mean
Lassen Sie uns den winsorisierten Mittelwert für den folgenden Datensatz berechnen: 1, 5, 7, 8, 9, 10, 34. In diesem Beispiel nehmen wir an, dass der winsorisierte Mittelwert in erster Ordnung liegt, wobei wir den kleinsten und größten Wert durch. ersetzen ihre nächsten Beobachtungen.
Der Datensatz sieht nun wie folgt aus: 5, 5, 7, 8, 9, 10, 10. Ein arithmetisches Mittel des neuen Datensatzes ergibt einen winsorisierten Mittelwert von 7,7 oder (5 + 5 + 7 + 8 + 9 + 10 + 10) dividiert durch 7. Beachten Sie, dass das arithmetische Mittel höher wäre – 10.6. Der winsorisierte Mittelwert reduziert effektiv den Einfluss des 34-Wertes als Ausreißer.
Oder betrachten Sie einen Winsorized-Mittelwert von 20 %, der die oberen 10 % und die unteren 10 % durch den nächstgelegenen Wert ersetzt. Wir werden den folgenden Datensatz gewinnen: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Die beiden kleinste und größte Datenpunkte – 10 % der 20 Datenpunkte – werden durch den nächstgelegenen Wert ersetzt. Somit lautet der neue Datensatz: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Der Winsorized-Mittelwert beträgt 33,9 oder die Gesamtzahl der Daten (678) geteilt durch die Gesamtzahl der Datenpunkte (20).
Winsorized-Mittelwert vs. getrimmter Mittelwert
Der winsorisierte Mittelwert beinhaltet das Modifizieren von Datenpunkten, während der getrimmte Mittelwert das Entfernen von Datenpunkten beinhaltet. Es ist üblich, dass der Winsorized-Mittelwert und der getrimmte Mittelwert nahe beieinander liegen oder manchmal den gleichen Wert haben.
Einschränkungen des Winsorized Mean
Ein großer Nachteil von Winsorized-Mitteln besteht darin, dass sie natürlich eine gewisse Verzerrung in den Datensatz einbringen. Durch die Reduzierung des Einflusses von Ausreißern wird die Analyse für eine bessere Analyse modifiziert, aber auch Informationen über die zugrunde liegenden Daten entfernt.