Beschreibende Statistik
Was sind deskriptive Statistiken?
Deskriptive Statistiken sind kurze deskriptive Koeffizienten, die einen bestimmten Datensatz zusammenfassen, der entweder eine Darstellung der Gesamtheit oder eine Stichprobe einer Population sein kann. Deskriptive Statistiken werden in Maße der zentralen Tendenz und Maße der Variabilität (Spread) unterteilt. Maße der zentralen Tendenz sind der Mittelwert, Median und Modus, während Maßnahmen der Variabilität umfassen Kurtosis und Schiefe.
Die zentralen Thesen
- Deskriptive Statistik fasst die Eigenschaften eines Datensatzes zusammen oder beschreibt sie.
- Die deskriptive Statistik besteht aus zwei grundlegenden Kategorien von Maßnahmen: Maßnahmen der zentralen Tendenz und Maßnahmen der Variabilität (oder Streuung).
- Maße der zentralen Tendenz beschreiben das Zentrum eines Datensatzes.
- Variabilitäts- oder Ausbreitungsmaße beschreiben die Streuung von Daten innerhalb des Satzes.
Deskriptive Statistik verstehen
Kurz gesagt, beschreibende Statistiken helfen dabei, die Merkmale eines bestimmten Datensatzes zu beschreiben und zu verstehen, indem sie kurze Zusammenfassungen über die Stichprobe und die Maße der Daten geben. Die bekanntesten Arten der deskriptiven Statistik sind Zentrumsmaße: der Mittelwert, der Median und der Modus, die auf fast allen Ebenen der Mathematik und Statistik verwendet werden. Der Mittelwert oder der Durchschnitt wird berechnet, indem alle Zahlen innerhalb des Datensatzes addiert und dann durch die Anzahl der Zahlen innerhalb des Satzes dividiert werden. Die Summe des folgenden Datensatzes ist beispielsweise 20: (2, 3, 4, 5, 6). Der Mittelwert ist 4 (20/5). Der Modus eines Datensatzes ist der am häufigsten vorkommende Wert und der Median die Zahl, die sich in der Mitte des Datensatzes befindet. Es ist die Zahl, die die höheren Zahlen von den niedrigeren Zahlen innerhalb eines Datensatzes trennt. Es gibt jedoch weniger verbreitete Arten deskriptiver Statistiken, die immer noch sehr wichtig sind.
Menschen verwenden deskriptive Statistiken, um schwer verständliche quantitative Erkenntnisse aus einem großen Datensatz in mundgerechte Beschreibungen umzuwandeln. Der Notendurchschnitt (GPA) eines Schülers beispielsweise vermittelt ein gutes Verständnis der deskriptiven Statistik. Die Idee eines GPA besteht darin, dass er Datenpunkte aus einer Vielzahl von Prüfungen, Klassen und Noten nimmt und sie zusammenfasst, um ein allgemeines Verständnis der gesamten akademischen Leistung eines Schülers zu erhalten. Der persönliche GPA eines Schülers spiegelt seine durchschnittliche akademische Leistung wider.
Maßnahmen der deskriptiven Statistik
Alle deskriptiven Statistiken sind entweder Maße der zentralen Tendenz oder Maße der Variabilität, auch bekannt als Streuungsmaße. Maßzahlen der zentralen Tendenz konzentrieren sich auf die Durchschnitts- oder Mittelwerte von Datensätzen, während sich die Variabilitätsmaße auf die Streuung der Daten konzentrieren. Diese beiden Maßnahmen verwenden Grafiken, Tabellen und allgemeine Diskussionen, um die Bedeutung der analysierten Daten zu verstehen.
Zentraltendenzmaße beschreiben die Zentrumsposition einer Verteilung für einen Datensatz. Eine Person analysiert die Häufigkeit jedes Datenpunkts in der Verteilung und beschreibt sie mit dem Mittelwert, Median oder Modus, der die häufigsten Muster des analysierten Datensatzes misst.
Variabilitätsmaße oder Streuungsmaße helfen bei der Analyse, wie gestreut die Verteilung für einen Datensatz ist. Während beispielsweise die Maße der zentralen Tendenz einer Person den Durchschnitt eines Datensatzes geben können, beschreiben sie nicht, wie die Daten innerhalb des Datensatzes verteilt sind. Der Durchschnitt der Daten kann also 65 von 100 betragen, es können aber immer noch Datenpunkte sowohl bei 1 als auch bei 100 vorhanden sein. Variabilitätsmaße helfen, dies zu kommunizieren, indem sie die Form und Ausbreitung des Datensatzes beschreiben. Reichweite, Quartile, absolute Abweichung und Varianz sind Beispiele für Variabilitätsmaße.
Betrachten Sie den folgenden Datensatz: 5, 19, 24, 62, 91, 100. Der Bereich dieses Datensatzes ist 95, der berechnet wird, indem die niedrigste Zahl (5) im Datensatz von der höchsten (100) subtrahiert wird.
Häufig gestellte Fragen
Warum brauchen wir Statistiken, die einfach Daten beschreiben?
Deskriptive Statistiken werden verwendet, um die Merkmale einer Stichprobe oder eines Datensatzes zu beschreiben oder zusammenzufassen, z. B. den Mittelwert, die Standardabweichung oder die Häufigkeit einer Variablen. Inferenzstatistik. Diese Art von Statistik kann uns helfen, die kollektiven Eigenschaften der Elemente einer Datenstichprobe zu verstehen. Diese Maßnahmen können uns eine Vorstellung über die Wahrscheinlichkeitsverteilung oder die Gesamt – Wertung „Form“ der Daten, die auf einem Diagramm wie ein Histogramm dargestellt werden können oder Grundstück Punkt. Die Kenntnis des Stichprobenmittelwerts, der Varianz und der Verteilung einer Variablen kann uns helfen, die Welt um uns herum zu verstehen.
Was sind Mittelwert und Standardabweichung?
Dies sind zwei häufig verwendete deskriptive Statistiken. Der Mittelwert ist das durchschnittliche Niveau, das in einem Datenelement beobachtet wurde, während die Standardabweichung die Varianz beschreibt oder wie gestreut die in dieser Variablen beobachteten Daten um ihren Mittelwert verteilt sind.
Kann deskriptive Statistik verwendet werden, um Schlussfolgerungen oder Vorhersagen zu ziehen?
Nein. Während diese Beschreibungen hilfreich sind, um die Attribute von Daten zu verstehen, sind inferentielle statistische Techniken – ein separater Zweig der Statistik – erforderlich, um zu verstehen, wie Variablen in einem Datensatz miteinander interagieren.