19 Juni 2021 21:58

Statistiken

Was sind Statistiken?

Statistik ist ein Zweig der angewandten Mathematik, der die Sammlung, Beschreibung, Analyse und Schlussfolgerung von Schlussfolgerungen aus quantitativen Daten umfasst. Die mathematischen Theorien hinter der Statistik stützen sich stark auf Differential- und Integralrechnung, lineare Algebra und Wahrscheinlichkeitstheorie. Statistikern, also Personen, die Statistik betreiben, ist es besonders wichtig, aus den beobachtbaren Merkmalen kleiner Stichproben, die nur einen kleinen Teil der großen Gruppe oder eine begrenzte Anzahl von Fällen eines allgemeinen Phänomens darstellen, zuverlässige Rückschlüsse auf große Gruppen und allgemeine Phänomene zu ziehen.

Die beiden Hauptbereiche der Statistik sind als deskriptive Statistik bekannt, die die Eigenschaften von Stichproben- und Populationsdaten beschreibt, und inferenzielle Statistik, die diese Eigenschaften verwendet, um Hypothesen zu testen und Schlussfolgerungen zu ziehen.

Einige gängige statistische Werkzeuge und Verfahren umfassen Folgendes:

Die zentralen Thesen

  • Statistik ist das Studium und die Manipulation von Daten, einschließlich der Möglichkeiten zum Sammeln, Überprüfen, Analysieren und Ziehen von Schlussfolgerungen aus Daten.
  • Die beiden Hauptbereiche der Statistik sind die deskriptive und die inferenzielle Statistik.
  • Statistiken können verwendet werden, um fundiertere Geschäfts- und Investitionsentscheidungen zu treffen.

Statistik verstehen

Statistik wird in praktisch allen wissenschaftlichen Disziplinen wie den Natur- und Sozialwissenschaften sowie in der Wirtschaft, den Geisteswissenschaften, der Regierung und dem verarbeitenden Gewerbe verwendet. Statistik ist im Grunde ein Zweig der angewandten Mathematik, der sich aus der Anwendung mathematischer Werkzeuge wie Infinitesimalrechnung und linearer Algebra zur Wahrscheinlichkeitstheorie entwickelt hat.

In der Praxis ist Statistik die Idee, die wir über die Eigenschaften großer Mengen von Objekten oder Ereignissen (einer Population ) lernen können, indem wir die Eigenschaften einer kleineren Anzahl ähnlicher Objekte oder Ereignisse (eine Stichprobe ) untersuchen. Da das Sammeln umfassender Daten über eine ganze Bevölkerung in vielen Fällen zu teuer, schwierig oder gar unmöglich ist, beginnen Statistiken mit einer Stichprobe, die bequem oder kostengünstig beobachtet werden kann.

Bei der Datenanalyse werden zwei Arten von statistischen Methoden verwendet: deskriptive Statistik und inferenzielle Statistik. Statistiker messen und sammeln Daten über die Personen oder Elemente einer Stichprobe und analysieren diese Daten dann, um beschreibende Statistiken zu erstellen. Sie können dann diese beobachteten Merkmale der Stichprobendaten, die richtigerweise als „Statistiken“ bezeichnet werden, verwenden, um Rückschlüsse oder fundierte Vermutungen über die nicht gemessenen (oder nicht gemessenen) Merkmale der breiteren Bevölkerung, die als Parameter bekannt sind, anzustellen.

Beschreibende Statistik

Deskriptive Statistik konzentriert sich hauptsächlich auf die zentrale Tendenz, Variabilität und Verteilung von Stichprobendaten. Zentrale Tendenz bedeutet die Schätzung der Merkmale, ein typisches Element einer Stichprobe oder Grundgesamtheit, und umfasst deskriptive Statistiken wie Mittelwert, Median und Modus. Variabilität bezieht sich auf eine Reihe von Statistiken, die zeigen, wie groß die Unterschiede zwischen den Elementen einer Stichprobe oder Grundgesamtheit entlang der gemessenen Merkmale sind, und umfasst Metriken wie Spannweite, Varianz und Standardabweichung.

Die Verteilung bezieht sich auf die Gesamtform der Daten, die in einem Diagramm wie einem Histogramm oder einem Punktdiagramm dargestellt werden kann, und umfasst Eigenschaften wie die Wahrscheinlichkeitsverteilungsfunktion, Schiefe und Krümmung. Deskriptive Statistiken können auch Unterschiede zwischen beobachteten Merkmalen der Elemente eines Datensatzes beschreiben. Deskriptive Statistiken helfen uns, die kollektiven Eigenschaften der Elemente einer Datenstichprobe zu verstehen und bilden die Grundlage für das Testen von Hypothesen und das Treffen von Vorhersagen mithilfe von inferentiellen Statistiken.

Inferenzstatistik

Inferenzstatistiken sind Werkzeuge, die Statistiker verwenden, um aus den Merkmalen einer Stichprobe Rückschlüsse auf die Merkmale einer Grundgesamtheit zu ziehen und zu entscheiden, wie sicher sie sich von der Verlässlichkeit dieser Schlussfolgerungen sein können. Anhand der Stichprobengröße und der Verteilung der Stichprobendaten können Statistiker die Wahrscheinlichkeit berechnen, dass Statistiken, die die zentrale Tendenz, Variabilität, Verteilung und Beziehungen zwischen Merkmalen innerhalb einer Datenstichprobe messen, ein genaues Bild der entsprechenden Parameter der Gesamtpopulation liefern von dem die Probe gezogen wird.

Inferenzstatistiken werden verwendet, um Verallgemeinerungen über große Gruppen anzustellen, wie etwa die Schätzung der durchschnittlichen Nachfrage nach einem Produkt durch Erhebung einer Stichprobe der Kaufgewohnheiten von Verbrauchern oder um zu versuchen, zukünftige Ereignisse vorherzusagen, wie etwa die Prognose der zukünftigen Rendite eines Wertpapiers oder einer Anlageklasse basierend or auf Rücksendungen in einem Musterzeitraum.

Die Regressionsanalyse  ist eine gängige Methode der statistischen Inferenz, die versucht, die Stärke und den Charakter der Beziehung (oder Korrelation ) zwischen einer abhängigen Variablen (normalerweise mit Y bezeichnet) und einer Reihe anderer Variablen (bekannt als unabhängige Variablen) zu bestimmen. Die Ausgabe eines Regressionsmodells kann auf statistische Signifikanz analysiert werden, was sich auf die Behauptung bezieht, dass ein Ergebnis von Ergebnissen, die durch Tests oder Experimente generiert wurden, wahrscheinlich nicht zufällig oder zufällig aufgetreten ist, sondern eher auf eine bestimmte geklärte Ursache zurückzuführen ist durch die Daten. Eine statistische Signifikanz ist wichtig für akademische Disziplinen oder Praktiker, die stark auf die Analyse von Daten und Forschung angewiesen sind.

Häufig gestellte Fragen

Was ist der Unterschied zwischen deskriptiver und inferentieller Statistik?

Beschreibende Statistiken werden verwendet, um die Merkmale einer Stichprobe oder eines Datensatzes zu beschreiben oder zusammenzufassen, z. B. den Mittelwert, die Standardabweichung oder die Häufigkeit einer Variablen. Im Gegensatz dazu verwendet die Inferenzstatistik eine beliebige Anzahl von Techniken, um Variablen in einem Datensatz miteinander in Beziehung zu setzen, beispielsweise durch Korrelations- oder Regressionsanalyse. Diese können dann verwendet werden, um Prognosen abzuschätzen oder auf Kausalitäten zu schließen.

Wer verwendet Statistiken?

Statistiken werden in einer Vielzahl von Anwendungen und Berufen häufig verwendet. Jedes Mal, wenn Daten gesammelt und analysiert werden, werden Statistiken erstellt. Dies kann von Regierungsbehörden über akademische Forschung bis hin zur Analyse von Investitionen reichen.

Wie werden Statistiken in Wirtschaft und Finanzen verwendet?

Ökonomen sammeln und untersuchen alle möglichen Daten, von Konsumausgaben über Baubeginn bis hin zu Inflation und BIP-Wachstum. Im Finanzbereich sammeln Analysten und Investoren Daten über Unternehmen, Branchen, Stimmungen und Marktdaten zu Preis und Volumen. Zusammenfassend wird die Verwendung von Inferenzstatistiken in diesen Bereichen als Ökonometrie bezeichnet. Mehrere wichtige Finanzmodelle von CAPM bis hin zu Modern Portfolio Theory (MPT) und dem Black-Scholes Optionspreismodell beruhen auf statistischen Inferenzen.