13 Juni 2021 18:26

Nichtparametrische Methode

Was ist die nichtparametrische Methode?

Die nichtparametrische Methode bezieht sich auf eine Art von Statistik, die keine Annahmen über die Merkmale der Stichprobe (ihre Parameter) macht oder ob die beobachteten Daten quantitativ oder qualitativ sind.

Nichtparametrische Statistiken können bestimmte deskriptive Statistiken, statistische Modelle, Inferenz und statistische Tests umfassen. Die Modellstruktur nichtparametrischer Verfahren wird nicht  a priori festgelegt,  sondern aus Daten bestimmt. Der Begriff  nichtparametrisch  soll nicht bedeuten, dass solchen Modellen Parameter vollständig fehlen, sondern dass Anzahl und Art der Parameter flexibel sind und nicht im Voraus festgelegt werden. Ein Histogramm ist ein Beispiel für eine nichtparametrische Schätzung einer Wahrscheinlichkeitsverteilung.

Im Gegensatz dazu machen bekannte statistische Methoden wie ANOVA, Pearson-Korrelation, t-Test und andere Annahmen über die analysierten Daten. Eine der häufigsten parametrischen Annahmen ist, dass Bevölkerungsdaten eine “ Normalverteilungaufweisen.

Die zentralen Thesen

  • Das nichtparametrische Verfahren ist ein Zweig der Statistik, bei dem nicht davon ausgegangen wird, dass die Daten aus vorgegebenen Modellen stammen, die durch eine kleine Anzahl von Parametern bestimmt werden.
  • Die nichtparametrische Analyse ist oft am besten geeignet, wenn die Reihenfolge von etwas berücksichtigt wird, bei der die Ergebnisse selbst bei Änderungen der numerischen Daten wahrscheinlich gleich bleiben.
  • Dies steht im Gegensatz zu parametrischen Methoden, die Annahmen über die Form oder Eigenschaften der Daten treffen. Beispiele für solche Verfahren umfassen das Normalverteilungsmodell und das lineare Regressionsmodell.

Die nichtparametrische Methode erklärt

Parametrische und nichtparametrische Methoden werden häufig für verschiedene Datentypen verwendet. Für parametrische Statistiken sind im Allgemeinen Intervall- oder Verhältnisdaten erforderlich. Ein Beispiel für diese Art von Daten sind Alter, Einkommen, Größe und Gewicht, wobei die Werte kontinuierlich sind und die Intervalle zwischen den Werten eine Bedeutung haben.

Im Gegensatz dazu werden nichtparametrische Statistiken normalerweise für Daten verwendet, die nominal oder ordinal sind. Nominale Variablen sind Variablen, deren Werte keinen quantitativen Wert haben. Zu den üblichen nominalen Variablen in der sozialwissenschaftlichen Forschung gehört beispielsweise das Geschlecht, dessen mögliche Werte diskrete Kategorien sind, „männlich“ und „weiblich“. (Beschäftigte versus Arbeitslose).

Ordinale Variablen sind diejenigen, bei denen der Wert eine gewisse Ordnung vorschlägt. Ein Beispiel für eine ordinale Variable wäre, wenn ein Umfrageteilnehmer fragen würde: „Auf einer Skala von 1 bis 5, wobei 1 extrem unzufrieden und 5 extrem zufrieden ist, wie würden Sie Ihre Erfahrung mit dem Kabelunternehmen bewerten?“

Parametrische Statistiken können jedoch auch auf Populationen mit anderen bekannten Verteilungstypen angewendet werden. Nichtparametrische Statistiken erfordern nicht, dass die Populationsdaten die für parametrische Statistik erforderlichen Annahmen erfüllen. Nichtparametrische Statistiken fallen daher in eine Kategorie von Statistiken, die manchmal als verteilungsfrei bezeichnet wird. Oft werden nichtparametrische Methoden verwendet, wenn die Populationsdaten eine unbekannte Verteilung haben oder wenn die Stichprobengröße klein ist.

Besondere Überlegungen

Obwohl nichtparametrische Statistiken den Vorteil haben, dass sie wenige Annahmen erfüllen müssen, sind sie weniger leistungsfähig als parametrische Statistiken. Dies bedeutet, dass sie möglicherweise keine Beziehung zwischen zwei Variablen zeigen, wenn tatsächlich eine existiert.

Nichtparametrische Statistiken haben aufgrund ihrer Benutzerfreundlichkeit an Bedeutung gewonnen. Da der Bedarf an Parametern verringert wird, werden die Daten für eine größere Vielfalt von Tests anwendbarer. Diese Art von Statistik kann ohne Mittelwert, Stichprobengröße, Standardabweichung oder Schätzung anderer verwandter Parameter verwendet werden, wenn keine dieser Informationen verfügbar ist.

Da die nichtparametrische Statistik weniger Annahmen über die Stichprobendaten macht, ist ihre Anwendung breiter als die parametrische Statistik. In Fällen, in denen parametrisches Testen geeigneter ist, sind nichtparametrische Methoden weniger effizient. Dies liegt daran, dass nichtparametrische Statistiken im Gegensatz zu parametrischen Statistiken einige in den Daten verfügbare Informationen verwerfen.



Übliche nichtparametrische Tests umfassen Chi-Quadrat, Wilcoxon-Rang-Summen-Test, Kruskal-Wallis-Test und Spearmans Rangordnungskorrelation.

Beispiele für die nichtparametrische Methode

Stellen Sie sich einen Finanzanalysten vor, der den Value-at-Risk (VaR) einer Anlage schätzen möchte. Der Analyst sammelt Gewinndaten von Hunderten ähnlicher Investitionen über einen ähnlichen Zeithorizont. Anstatt davon auszugehen, dass die Einnahmen einer Normalverteilung folgen, verwendet sie das Histogramm, um die Verteilung nichtparametrisch zu schätzen. Das 5. Perzentil dieses Histogramms liefert dem Analysten dann eine nichtparametrische Schätzung des VaR.

Betrachten Sie als zweites Beispiel einen anderen Forscher, der wissen möchte, ob die durchschnittliche Schlafdauer mit der Häufigkeit von Erkrankungen zusammenhängt. Da viele Menschen selten oder gar nicht erkranken und gelegentlich andere weitaus häufiger als die meisten anderen, ist die Verteilung der Krankheitshäufigkeit eindeutig nicht normal, rechtsschief und anfällig für Ausreißer. Anstatt eine Methode zu verwenden, die eine Normalverteilung der Krankheitshäufigkeit annimmt, wie es beispielsweise bei der klassischen Regressionsanalyse der Fall ist, entscheidet sich der Forscher für eine nichtparametrische Methode wie die Quantil-Regressionsanalyse.