Güte der Anpassung - KamilTaylan.blog
6 Juni 2021 13:03

Güte der Anpassung

Was ist Goodness-of-Fit?

Der Anpassungstest ist ein statistischer Hypothesentest, um zu sehen, wie gut Stichprobendaten zu einer Verteilung aus einer Grundgesamtheit mit einer Normalverteilung passen. Anders ausgedrückt zeigt dieser Test, ob Ihre Stichprobendaten die Daten darstellen, die Sie in der tatsächlichen Population erwarten würden, oder ob sie irgendwie verzerrt sind. Die Anpassungsgüte bestimmt die Diskrepanz zwischen den beobachteten Werten und denen, die im Normalverteilungsfall vom Modell erwartet würden.

Es gibt mehrere Methoden zur Bestimmung der Güte der Anpassung. Zu den beliebtesten Methoden in der Statistik gehören der Chi-Quadrat, der Kolmogorov-Smirnov-Test, der Anderson-Darling-Test und der Shipiro-Wilk-Test.

Die zentralen Thesen

  • Anpassungstests sind statistische Tests, die darauf abzielen, festzustellen, ob eine Reihe von beobachteten Werten mit den unter dem anwendbaren Modell erwarteten Werten übereinstimmt.
  • Es gibt mehrere Arten von Anpassungstests, aber der gebräuchlichste ist der Chi-Quadrat-Test.
  • Das Chi-Quadrat bestimmt, ob eine Beziehung zwischen kategorialen Daten besteht.
  • Der Kolmogorov-Smirnov-Test – der für große Stichproben verwendet wird – bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung einer Population stammt.
  • Anpassungstests können Ihnen zeigen, ob Ihre Stichprobendaten zu einem erwarteten Datensatz einer Population mit Normalverteilung passen.

Die Güte der Passform verstehen Good

Anpassungstests sind statistische Methoden, die häufig verwendet werden, um Rückschlüsse auf beobachtete Werte zu ziehen. Diese Tests bestimmen, wie die tatsächlichen Werte mit den vorhergesagten Werten in einem Modell zusammenhängen, und wenn sie bei der Entscheidungsfindung verwendet werden, können Anpassungstests helfen, zukünftige Trends und Muster vorherzusagen.

Der häufigste Anpassungstest ist der Chi-Quadrat-Test, der typischerweise für diskrete Verteilungen verwendet wird. Der Chi-Quadrat-Test wird ausschließlich für Daten verwendet, die in Klassen (Bins) eingeteilt sind, und erfordert eine ausreichende Stichprobengröße, um genaue Ergebnisse zu erzielen.



Anpassungstests werden üblicherweise verwendet, um die Normalität von Residuen zu testen oder um festzustellen, ob zwei Proben aus identischen Verteilungen entnommen wurden.

Arten von Eignungstests

Chi-Quadrat-Test

Der Chi-Quadrat-Test, auch bekannt als Chi-Quadrat-Test auf Unabhängigkeit, ist eine inferentielle Statistikmethode, die die Gültigkeit einer Aussage über eine Grundgesamtheit anhand einer Zufallsstichprobe überprüft. Es zeigt jedoch nicht die Art oder Intensität der Beziehung an. Zum Beispiel wird nicht geschlossen, ob die Beziehung positiv oder negativ ist.



Um sich für den Chi-Quadrat-Test auf Unabhängigkeit zu qualifizieren, müssen sich Variablen gegenseitig ausschließen.

Um eine Chi-Quadrat-Anpassungsgüte zu berechnen, ist es notwendig, das gewünschte Alpha-Signifikanzniveau festzulegen (z testen und Hypothesenaussagen über die Beziehungen zwischen ihnen definieren. Die Nullhypothese behauptet, dass zwischen Variablen keine Beziehung besteht, und die Alternativhypothese geht davon aus, dass eine Beziehung existiert. Die Häufigkeit der beobachteten Werte wird gemessen und anschließend mit den Erwartungswerten und den Freiheitsgraden zur Chi-Quadrat-Berechnung verwendet. Wenn das Ergebnis kleiner als Alpha ist, ist die Nullhypothese ungültig, was darauf hinweist, dass eine Beziehung zwischen den Variablen besteht.

Kolmogorov-Smirnov-Test

D=max⁡1≤ich≤Nein(F(Jaich)−ich−1Nein,ichNein−F(Jaich))D=\max\limits_{1\leq i\leq N}\bigg(F(Y_i)-\frac{i-1}{N},\frac{i}{N}-F(Y_i)\bigg)D=1≤ich≤Nmax​( F(Jaich​)−Nein

Der Kolmogorov-Smirnov-Test (auch bekannt als KS-Test) ist nach den russischen Mathematikern Andrey Kolmogorov und Nikolai Smirnov benannt und ist eine statistische Methode, die bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt. Der Kolmogorov-Smirnov-Test – empfohlen für große Stichproben (z. B. über 2000) – ist nicht parametrisch, dh er verlässt sich nicht auf eine gültige Verteilung. Es konzentriert sich Das Ziel ist es, die Nullhypothese zu beweisen, die die Stichprobe der Normalverteilung ist.

Im Gegensatz zum Chi-Quadrat-Test gilt der Kolmogorov-Smirnov-Test für stetige Verteilungen. Wie das Chi-Quadrat verwendet es eine Null- und Alternativhypothese und ein Alpha-Signifikanzniveau. Null gibt an, dass die Daten einer bestimmten Verteilung innerhalb der Population folgen, und alternativ bedeutet, dass die Daten keiner bestimmten Verteilung innerhalb der Population folgen. Das Alpha wird verwendet, um den im Test verwendeten kritischen Wert zu bestimmen.

Die berechnete Teststatistik, oft als D bezeichnet, bestimmt, ob die Nullhypothese akzeptiert oder abgelehnt wird. Wenn D größer als der kritische Wert bei Alpha ist, wird die Nullhypothese verworfen. Wenn D kleiner als der kritische Wert ist, wird die Nullhypothese akzeptiert, was anzeigt, dass

Shipiro-Wilk-Test

Der Shipiro-Wilk-Test bestimmt, ob eine Probe einer Normalverteilung folgt. Der Shipiro-Wilk-Test prüft anhand einer Stichprobe mit einer Variablen kontinuierlicher Daten nur die Normalität. Es wird für kleine Stichprobengrößen bis 2000 empfohlen. Wie die anderen verwendet es Alpha und bildet zwei Hypothesen: Null und Alternative. Die Nullhypothese besagt, dass die Stichprobe aus der Normalverteilung stammt, während die Alternativhypothese besagt, dass die Stichprobe nicht aus der Normalverteilung stammt.

Der Shipiro-Wilk-Test verwendet ein Wahrscheinlichkeitsnetz namens QQ-Plot. Dieses Streudiagramm zeigt visuell zwei Sätze von Quantilen auf der y-Achse an, die vom kleinsten zum größten angeordnet sind. Wenn jedes Quantil aus derselben Verteilung stammt, zeigt das Streudiagramm eine lineare Reihe von Diagrammen an. Der Shipiro-Wilk-Test verwendet das QQ-Plot, um die Varianz zu schätzen. Unter Verwendung der QQ-Plot-Varianz zusammen mit der geschätzten Varianz der Grundgesamtheit kann man bestimmen, ob die Stichprobe zu einer Normalverteilung gehört. Wenn der Quotient beider Varianzen gleich oder nahe 1 ist, kann die Nullhypothese akzeptiert werden. Wenn es deutlich unter 1 liegt, kann es abgelehnt werden.

Beispiel für einen Eignungstest

Ein kleines Gemeinschafts-Fitnessstudio könnte beispielsweise unter der Annahme betrieben werden, dass es montags, dienstags und samstags am höchsten, mittwochs und donnerstags im Durchschnitt und freitags und sonntags am niedrigsten ist. Basierend auf diesen Annahmen beschäftigt das Fitnessstudio jeden Tag eine bestimmte Anzahl von Mitarbeitern, um Mitglieder einzuchecken, Einrichtungen zu reinigen, Schulungsdienste anzubieten und Kurse zu unterrichten.

Allerdings läuft das Fitnessstudio finanziell nicht gut und der Besitzer möchte wissen, ob diese Annahmen zur Anwesenheit und der Personalbestand richtig sind. Der Eigentümer beschließt, sechs Wochen lang jeden Tag die Anzahl der Besucher des Fitnessstudios zu zählen. Er kann dann die angenommene Besucherzahl des Fitnessstudios mit der beobachteten Besucherzahl vergleichen, beispielsweise mithilfe eines Chi-Quadrat-Fitness-of-Fit-Tests. Mit den neuen Daten kann er bestimmen, wie er das Fitnessstudio am besten verwaltet und die Rentabilität verbessert.

Häufig gestellte Fragen zur Passform

Was bedeutet Passformgüte?

Die Anpassungsgüte ist ein statistischer Hypothesentest, der verwendet wird, um zu sehen, wie genau beobachtete Daten die erwarteten Daten widerspiegeln. Anpassungsgütetests können dabei helfen, festzustellen, ob eine Stichprobe einer Normalverteilung folgt, ob kategoriale Variablen in Beziehung stehen oder ob Zufallsstichproben aus derselben Verteilung stammen.

Warum ist die Passform wichtig?

Anpassungstests helfen festzustellen, ob die beobachteten Daten mit den Erwartungen übereinstimmen. Entscheidungen können basierend auf dem Ergebnis des durchgeführten Hypothesentests getroffen werden. Ein Händler möchte beispielsweise wissen, welches Produktangebot junge Leute anspricht. Der Händler befragt eine Zufallsstichprobe von alten und jungen Leuten, um herauszufinden, welches Produkt bevorzugt wird. Anhand des Chi-Quadrat-Prinzips stellen sie fest, dass mit 95-prozentiger Sicherheit eine Beziehung zwischen Produkt A und jungen Menschen besteht. Anhand dieser Ergebnisse konnte festgestellt werden, dass diese Stichprobe die Population junger Erwachsener repräsentiert. Einzelhandelsvermarkter können dies nutzen, um ihre Kampagnen zu reformieren.

Was ist die Anpassungsgüte im Chi-Quadrat-Test?

Der Chi-Quadrat-Test, ob Beziehungen zwischen kategorialen Variablen bestehen und ob die Stichprobe das Ganze darstellt. Es schätzt, wie genau die beobachteten Daten die erwarteten Daten widerspiegeln oder wie gut sie passen.

Wie führen Sie den Eignungstest durch?

Der Goodness-of-FIt-Test besteht aus verschiedenen Testmethoden. Das Ziel des Tests hilft bei der Bestimmung der zu verwendenden Methode. Wenn das Ziel beispielsweise darin besteht, die Normalität an einer relativ kleinen Stichprobe zu testen, kann der Shipiro-Wilk-Test geeignet sein. Will man feststellen, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt, wird der Kolmogorov-Smirnov-Test verwendet. Jeder Test verwendet seine eigene einzigartige Formel. Sie haben jedoch Gemeinsamkeiten wie eine Nullhypothese und ein Signifikanzniveau.

Das Fazit

Anpassungstests bestimmen, wie gut Stichprobendaten mit den Erwartungen einer Population übereinstimmen. Aus den Stichprobendaten wird ein beobachteter Wert ermittelt und mittels eines Abweichungsmaßes mit dem berechneten Erwartungswert verglichen. Je nachdem, welches Ergebnis Sie anstreben, stehen verschiedene Tests zur Anpassung der Hypothese zur Verfügung.

Die Wahl des richtigen Anpassungstests hängt weitgehend davon ab, was Sie über eine Stichprobe wissen möchten und wie groß die Stichprobe ist. Wenn Sie beispielsweise wissen möchten, ob beobachtete Werte für kategoriale Daten mit den erwarteten Werten für kategoriale Daten übereinstimmen, verwenden Sie Chi-Quadrat. Wenn Sie wissen möchten, ob eine kleine Stichprobe einer Normalverteilung folgt, kann der Shipiro-Wilk-Test von Vorteil sein. Es gibt viele Tests, um die Güte der Anpassung zu bestimmen.