26 Juni 2021 6:44

Varianzanalyse (ANOVA)

Was ist Varianzanalyse (ANOVA)?

Die Varianzanalyse (ANOVA) ist ein Analysewerkzeug, das in der Statistik verwendet wird und eine beobachtete aggregierte Variabilität innerhalb eines Datensatzes in zwei Teile aufteilt: systematische Faktoren und Zufallsfaktoren. Die systematischen Faktoren haben einen statistischen Einfluss auf den gegebenen Datensatz, die Zufallsfaktoren jedoch nicht. Analysten verwenden den ANOVA-Test, um den Einfluss zu bestimmen, den unabhängige Variablen auf die abhängige Variable in einer Regressionsstudie haben.

Dieim 20. Jahrhundert entwickeltent- und z-Testmethoden wurden bis 1918 für die statistische Analyse verwendet, als Ronald Fisher die Varianzanalysemethode entwickelte.1 ANOVA wird auch als Fisher-Varianzanalyse bezeichnet und ist die Erweiterung der t- und z-Tests. Der Begriff wurde 1925 bekannt, nachdem er in Fishers Buch „Statistical Methods for Research Workers“ erschienen war. Es wurde in der experimentellen Psychologie eingesetzt und später auf komplexere Themen ausgeweitet.

Die Formel für die ANOVA lautet:

Was zeigt die Varianzanalyse?

Der ANOVA-Test ist der erste Schritt bei der Analyse von Faktoren, die einen bestimmten Datensatz beeinflussen. Nach Abschluss des Tests führt ein Analyst zusätzliche Tests zu den methodischen Faktoren durch, die messbar zur Inkonsistenz des Datensatzes beitragen. Der Analytiker verwendet die ANOVA-Testergebnisse in einem f-Test, um zusätzliche Daten zu generieren, die mit den vorgeschlagenen Regressionsmodellen übereinstimmen.

Der ANOVA-Test ermöglicht einen gleichzeitigen Vergleich von mehr als zwei Gruppen, um festzustellen, ob eine Beziehung zwischen ihnen besteht. Das Ergebnis der ANOVA-Formel, die F-Statistik (auch F-Verhältnis genannt), ermöglicht die Analyse mehrerer Datengruppen, um die Variabilität zwischen Stichproben und innerhalb von Stichproben zu bestimmen.

Wenn zwischen den getesteten Gruppen kein wirklicher Unterschied besteht, was als Nullhypothese bezeichnet wird, liegt das Ergebnis der F-Verhältnis-Statistik der ANOVA nahe bei 1. Die Verteilung aller möglichen Werte der F-Statistik ist die F-Verteilung. Dies ist tatsächlich eine Gruppe von Verteilungsfunktionen, mit zwei charakteristischen Zahlen der Zähler genannt Freiheitsgrade und den Nenner Freiheitsgrade.

Die zentralen Thesen

  • Die Varianzanalyse oder ANOVA ist eine statistische Methode, die beobachtete Varianzdaten in verschiedene Komponenten aufteilt, um sie für zusätzliche Tests zu verwenden.
  • Eine einfache ANOVA wird für drei oder mehr Datengruppen verwendet, um Informationen über die Beziehung zwischen den abhängigen und unabhängigen Variablen zu erhalten.
  • Wenn zwischen den Gruppen keine echte Varianz besteht, sollte das F-Verhältnis der ANOVA nahe 1 liegen.

Beispiel für die Verwendung von ANOVA

Ein Forscher könnte zum Beispiel Studenten von mehreren Colleges testen, um zu sehen, ob Studenten eines der Colleges die Studenten der anderen Colleges durchweg übertreffen. In einer Geschäftsanwendung kann ein F&E-Forscher zwei verschiedene Prozesse zur Herstellung eines Produkts testen, um festzustellen, ob ein Prozess in Bezug auf die Kosteneffizienz besser ist als der andere.

Die Art des verwendeten ANOVA-Tests hängt von einer Reihe von Faktoren ab. Es wird angewendet, wenn Daten experimentell sein müssen. Die Varianzanalyse wird verwendet, wenn kein Zugriff auf statistische Software besteht, was zu einer manuellen Berechnung der ANOVA führt. Es ist einfach zu bedienen und am besten für kleine Proben geeignet. Bei vielen experimentellen Designs müssen die Stichprobengrößen für die verschiedenen Faktorstufenkombinationen gleich sein.

ANOVA ist hilfreich, um drei oder mehr Variablen zu testen. Es ähnelt mehreren t-Tests mit zwei Stichproben. Es führt jedoch zu weniger Typ-I-Fehlern und ist für eine Reihe von Problemen geeignet. ANOVA gruppiert Unterschiede durch Vergleichen der Mittelwerte jeder Gruppe und umfasst das Verteilen der Varianz auf verschiedene Quellen. Es wird bei Probanden, Testgruppen, zwischen Gruppen und innerhalb von Gruppen eingesetzt.

Einweg-ANOVA im Vergleich zu Zweiweg-ANOVA

Es gibt zwei Haupttypen von ANOVA: Einweg- (oder unidirektional) und Zweiweg-ANOVA. Es gibt auch Variationen von ANOVA. Beispielsweise unterscheidet sich die MANOVA (multivariate ANOVA) von der ANOVA, da die erstere gleichzeitig auf mehrere abhängige Variablen testet, während die letztere jeweils nur eine abhängige Variable bewertet. Einweg oder Zweiweg bezieht sich auf die Anzahl der unabhängigen Variablen in Ihrem Varianzanalysetest. Eine Einweg-ANOVA bewertet den Einfluss eines einzigen Faktors auf eine einzige Antwortvariable. Es bestimmt, ob alle Samples gleich sind. Die Einweg-ANOVA wird verwendet, um zu bestimmen, ob es irgendwelche statistisch signifikanten Unterschiede zwischen den Mittelwerten von drei oder mehr unabhängigen (nicht zusammenhängenden) Gruppen gibt.

Eine Zweiwege-ANOVA ist eine Erweiterung der Einweg-ANOVA. Bei einer Einweg-Variablen haben Sie eine unabhängige Variable, die sich auf eine abhängige Variable auswirkt. Bei einer Zwei-Wege-ANOVA gibt es zwei Unabhängige. Beispielsweise ermöglicht eine Zwei-Wege-ANOVA einem Unternehmen den Vergleich der Mitarbeiterproduktivität basierend auf zwei unabhängigen Variablen wie Gehalt und Qualifikation. Es wird verwendet, um die Wechselwirkung zwischen den beiden Faktoren zu beobachten und gleichzeitig die Wirkung zweier Faktoren zu testen.