5 Juni 2021 22:23

T-Test

Was ist ein T-Test?

Ein t-Test ist eine Art von inferential – Statistik verwendet, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mittelwerten der zwei Gruppen ist, die in bestimmten Merkmalen in Zusammenhang stehen können. Es wird meistens verwendet, wenn die Datensätze, wie der Datensatz, der als Ergebnis eines 100-maligen Werfens einer Münze aufgezeichnet wurde, einer Normalverteilung folgen und unbekannte Varianzen aufweisen können. Ein t-Test wird als Hypothesentestwerkzeug verwendet, mit dem eine auf eine Population anwendbare Annahme getestet werden kann.

Ein t-Test betrachtet die t-Statistik, die t-Verteilungswerte und die Freiheitsgrade, um die statistische Signifikanz zu bestimmen. Um einen Test mit drei oder mehr Mittelwerten durchzuführen, muss man eine  Varianzanalyse verwenden.

Die zentralen Thesen

  • Ein t-Test ist eine Art von Inferenzstatistik, die verwendet wird, um festzustellen, ob zwischen den Mittelwerten zweier Gruppen ein signifikanter Unterschied besteht, der in bestimmten Merkmalen zusammenhängen kann.
  • Der t-Test ist einer von vielen Tests, die zum Zweck des Hypothesentests in der Statistik verwendet werden.
  • Die Berechnung eines T-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.
  • Es gibt verschiedene Arten von t-Tests, die abhängig von den Daten und der Art der erforderlichen Analyse durchgeführt werden können.

Erklärung des T-Tests

Im Wesentlichen ermöglicht uns ein t-Test, die Durchschnittswerte der beiden Datensätze zu vergleichen und festzustellen, ob sie aus derselben Population stammen. Wenn wir in den obigen Beispielen eine Stichprobe von Schülern der Klasse A und eine andere Stichprobe von Schülern der Klasse B nehmen würden, würden wir nicht erwarten, dass sie genau denselben Mittelwert und dieselbe Standardabweichung aufweisen. Ebenso sollten Proben aus der mit Placebo gefütterten Kontrollgruppe und diejenigen aus der Gruppe mit verschriebenem Medikament einen leicht unterschiedlichen Mittelwert und eine andere Standardabweichung aufweisen.

Mathematisch nimmt der t-Test eine Stichprobe aus jeder der beiden Mengen und erstellt die Problemstellung durch die Annahme einer Nullhypothese, dass die beiden Mittelwerte gleich sind. Anhand der anwendbaren Formeln werden bestimmte Werte berechnet und mit den Standardwerten verglichen und die angenommene Nullhypothese entsprechend akzeptiert oder verworfen.

Wenn die Nullhypothese abgelehnt werden kann, weist dies darauf hin, dass die Datenablesungen stark sind und wahrscheinlich nicht auf Zufall zurückzuführen sind. Der t-Test ist nur einer von vielen Tests, die zu diesem Zweck verwendet werden. Statistiker müssen zusätzlich andere Tests als den t-Test verwenden, um mehr Variablen und Tests mit größeren Stichprobengrößen zu untersuchen. Für eine große Stichprobengröße verwenden Statistiker einen  z-Test. Weitere Testmöglichkeiten sind der Chi-Quadrat-Test und der F-Test.

Es gibt drei Arten von t-Tests, die als abhängige und unabhängige t-Tests kategorisiert werden.

Mehrdeutige Testergebnisse

Bedenken Sie, dass ein Arzneimittelhersteller ein neu erfundenes Medikament testen möchte. Es folgt dem Standardverfahren, das Medikament an einer Patientengruppe auszuprobieren und einer anderen Gruppe, der sogenannten Kontrollgruppe, ein Placebo zu geben. Das der Kontrollgruppe verabreichte Placebo ist eine Substanz ohne beabsichtigten therapeutischen Wert und dient als Maßstab, um zu messen, wie die andere Gruppe, der das eigentliche Medikament verabreicht wird, anspricht.

Nach der Medikamentenstudie berichteten die Mitglieder der Placebo-gefütterten Kontrollgruppe von einer Erhöhung der durchschnittlichen Lebenserwartung um drei Jahre, während die Mitglieder der Gruppe, denen das neue Medikament verschrieben wurde, eine Erhöhung der durchschnittlichen Lebenserwartung von vier Jahren berichteten. Eine sofortige Beobachtung kann darauf hinweisen, dass das Medikament tatsächlich wirkt, da die Ergebnisse für die Gruppe, die das Medikament verwendet, besser sind. Es ist jedoch auch möglich, dass die Beobachtung auf ein zufälliges Ereignis zurückzuführen ist, insbesondere auf ein überraschendes Glück. Ein t-Test ist sinnvoll, um festzustellen, ob die Ergebnisse tatsächlich richtig und auf die gesamte Population anwendbar sind.

In einer Schule erzielten 100 Schüler der Klasse A durchschnittlich 85% mit einer Standardabweichung von 3%. Weitere 100 Schüler der Klasse B erreichten durchschnittlich 87% bei einer Standardabweichung von 4%. Obwohl der Durchschnitt der Klasse B besser ist als der der Klasse A, ist es möglicherweise nicht richtig, zu dem Schluss zu kommen, dass die Gesamtleistung der Schüler der Klasse B besser ist als die der Schüler der Klasse A. Dies liegt daran, dass es eine natürliche Variabilität gibt in den Testergebnissen in beiden Klassen, so dass der Unterschied allein auf Zufall zurückzuführen sein könnte. Ein t-Test kann helfen, festzustellen, ob eine Klasse besser abschneidet als die andere.

T-Test-Annahmen

  1. Die erste Annahme bezüglich t-Tests betrifft die Messskala. Die Annahme für einen t-Test ist, dass die Messskala, die auf die gesammelten Daten angewendet wird, einer kontinuierlichen oder ordinalen Skala folgt, wie beispielsweise den Bewertungen für einen IQ-Test.
  2. Die zweite Annahme ist die einer einfachen Zufallsstichprobe, bei der die Daten von einem repräsentativen, zufällig ausgewählten Teil der Gesamtbevölkerung erhoben werden.
  3. Die dritte Annahme ist, dass die Daten, wenn sie aufgetragen werden, zu einer normalverteilten, glockenförmigen Verteilungskurve führen.
  4. Die letzte Annahme ist die Homogenität der Varianz. Homogene oder gleiche Varianz liegt vor, wenn die Standardabweichungen der Stichproben ungefähr gleich sind.

Berechnen von T-Tests

Die Berechnung eines T-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.

Das Ergebnis des t-Tests ergibt den t-Wert. Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer Tabelle mit kritischen Werten (als T-Verteilungstabelle bezeichnet ) erhalten wird. Dieser Vergleich hilft, die Auswirkung des Zufalls allein auf die Differenz zu bestimmen und zu bestimmen, ob die Differenz außerhalb dieses Zufallsbereichs liegt. Der t-Test fragt, ob der Unterschied zwischen den Gruppen einen echten Unterschied in der Studie darstellt oder ob es sich möglicherweise um einen bedeutungslosen zufälligen Unterschied handelt.

T-Verteilungstabellen

Die T-Verteilungstabelle ist in einseitigen und zweiseitigen Formaten erhältlich. Ersteres wird zur Beurteilung von Fällen verwendet, die einen festen Wert oder Bereich mit klarer Richtung (positiv oder negativ) haben. Wie groß ist zum Beispiel die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder beim Würfeln mehr als sieben erreicht? Letzteres wird für die Analyse der Bereichsgrenzen verwendet, beispielsweise um zu fragen, ob die Koordinaten zwischen -2 und +2 liegen.

Die Berechnungen können mit Standard-Softwareprogrammen durchgeführt werden, die die notwendigen statistischen Funktionen unterstützen, wie sie beispielsweise in MS Excel zu finden sind.

T-Werte und Freiheitsgrade

Der t-Test erzeugt als Ausgabe zwei Werte: t-Wert und Freiheitsgrade. Der t-Wert ist ein Verhältnis der Differenz zwischen dem Mittelwert der beiden Stichprobensätze und der Variation, die innerhalb der Stichprobensätze vorhanden ist. Während der Zählerwert (die Differenz zwischen dem Mittelwert der beiden Stichprobensätze) einfach zu berechnen ist, kann der Nenner (die Variation, die innerhalb der Stichprobensätze vorhanden ist) je nach Art der beteiligten Datenwerte etwas kompliziert werden. Der Nenner des Verhältnisses ist ein Maß für die Streuung oder Variabilität. Höhere Werte des t-Wertes, auch t-Score genannt, weisen darauf hin, dass zwischen den beiden Stichprobensätzen ein großer Unterschied besteht. Je kleiner der t-Wert ist, desto mehr Ähnlichkeit besteht zwischen den beiden Stichprobensätzen.

  • Ein großer t-Wert zeigt an, dass die Gruppen unterschiedlich sind.
  • Ein kleiner t-Wert zeigt an, dass die Gruppen ähnlich sind.

Freiheitsgrade beziehen sich auf die Werte in einer Studie, die die Freiheit haben zu variieren und für die Beurteilung der Wichtigkeit und Gültigkeit der Nullhypothese wesentlich sind. Die Berechnung dieser Werte hängt normalerweise von der Anzahl der Datensätze ab, die im Stichprobensatz verfügbar sind.

Korrelierter (oder gepaarter) T-Test

Der korrelierte t-Test wird durchgeführt, wenn die Stichproben typischerweise aus übereinstimmenden Paaren ähnlicher Einheiten bestehen oder wenn es Fälle von wiederholten Messungen gibt. Beispielsweise kann es vorkommen, dass dieselben Patienten wiederholt getestet werden – vor und nach einer bestimmten Behandlung. In solchen Fällen wird jeder Patient als Kontrollprobe gegen sich selbst verwendet.

Diese Methode gilt auch für Fälle, in denen die Stichproben in irgendeiner Weise in Beziehung stehen oder übereinstimmende Merkmale aufweisen, z. B. eine vergleichende Analyse, an der Kinder, Eltern oder Geschwister beteiligt sind. Korrelierte oder gepaarte t-Tests sind von einem abhängigen Typ, da es sich um Fälle handelt, in denen die beiden Stichprobensätze verwandt sind.

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen gepaarten t-Test lautet:

Die verbleibenden zwei Typen gehören zu den unabhängigen t-Tests. Die Stichproben dieser Typen werden unabhängig voneinander ausgewählt, dh die Datensätze in den beiden Gruppen beziehen sich nicht auf dieselben Werte. Dazu gehören Fälle wie eine Gruppe von 100 Patienten, die in zwei Gruppen zu je 50 Patienten aufgeteilt werden. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe die verschriebene Behandlung erhält. Dies stellt zwei unabhängige Stichprobengruppen dar, die nicht miteinander gepaart sind.

Gleiche Varianz (oder gepoolter) T-Test

Der t-Test auf gleiche Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für den t-Test mit gleicher Varianz verwendet:

T-value=icheeinnein1−icheeinnein2(nein1−1)