6 Juni 2021 13:33

Homoskedastic

Was ist homoskedastisch?

Homoskedastisch (auch „homoskedastisch“ geschrieben) bezieht sich auf einen Zustand, bei dem die Varianz des Residuums oder Fehlerterms in einem Regressionsmodell konstant ist. Das heißt, der Fehlerterm ändert sich nicht sehr, wenn sich der Wert der Prädiktorvariablen ändert. Anders ausgedrückt ist die Varianz der Datenpunkte für alle Datenpunkte ungefähr gleich. Dies deutet auf ein gewisses Maß an Konsistenz hin und erleichtert die Modellierung und die Arbeit mit den Daten durch Regression. Das Fehlen von Homoskedastizität kann jedoch darauf hindeuten, dass das Regressionsmodell möglicherweise zusätzliche Prädiktorvariablen enthalten muss, um die Leistung der abhängigen Variablen zu erklären.

Die zentralen Thesen

  • Homoskedastizität tritt auf, wenn die Varianz des Fehlerterms in einem Regressionsmodell konstant ist.
  • Wenn die Varianz des Fehlerterms homoskedastisch ist, war das Modell wohldefiniert. Wenn die Varianz zu groß ist, ist das Modell möglicherweise nicht gut definiert.
  • Das Hinzufügen zusätzlicher Prädiktorvariablen kann helfen, die Leistung der abhängigen Variablen zu erklären.
  • Im Gegensatz dazu tritt Heteroskedastizität auf, wenn die Varianz des Fehlerterms nicht konstant ist.

Wie Homoskedastizität funktioniert

Homoskedastizität ist eine Annahme der linearen Regressionsmodellierung, und Daten dieses Typs funktionieren gut mit der Methode der kleinsten Quadrate. Wenn die Varianz der Fehler um die Regressionsgerade stark variiert, ist das Regressionsmodell möglicherweise schlecht definiert. Das Gegenteil von Homoskedastizität ist Heteroskedastizität, genauso wie das Gegenteil von „homogen“ „heterogen“ ist. Heteroskedastizität (auch „Heteroskedastie“ genannt) bezieht sich auf einen Zustand, bei dem die Varianz des Fehlerterms in einer Regressionsgleichung nicht konstant ist.



Wenn man bedenkt, dass die Varianz die gemessene Differenz zwischen dem vorhergesagten Ergebnis und dem tatsächlichen Ergebnis einer bestimmten Situation ist, kann die Bestimmung der Homoskedastizität helfen, zu bestimmen, welche Faktoren für die Genauigkeit angepasst werden müssen.

Besondere Überlegungen

Ein einfaches Regressionsmodell oder eine Gleichung besteht aus vier Termen. Auf der linken Seite befindet sich die abhängige Variable. Es repräsentiert das Phänomen, das das Modell „erklären“ will. Auf der rechten Seite befinden sich eine Konstante, eine Prädiktorvariable und ein Rest- oder Fehlerterm. Der Fehlerterm zeigt die Variabilität der abhängigen Variablen, die nicht durch die Prädiktorvariable erklärt wird.

Beispiel für Homoskedastic

Angenommen, Sie möchten die Testergebnisse der Schüler anhand der Zeit erklären, die jeder Schüler mit dem Lernen verbracht hat. In diesem Fall wären die Testergebnisse die abhängige Variable und die für das Studium aufgewendete Zeit die Prädiktorvariable.

Der Fehlerterm würde die Varianz in den Testergebnissen zeigen, die nicht durch die Studienzeit erklärt wurde. Wenn diese Varianz gleichförmig oder homoskedastisch ist, könnte das Modell eine adäquate Erklärung für die Testleistung sein – und zwar in Bezug auf die für das Studium aufgewendete Zeit.

Aber die Varianz kann heteroskedastisch sein. Eine grafische Darstellung der Fehlertermdaten kann zeigen, dass eine große Studienzeit sehr eng mit hohen Testergebnissen korrespondiert, aber dass Testergebnisse mit niedriger Studienzeit stark variierten und sogar einige sehr hohe Werte einschlossen. Die Varianz der Scores würde also nicht einfach durch eine Prädiktorvariable – die Studienzeit – gut erklärt werden. In diesem Fall ist wahrscheinlich ein anderer Faktor am Werk, und das Modell muss möglicherweise verbessert werden, um ihn oder sie zu identifizieren.

Weitere Untersuchungen könnten ergeben, dass einige Schüler die Antworten auf den Test im Voraus gesehen hatten oder zuvor einen ähnlichen Test absolviert hatten und daher nicht für diesen bestimmten Test lernen mussten. Im Übrigen kann sich herausstellen, dass die Schüler unabhängig von ihrer Studienzeit und ihren Leistungen in früheren Prüfungen unabhängig vom Fach unterschiedliche Fähigkeiten zum Bestehen der Prüfung hatten.

Um das Regressionsmodell zu verbessern, müsste der Forscher andere erklärende Variablen ausprobieren, die eine genauere Anpassung an die Daten ermöglichen könnten. Wenn zum Beispiel einige Schüler die Antworten im Voraus gesehen hätten, hätte das Regressionsmodell zwei erklärende Variablen: Zeitstudium und ob der Schüler Vorkenntnisse über die Antworten hatte. Mit diesen beiden Variablen würde mehr von der Varianz der Testergebnisse erklärt und die Varianz des Fehlerterms könnte dann homoskedastisch sein, was darauf hindeutet, dass das Modell wohldefiniert war.