28 Juni 2021 13:46

Erstellen eines linearen Regressionsmodells in Excel

Was ist lineare Regression?

Die lineare Regression ist ein Datendiagramm, das die lineare Beziehung  zwischen einer unabhängigen und einer abhängigen Variablen grafisch darstellt. Es wird typischerweise verwendet, um die Stärke der Beziehung und die Streuung der Ergebnisse visuell darzustellen – alles mit dem Ziel, das Verhalten der abhängigen Variablen zu erklären.

Sagen wir, wir wollten die Stärke des Zusammenhangs zwischen der Menge an gegessenem Eis und Fettleibigkeit testen. Wir würden die unabhängige Variable, die Menge an Eiscreme, nehmen und sie mit der abhängigen Variablen Fettleibigkeit in Beziehung setzen, um zu sehen, ob ein Zusammenhang besteht. Bei einer Regression handelt es sich um eine grafische Darstellung dieser Beziehung, je geringer die Variabilität in den Daten, desto stärker die Beziehung und desto enger die Anpassung an die Regressionsgerade.

Die zentralen Thesen

  • Die lineare Regression modelliert die Beziehung zwischen einer abhängigen und einer unabhängigen Variable(n).
  • Eine Regressionsanalyse kann durchgeführt werden, wenn die Variablen unabhängig sind, keine Heteroskedastizität vorliegt und die Fehlerterme der Variablen nicht korreliert sind.
  • Die Modellierung der linearen Regression in Excel ist mit dem Data Analysis ToolPak einfacher.

Wichtige Überlegungen

Es gibt einige kritische Annahmen bezüglich Ihres Datensatzes, die wahr sein müssen, um mit einer Regressionsanalyse fortzufahren :

  1. Die Variablen müssen wirklich unabhängig sein (unter Verwendung eines Chi-Quadrat Tests).
  2. Die Daten dürfen keine unterschiedlichen Fehlervarianzen aufweisen (dies wird Heteroskedastizität genannt (auch Heteroskedastizität genannt).
  3. Die Fehlerterme jeder Variablen müssen unkorreliert sein. Wenn nicht, bedeutet dies, dass die Variablen  seriell korreliert sind.

Wenn diese drei Dinge kompliziert klingen, sind sie es. Aber die Auswirkung, dass eine dieser Überlegungen nicht wahr ist, ist eine verzerrte Schätzung. Im Wesentlichen würden Sie die Beziehung, die Sie messen, falsch angeben.

Eine Regression in Excel ausgeben

Der erste Schritt beim Ausführen der Regressionsanalyse in Excel besteht darin, zu überprüfen, ob das kostenlose Excel-Plugin Data Analysis ToolPak installiert ist. Dieses Plugin macht die Berechnung einer Reihe von Statistiken sehr einfach. Es ist nicht  erforderlich, eine lineare Regressionslinie darzustellen, aber es vereinfacht die Erstellung von Statistiktabellen. Um zu überprüfen, ob es installiert ist, wählen Sie „Daten“ aus der Symbolleiste. Wenn „Datenanalyse“ eine Option ist, ist die Funktion installiert und einsatzbereit. Falls nicht installiert, können Sie diese Option anfordern, indem Sie auf die Office-Schaltfläche klicken und „Excel-Optionen“ auswählen.

Mit dem Data Analysis ToolPak können Sie mit wenigen Klicks eine Regressionsausgabe erstellen.



Die unabhängige Variable geht in den X-Bereich.

Angesichts der S & P 500  zurückkehrt, sagen wir wissen wollen, ob wir die Kraft und die Beziehung von Visa (schätzen Lager zurückkehrt. Die Visa (V)-Aktie liefert Daten in Spalte 1 als abhängige Variable. S&P 500 gibt Daten aus Spalte 2 als unabhängige Variable zurück.

  1. Wählen Sie „Daten“ aus der Symbolleiste. Das Menü „Daten“ wird angezeigt.
  2. Wählen Sie „Datenanalyse“. Das Dialogfeld Datenanalyse – Analysetools wird angezeigt.
  3. Wählen Sie im Menü „Regression“ und klicken Sie auf „OK“.
  4. Klicken Sie im Dialogfeld „Regression“ auf das Feld „Input Y Range“ und wählen Sie die abhängigen Variablendaten (Visa (V) Stock Returns) aus.
  5. Klicken Sie auf das Feld „Input X Range“ und wählen Sie die unabhängigen Variablendaten aus (S&P 500 gibt zurück).
  6. Klicken Sie auf „OK“, um die Ergebnisse auszuführen.

[Hinweis: Wenn die Tabelle klein erscheint, klicken Sie mit der rechten Maustaste auf das Bild und öffnen Sie es in einem neuen Tab, um eine höhere Auflösung zu erhalten.]

Interpretieren Sie die Ergebnisse

Unter Verwendung dieser Daten (die gleichen aus unserem R-Quadrat- Artikel) erhalten wir die folgende Tabelle:

Der R 2 -Wert, auch Bestimmtheitsmaß genannt, misst den Anteil der Variation der abhängigen Variablen, der durch die unabhängige Variable erklärt wird oder wie gut das Regressionsmodell an die Daten angepasst ist. Der R 2 -Wert reicht von 0 bis 1, und ein höherer Wert zeigt eine bessere Anpassung an. Der p-Wert oder Wahrscheinlichkeitswert reicht ebenfalls von 0 bis 1 und zeigt an, ob der Test signifikant ist. Im Gegensatz zum R 2 -Wert ist ein kleiner p-Wert günstig, da er auf eine Korrelation zwischen abhängigen und unabhängigen Variablen hinweist.

Zeichnen einer Regression in Excel

Wir können eine Regression in Excel darstellen, indem wir die Daten hervorheben und als Streudiagramm darstellen. Um eine Regressionslinie hinzuzufügen, wählen Sie „Layout“ aus dem Menü „Diagrammtools“. Wählen Sie im Dialogfeld „Trendlinie“ und dann „Lineare Trendlinie“. Um den R 2 -Wert hinzuzufügen, wählen Sie „Weitere Trendlinien-Optionen“ aus dem „Trendlinien-Menü“. Wählen Sie zuletzt „R-Quadrat-Wert im Diagramm anzeigen“. so detailliert wie die obige Tabelle.