Quadratsumme
Was ist die Summe der Quadrate?
Die Quadratsumme ist eine statistische Technik, die in der Regressionsanalyse verwendet wird, um die Streuung von Datenpunkten zu bestimmen. Bei einer Regressionsanalyse besteht das Ziel darin zu bestimmen, wie gut eine Datenreihe an eine Funktion angepasst werden kann, die helfen könnte, zu erklären, wie die Datenreihe generiert wurde. Die Quadratsumme wird als mathematische Methode verwendet, um die Funktion zu finden, die am besten zu den Daten passt (die am wenigsten variiert).
Die Formel für die Summe der Quadrate lautet
Die Summe der Quadrate wird auch als Variation bezeichnet.
Was sagt Ihnen die Summe der Quadrate?
Die Quadratsumme ist ein Maß für die Abweichung vom Mittelwert. In der Statistik ist der Mittelwert der Durchschnitt einer Reihe von Zahlen und das am häufigsten verwendete Maß für die zentrale Tendenz. Das arithmetische Mittel wird einfach berechnet, indem die Werte im Datensatz aufsummiert und durch die Anzahl der Werte dividiert werden.
Nehmen wir an, die Schlusskurse von Microsoft (MSFT) in den letzten fünf Tagen waren 74,01, 74,77, 73,94, 73,61 und 73,40 in US-Dollar. Die Summe der Gesamtpreise beträgt 369,73 USD und der Mittel- oder Durchschnittspreis des Lehrbuchs wäre somit 369,73 USD / 5 = 73,95 USD.
Es reicht jedoch nicht immer aus, den Mittelwert eines Messsatzes zu kennen. Manchmal ist es hilfreich zu wissen, wie viel Variation es in einer Reihe von Messungen gibt. Wie weit die einzelnen Werte vom Mittelwert entfernt sind, kann Aufschluss darüber geben, wie gut die Beobachtungen oder Werte zum erstellten Regressionsmodell passen.
Wenn ein Analyst beispielsweise wissen möchte, ob sich der Aktienkurs von MSFT parallel zum Kurs von Apple (AAPL) bewegt, kann er die Beobachtungen für den Prozess beider Aktien für einen bestimmten Zeitraum auflisten, sagen wir 1, 2, oder 10 Jahre und erstellen Sie ein lineares Modell mit jeder der aufgezeichneten Beobachtungen oder Messungen. Wenn die Beziehung zwischen beiden Variablen (dh dem Preis von AAPL und dem Preis von MSFT) keine gerade Linie ist, gibt es Abweichungen im Datensatz, die untersucht werden müssen.
Wenn die Linie in dem erstellten linearen Modell in der Statistik nicht alle Wertmessungen durchläuft, ist ein Teil der Variabilität, die bei den Aktienkursen beobachtet wurde, unerklärlich. Die Quadratsumme wird verwendet, um zu berechnen, ob eine lineare Beziehung zwischen zwei Variablen besteht, und jede unerklärte Variabilität wird als Restquadratsumme bezeichnet.
Die Summe der Quadrate ist die Summe des Variationsquadrats, wobei die Variation als die Streuung zwischen jedem einzelnen Wert und dem Mittelwert definiert ist. Um die Summe der Quadrate zu bestimmen, wird der Abstand zwischen jedem Datenpunkt und der Linie der besten Anpassung quadriert und dann aufsummiert. Die Linie der besten Anpassung minimiert diesen Wert.
So berechnen Sie die Summe der Quadrate
Jetzt können Sie sehen, warum die Messung als Summe der quadrierten Abweichungen oder kurz als Summe der Quadrate bezeichnet wird. Mit unserem obigen MSFT-Beispiel kann die Summe der Quadrate wie folgt berechnet werden:
- SS = (74,01 – 73,95) 2 + (74,77 – 73,95) 2 + (73,94 – 73,95) 2 + (73,61 – 73,95) 2 + (73,40 – 73,95) 2
- SS = (0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
- SS = 1,0942
Das Addieren der Summe der Abweichungen allein ohne Quadrieren führt zu einer Zahl gleich oder nahe Null, da die negativen Abweichungen die positiven Abweichungen fast perfekt ausgleichen. Um eine realistischere Zahl zu erhalten, muss die Summe der Abweichungen quadriert werden. Die Summe der Quadrate ist immer eine positive Zahl, da das Quadrat jeder Zahl, ob positiv oder negativ, immer positiv ist.
Beispiel für die Verwendung der Quadratsumme
Basierend auf den Ergebnissen der MSFT-Berechnung zeigt eine hohe Quadratsumme an, dass die meisten Werte weiter vom Mittelwert entfernt sind und daher eine große Variabilität der Daten besteht. Eine geringe Summe von Quadraten bezieht sich auf eine geringe Variabilität in der Menge der Beobachtungen.
Im obigen Beispiel zeigt 1,0942, dass die Variabilität des MSFT-Aktienkurses in den letzten fünf Tagen sehr gering ist und Anleger, die in Aktien investieren möchten, die sich durch Preisstabilität und geringe Volatilität auszeichnen, sich für MSFT entscheiden können.
Die zentralen Thesen
- Die Quadratsumme misst die Abweichung der Datenpunkte vom Mittelwert.
- Ein höheres Quadratsummenergebnis weist auf eine große Variabilität innerhalb des Datensatzes hin, während ein niedrigeres Ergebnis darauf hinweist, dass die Daten nicht wesentlich vom Mittelwert abweichen.
Einschränkungen bei der Verwendung der Quadratsumme
Um eine Investitionsentscheidung darüber zu treffen, welche Aktie gekauft werden soll, sind viel mehr Beobachtungen erforderlich als die hier aufgeführten. Ein Analyst muss möglicherweise mit jahrelangen Daten arbeiten, um mit größerer Sicherheit zu wissen, wie hoch oder niedrig die Variabilität eines Vermögenswerts ist. Wenn dem Satz mehr Datenpunkte hinzugefügt werden, wird die Summe der Quadrate größer, da die Werte weiter verteilt werden.
Die am häufigsten verwendeten Variationsmaße sind die Standardabweichung und die Varianz. Um jedoch eine der beiden Metriken zu berechnen, muss zuerst die Summe der Quadrate berechnet werden. Die Varianz ist der Durchschnitt der Summe der Quadrate (dh der Summe der Quadrate geteilt durch die Anzahl der Beobachtungen). Die Standardabweichung ist die Quadratwurzel der Varianz.
Es gibt zwei Methoden der Regressionsanalyse, die die Quadratsumme verwenden: die lineare Methode der kleinsten Quadrate und die nichtlineare Methode der kleinsten Quadrate. Die Methode der kleinsten Quadrate bezieht sich auf die Tatsache, dass die Regressionsfunktion die Summe der Quadrate der Varianz von den tatsächlichen Datenpunkten minimiert. Auf diese Weise ist es möglich, eine Funktion zu zeichnen, die statistisch die beste Anpassung für die Daten liefert. Beachten Sie, dass eine Regressionsfunktion entweder linear (eine gerade Linie) oder nichtlinear (eine gekrümmte Linie) sein kann.