Restquadratsumme (RSS)
Was ist die Residual Sum of Squares (RSS)?
Eine Residualsumme der Quadrate (RSS) ist eine statistische Technik, die verwendet wird, um die Varianz in einem Datensatz zu messen, die nicht durch ein Regressionsmodell selbst erklärt wird. Stattdessen wird die Varianz in den Residuen oder der Fehlerterm geschätzt.
Die lineare Regression ist eine Messung, die hilft, die Stärke der Beziehung zwischen einer abhängigen Variablen und einem oder mehreren anderen Faktoren zu bestimmen, die als unabhängige oder erklärende Variablen bekannt sind.
Die zentralen Thesen
- Eine Residuumsumme von Quadraten (RSS) misst den Grad der Varianz im Fehlerterm oder den Residuen eines Regressionsmodells.
- Idealerweise sollte die Summe der quadratischen Residuen kleiner oder niedriger sein als die Summe der Quadrate aus den Eingaben des Regressionsmodells.
- Der RSS wird von Finanzanalysten verwendet, um die Gültigkeit ihrer ökonometrischen Modelle zu schätzen.
Die Formel für die Residualsumme der Quadrate (RSS)
RSS =
Σ
n
i = 1 (
y i –
f (
x i ))
2
wo:
- y i = der i- te Wert der vorherzusagenden Variablen
- f (x i ) = vorhergesagter Wert von y i
- n = Obergrenze der Summation
Grundlegendes zur verbleibenden Quadratsumme (RSS)
Im Allgemeinen ist die Quadratsumme eine statistische Technik, die in der Regressionsanalyse verwendet wird, um die Streuung von Datenpunkten zu bestimmen. Bei einer Regressionsanalyse besteht das Ziel darin zu bestimmen, wie gut eine Datenreihe an eine Funktion angepasst werden kann, die helfen könnte, zu erklären, wie die Datenreihe generiert wurde. Die Quadratsumme wird als mathematische Methode verwendet, um die Funktion zu finden, die am besten zu den Daten passt (die am wenigsten variiert).
Der RSS misst den Fehlerbetrag, der zwischen der Regressionsfunktion und dem Datensatz verbleibt, nachdem das Modell ausgeführt wurde. Eine kleinere RSS-Zahl repräsentiert eine Regressionsfunktion.
Das RSS, auch als Summe der quadratischen Residuen bekannt, bestimmt im Wesentlichen, wie gut ein Regressionsmodell die Daten im Modell erklärt oder darstellt.
Residualsumme der Quadrate (RSS) vs. Reststandardfehler (RSE)
Der Reststandardfehler (RSE) ist ein weiterer statistischer Begriff, der verwendet wird, um den Unterschied der Standardabweichungen von beobachteten Werten gegenüber vorhergesagten Werten zu beschreiben, wie durch Punkte in einer Regressionsanalyse gezeigt. Es ist eine Güte-of-fit Maßnahme, die verwendet werden kann, um zu analysieren, wie gut ein Satz von Datenpunkten mit dem aktuellen Modell passen.
RSE wird berechnet, indem der RSS durch die Anzahl der Beobachtungen in der Stichprobe abzüglich 2 dividiert und dann die Quadratwurzel gezogen wird: RSE = [RSS / (n-2)] 1/2
Die Residual Sum of Squares (RSS), Finanzen und Ökonometrie
Die Finanzmärkte werden zunehmend quantitativ getrieben; Daher verwenden viele Anleger auf der Suche nach einem Vorteil fortschrittliche statistische Techniken, um ihre Entscheidungen zu unterstützen. Big Data, maschinelles Lernen und Anwendungen der künstlichen Intelligenz erfordern weiterhin die Verwendung statistischer Eigenschaften, um zeitgemäße Anlagestrategien zu leiten. Die Residualsumme von Quadraten – oder RSS-Statistiken – ist eine von vielen statistischen Eigenschaften, die eine Renaissance erleben.
Statistische Modelle werden von Anlegern und Portfoliomanagern verwendet, um den Preis einer Anlage zu verfolgen und diese Daten zur Vorhersage zukünftiger Bewegungen zu verwenden. Die als Regressionsanalyse bezeichnete Studie könnte eine Analyse der Beziehung der Preisbewegungen zwischen einem Rohstoff und den Aktien von Unternehmen beinhalten, die den Rohstoff produzieren.
Jedes Modell kann Abweichungen zwischen den vorhergesagten Werten und den tatsächlichen Ergebnissen aufweisen. Obwohl die Varianzen durch die Regressionsanalyse erklärt werden können, repräsentiert die RSS die Varianzen oder Fehler, die nicht erklärt werden.
Da eine ausreichend komplexe Regressionsfunktion erstellt werden kann, um praktisch jedem Datensatz genau zu entsprechen, sind weitere Untersuchungen erforderlich, um festzustellen, ob die Regressionsfunktion tatsächlich zur Erklärung der Varianz des Datensatzes nützlich ist. Normalerweise ist jedoch ein kleinerer oder niedrigerer Wert für RSS in jedem Modell ideal, da dies bedeutet, dass der Datensatz weniger variiert. Mit anderen Worten, je niedriger die Summe der quadratischen Residuen ist, desto besser kann das Regressionsmodell die Daten erklären.