Nichtlineare Regression definieren
Die nichtlineare Regression ist eine Form der Regressionsanalyse, bei der Daten an ein Modell angepasst und dann als mathematische Funktion ausgedrückt werden. Die einfache lineare Regression verbindet zwei Variablen (X und Y) mit einer geraden Linie (y = mx + b), während die nichtlineare Regression die beiden Variablen in einer nichtlinearen (gekrümmten) Beziehung verbindet.
Ziel des Modells ist es, die Summe der Quadrate so klein wie möglich zu machen. Die Summe der Quadrate ist ein Maß, das verfolgt, wie weit die Y-Beobachtungen von der nichtlinearen (gekrümmten) Funktion abweichen, die zur Vorhersage von Y verwendet wird.
Es wird berechnet, indem zuerst der Unterschied zwischen der angepassten nichtlinearen Funktion und jedem Y-Punkt der Daten in der Menge ermittelt wird. Dann wird jede dieser Differenzen quadriert. Zuletzt werden alle quadrierten Zahlen addiert. Je kleiner die Summe dieser quadratischen Zahlen ist, desto besser passt die Funktion zu den Datenpunkten in der Menge. Die nichtlineare Regression verwendet logarithmische Funktionen, trigonometrische Funktionen, Exponentialfunktionen, Potenzfunktionen, Lorenzkurven, Gaußsche Funktionen und andere Anpassungsmethoden.
Die zentralen Thesen
- Sowohl die lineare als auch die nichtlineare Regression sagen Y-Antworten von einer X-Variablen (oder Variablen) voraus.
- Die nichtlineare Regression ist eine gekrümmte Funktion einer X-Variablen (oder Variablen), die verwendet wird, um eine Y-Variable vorherzusagen
- Die nichtlineare Regression kann eine Vorhersage des Bevölkerungswachstums im Zeitverlauf zeigen.
Die nichtlineare Regressionsmodellierung ähnelt der linearen Regressionsmodellierung darin, dass beide versuchen, eine bestimmte Reaktion aus einem Satz von Variablen grafisch zu verfolgen. Nichtlineare Modelle sind komplizierter als lineare Modelle zu entwickeln, da die Funktion durch eine Reihe von Näherungen (Iterationen) erstellt wird, die aus Versuch und Irrtum resultieren können. Mathematiker verwenden mehrere etablierte Methoden, wie die Gauss-Newton-Methode und die Levenberg-Marquardt-Methode.
Regressionsmodelle, die auf den ersten Blick nichtlinear erscheinen, sind oft tatsächlich linear. Das Kurvenschätzungsverfahren kann verwendet werden, um die Art der funktionalen Beziehungen in Ihren Daten zu identifizieren, sodass Sie das richtige Regressionsmodell auswählen können, sei es linear oder nichtlinear. Lineare Regressionsmodelle bilden zwar normalerweise eine gerade Linie, können aber auch Kurven bilden, abhängig von der Form der linearen Regressionsgleichung. Ebenso ist es möglich, Algebra zu verwenden, um eine nichtlineare Gleichung so zu transformieren, dass sie eine lineare Gleichung nachahmt – eine solche nichtlineare Gleichung wird als „intrinsisch linear“ bezeichnet.
Die lineare Regression verbindet zwei Variablen mit einer geraden Linie; nichtlineare Regression bezieht die Variablen mit einer Kurve in Beziehung.
Beispiel für nichtlineare Regression
Ein Beispiel dafür, wie die nichtlineare Regression verwendet werden kann, ist die Vorhersage des Bevölkerungswachstums im Zeitverlauf. Ein Streudiagramm der sich im Laufe der Zeit ändernden Bevölkerungsdaten zeigt, dass es einen Zusammenhang zwischen Zeit und Bevölkerungswachstum zu geben scheint, dass es sich jedoch um einen nichtlinearen Zusammenhang handelt, der die Verwendung eines nichtlinearen Regressionsmodells erfordert. Ein logistisches Bevölkerungswachstumsmodell kann Schätzungen der Bevölkerung für nicht gemessene Zeiträume und Vorhersagen des zukünftigen Bevölkerungswachstums liefern.
Unabhängige und abhängige Variablen, die in der nichtlinearen Regression verwendet werden, sollten quantitativ sein. Kategoriale Variablen, wie Wohnort oder Religion, sollten als binäre Variablen oder andere Arten quantitativer Variablen kodiert werden.
Um genaue Ergebnisse aus dem nichtlinearen Regressionsmodell zu erhalten, sollten Sie sicherstellen, dass die von Ihnen angegebene Funktion die Beziehung zwischen den unabhängigen und abhängigen Variablen genau beschreibt. Auch gute Startwerte sind notwendig. Schlechte Startwerte können dazu führen, dass ein Modell nicht konvergiert oder eine Lösung nur lokal und nicht global optimal ist, selbst wenn Sie die richtige funktionale Form für das Modell angegeben haben.