Was ist PCA und was hat sie mit Eigenvektoren und Eigenwerten zu tun? - KamilTaylan.blog
28 April 2022 6:45

Was ist PCA und was hat sie mit Eigenvektoren und Eigenwerten zu tun?

Wann macht PCA Sinn?

für Principal Component Analysis, PCA) wendest Du an, wenn Du einen großen Datensatz strukturieren bzw. vereinfachen möchtest. Dabei versuchst Du die Gesamtzahl Deiner gemessenen Variablen zu reduzieren und trotzdem einen möglichst großen Anteil der Varianz aller Variablen zu erklären.

Wie funktioniert PCA?

Die PCA versucht im ersten Schritt die Variable zu finden, die die erklärte Varianz des Datensatzes maximiert. Anschließend werden schrittweise mehr Variablen hinzugefügt, die den verbleibenden Teil der Varianz erklären, denn in der Varianz, also der Abweichung vom Mittelwert, steckt die meiste Information.

Was ist eine Hauptkomponente?

Die Hauptkomponentenanalyse besteht darin, eine orthogonale Transformation der ursprünglichen Variablen in eine neue Menge unkorrelierter Variablen, die Hauptkomponenten (Englisch: principal components) genannt werden. Die Hauptkom- ponenten werden nacheinander in absteigender Bedeutung konstruiert.

Warum macht man eine Faktorenanalyse?

Die Faktorenanalyse oder Faktoranalyse ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen vieler verschiedener manifester Variablen (Observablen, Statistische Variablen) auf wenige zugrundeliegende latente Variablen („Faktoren“) zu schließen.

Was ist eine Parallelanalyse?

Eines der mathematischen Verfahren ist die Parallelanalyse nach Horn (1965). Bei der Parallelanalyse werden Eigenwerte einer Faktoranalyse eines empirisch gewonnenen Datensatzes mit den Eigenwerten einer Faktorenanalyse eines Datensatzes mit normalverteilten Zufallsdaten verglichen.

Was sind Faktoren SPSS?

SPSS-Beispieldatensatz

Die Faktorenanalyse fasst Gruppen von intervallskalierten Variablen zu aussagekräftigen und voneinander möglichst unabhängigen Faktoren zusammen. Sie kann auch eingesetzt werden, um Strukturen in den Daten zu entdecken.

Was sagt die Faktorladung aus?

Faktorladung, Kennzahl, die nach gerechneter Faktorenanalyse angibt, wie hoch der Anteil eines Faktors an der Streuung (Varianz) eines in der Korrelationsmatrix enthaltenen Verfahrens ist; kennzeichnet die Stärke, mit der ein Faktor eine empirisch erhobene Variable linear determiniert.

Was ist eine gute Faktorladung?

Je näher die Ladung am Extremwert –1 oder 1 liegt, desto stärker beeinflusst der Faktor die Variable. Eine Ladung nahe 0 gibt an, dass die Variable durch den Faktor nur schwach beeinflusst wird. Manche Variablen können eine hohe Ladung bei mehreren Faktoren aufweisen.

Was bedeutet eine negative Faktorladung?

Aber auch negative Faktorladungen sind möglich. Das bedeutet, dass eine hohe Ausprägung der Merkmalsdimension (z.B. der Vorliebe für Sachbücher) dann damit einhergeht, dass ein spezifisches Einzelmerkmal gering ausgeprägt ist (z.B. der Roman Z wird ungern gelesen, wenn man eine hohe Vorliebe für Sachbücher hat).

Was ist ein Faktorwert?

Die Faktorwerte ergeben sich als gewichteter Mittelwert der standardisierten Werte der in eine Hauptkomponentenanalyse eingehenden Variablen. Die Gewichte unterscheiden sich zwischen den Faktoren.

Wie hoch sollte kommunalität sein?

Die maximale Kommunalität ist 1 – würde Die Kommunalität eines Faktors in Bezug auf eine einzelne Variable 1 betragen, wären damit quasi 100 % der Varianz der Variablen durch den Faktor aufgeklärt. Vorsicht allerdings, dass Du die Kommunalität nicht mit dem Eigenwert verwechselst.