18 April 2022 2:24

Imputation von fehlenden Erträgen

Wann imputation?

Unter dem Begriff Imputation werden in der Mathematischen Statistik Verfahren zusammengefasst, mit denen fehlende Daten in statistischen Erhebungen – die sogenannten Antwortausfälle – in der Datenmatrix vervollständigt werden. Die Schweigeverzerrung, die durch die Antwortausfälle entsteht, wird dadurch verringert.

Wie funktioniert Multiple Imputation?

Bei der Multiplen Imputation werden für die fehlenden Werte Schätzwerte eingesetzt, die durch die Verteilung verschiedener Prä- diktoren vorhergesagt werden. Dies geschieht, indem alle vorliegenden relevanten Informationen des Datensatzes berücksichtigt und Zufallsfehler hinzugerechnet werden.

Wie geht man mit fehlenden Werten um?

Die einfachste und am häufigsten in der Praxis verwendete Methode zur Behandlung von fehlenden Werten ist der listenweise Fallausschluss. Bei diesem Verfahren werden bei der statistischen Analyse nur Fälle berücksichtigt, bei denen alle beteiligten Variablen gültige Ausprägungen aufweisen.

Was sind fehlende Werte SPSS?

Benutzerdefiniert fehlende Werte werden zumeist vom Ersteller der Umfrage definiert und sind eine Zahl. Es handelt sich dabei um unsinnige Werte, die auf keinen Fall im Wertebereich der Variable liegen können. Das soll verhindern, dass diese zufällig mit in die Auswertung einfließen.

Was macht SPSS mit fehlenden Werten?

System-definied-Missings als fehlender Wert in SPSS

Alle numerischen Zellen, in denen kein Wert steht, werden von SPSS als System-Missing betrachtet. In der Datenansicht wird hier einfach ein Punkt angezeigt. Da dieses Verfahren am einfachsten ist, wird es wahrscheinlich auch am häufigsten genutzt.

Was ist MCAR?

Daten, die Missing Completely at Random (MCAR; englisch: vollkommen willkürlich fehlend) sind, stehen mit keiner anderen Variable systematisch in Zusammenhang. Anders ausgedrückt: MCAR bedeutet, dass das Fehlen einer Beobachtung nichts mit der untersuchten Person oder dem untersuchten Objekt zu tun hat.