Skip to content

Publication

Imputation of missing data in surveys

Abstract

"Gerade bei Umfragen mit sog. sensitiven Variablen, wie etwa dem Einkommen, ist bekannt, daß z.B. die Bezieher sehr hoher Einkommen eher zur Verweigerung der Beantwortung von Einkommensfragen neigen als andere. Einfaches Vernachlässigen der unvollständigen Datensätze für die statistische Analyse würde jedoch bei systematischen und insbesondere bei den sog. nicht zufälligen verzerrenden Antwortausfällen zu einer Stichprobe führen, die nicht mehr als repräsentativ für die interessierende Grundgesamtheit betrachtet werden könnte. Verstärkt werden daher Methoden zur Ergänzung der fehlenden Daten, sog. Imputationstechniken, publiziert, in statistischer Standardsoftware zur Verfügung gestellt und in der Praxis eingesetzt. Diese Arbeit gibt zunächst einen Überblick über gängige ad hoc und neuere modellbasierte Ergänzungstechniken, wobei die meisten dieser Verfahren eine gewisse Zufälligkeit in den Datenausfällen voraussetzen. Mit Hilfe einer Simulationsstudie wird anschließend der Einsatz verschiedener Verfahren zur Ergänzung systematisch fehlender Daten veranschaulicht und diskutiert. An normalverteilten Daten werden die Eigenschaften der üblichen Schätzfunktion für Mittelwerte, Varianzen und Korrelationen untersucht, wenn verschiedene Ausfallmechanismen den Datenverlust steuern und Werte mit Hilfe unterschiedlicher Verfahren ergänzt werden. Es zeigt sich deutlich, wie wenig verzerrende Ausfälle durch die Ergänzung von Werten "geheilt" werden können." (Autorenreferat, IAB-Doku)

Cite article

Rässler, S. (2000): Ergänzung fehlender Daten in Umfragen. In: Jahrbücher für Nationalökonomie und Statistik, Vol. 220, No. 1, p. 64-94.