Springe zum Inhalt

Publikation

PRIMA: A new multiple imputation procedure for binary variables

Beschreibung

Bei der Untersuchung von Arbeitsmarktdaten ist häufig die Abschätzung von Teilpopulationen, z.B. in regionaler Hinsicht, von Interesse. Hierzu werden gewöhnlich Horvitz-Thompson-Schätzungen durchgeführt. Da die Daten oft unter hohen Antwortausfall- und Antwortverweigerungsquoten leiden, werden zur Validierung dieser Schätzungen Varianzkorrekturen benötigt. In dem Beitrag werden Imputationsaspekte unter besonderer Berücksichtigung binärer Variablen diskutiert. Angesichts der Unhandlichkeit multivariater Imputationsverfahren werden univariate Spezifikationen vorgeschlagen, die leichter durchzuführen sind. Die Methode des 'regression switching' bzw. 'chained equation' oder Gibbs-Sampling wird diskutiert; dabei werden mögliche theoretische Unzulänglichkeiten des Ansatzes ebenso angesprochen wie typische Probleme bei der Datenanalyse. Auf der Basis der deutschen Mikrozensus-Daten wurde eine Simulation durchgeführt. Multiple Imputation, Ranking sowie Kalibrierungstechniken werden dabei in Hinblick auf Schätzungen der Anzahl der Arbeitslosen in unterschiedlichen Umgebungen verglichen. Dabei stellt sich heraus, dass logistische multiple Imputationsverfahren für binäre Variablen in manchen Fällen zu unzulänglichen Punkt- und Varianzschätzungen führen. Um möglichen Schwächen der logistischen Regressions-Imputation zu begegnen, wird ein multipler Imputations-Matching-Algorithmus entwickelt (PRIMA - Predictive Imputation Matching), der vielversprechende Ergebnisse liefert. (IAB)

Zitationshinweis

Münnich, Ralf & Susanne Rässler (2005): PRIMA: A new multiple imputation procedure for binary variables. In: Journal of official statistics, Jg. 21, H. 2, S. 325-341.