Releasing multiply-imputed synthetic data generated in two stages to protect confidentiality
Beschreibung
Eine Methode, um die Vertraulichkeit von Daten, die in statistischen Ämtern erhobenen werden, zu gewährleisten, ist das Ersetzen vertraulicher Werte durch synthetische Daten, die mittels multipler Imputation generiert werden. Es wird ein zweistufiges Verfahren zur Generierung der synthetischen Daten vorgestellt, das eine unterschiedliche Anzahl von Imputationen für unterschiedliche Variablen ermöglicht. Die Vorteile eines zweistufigen Verfahren liegen in der Reduzierung der Laufzeit bei der Berechnung, in der Verringerung des Risikos der Deanonymisierung, und in der Erhöhung der inferentiellen Genauigkeit. Es wird beschrieben, wie das zweistufige Verfahren bei der Generierung eines Public-Use-Files des IAB-Betriebpanels zur Anwendung kommt. (IAB)
Zitationshinweis
Reiter, Jerome P. & Jörg Drechsler (2007): Releasing multiply-imputed synthetic data generated in two stages to protect confidentiality. (IAB-Discussion Paper 20/2007), Nürnberg, 26 S.