Springe zum Inhalt

Publikation

New data dissemination approaches in old Europe

Beschreibung

Die Veröffentlichung von Mikrodaten mit hohem Nutzen unter Einhaltung des Schutzes der Anonymität der Befragten ist eine schwierige Aufgabe. Die Erzeugung multipler imputierter synthetischer Datensätze ist ein innovatives statistisches Verfahren der Offenlegungskontrolle, mit dem dieses Ziel erreicht werden kann. Bisher war dieser Ansatz nur für einige Datensätze in den USA erfolgreich angewendet worden. In diesem Aufsatz wird die erste erfolgreiche Implementation außerhalb der USA vorgestellt: die Erzeugung von partiell synthetischen Datensätzen für das IAB-Betriebspanel. Beschrieben wird die gesamte Entwicklung des Projektes: von ersten Diskussionen über Risikovariablen bis zur endgültigen Synthese. Präsentiert werden außerdem Ergebnisse der Evaluation des Offenlegungsrisikos und erste Ergebnisse bezüglich der Datenqualität der generierten Datensätze. Ein Varianzinflations-Imputationsmodell wird vorgestellt, welches zusätzliche Variabilität für Daten bietet, welche durch die Standardsynthese nicht ausreichend geschützt sind. (IAB)

Zitationshinweis

Drechsler, Jörg (2012): New data dissemination approaches in old Europe. Synthetic datasets for a German establishment survey. In: Journal of applied statistics, Jg. 39, H. 2, S. 243-265. DOI:10.1080/02664763.2011.584523