Springe zum Inhalt

Publikation

Methodenreport: Synthetische Scientific-Use-Files der Welle 2007 des IAB-Betriebspanels

Beschreibung

"Die Bereitstellung von Scientific-Use-Files für Betriebsdaten stellt für die Forschungsdatenzentren eine besondere Herausforderung dar. Aufgrund der kleineren Grundgesamtheiten, dem hohen Auswahlsatz und der oft extrem schiefen Verteilung einzelner Variablen ist eine Reidentifikation einzelner Befragungsteilnehmer wesentlich leichter möglich als beispielsweise bei Haushaltsbefragungen. Einfache Maßnahmen wie Vergröberungen bei einzelnen kategorialen Variablen sind daher nicht ausreichend, um den Datenschutz zu gewährleisten. Bei der Erzeugung synthetischer Datensätze wird versucht, ein möglichst exaktes Abbild der Originaldaten zu erzeugen, wobei sensible Merkmale und Merkmale, die zu einer Reidentifikation führen könnten durch mehrfach imputierte Werte ersetzt werden. Neben einer Einführung in das Verfahren bietet dieser Methodenreport hilfreiche Hinweise, die es bei der Nutzung der synthetischen Datensätze zu beachten gilt. Zudem wird erklärt, wie der Datennutzer vorgehen muss, um mit den synthetischen Datensätzen valide Ergebnisse zu erhalten. Abschließend zeigen erste Analyseergebnisse das Potenzial aber auch die Grenzen der erzeugten Datensätze auf." (Autorenreferat, IAB-Doku)

Zitationshinweis

Drechsler, Jörg (2011): Methodenreport: Synthetische Scientific-Use-Files der Welle 2007 des IAB-Betriebspanels. (FDZ-Methodenreport 01/2011 (de)), Nürnberg, 19 S.

Bezugsmöglichkeiten

kostenfreier Zugang