Springe zum Inhalt

Publikation

Remote data access and the risk of disclosure from linear regression

Beschreibung

Wenn es darum geht, Wege zu finden, um Wissenschaftlern, die nicht in einem statistischen Amt beschäftigt sind, einen einfachen Datenzugang zu ermöglichen, scheint der Fernzugriff auf Daten eine gute Alternative zur gegenwärtigen Praxis zu sein, entweder die Daten vor der Freigabe zu verändern oder einen Zugriff auf bestimmte Datenarchive oder Forschungsdatenzentren zu beschränken. Die Perturbation von Daten wird von Wissenschaftlern oft nicht akzeptiert, da sie die Ergebnisse aus veränderten Datensätzen nicht für verlässlich halten; auf der anderen Seite stellt ein Zugriff vor Ort sowohl für die Wissenschaftler als auch für die Institution, die die Daten zur Verfügung stellt, eine zeitliche und finanzielle Belastung dar. Die Nachteile beider Verfahren werden bei einem Fernzugriff vermieden. Obwohl dabei die Mikrodaten den Wissenschaftlern nicht direkt zur Verfügung stehen, besteht dabei dennoch die Möglichkeit, sensible Informationen über einzelne Befragte zu gewinnen. In dem Beitrag wird gezeigt, wie allgemein verfügbare Hintergrundinformationen genutzt werden können, um mittels einfacher linearer Regression sensible Informationen zu enthüllen. Die tatsächlichen Risiken werden anhand einer empirischen Evaluation auf der Basis des IAB-Betriebspanels aufgezeigt. Obwohl diese Form der missbräuchlichen Nutzung leicht verhindert werden kann, wenn sich die Behörde des Problems bewusst ist, zeigt die Simulation doch deutlich, dass viele - auch bisher nicht offensichtliche - Wege existieren können, um mittels multivariater Analysemethoden sensible Informationen zu erhalten. Deshalb sollten Behörden, die über eine Implementierung eines Fernzugriffs nachdenken, sorgfältig abwägen, welche Abfragen zugelassen werden sollen. (IAB)

Zitationshinweis

Bleninger, Philipp, Jörg Drechsler & Gerd Ronning (2011): Remote data access and the risk of disclosure from linear regression. An empirical study. In: J. Domingo-Ferrer & E. Magkos (Hrsg.) (2011): Privacy in statistical databases : UNESCO Chair in Data Privacy, International Conference, PSD 2010, Corfu, Greece, September 22-24, 2010. Proceedings (Lecture notes in computer science, 6344), S. 220-233. DOI:10.1007/978-3-642-15838-4_20