Springe zum Inhalt

Projekt

Validierung und Entwicklung von Proxy Variablen für multivariate Arbeitsmarktanalysen auf Basis von administrativen Individualdaten des IAB.

Projektlaufzeit: 20.10.2013 bis 30.01.2016

Kurzbeschreibung

Immer häufiger werden administrative Individualdaten als Grundlage für die politische Beratung herangezogen. Sie werden für die Erforschung wichtiger Aspekte der Sozialsysteme verwendet und dienen damit der politischen und administrativen Entscheidungsfindung als Hintergrundinformation. Zum Beispiel basiert in Deutschland die Volkszählung auf administrativen Daten und weite Teile der sogenannten Hartz-Reformen wurden auf Basis von administrativen Individualdaten evaluiert. Administrative Daten beinhalten eine Zahl von politisch hoch relevanten und präzisen Variablen wie z. B. Bezugszeiten von staatlichen Transferleistungen, Löhne und Beschäftigungsphasen sowie öffentliche Lohnzuschüsse.
Da diese Daten einen Großteil der Bevölkerung umfassen, ist der Stichprobenfehler klein und man erhofft sich so eine starke Aussagekraft der Ergebnisse. Aus diesem Grund sind diese Daten in vielen Ländern ein wichtiges Produkt zur Informationsbeschaffung in der Politik geworden. Während die großen Fallzahlen und die vielfach genauen Informationen ein klarer Vorteil gegenüber kostspielig gesammelten Umfragedaten darstellen, enthalten sie häufig kaum Informationen auf der Ebene der Privathaushalte wie Haushaltseinkommen, Anzahl der Personen im Haushalt , Informationen über den sozialen Kontext , Netzwerke und individuelle Motivation . Hierfür werden Ergebnisse auf Basis dieser Daten häufig kritisiert, da ausgelassene Variablen zu erheblichen Verzerrungen der Schätzergebnisse auf Basis von multivariaten Verfahren führen können.
In diesem Projekt werden die Integrierten Erwerbsbiografien (IEB), administrative Individualdaten des Instituts für Arbeitsmarkt-und Berufsforschung (IAB) verwendet. Diese Daten sind eine wichtige administrative Datenquelle, die z.B. für die Evaluationen der Hartz-Arbeitsmarktreformen im Auftrag des BMAS verwendet wurden.
Da das offensichtliche Fehlen von Haushaltskontextvariablen die Ergebnisse der Arbeitsmarkstudien verzerren können, gab es einen Konsens in der deutschen Politik und in der Forschung , die Datenlage durch Befragungsdaten zu ergänzen. Die Panel Studie „Arbeitsmarkt und soziale Sicherung“ ( PASS ) wird seit 2006 vom IAB durchgeführt und sammelt für eine Stichprobe von Haushalten detaillierte Informationen, die in administrativen Daten fehlen (Trappmann et al., 2010). PASS lässt sich für alle Teilnehmer, die dem zugestimmt haben, mit administrativen Daten der Bundesagentur für Arbeit verknüpfen.
Zwar gibt es eine Vielzahl von Forschungsarbeiten, die die Qualität der Befragungsdaten durch Vergleich mit administrativen Daten untersuchen, jedoch wurden bisher keine Versuche unternommen, umgekehrt die Arbeitsgrundlage für administrative Daten mit Hilfe der Umfragedaten zu verbessern.
Um den Kritikpunkt wichtiger ausgelassener Variablen in Analysen auf Basis von administrativen Daten zu adressieren, verwendet die Forschung regelmäßig sogenannte Proxy Variablen. Diese Variablen können anstelle der ausgelassenen Variablen verwendet werden und, sofern sie einige statistische Eigenschaften erfüllen, Verzerrungen der Schätzergebnisse abschwächen oder beseitigen. So werden insbesondere Variablen aus der Erwerbshistorie gebildet, die Personen im Hinblick auf Motivation und Erfolgsaussichten auf dem Arbeitsmarkt typisieren sollen. Da es nicht möglich ist, die Validität dieses Ansatzes nur auf Basis von administrativen Daten zu überprüfen, ist es zurzeit nicht bekannt, ob dieser Ansatz überhaupt funktioniert. Beispiele für wissenschaftliche Studien, die Variablen der Erwerbshistorie verwenden, sind: Biewen et al. (2011), Lechner und Wunsch (2010) und Wichert und Wilke (2012). Viele weitere Analysen verwenden weder Proxies noch ausgelassene Variablen. Hier kann davon ausgegangen werden, dass die Ergebnisse verzerrt sind, jedoch ist unklar, in welchem Umfang. Wir sehen deshalb erheblichen Forschungsbedarf um die Validität dieser und anderer Studien, die wichtige Aspekte der Sozialsysteme in Deutschland analysieren, zu erhöhen.
Durch die Verwendung von zusätzlichen Informationen aus Umfragedaten erhalten wir erste Einblicke, inwieweit diese Proxy Variablen tatsächlich mit wichtigen ausgelassenen Variablen korreliert sind und daher die Bedingungen für zulässige Proxys erfüllen. Unsere Ergebnisse werden deshalb dazu beitragen, die Qualität empirischer Ergebnisse auf der Grundlage administrativer Daten zu verbessern. Wir weisen darauf hin, dass Forschung zur Qualität administrativer Daten unterentwickelt ist und es gibt aufgrund der Vielzahl von aktuellen Studien auf Basis dieser Daten einen starken Bedarf für solche Untersuchungen.
 

Wichert, L. and Wilke, R.A. (2012), Which factors safeguard employment? An analysis with misclassified register data, Journal of the Royal Statistical Society, Series A, 175(1), 135-151.
 

Ziel

Ziel ist es, bestehende und zukünftige administrative Datenprodukte zu verbessern, indem wir Nutzern verbesserte und validierte Proxy Variablen für ausgelassene Variablen zur Verfügung stellen.

Methoden

In unserer empirischen Analyse werden wir eine Vielzahl von statistischen/quantitativen Methoden verwenden. Zu Beginn wenden wir Regressions-, Korrelations- und Clusteranalyse an, um (bedingte) Korrelationen zwischen beobachtbaren Variablen und ausgelassen Variablen identifizieren. In unseren Anwendungen werden wir diverse multivariate Regressionstechniken wie Lohnregressionen und Modelle mit beschränkten abhängigen Variable für die Analyse von Arbeitsmarktübergängen verwenden. Hiermit soll überprüft werden, inwieweit sich die Ergebnisse verändern, wenn anstelle der ausgelassenen Variablen, geeignete oder vorhandene Proxy Variablen oder die in den Umfragedaten beobachteten zusätzlichen Variablen verwendet werden.

Leitung

20.10.2013 - 30.01.2016
Ralf Andreas Wilke
20.10.2013 - 30.01.2016

Mitarbeiter

Arne Bethmann
20.10.2013 - 30.01.2016
Shihan Du
20.10.2013 - 30.01.2016