Springe zum Inhalt
Kennungsbild für das IAB-Thema/Kompetenzfeld „Forschungsdaten und Methoden“

Forschungsdaten und Methoden

Für die Bereitstellung von Forschungsdaten greift das IAB auf die im Verwaltungsprozess entstehenden Registerdaten zurück, die im Data-Warehouse der Statistik der Bundesagentur für Arbeit aufbereitet werden. Hierzu gehören Informationen zu arbeitsmarktpolitischen Leistungen, zu Maßnahmen wie Berufsberatung und Berufsvorbereitung sowie zu sozialversicherungs¬pflichtiger Beschäftigung. Am IAB werden diese Daten an die Forschungsbedarfe angepasst und zu Forschungsdaten weiterentwickelt. Darüber hinaus werden Daten aus quantitativen (Panel-)
Erhebungen und qualitativen Befragungen zu Betrieben, Personen, Haushalten und Jobcentern verwendet. Auf Basis datenschutzrechtlicher Regelungen können verschiedene Datenquellen, zum Beispiel Betriebs- und Personendaten, durch Record-Linkage-Methoden verknüpft werden. Die so generierten Datenprodukte werden für die Forschung und Politikberatung intern bereitgestellt, weiterverarbeitet und über verschiedene Zugangswege in anonymisierter Form der nationalen und internationalen Forschungsgemeinschaft über das Forschungsdatenzentrum der Bundesagentur für Arbeit im IAB (FDZ) zugänglich gemacht. Zudem werden externe Datenquellen erschlossen, insbesondere große, teils unstrukturierte Datenmengen (Big Data). Darunter fallen auch Audiomitschnitte von Interviews mit Erlaubnis der Befragten.

Um die Qualität und Nutzbarkeit der Datenprodukte für die Forschung zu steigern, hat die Qualitätssicherung im gesamten Datenlebenszyklus einen hohen Stellenwert und wird methodisch mit Forschungsprojekten begleitet. Dafür entwickelt und evaluiert das IAB neue Verfahren zur Datenerhebung, -korrektur und -analyse. Zum Einsatz kommen dabei experimentelle Verfahren und statistische Modelle ebenso wie zunehmend auch Verfahren der künstlichen Intelligenz. Im Jahr 2025 wird eine neue Längsschnitt-Online-Befragung „The International Mobility Panel of Migrants in Germany“ aufgebaut, die mehrere Kohorten von Migrant*innen umfasst. Die Befragung wird für jede neue Kohorte 5 Jahre lang fortgeführt, auch mit den Befragten, die Deutschland verlassen haben. Damit können zukünftig nicht nur Wanderungsabsichten und Gründe der Abwanderung, sondern ebenso tatsächliche Wanderungsbewegungen beobachtet und analysiert werden. Zudem werden neue Formen der Erhebung in etablierten Befragungen erarbeitet. Für das Linked Personnel Panel wird z.B. ein „Push-to-Web-Ansatz“ für die Beschäftigtenbefragung vorbereitet, bei dem die befragten Personen motiviert werden, die Befragung online auszufüllen. Außerdem befasst sich das Kompetenzfeld in einem Grundlagenprojekt mit einem systematischen Vergleich von Ansätzen aus der Statistik und der Informatik zur Erstellung synthetischer Daten. Bei diesem Verfahren werden die Originaldaten durch künstlich generierte Werte ersetzt. Diese synthetischen Werte werden durch Modelle generiert, die anhand von Originaldaten trainiert wurden. Synthetische Daten können insbesondere bei sehr sensiblen Daten einen vereinfachten Datenzugang ermöglichen, bei gleichzeitiger Gewährleistung hoher Datenschutzanforderungen.

Aktivitäten

Bereiche

Kontakt