FDZ-Literatur / FDZ Literature
Die FDZ-Literaturdatenbank umfasst neben Datensatzbeschreibungen und Methodenberichten die zahlreichen Forschungsarbeiten, die auf Basis der am FDZ angebotenen Daten entstanden sind. Hier finden Sie aktuell laufende Projekte von FDZ-Nutzenden.
Darüber hinaus stehen die Literaturdatenbank zum IAB-Betriebspanel sowie die Literaturdatenbank zum PASS zur Verfügung.
Apart from dataset descriptions and methodology reports, the FDZ literature database contains numerous research papers written on the basis of the data provided by the FDZ. Here you can find currently ungoing research projects of FDZ users.
In addition, literature databases on the IAB Establishment Panel and the Panel Study Labour Market and Social Security (PASS) are available for research.
- FDZ Publikationen / FDZ publications
- Arbeiten und Lernen im Wandel / Working and Learning in a Changing World (ALWA)
- BA-Beschäftigtenpanel / BA Employment Panel
- Berufliche Weiterbildung und lebenslanges Lernen (WeLL)/Further Training and Lifelong Learning (WeLL
- Berufstätigenerhebung 1989 (BTE1989) / Employment survey for East Germany (DDR) 1989 (BTE1989)
- Beschäftigtenbefragung "Bonuszahlungen, Lohnzuwächse und Gerechtigkeit" - BLoG
- Betriebsbefragung IAB-IZA-ZEW-Arbeitswelt 4.0 (BIZA) und DiWaBe-Beschäftigtenbefragung
- Biografiedaten dt. Sozialversicherungsträger / Biographical data of social insurances (BASiD)
- Children of Immigrants Longitudinal Survey in Four European Countries - Germany verknüpft mit administrativen Daten des IAB
- Daten der Treuhandanstalt verknüpft mit Betriebs-Historik-Panel (THA-BHP)
- Datensatz NEPS-SC1-ADIAB Neugeborene
- Datensatz NEPS-SC3-ADIAB Schüler Klasse 5
- Datensatz NEPS-SC4-ADIAB Schüler Klasse 9
- Datensatz NEPS-SC5-ADIAB Studierende
- Datensatz NEPS-SC6-ADIAB Erwachsene
- Datensatz SOEP-CMI-ADIAB
- Datenspeicher Gesellschaftliches Arbeitsvermögen verknüpft mit administrativen Daten des IAB (GAV-ADIAB) 1975-2019
- GAW-IAB-Gründerbefragung
- German Management and Organizational Practices (GMOP) Survey
- IAB-BAMF-SOEP Befragung von Geflüchteten
- IAB-Beschäftigtenstichprobe / IAB Employment Sample
- IAB-Betriebs-Historik-Panel / IAB Establishment History Panel
- IAB-Betriebspanel / IAB Establishment Panel
- IAB-Datensatz BeCovid
- IAB-Datensatz HOPP
- IAB-Linked-Employer-Employee-Datensatz (LIAB) / Linked Employer-Employee Data from the IAB
- IAB-Querschnittsbefragung / Cross-sectional survey
- IAB-SOEP Migrationsstichprobe (IAB-SOEP MIG)
- IAB-Stellenerhebung / IAB Job Vacancy Survey
- International Mobility Panel of Migrants in Germany (IMPa)
- IZA/IAB Administrativer Evaluationsdatensatz (AED und LED) / IZA Evaluation Dataset Survey
- Kundenbefragung zu Organisationsstrukturen nach SGB II / Client survey on German SGBII-Agencies
- LidA - Leben in der Arbeit
- Linked Inventor Biography Data
- Linked Personnel Panel (LPP)
- Mannheimer Unternehmenspanel (MUP) verknüpft mit Daten des IAB
- Panel Arbeitsmarkt und soziale Sicherung (PASS) / Panel Study Labour Market and Social Security
- Stichprobe Integrierter Employer-Employee Daten (SIEED)/Sample of Integrated Employer-Employee Data
- Stichprobe der Integr. Arbeitsmarktbiografien/Sample of integrated labour market biographies (SIAB)
- Stichprobe der Integrierten Grundsicherungsbiografien (SIG)
- Stichprobe des Administrative Wage and Labor Market Flow Panel (FDZ-AWFP)
- Studie Mentale Gesundheit bei der Arbeit (S-MGA)
-
Literaturhinweis
Capital stock approximation with the perpetual inventory method: An update (2017)
Zitatform
Müller, Steffen (2017): Capital stock approximation with the perpetual inventory method: An update. (FDZ-Methodenreport 05/2017 (en)), Nürnberg, 8 S.
Abstract
"Der beigefügte Datensatz enthält regelmäßig Updates zu den für die Kapitalstockberechnung notwendigen Informationen zur Nutzungsdauer von Kapitalgütern. Detaillierte Informationen zur Berechnung des Kapitalstocks finden sich in FDZ Methodenreport Nr. 02/2010 und FDZ Methodenreport Nr. 05/2017." (Autorenreferat, IAB-Doku)
Weiterführende Informationen
Annex data -
Literaturhinweis
Zusammenführen der Wellen des IAB-Betriebspanels: Ein Do-File für die grundlegende Aufbereitung eines Paneldatensatzes in Stata (2017)
Umkehrer, Matthias;Zitatform
Umkehrer, Matthias (2017): Zusammenführen der Wellen des IAB-Betriebspanels. Ein Do-File für die grundlegende Aufbereitung eines Paneldatensatzes in Stata. (FDZ-Methodenreport 12/2017 (de)), Nürnberg, 13 S.
Abstract
"Dieser FDZ-Methodenreport stellt das Do-file BP_panelgen_93JJ_v1 vor, welches alle Wellen des IAB-Betriebspanels von 1993 bis zum aktuellsten Jahr zu einem Paneldatensatz in Stata zusammenfügt. Er erläutert die Ausgangslage, skizziert den Aufbau des Do-files, beschreibt den Paneldatensatz und bietet Bedienhinweise. Die Variablen im generierten Paneldatensatz sind konsistent benannt, kodiert und beschriftet, um eine standardisierte Grundlage für Panel-Analysen zu schaffen. Der Programmcode ist einfach und transparent gehalten, sodass Nutzerinnen oder Nutzer bei Bedarf leicht Anpassungen vornehmen können. Allerdings gilt es zu beachten, dass sich die generierten Panelvariablen, zum Beispiel aufgrund von Änderungen der Fragestellung, noch immer in ihrem Inhalt über die Wellen hinweg unterscheiden können." (Autorenreferat, IAB-Doku)
Beteiligte aus dem IAB
Umkehrer, Matthias;Ähnliche Treffer
English version FDZ-Methodenreport , 12/2017 (en) -
Literaturhinweis
Combining the waves of the IAB Establishment Panel: a do-file for the basic data preparation of a panel data set in Stata (2017)
Umkehrer, Matthias;Zitatform
Umkehrer, Matthias (2017): Combining the waves of the IAB Establishment Panel. A do-file for the basic data preparation of a panel data set in Stata. (FDZ-Methodenreport 12/2017 (en)), Nürnberg, 12 S.
Abstract
"Dieser FDZ-Methodenreport stellt das Do-file BP_panelgen_93JJ_v1 vor, welches alle Wellen des IAB-Betriebspanels von 1993 bis zum aktuellsten Jahr zu einem Paneldatensatz in Stata zusammenfügt. Er erläutert die Ausgangslage, skizziert den Aufbau des Do-files, beschreibt den Paneldatensatz und bietet Bedienhinweise. Die Variablen im generierten Paneldatensatz sind konsistent benannt, kodiert und beschriftet, um eine standardisierte Grundlage für Panel-Analysen zu schaffen. Der Programmcode ist einfach und transparent gehalten, sodass Nutzerinnen oder Nutzer bei Bedarf leicht Anpassungen vornehmen können. Allerdings gilt es zu beachten, dass sich die generierten Panelvariablen, zum Beispiel aufgrund von Änderungen der Fragestellung, noch immer in ihrem Inhalt über die Wellen hinweg unterscheiden können." (Autorenreferat, IAB-Doku)
Beteiligte aus dem IAB
Umkehrer, Matthias; -
Literaturhinweis
Disclosure risk from factor scores (2014)
Zitatform
Bleninger, Philipp, Jörg Drechsler & Gerd Ronning (2014): Disclosure risk from factor scores. In: Journal of official statistics, Jg. 30, H. 1, S. 107-122., 2013-09-02. DOI:10.2478/jos-2014-0006
Abstract
"Remote access can be a powerful tool for providing data access for external researchers. Since the microdata never leave the secure environment of the data-providing agency, alterations of the microdata can be kept to a minimum. Nevertheless, remote access is not free from risk. Many statistical analyses that do not seem to provide disclosive information at first sight can be used by sophisticated intruders to reveal sensitive information. For this reason the list of allowed queries is usually restricted in a remote setting. However, it is not always easy to identify problematic queries. We therefore strongly support the argument that has been made by other authors: that all queries should be monitored carefully and that any microlevel information should always be withheld. As an illustrative example, we use factor score analysis, for which the output of interest - the factor loading of the variables - seems to be unproblematic. However, as we show in the article, the individual factor scores that are usually returned as part of the output can be used to reveal sensitive information. Our empirical evaluations based on a German establishment survey emphasize that this risk is far from a purely theoretical problem." (Author's abstract, IAB-Doku) ((en))
-
Literaturhinweis
Are they willing to use the web?: first results of a possible switch from PAPI to CAPI/CAWI in an establishment survey (2014)
Ellguth, Peter; Kohaut, Susanne;Zitatform
Ellguth, Peter & Susanne Kohaut (2014): Are they willing to use the web? First results of a possible switch from PAPI to CAPI/CAWI in an establishment survey. In: Statistics Canada (Hrsg.) (2014): Beyond traditional survey taking: adapting to a changing world : Proceedings of Statistics Canada Symposium 2014, S. 1-6, 2015-03-10.
Abstract
"The IAB-Establishment Panel is the most comprehensive establishment survey in Germany with almost 16.000 firms participating every year. Face-to-face interviews with paper and pencil (PAPI) are conducted since 1993. An ongoing project examines possible effects of a change of the survey to computer aided personal interviews (CAPI) combined with a web based version of the questionnaire (CAWI). In a first step, questions about the internet access, the willingness to complete the questionnaire online and reasons for refusal were included in the 2012 wave. First results are indicating a widespread refusal to take part in a web survey. A closer look reveals that smaller establishments, long time participants and older respondents are reluctant to use the internet." (Author's abstract, IAB-Doku) ((en))
Beteiligte aus dem IAB
Kohaut, Susanne;Weiterführende Informationen
Program and proceedings -
Literaturhinweis
The IAB Establishment Panel - methodological essentials and data quality (2014)
Zitatform
Ellguth, Peter, Susanne Kohaut & Iris Möller (2014): The IAB Establishment Panel - methodological essentials and data quality. In: Journal for labour market research, Jg. 47, H. 1-2, S. 27-41., 2013-10-18. DOI:10.1007/s12651-013-0151-0
Abstract
"Das IAB-Betriebspanel wurde vor 20 Jahren gestartet, um einen umfassenden Datensatz für die Nachfrageseite des Arbeitsmarkts zu generieren. Damit sollten sowohl der Wissenschaft hochwertige Daten mit entsprechendem Analysepotenzial zur Verfügung gestellt, als auch ein zuverlässiges Informationssystem für politische Entscheidungsträger etabliert werden. Dieser Beitrag gibt einen Überblick über die methodischen Grundlagen des IAB-Betriebspanels angefangen von der Stichprobenziehung über die Datengewinnung bis hin zu Fragen der Hochrechnung. Besonderes Augenmerk wird dabei auf Veränderungen im methodischen Design gelegt, die in den letzten Jahren vorgenommen wurden, sowie auf Fragen der Datenqualität. Zudem werden Überlegungen hinsichtlich eines möglichen Umstiegs der Erhebungsmethode auf computergestützte Formen präsentiert." (Autorenreferat, IAB-Doku)
-
Literaturhinweis
Estimation of standard errors and treatment effects in empirical economics: methods and applications (2014)
Zitatform
Hübler, Olaf (2014): Estimation of standard errors and treatment effects in empirical economics. Methods and applications. In: Journal for labour market research, Jg. 47, H. 1-2, S. 43-62. DOI:10.1007/s12651-013-0135-0
Abstract
"Dieser Beitrag diskutiert Möglichkeiten zur Schätzung von Standardfehlern und Kausaleffekten. Zunächst werden heteroskedastie- und gruppenrobuste Schätzungen für Standardfehler betrachtet sowie Auffälligkeiten und Probleme bei Dummy-Variablen als Regressoren, Ausreißern und nur partiell identifizierten Parametern erörtert. Danach geht es um Verfahren zur Bestimmung von Treatmenteffekten. Vier Prinzipien werden hierzu vorgestellt: Differenz-von-Differenzen-Schätzer, Matchingverfahren, Kausaleffekte in der Quantilsregressionsanalyse und Ansätze zur Bestimmung von Diskontinuitäten bei Regressionsschätzungen. Anwendungen erfolgen im zweiten Teil der Arbeit auf Cobb-Douglas-Produktionsfunktionen unter Verwendung von IAB-Betriebspaneldaten.
Verschiedene heteroskedastiekonsistente Verfahren führen zu recht ähnlichen Ergebnissen bei den Standardfehlern. Clusterrobuste Schätzungen zeigen dagegen deutliche Abweichungen. Dummies als Regressoren mit einem Mittelwert in der Nähe von 0.5 weisen kleinere Varianzen der Koeffizienterschätzer auf als andere. Nicht alle Ausreißer haben einen nennenswerten Einfluss auf die Signifikanz. Neuere Methoden zur Behandlung des Problems von nur partiell identifizierten Parametern führen zu effizienteren Schätzungen.
Die vier diskutierten Verfahren zur Bestimmung der Wirkungen von Maßnahmen werden auf das Problem, ob betriebliche Bündnisse einen signifikanten Einfluss auf den Produktionsoutput haben, angewandt. Im Gegensatz zu nicht konditionalen Differenz-von-Differenzen-Schätzern und Schätzern ohne Matching sind die Effekte betrieblicher Bündnisse bei bedingten Differenz-von-Differenzen- Schätzern und Matching-Verfahren zwar positiv, aber insignifikant. Diese Aussage ist auf Basis der Treatment-Quantilsanalyse zu präzisieren. Je höher die Quantile sind, umso größer ist die Wirkung betrieblicher Bündnisse mit einer Tendenz von insignifikanten zu signifikanten Effekten. Die deterministische Regressionsanalyse mit Diskontinuitäten zeigt einen Strukturbruch bei Wahrscheinlichkeit 0.5, dass ein betriebliches Bündnis existiert. Es lassen sich keine spezifischen Effekte während der Rezession 2009 ausmachen. Schätzungen im Rahmen stochastischer Diskontinuitätsansätze offenbaren, dass die Wirkungen betrieblicher Bündnisse in Ostdeutschland signifikant niedriger ausfallen als in Westdeutschland." (Autorenreferat, IAB-Doku) -
Literaturhinweis
Daten des IAB-Betriebspanels und Firmenpaneldaten aus Erhebungen der Amtlichen Statistik - substitutive oder komplementäre Inputs für die Empirische Wirtschaftsforschung? (2014)
Zitatform
Wagner, Joachim (2014): Daten des IAB-Betriebspanels und Firmenpaneldaten aus Erhebungen der Amtlichen Statistik - substitutive oder komplementäre Inputs für die Empirische Wirtschaftsforschung? In: Journal for labour market research, Jg. 47, H. 1-2, S. 63-70., 2013-02-01. DOI:10.1007/s12651-013-0129-y
Abstract
"Repräsentative Längsschnittdaten für Firmen (Betriebe bzw. Unternehmen), die für wissenschaftliche Auswertungen genutzt werden können, stammen in Deutschland vor allem aus zwei Quellen, dem IAB-Betriebspanel und den AFiD-Panel, wobei das Akronym AFiD für Amtliche Firmendaten für Deutschland steht, die von den Statistischen Ämtern erhoben werden. In diesem Beitrag werden sechs Aspekte für einen Vergleich dieser beiden Datenquellen herangezogen. Es zeigt sich, dass es sich hierbei um komplementäre und nicht um substitutive Inputs für die Empirische Wirtschaftsforschung handelt. Beide haben jeweils spezifische Stärken und Schwächen, die sie zur Analyse von konkreten Fragestellungen mehr oder weniger gut geeignet oder auch völlig ungeeignet machen. Daraus folgt, dass der Werkzeugkasten für die empirischen Forschung mit Längsschnittdaten für Firmen in Deutschland sowohl das IAB-Betriebspanel als auch die AFiD-Panel enthalten muss, denn nur so ist sichergestellt, dass ein möglichst breites Spektrum von Fragestellungen mit jeweils adäquaten Daten untersucht werden kann." (Autorenreferat, IAB-Doku)
-
Literaturhinweis
Methods in empirical economics: a selective review with applications (2013)
Zitatform
Hübler, Olaf (2013): Methods in empirical economics. A selective review with applications. (Universität Hannover, Wirtschaftswissenschaftliche Fakultät. Diskussionspapier 513), Hannover, 54 S.
Abstract
"Der Beitrag behandelt einige selektive Aspekte ökonometrischer Standardmethoden und neuerer Entwicklungen in der Ökonometrie, die wichtig sind für Anwendungen im Bereich von Mikrodaten. Das Spektrum umfasst Varianzschätzer, Messung von Ausreißern, Probleme bei nur partiell identifizierten Parametern, nichtlineare Modelle, Instrumentalvariablen, Methoden zur Analyse von Paneldaten bei zeitinvarianten Regressoren, Differenz-von-Differenzen Schätzer, Matchingverfahren, Treatmenteffekte im Rahmen von Quantilsregressionen und Regression-Discontinuity-Ansätze. Diese Methoden werden angewandt auf Produktionsfunktionen unter Verwendung von IAB-Betriebspaneldaten." (Autorenreferat, IAB-Doku)
-
Literaturhinweis
Ökonometrische Prognoseverfahren für Paneldaten (2012)
Zitatform
Aßmann, Christian, Susanne Rässler & Katja Wolf (2012): Ökonometrische Prognoseverfahren für Paneldaten. In: P. Mertens & S. Rässler (Hrsg.) (2012): Prognoserechnung, S. 153-166.
Abstract
"Wiederholungsbefragungen von mehreren Individuen zu wiederkehrenden Zeitpunkten liefern einen reichhaltigen Datenschatz, die sogenannten Paneldaten. Die zweidimensionale Struktur von Paneldaten, bei denen für eine bestimmte Gruppe von Querschnittseinheiten (dies können etwa Personen, Haushalte oder Betriebe sein) interessierende Variablen an mehreren Zeitpunkten erhoben werden, erlaubt die Anwendung reichhaltigerer und realistischerer ökonometrischer Spezifikationen als dies bei Verwendung von Querschnitts- oder Zeitreihendaten allein der Fall wäre (vgl. z.B. [17]). So ermöglicht die Analyse von Paneldaten unter anderem, unbeobachtete zeitkonstante Unterschiede zwischen den einzelnen Querschnittseinheiten innerhalb des Modells zu kontrollieren. Dies gilt sowohl für systematische als auch unsystematische Formen solch einer individuenspezifischen Heterogenität. Bekannte Beispiele für deutsche Paneldaten sind etwa das Sozioökonomische Panel (SOEP), das Nationale Bildungspanel (NEPS) oder das IAB-Betriebspanel. Weitere Beispiele betriebswirtschaftlicher Natur (GfK-Panel) finden sich in Kapitel 19 dieses Buches." (Autorenreferat, IAB-Doku)
Beteiligte aus dem IAB
Wolf, Katja; -
Literaturhinweis
New data dissemination approaches in old Europe: synthetic datasets for a German establishment survey (2012)
Zitatform
Drechsler, Jörg (2012): New data dissemination approaches in old Europe. Synthetic datasets for a German establishment survey. In: Journal of applied statistics, Jg. 39, H. 2, S. 243-265., 2011-04-19. DOI:10.1080/02664763.2011.584523
Abstract
Die Veröffentlichung von Mikrodaten mit hohem Nutzen unter Einhaltung des Schutzes der Anonymität der Befragten ist eine schwierige Aufgabe. Die Erzeugung multipler imputierter synthetischer Datensätze ist ein innovatives statistisches Verfahren der Offenlegungskontrolle, mit dem dieses Ziel erreicht werden kann. Bisher war dieser Ansatz nur für einige Datensätze in den USA erfolgreich angewendet worden. In diesem Aufsatz wird die erste erfolgreiche Implementation außerhalb der USA vorgestellt: die Erzeugung von partiell synthetischen Datensätzen für das IAB-Betriebspanel. Beschrieben wird die gesamte Entwicklung des Projektes: von ersten Diskussionen über Risikovariablen bis zur endgültigen Synthese. Präsentiert werden außerdem Ergebnisse der Evaluation des Offenlegungsrisikos und erste Ergebnisse bezüglich der Datenqualität der generierten Datensätze. Ein Varianzinflations-Imputationsmodell wird vorgestellt, welches zusätzliche Variabilität für Daten bietet, welche durch die Standardsynthese nicht ausreichend geschützt sind. (IAB)
-
Literaturhinweis
Why don't they answer?: Unit non-response in the IAB Establishment Panel (2012)
Janik, Florian; Kohaut, Susanne;Zitatform
Janik, Florian & Susanne Kohaut (2012): Why don't they answer? Unit non-response in the IAB Establishment Panel. In: Quality & quantity, Jg. 46, H. 3, S. 917-934., 2010-02-02. DOI:10.1007/s11135-011-9436-y
Abstract
"The paper proposed focuses on the unit-nonresponse in the IAB (Institute for Employment Research) Establishment Panel, a comprehensive data set describing the employer side of the labour market in Germany. Every year since 1993 (1996) the IAB Establishment Panel has surveyed the same establishments from all branches and different size categories in western (eastern) Germany. Although great efforts are taken to convince the owner/manager to take part in the survey there are always firms that do not answer the questionnaire. In this paper the authors try to find out why some establishments are not willing or able to respond to the questionnaire. If the respondent has the authority to provide relevant information, is able to give reliable answers to the questions with a justifiable amount of effort and is interested in the survey in business terms, participation is less frequently refused. The results also confirm the central significance of the interaction between the respondent and the interviewer. If one of the two individuals changes, the probability of further participation falls clearly." (Author's abstract, IAB-Doku) ((en))
Beteiligte aus dem IAB
Kohaut, Susanne; -
Literaturhinweis
Daten des IAB-Betriebspanels und Firmenpaneldaten aus Erhebungen der Amtlichen Statistik - substitutive oder komplementäre Inputs für die Empirische Wirtschaftsforschung? (2012)
Zitatform
Wagner, Joachim (2012): Daten des IAB-Betriebspanels und Firmenpaneldaten aus Erhebungen der Amtlichen Statistik - substitutive oder komplementäre Inputs für die Empirische Wirtschaftsforschung? (Universität Lüneburg. Working paper series in economics 252), Lüneburg, 18 S.
Abstract
"Repräsentative Längsschnittdaten für Firmen (Betriebe bzw. Unternehmen), die für wissenschaftliche Auswertungen genutzt werden können, stammen in Deutschland vor allem aus zwei Quellen, dem IAB-Betriebspanel und den AFiD-Panel, wobei das Akronym AFiD für Amtliche Firmendaten für Deutschland steht, die von den Statistischen Ämtern erhoben werden. In diesem Beitrag werden sechs Aspekte für einen Vergleich dieser beiden Datenquellen herangezogen. Es zeigt sich, dass es sich hierbei um komplementäre und nicht um substitutive Inputs für die Empirische Wirtschaftsforschung handelt. Beide haben jeweils spezifische Stärken und Schwächen, die sie zur Analyse von konkreten Fragestellungen mehr oder weniger gut geeignet oder auch völlig ungeeignet machen. Daraus folgt, dass der Werkzeugkasten für die empirischen Forschung mit Längsschnittdaten für Firmen in Deutschland sowohl das IAB-Betriebspanel als auch die AFiD-Panel enthalten muss, denn nur so ist sicher gestellt, dass ein möglichst breites Spektrum von Fragestellungen mit jeweils adäquaten Daten untersucht werden kann." (Autorenreferat, IAB-Doku)
-
Literaturhinweis
Disclosure risk from factor scores in a remote access environment (2011)
Zitatform
Bleninger, Philipp, Jörg Drechsler & Gerd Ronning (2011): Disclosure risk from factor scores in a remote access environment. (Joint UNECE/Eurostat work session on statistical data confidentiality 2011. Working paper 02), New York, 14 S.
Abstract
Fernzugriff (Remote Access) ist ein vielversprechendes Werkzeug, um den Zugriff auf Mikrodaten zu erweitern, ohne Vertraulichkeitsregelungen zu verletzen. In einer Fernzugriffsumgebung schickt der Benutzer Suchfragen an ein System der Statistikbehörde und nur die Ergebnisse der Fragen werden an den Benutzer übermittelt. Da kein direkter Zugriff auf die Daten gewährt wird, ist im Allgemeinen keine Veränderung der zugrundeliegenden Mikrodaten erforderlich. Dennoch birgt Fernzugriff das Risiko, sensitive Daten offenzulegen, obwohl die tatsächlichen Daten nicht direkt zugänglich sind. Die risikoreichsten Fragen werden leicht entdeckt und können durch das System unterdrückt werden. Allerdings können komplexere Prozeduren wie multivariante Analysen auch zu einer Verletzung der Vertraulichkeit führen, wenn sie auf anspruchsvollem Niveau angewendet werden, um bestimmte Merkmale der Daten zu nutzen. Es wird gezeigt, wie ein Eindringling allgemein übliche Faktorenanalysen benutzen kann, um sensitive Informationen, betreffend der zugrundeliegenden Mikrodaten, zu erlangen. Das generelle Konzept wird vorgestellt und der Ansatz anhand des IAB-Betriebspanels evaluiert. Es gibt theoretische und empirische Befunde für ein hohes Offenlegungsrisiko durch Faktorenanalyse. (IAB)
Weiterführende Informationen
-
Literaturhinweis
Remote data access and the risk of disclosure from linear regression: an empirical study (2011)
Zitatform
Bleninger, Philipp, Jörg Drechsler & Gerd Ronning (2011): Remote data access and the risk of disclosure from linear regression. An empirical study. In: J. Domingo-Ferrer & E. Magkos (Hrsg.) (2011): Privacy in statistical databases : UNESCO Chair in Data Privacy, International Conference, PSD 2010, Corfu, Greece, September 22-24, 2010. Proceedings (Lecture notes in computer science, 6344), S. 220-233, 2010-01-01. DOI:10.1007/978-3-642-15838-4_20
Abstract
Wenn es darum geht, Wege zu finden, um Wissenschaftlern, die nicht in einem statistischen Amt beschäftigt sind, einen einfachen Datenzugang zu ermöglichen, scheint der Fernzugriff auf Daten eine gute Alternative zur gegenwärtigen Praxis zu sein, entweder die Daten vor der Freigabe zu verändern oder einen Zugriff auf bestimmte Datenarchive oder Forschungsdatenzentren zu beschränken. Die Perturbation von Daten wird von Wissenschaftlern oft nicht akzeptiert, da sie die Ergebnisse aus veränderten Datensätzen nicht für verlässlich halten; auf der anderen Seite stellt ein Zugriff vor Ort sowohl für die Wissenschaftler als auch für die Institution, die die Daten zur Verfügung stellt, eine zeitliche und finanzielle Belastung dar. Die Nachteile beider Verfahren werden bei einem Fernzugriff vermieden. Obwohl dabei die Mikrodaten den Wissenschaftlern nicht direkt zur Verfügung stehen, besteht dabei dennoch die Möglichkeit, sensible Informationen über einzelne Befragte zu gewinnen. In dem Beitrag wird gezeigt, wie allgemein verfügbare Hintergrundinformationen genutzt werden können, um mittels einfacher linearer Regression sensible Informationen zu enthüllen. Die tatsächlichen Risiken werden anhand einer empirischen Evaluation auf der Basis des IAB-Betriebspanels aufgezeigt. Obwohl diese Form der missbräuchlichen Nutzung leicht verhindert werden kann, wenn sich die Behörde des Problems bewusst ist, zeigt die Simulation doch deutlich, dass viele - auch bisher nicht offensichtliche - Wege existieren können, um mittels multivariater Analysemethoden sensible Informationen zu erhalten. Deshalb sollten Behörden, die über eine Implementierung eines Fernzugriffs nachdenken, sorgfältig abwägen, welche Abfragen zugelassen werden sollen. (IAB)
-
Literaturhinweis
Remote data access and the risk of disclosure from linear regression (2011)
Zitatform
Bleninger, Philipp, Jörg Drechsler & Gerd Ronning (2011): Remote data access and the risk of disclosure from linear regression. In: Statistics and operations research transactions (SORT) H. Special Issue, S. 7-24., 2011-01-03.
Abstract
Wenn es darum geht, Wege zu finden, um Wissenschaftlern, die nicht in einem statistischen Amt beschäftigt sind, einen einfachen Datenzugang zu ermöglichen, scheint der Fernzugriff auf Daten eine gute Alternative zur gegenwärtigen Praxis zu sein, entweder die Daten vor der Freigabe zu verändern oder einen Zugriff auf bestimmte Datenarchive oder Forschungsdatenzentren zu beschränken. Die Perturbation von Daten wird von Wissenschaftlern oft nicht akzeptiert, da sie die Ergebnisse aus veränderten Datensätzen nicht für verlässlich halten; auf der anderen Seite stellt ein Zugriff vor Ort sowohl für die Wissenschaftler als auch für die Institution, die die Daten zur Verfügung stellt, eine zeitliche und finanzielle Belastung dar. Die Nachteile beider Verfahren werden bei einem Fernzugriff vermieden. Obwohl dabei die Mikrodaten den Wissenschaftlern nicht direkt zur Verfügung stehen, besteht dabei dennoch die Möglichkeit, sensible Informationen über einzelne Befragte zu gewinnen. In dem Beitrag wird gezeigt, wie allgemein verfügbare Hintergrundinformationen genutzt werden können, um mittels einfacher linearer Regression sensible Informationen zu enthüllen. Die tatsächlichen Risiken werden anhand einer empirischen Evaluation auf der Basis des IAB-Betriebspanels aufgezeigt. Obwohl diese Form der missbräuchlichen Nutzung leicht verhindert werden kann, wenn sich die Behörde des Problems bewusst ist, zeigt die Simulation doch deutlich, dass viele - auch bisher nicht offensichtliche - Wege existieren können, um mittels multivariater Analysemethoden sensible Informationen zu erhalten. Deshalb sollten Behörden, die über eine Implementierung eines Fernzugriffs nachdenken, sorgfältig abwägen, welche Abfragen zugelassen werden sollen. (IAB)
-
Literaturhinweis
Erzeugung synthetischer Datensätze durch multiple Imputation: Theorie und Implementierung in der Praxis. Gerhard-Fürst-Preis (2011)
Zitatform
Drechsler, Jörg (2011): Erzeugung synthetischer Datensätze durch multiple Imputation. Theorie und Implementierung in der Praxis. Gerhard-Fürst-Preis. In: Wirtschaft und Statistik H. 4, S. 402-407.
Abstract
"In den letzten Jahren wurden in der Literatur verschiedene Varianten zur Erzeugung synthetischer Daten vorgeschlagen. Im Rahmen der hier vorgestellten Dissertation wurden diese Verfahren miteinander verglichen und jeweils auf das Betriebspanel des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) der Bundesagentur für Arbeit angewendet. Ein wichtiges Ergebnis dieser Arbeit sind die synthetischen Datensätze der Welle 2007 des IAB-Betriebspanels, die seit Anfang 2011 über das Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung verfügbar sind. Außerdem wird ein neues zweistufiges Imputationsverfahren vorgestellt, das eine bessere Abwägung zwischen der Begrenzung des Re-Identifikationsrisikos und einer möglichst hohen Datenqualität zulässt. Daneben werden neue Maße vorgeschlagen, um das verbleibende Re-Identifikationsrisiko der synthetischen Datensätze zu messen. In dem Beitrag sollen die einzelnen Verfahrensvarianten und wichtige Ergebnisse der Arbeit kurz vorgestellt werden." (Textauszug, IAB-Doku)
-
Literaturhinweis
Using support vector machines for generating synthetic datasets (2011)
Zitatform
Drechsler, Jörg (2011): Using support vector machines for generating synthetic datasets. In: J. Domingo-Ferrer & E. Magkos (Hrsg.) (2011): Privacy in statistical databases : UNESCO Chair in Data Privacy, International Conference, PSD 2010, Corfu, Greece, September 22-24, 2010. Proceedings (Lecture notes in computer science, 6344), S. 148-161. DOI:10.1007/978-3-642-15838-4
Abstract
Die Herstellung synthetischer Datensätze ist ein innovativer Ansatz zur Verbreitung von Daten. Werte, die mit einem Enthüllungsrisiko verbunden sind oder sogar der gesamte Datensatz werden durch Mehrfachziehungen aus statistischen Modellen ersetzt. Die Qualität dieser Daten hängt dabei in hohem Maße davon ab, inwieweit diese Modelle wichtige Beziehungen in den Originaldaten abbilden. Da die Entwicklung dieser Modelle schwierig und aufwändig ist, ist es sinnvoll, bei der Modellierung lernende Tools einzusetzen, um wichtige Beziehungen in den Daten zu identifizieren. In dem Beitrag werden erste Überlegungen angestellt, ob Support Vector Machines zur Entwicklung synthetischer Datensätze genutzt werden können. Die Anwendung beschränkt sich auf kategoriale Daten, eine Analyse kontinuierlicher Daten ist jedoch auch möglich. Das Konzept der Support Vector Machine sowie die notwendigen Anpassungen zur Generierung synthetischer Datensätze werden kurz beschrieben. Anhand des IAB-Betriebspanels wird die Leistungsfähigkeit des vorgeschlagenen Algorithmus getestet. Die Ergebnisse zeigen, dass mit Support Vector Machiness zwar eine Verbesserung der Daten erzielt werden kann; der Preis dafür ist jedoch ein erhöhtes Enthüllungsrisiko im Vergleich zu parametrischen Modellen und ein erhöhter Aufwand, um dieses Risiko zu minimieren. Dieses Thema wird abschließend diskutiert. (IAB)
-
Literaturhinweis
Multiple imputation in practice: a case study using a complex German establishment survey (2011)
Zitatform
Drechsler, Jörg (2011): Multiple imputation in practice. A case study using a complex German establishment survey. In: Advances in statistical analysis, Jg. 95, H. 1, S. 1-26. DOI:10.1007/s10182-010-0136-z
Abstract
"Multiple imputation is widely accepted as the method of choice to address item nonresponse in surveys. Nowadays most statistical software packages include features to multiply impute missing values in a dataset. Nevertheless, the application to real data imposes many implementation problems. To define useful imputation models for a dataset that consists of categorical and possibly skewed continuous variables, contains skip patterns and all sorts of logical constraints is a challenging task. Besides, in most applications little attention is paid to the evaluation of the underlying assumptions behind the imputation models.
In this paper, we present a case study from a complex imputation project at the German Institute for Employment Research (IAB): the imputation of missing values in one wave of the IAB Establishment Panel. We discuss possible ways to handle the problems mentioned above and provide an overview which of these problems can be tackled by which imputation software. The detailed review of our imputation project that also includes a discussion on how we monitored the quality of the imputation models will be a useful guide for other agencies willing to implement the approach for their own surveys." (Author's abstract, IAB-Doku) ((en)) -
Literaturhinweis
Methodenreport: Synthetische Scientific-Use-Files der Welle 2007 des IAB-Betriebspanels (2011)
Zitatform
Drechsler, Jörg (2011): Methodenreport: Synthetische Scientific-Use-Files der Welle 2007 des IAB-Betriebspanels. (FDZ-Methodenreport 01/2011 (de)), Nürnberg, 19 S.
Abstract
"Die Bereitstellung von Scientific-Use-Files für Betriebsdaten stellt für die Forschungsdatenzentren eine besondere Herausforderung dar. Aufgrund der kleineren Grundgesamtheiten, dem hohen Auswahlsatz und der oft extrem schiefen Verteilung einzelner Variablen ist eine Reidentifikation einzelner Befragungsteilnehmer wesentlich leichter möglich als beispielsweise bei Haushaltsbefragungen. Einfache Maßnahmen wie Vergröberungen bei einzelnen kategorialen Variablen sind daher nicht ausreichend, um den Datenschutz zu gewährleisten. Bei der Erzeugung synthetischer Datensätze wird versucht, ein möglichst exaktes Abbild der Originaldaten zu erzeugen, wobei sensible Merkmale und Merkmale, die zu einer Reidentifikation führen könnten durch mehrfach imputierte Werte ersetzt werden. Neben einer Einführung in das Verfahren bietet dieser Methodenreport hilfreiche Hinweise, die es bei der Nutzung der synthetischen Datensätze zu beachten gilt. Zudem wird erklärt, wie der Datennutzer vorgehen muss, um mit den synthetischen Datensätzen valide Ergebnisse zu erhalten. Abschließend zeigen erste Analyseergebnisse das Potenzial aber auch die Grenzen der erzeugten Datensätze auf." (Autorenreferat, IAB-Doku)
Aspekt auswählen:
Aspekt zurücksetzen
- FDZ Publikationen / FDZ publications
- Arbeiten und Lernen im Wandel / Working and Learning in a Changing World (ALWA)
- BA-Beschäftigtenpanel / BA Employment Panel
- Berufliche Weiterbildung und lebenslanges Lernen (WeLL)/Further Training and Lifelong Learning (WeLL
- Berufstätigenerhebung 1989 (BTE1989) / Employment survey for East Germany (DDR) 1989 (BTE1989)
- Beschäftigtenbefragung "Bonuszahlungen, Lohnzuwächse und Gerechtigkeit" - BLoG
- Betriebsbefragung IAB-IZA-ZEW-Arbeitswelt 4.0 (BIZA) und DiWaBe-Beschäftigtenbefragung
- Biografiedaten dt. Sozialversicherungsträger / Biographical data of social insurances (BASiD)
- Children of Immigrants Longitudinal Survey in Four European Countries - Germany verknüpft mit administrativen Daten des IAB
- Daten der Treuhandanstalt verknüpft mit Betriebs-Historik-Panel (THA-BHP)
- Datensatz NEPS-SC1-ADIAB Neugeborene
- Datensatz NEPS-SC3-ADIAB Schüler Klasse 5
- Datensatz NEPS-SC4-ADIAB Schüler Klasse 9
- Datensatz NEPS-SC5-ADIAB Studierende
- Datensatz NEPS-SC6-ADIAB Erwachsene
- Datensatz SOEP-CMI-ADIAB
- Datenspeicher Gesellschaftliches Arbeitsvermögen verknüpft mit administrativen Daten des IAB (GAV-ADIAB) 1975-2019
- GAW-IAB-Gründerbefragung
- German Management and Organizational Practices (GMOP) Survey
- IAB-BAMF-SOEP Befragung von Geflüchteten
- IAB-Beschäftigtenstichprobe / IAB Employment Sample
- IAB-Betriebs-Historik-Panel / IAB Establishment History Panel
- IAB-Betriebspanel / IAB Establishment Panel
- IAB-Datensatz BeCovid
- IAB-Datensatz HOPP
- IAB-Linked-Employer-Employee-Datensatz (LIAB) / Linked Employer-Employee Data from the IAB
- IAB-Querschnittsbefragung / Cross-sectional survey
- IAB-SOEP Migrationsstichprobe (IAB-SOEP MIG)
- IAB-Stellenerhebung / IAB Job Vacancy Survey
- International Mobility Panel of Migrants in Germany (IMPa)
- IZA/IAB Administrativer Evaluationsdatensatz (AED und LED) / IZA Evaluation Dataset Survey
- Kundenbefragung zu Organisationsstrukturen nach SGB II / Client survey on German SGBII-Agencies
- LidA - Leben in der Arbeit
- Linked Inventor Biography Data
- Linked Personnel Panel (LPP)
- Mannheimer Unternehmenspanel (MUP) verknüpft mit Daten des IAB
- Panel Arbeitsmarkt und soziale Sicherung (PASS) / Panel Study Labour Market and Social Security
- Stichprobe Integrierter Employer-Employee Daten (SIEED)/Sample of Integrated Employer-Employee Data
- Stichprobe der Integr. Arbeitsmarktbiografien/Sample of integrated labour market biographies (SIAB)
- Stichprobe der Integrierten Grundsicherungsbiografien (SIG)
- Stichprobe des Administrative Wage and Labor Market Flow Panel (FDZ-AWFP)
- Studie Mentale Gesundheit bei der Arbeit (S-MGA)
