Springe zum Inhalt

Projekt

Zur Integration von Datenspenden in Befragungsinfrastrukturen: Quantifizierung, Erklärung und Adressierung von Stichproben- und Messfehlern

Projektlaufzeit: 01.03.2024 bis 30.06.2027

Kurzbeschreibung

Die Daten, die über Smartphone-Sensoren und -Logs gesammelt werden, ermöglichen Forschenden einen detaillierten Einblick in verschiedene Aspekte des Alltags der Menschen, die für Arbeitsmarktoutcomes bestimmend sein können, darunter Informationen zu sozialen Interaktionen, körperlicher Aktivität, Mobilität und Arbeitssuche. Um Zugriff auf diese Daten zu erhalten, besteht eine Möglichkeit darin, Einzelpersonen zu bitten, eine Forschungs-App auf ihr Smartphone herunterzuladen, die dann passiv Daten auf dem Gerät erhebt. In der IAB-SMART-Studie im Jahr 2018 haben wir Teilnehmende der Panelstudie Arbeitsmarkt und soziale Sicherung (PASS) eingeladen, eine Forschungs-App auf ihr Smartphone herunterzuladen und Daten über einen Zeitraum von 6 Monaten erhoben (Kreuter et al. 2020). Der RatSWD bespricht die Studie in seinen Empfehlungen ausführlich als Best-Practice-Beispiel für die datenschutzkonforme Erhebung digitaler Verhaltendaten (RATSWD 2020) Die Ergebnisse von IAB-SMART verdeutlichen sowohl die Vorteile, als auch die Herausforderungen des Forschungs-App-Ansatzes. Während wir in der Lage waren, über einen längeren Zeitraum detaillierte Informationen von den Teilnehmenden zu erheben, stellten wir fest, dass der Ansatz Einschränkungen in Bezug auf die Abdeckung (die IAB-SMART-App funktionierte nur auf Android-Smartphones), die Nichtteilnahme (rund 16 % der eingeladenen PASS-Mitglieder luden die App herunter und stellten Daten zur Verfügung), und Messung (fehlende Informationen darüber, was die Teilnehmer in einer App getan haben) hat. Ein kürzlich entwickelter Ansatz zur Erhebung von Daten von Smartphones ist die Datenspende (Boeschoten et al. 2022), die das Recht der betroffenen Personen in der EU-DSGVO nutzt, die Daten, die ein für die Datenverarbeitung Verantwortlicher (z. B. Smartphone-App oder Social-Media-Plattform) über sie gespeichert hat, in einem strukturierten, gängigen und maschinenlesbaren Format zu erhalten und an andere für die Datenverarbeitung Verantwortliche (z. Forschende) zu spenden. Der Ansatz der Datenspende hat den Vorteil, dass keine Installation einer App erforderlich ist und die Teilnehmenden nur vorhandene Daten mit Forschenden teilen, wodurch sie ein höheres Maß an Kontrolle darüber ausüben, welche Daten für welchen Zeitraum geteilt werden. Es ist jedoch noch sehr wenig darüber bekannt, wie die Datenspende am besten datenschutzkonform in die bestehende Infrastruktur der Befragungsdatenerfassung implementiert werden kann und wie Repräsentations- und Messfehler durch das Design der Datenspendestudie beeinflusst werden. Mit diesem Projekt werden wir diese Lücke schließen, indem wir die Datenspende in bestehende Befragungsinfrastrukturprojekte des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) implementieren. Wir planen, Teilnehmende aus dem PASS-Panel sowie einem kommerziellen Online-Access-Panel zu bitten, ausgewählte Daten über ihre Nutzung und ihr Verhalten auf Social-Media-Plattformen (einschließlich allgemeiner Social-Media-Plattformen wie Facebook oder X, aber auch arbeitsbezogene Social-Media-Plattformen wie LinkedIn oder Jobportale) zu spenden. Dabei werden Extraktionsskripte verwendet, die sicherstellen, das ausschließlich Informationen erhoben werden, die für noch näher zu definierende inhaltliche Projekte der Arbeitsmarkt- und Berufsforschung (z.B. zu Arbeitssuchwegen und Sucherfolg, sozialen Netzwerken und Erwerbseinkommen) erforderlich sind. Aufbauend auf unserer methodischen Arbeit zur Datenqualität, die im Rahmen der IAB-SMART-Studie durchgeführt wurde und planen wir, Forschungsfragen zu Abdeckung, Nichtteilnahme und Messqualität des Datenspendeansatzes zu beantworten. Das Projekt besteht aus vier Arbeitspaketen, von denen nur Arbeitspaket 2 in Verantwortung des IAB liegt: Um Best Practices für die Kontaktaufnahme mit Teilnehmern zu etablieren, testet AP1 verschiedene Umfragedesignstrategien (z. B. Anreize, Formulierung der Datenspendeanfrage) in einem Non-Probability Sample. In AP2 replizieren und erweitern wir identifizierte Best Practices in einer Wahrscheinlichkeitsstichprobe aus der Panelstudie Arbeitsmarkt und soziale Sicherheit (PASS) und prüfen, was unter den besonderen Bedingungen des Sozialdatenschutzes datenschutzrechtlich machbar und technisch umsetzbar ist. Darüber hinaus stützen wir uns auf die probabilistische Natur der PASS-Stichprobe, um systematisch Fehler zu identifizieren, die aufgrund von Nichtabdeckung und Nichtteilnahme auftreten können. AP3 wird sich dann auf Daten beider Studien stützen, um Methoden zur Integration von Daten aus wahrscheinlichkeitsbasierten und nicht-wahrscheinlichkeitsbasierten Stichproben als Mittel zur Behebung dieser Fehler zu entwickeln, während AP4 dies für messbezogene Fehler tut.

Ziel

Investigating error sources like coverage error, nonresponse error and measurement error in donated digital trace data

Methoden

data linkage; experimental research; MTMM; bias estimation

Leitung

Valerie Hase
01.03.2024 - 30.06.2027
Florian Keusch
01.03.2024 - 30.06.2027
Frauke Kreuter
01.03.2024 - 30.06.2027
01.03.2024 - 30.06.2027