The validity of data fusion
Beschreibung
In dem Beitrag werden Bounds für die Korrelation zwischen Variablen, die nicht gemeinsam beobachtet wurden, entwickelt, unter der Voraussetzung, dass einer der Vektoren der spezifischen Variablen univariat ist, und es wird ein neuer Qualitätsindex der Datenfusion vorgeschlagen, der auf diesen Bounds basiert. Mithilfe dieser Ergebnisse können durch geeignete Algorithmen multipel imputierte Datensätze produziert werden, die unterschiedlichen zulässigen Korrelationsstrukturen zwischen X und Y ensprechen (wenn man Datenfusion als ein Problem fehlender Daten betrachtet, sind multiple Imputationen allgemein anwendbar). Die Analyse der unterschiedlichen fusionierten Datensätze zeigt die Sensitivität hinsichtlich verschiedener Annahmen über die Korrelationsstruktur zwischen Variablen, die nie gemeinsam beobachtet wurden. (IAB)
Zitationshinweis
Kiesl, Hans & Susanne Rässler (2009): The validity of data fusion. In: E. Europäische Gemeinschaft (Hrsg.) (2009): Insights on Data Integration Methodologies : ESSnet-ISAD workshop, Vienna, 29-30 May 2008, S. 60-67. DOI:10.2785/20079