Techniken und Einsatzgebiete von Datenintegration und Datenfusion
Abstract
"Unter Datenintegration und Datenfusion versteht man Techniken, Datensätze aus mindestens zwei verschiedenen Erhebungen mit teilweise nicht identischen Variablenmengen so zu verknüpfen, dass jeder Beobachtung der einen Erhebung Daten derselben Beobachtungseinheit (bei Datenintegration) oder einer 'ähnlichen' (bei Datenfusion) aus den anderen Erhebungen hinzugefügt werden. Während es bei der Datenintegration fehlerhafte Werte in den Schlüsselvariablen sind, die den Verknüpfungsprozess schwierig gestalten, kommt bei der Datenfusion eine implizite, nicht überprüfbare Modellvorstellung über Zusammenhänge zwischen den nicht gemeinsam beobachteten Variablen hinzu. In dem Beitrag werden diese implizite Annahme noch einmal verdeutlicht und verschiedene Gütekriterien einer Datenfusion diskutiert; außerdem wird eine alternative Vorgehensweise skizziert, die mit Hilfe multipler Ergänzung die Notwendigkeit dieser Annahme zu überwinden versucht." (Autorenreferat, IAB-Doku)
Cite article
Kiesl, H. & Rässler, S. (2005): Techniken und Einsatzgebiete von Datenintegration und Datenfusion. In: C. König, M. Stahl & E. Wiegand (Hrsg.) (2005): Datenfusion und Datenintegration : 6. Wissenschaftliche Tagung (Tagungsberichte, 10), p. 17-32.