Quality in data fusion

Beschreibung

Unter Datenfusion versteht man Techniken, Datensätze aus mindestens zwei verschiedenen Erhebungen mit nicht identischen Variablenmengen so zu verknüpfen, dass jeder Beobachtung der einen Erhebung Daten aus den anderen Erhebungen hinzugefügt werden. Als problematisch bei den traditionellen Algorithmen der Datenfusion erweist es sich, Zusammenhänge zwischen Variablen herzustellen, die niemals gemeinsam beobachtet wurden. Davon ausgehend referieren die Autoren über Identifikationsprobleme bei der Datenfusion. So können die gemeinsamen Verteilungen bzw. Korrelationen der nicht gemeinsam beobachteten Variablen nicht eindeutig geschätzt werden, allerdings lassen sich jeweils Bandbreiten für die möglichen Werte bestimmen: die gemeinsamen Verteilungen werden von den Frechet-Hoeffding-Grenzen eingeschränkt, die Korrelationsmatrizen müssen positiv semidefinit sein. Die Menge der zulässigen Korrelationsmatrizen kann im Allgemeinen nur simulativ ermittelt werden. Die Autoren geben in ihrem Beitrag eine analytische Bestimmung der zulässigen Korrelationen an und schlagen ein neues Qualitätsmaß für Datenfusionen vor. (IAB)

Zitationshinweis

Kiesl, Hans & Susanne Rässler (2006): Quality in data fusion. Cardiff, 8 S.

Bezugsmöglichkeiten

kostenfreier Zugang

Weitere Informationen

Hier finden Sie Informationen zur "European Conference on Quality in Survey Statistics (Q2006)", auf der das Papier präsentiert wurde.