Springe zum Inhalt

Publikation

A new name-based sampling method for migrants using n-grams

Beschreibung

"Zu den besten Verfahren für die Konstruktion von Migrantenstichproben gehören namensbasierte Stichproben. Hierfür werden bislang entweder ad-hoc-Listen oder namenskundliche Lexika für die Klassifikation von Namen verwendet. In diesem Beitrag wird ein neues Verfahren vorgeschlagen, das auf der automatischen Klassifikation eines Namens anhand der n-Gramme des Namens und der Anwendung des Bayes-Theorems basiert. Das neue Verfahren ist fehlertolerant gegenüber alternativen Schreibweisen und erlaubt auch die Klassifikation von Namen, die sich nicht in den Lexika finden. Das Verfahren wurde anhand der Namen der ca. 1.600 Ausländer im PASS-Panel und einer CATI-Studie in Hessen untersucht." (Autorenreferat, IAB-Doku)

Zitationshinweis

Schnell, Rainer, Tobias Gramlich, Tobias Bachteler, Jörg Reiher, Mark Trappmann, Menno Smid & Inna Becher (2013): A new name-based sampling method for migrants using n-grams. (German Record-Linkage Center. Working paper series 2013-04), Nürnberg, 27 S.

Bezugsmöglichkeiten

kostenfreier Zugang