A new name-based sampling method for migrants using n-grams
Beschreibung
"Zu den besten Verfahren für die Konstruktion von Migrantenstichproben gehören namensbasierte Stichproben. Hierfür werden bislang entweder ad-hoc-Listen oder namenskundliche Lexika für die Klassifikation von Namen verwendet. In diesem Beitrag wird ein neues Verfahren vorgeschlagen, das auf der automatischen Klassifikation eines Namens anhand der n-Gramme des Namens und der Anwendung des Bayes-Theorems basiert. Das neue Verfahren ist fehlertolerant gegenüber alternativen Schreibweisen und erlaubt auch die Klassifikation von Namen, die sich nicht in den Lexika finden. Das Verfahren wurde anhand der Namen der ca. 1.600 Ausländer im PASS-Panel und einer CATI-Studie in Hessen untersucht." (Autorenreferat, IAB-Doku)
Zitationshinweis
Schnell, Rainer, Tobias Gramlich, Tobias Bachteler, Jörg Reiher, Mark Trappmann, Menno Smid & Inna Becher (2013): A new name-based sampling method for migrants using n-grams. (German Record-Linkage Center. Working paper series 2013-04), Nürnberg, 27 S.
Bezugsmöglichkeiten
Weitere Informationen
- auch erschienen u.d.T.: "Ein neues Verfahren für namensbasierte Zufallsstichproben von Migranten". German Record-Linkage Center. Working paper series , 2012-02
- spätere (möglw. abweichende) Version erschienen u.d.T.: "Ein neues Verfahren für namensbasierte Zufallsstichproben von Migranten" in: Methoden, Daten, Analysen. Zeitschrift für empirische Sozialforschung, Jg. 7, H. 1 (2013), S. 5-33