Show Less
Restricted access

Record Linkage

Zusammenführung von Daten auf Basis des Modells von Fellegi und Sunter

Series:

Josef Schürle

Diese Arbeit wurde mit dem Gerhard-Fürst-Preis des Statistischen Bundesamtes ausgezeichnet.
Die automatisierte Zusammenführung von Datenquellen (engl. Record Linkage) gewinnt im Rahmen der sekundärstatistischen Informationsgewinnung zunehmend an Bedeutung. Gegenstand der Arbeit ist das zu diesem Zweck entwickelte wahrscheinlichkeitstheoretische Modell von Fellegi und Sunter. Neben einer ausführlichen Diskussion der mathematischen Eigenschaften werden einige gängige Probleme bei der Anwendung thematisiert. Ebenso wird die Schätzung der Modellparameter mit Hilfe des EM Algorithmus behandelt. Die dargestellten Verfahren ermöglichen die Entwicklung leistungsfähiger und breit anwendbarer Software. Ergebnisse, welche im Rahmen einer umfangreichen Simulationsstudie erzielt wurden, werden dargestellt und ausführlich diskutiert.
Aus dem Inhalt: Das Modell von Fellegi und Sunter und seine Anwendung in der Praxis – Methoden zur Schätzung der Modellparameter mit Hilfe des EM Algorithmus – Erprobung der Schätzverfahren anhand einer Simulationsstudie mit ausführlicher Darstellung und Interpretation der Ergebnisse.