Show Less
Restricted access

Assoziationsregel-Algorithmen für Daten mit komplexer Struktur

Mit Anwendungen im Web Mining

Series:

Lars Schmidt-Thieme

Diese Arbeit beschäftigt sich mit Assoziationsregeln und dem Auffinden häufiger Muster und Strukturen in komplexen Daten, z.B. in folgenwertigen Daten oder Daten, die als Folgen von Mengen beschrieben werden können. Solche Daten fallen in einer Vielzahl von Anwendungskontexten an, unter anderem als Protokolldaten in elektronischen Transaktionssystemen, z.B. in Form von Warenkörben wiederkehrender Besucher eines Online-Shops. Als Hauptbeitrag wird ein abstraktes Verfahren für das Mining häufiger Muster in allgemeinen Musterräumen entwickelt. Klassische Verfahren wie der Apriori-Algorithmus sowie seine zahllosen Varianten können als Spezialisierungen dieses abstrakten Verfahrens aufgefaßt werden. Eine spezielle Datenstruktur, der geschachtelte Prefixbaum, ermöglicht die effiziente Implementation dieses Verfahrens. Mit Hilfe von Schachtelungsoperatoren wird schließlich ein Baukasten für Apriori-artige Mining-Algorithmen zur Verfügung gestellt.
Aus dem Inhalt: Assoziationsregel-Algorithmen für Mengen (Apriori, Eclat, dEclat, FP-growth) – Algorithmen zum Mining häufiger Teilfolgen – Algorithmen zum Mining häufiger verallgemeinerter Teilfolgen – Algorithmen zum Mining häufiger geschachtelter Substrukturen – Anwendungsbeispiel: Recommender-Systeme basierend auf Pfaddaten.