Lehr- und Forschungseinheit für Datenbanksysteme
Datenbanksysteme
Database Systems

Prototypbasiertes Data Mining


Prototypbasierte Data Mining Verfahren repräsentieren eine Klasse oder einen Cluster von Datenobjekten durch eine Menge von Prototypen. Ein Prototyp ist dabei ein Datenobjekt, dass die zugehörige Gruppe von Datenobjekten innerhalb der gegebenen Data Mining-Aufgabe repräsentiert. Die Vorteile von Prototyp-Modellen sind zahlreich. Z.B. ermöglicht die starke Reduktion der Datenobjekte eine anschauliche Visualisierung der gesamten Datenmenge. Ein anderer wichtiger Vorteil ist, dass Prototyp-Modelle eine gegebene Datenmenge gut generalisieren können. Bekannte Beispiele für einfache prototypbasierte Verfahren sind k-Means oder k-Medoid Clusterings. Des Weiteren gibt es viele Data Mining Verfahren wie Self-Organizing-Maps (SOM) oder Support Vector Machines (SVMs), die man ebenfalls unter dem Blickwinkel der Prototyp-Modelle betrachten kann. Ziel dieses Projekts ist die Entwicklung neuer prototypbasierter Clustering und Klassifikations-Algorithmen. Ein weiterer Aspekt dieses Projekts ist es die zahlreichen Verbindungen zu anderen Ansätzen im maschinellen Lernen und im Data Mining herzuleiten, um damit einen besseren Vergleich zu bereits erforschten Gebieten zu haben. Ein letzter wichtiger Aspekt ist die möglichst deskriptive Darstellung von allgemeinen Prototyp-Modellen, um so einen intuitiven Zugang zu komplexen Datenmengen zu erhalten.

Teilaufgaben:

Vorkenntnisse

Ansprechpartner

Matthias Schubert Raum : E 1.09
Mail : schubert ( at ) dbs.ifi.lmu.de
Homepages: home DBShome Instituthome LMU
16.12.2005 Matthias Schubert