Prototypbasierte Data Mining Verfahren repräsentieren eine Klasse oder einen
Cluster von Datenobjekten durch eine Menge von Prototypen. Ein Prototyp ist dabei
ein Datenobjekt, dass die zugehörige Gruppe von Datenobjekten innerhalb der gegebenen
Data Mining-Aufgabe repräsentiert. Die Vorteile von Prototyp-Modellen sind zahlreich.
Z.B. ermöglicht die starke Reduktion der Datenobjekte eine anschauliche Visualisierung
der gesamten Datenmenge. Ein anderer wichtiger Vorteil ist, dass Prototyp-Modelle eine
gegebene Datenmenge gut generalisieren können. Bekannte Beispiele für einfache prototypbasierte
Verfahren sind k-Means oder k-Medoid Clusterings. Des Weiteren gibt es viele Data Mining Verfahren
wie Self-Organizing-Maps (SOM) oder Support Vector Machines (SVMs), die man ebenfalls unter
dem Blickwinkel der Prototyp-Modelle betrachten kann.
Ziel dieses Projekts ist die Entwicklung neuer prototypbasierter Clustering und Klassifikations-Algorithmen.
Ein weiterer Aspekt dieses Projekts ist es die zahlreichen Verbindungen zu anderen Ansätzen im maschinellen
Lernen und im Data Mining herzuleiten, um damit einen besseren Vergleich zu bereits erforschten Gebieten zu
haben. Ein letzter wichtiger Aspekt ist die möglichst deskriptive Darstellung von allgemeinen Prototyp-Modellen,
um so einen intuitiven Zugang zu komplexen Datenmengen zu erhalten.
Teilaufgaben:
Weiterentwicklung von prototypbasierten Klassifikationsalgorithmen
Entwicklung von Modellen zur Auswahl der richtigen Anzahl an Prototypen
Prototypbasiertes Clustering unter Berücksichtung maximaler Ränder
Neue Visualisierungstechniken für Prototyp-Modelle
Vorkenntnisse
Kenntnisse in Java oder C++ werden
vorrausgesetzt.
KDD (I) .
Wünschenswert: Maschinelles Lernen und Data Mining, KDD II, Kernel Methods in Bioinformatics
Ansprechpartner
Matthias
Schubert
Raum : E 1.09
Mail : schubert ( at ) dbs.ifi.lmu.de