Search:
Lehrstuhl  |  Institut  |  Fakultät  |  LMU
print

Inhaltsverzeichnis

Experimenteller Vergleich von Data Mining-Algorithmen

Für viele Data Mining-Aufgaben wie Clusteranalyse und Outlier-Detection gibt es zahlreiche Algorithmen für das selbe Problem. Für den Anwender ist aber meist nicht klar, welcher der Algorithmen für seine Daten und Anwendung am Besten geeignet ist, und wie die Parameter gewählt werden müssen, damit der Algorithmus brauchbare Ergebnisse liefert.

In unserem Framework ELKI: Environment for Developing KDD-Applications Supported by Index-Structures sind bereits viele solcher Algorithmen implementiert, und können für so einen Vergleich verwendet werden.

Aufgaben

Ziel dieser Bachelor- oder Projekt-Arbeit ist es, die bestehenden Verfahren zu vergleichen und zu testen. Hierzu soll:

  • die Implementierung mit dem ursprünglichen Artikel verglichen werden
  • die Implementierung auf verschiedenen Datensätzen getestet werden, wozu geeignete Parameter gewählt werden müssen
  • die Ergebnisse verschiedener Algorithmen verglichen werden
  • Datensätze ausgewählt und generiert werden, die die Stärken und Schwächen der Algorithmen zeigen
  • Unit-Tests als Regressionstests geschrieben werden, um die fortschreitende Entwicklung von ELKI zu unterstützen.

Vorkenntnisse

  • Vorteilhaft sind Kenntnisse in: Java, Software-Engineering

Hinweis

Die Themen in diesem Bereich sind aktuell alle bearbeitet, wir schauen aber ob wir weiterführende Anschluss-Themen festlegen können. Bitte kommen Sie zu uns in die Sprechstunde(n).

Kontakt

Erich Schubert, Elke Achtert, Arthur Zimek, Peer Kröger

blank
Datenschutz   Impressum