E-Mails haben sich in den letzten Jahren zur wichtigsten Methode
asynchroner, elektronischer Kommunikation entwickelt. Der E-Mail
Traffic innerhalb
einer abgegrenzten Gruppe von Personen spiegelt mannigfaltge
Interaktionen und Beziehungen innerhalb dieser Gruppe
wider. Data Mining in E-Mail Traffic Daten ist daher eine interessante
Anwendung, für die neue Analyseverfahren benötigt werden.
Ziel
dieses Projekts ist es, neue Methoden zum Entdecken von
inhaltlichen und zeitlichen Mustern zu entwickeln.
Teilaufgaben:
Extraktion von E-Mail Threads
Kodieren der Threads in geeigneten Repräsentationen
Mustersuche auf Strings, die aus den Threads generiert wurden
Clustering auf Basis der gefundenen Muster
Entwicklung von Vorhersagemodellen mit verzweigten
Markov-Prozessen
(Bei Projektarbeiten wird nicht die Bearbeitung aller Aufgaben
gefordert.)
Vorkenntnisse
Kenntnisse in Java oder C++ werden
vorrausgesetzt.
Techniken aus der KDD-Vorlesung
Grundkenntnisse in Statistik sind ebenfalls hilfreich
Ansprechpartner
Karsten Borgwardt
Raum : E 1.11
Mail : borgwardt (at ) dbs.ifi.lmu.de
Matthias
Schubert
Raum : E 1.09
Mail : schubert ( at ) dbs.ifi.lmu.de