Lehr- und Forschungseinheit für Datenbanksysteme Ludwig-Maximilians-Universität München
Institut für Informatik
Lehr- und Forschungseinheit für Datenbanksysteme
University of Munich
Institute for Computer Science
Database and Information Systems



Vorlesung Knowledge Discovery in Databases I
im WS 2008/09


Vorhergehende Jahre:
[ WS 07/08 | WS 06/07 | WS 05/06 | WS 04/05 | WS 03/04 | WS 02/03 | WS 00/01 | WS 99/00 ]


Veranstaltung Zeit Ort Beginn
Vorlesung Di, 13.00 - 16.00 Uhr Raum 1.14 (Oettingenstr. 67) 14.10.2008
Übung


Fr, 12.00 - 14.00 Ühr
Fr, 14.00 - 16.00 Ühr
Raum 0.37 (Oettingenstr. 67)
Raum 0.37 (Oettingenstr. 67)
24.10.2008
24.10.2008


Aktuelles



Inhalt:
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Meßverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.

Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, dem maschinellen Lernen, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozeß, in dem die eigentliche Analyse der Daten durchgeführt wird.
Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in sogenannten Data Warehouses gesondert verwaltet werden.
Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.

Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assozationsregeln.

Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.


- Umfang: 3 + 2 Semesterwochenstunden
- Vorlesung: Dr. Matthias Schubert
- Vorkenntnisse: Vorlesung Datenbanksysteme (wünschenswert)
- Übungen: Dr. Matthias Schubert

Anmeldung zur Übung

Zum Scheinerwerb ist eine Anmeldung zum Übungsbetrieb notwendig.

Die Anmeldung ist nur bis spätestens zum 07.12.2008 möglich.


Vorlesungsplan

Datum Vorlesung Datum Übung
14.10.2008 Einleitung und Merkmalsräume
21.10.2008 Merkmalsräume und Klassifikation 24.10.2008 Merkmalsräume und Klassifikation Blatt 1
28.10.2008 Klassifikation 31.10.2008 Metriken und Klassifikation Blatt 2 Cross-Validation Algorithmus
04.11.2008 Klassifikation 07.11.2008 Merkmalsräume und Klassifikation Blatt 3
11.11.2008 Klassifikation 14.11.2008 Klassifikation Blatt 4
18.11.2008
Klassifikation und Regression 21.11.2008 Klassifikation Blatt 5
25.11.2008 Clustering 28.11.2008 Klassifikation und Regression Blatt 6
Lösung 6-2
2.12.2008 Clustering (Forts.) 5.12.2008 Clustering Blatt 7
Loesung 7-1
09.12.2008 Clustering 12.12.2008 Clustering
16.12.2008 Clustering 19.12.2008 Clustering Blatt 8( Loesung 8-3)
23.12.2008 Outlier Detection 9.01.2009 Clustering und Outlier Detection Blatt 9, Loesung 9-1
13.01.2009 Assoziationsregeln, 16.01.2009 Blatt 10
20.01.2009 DB-Techniken zur Leistungssteigerung 23.01.2009 Blatt 11
27.01.2009 Data Warehousing
30.01.2009
03.02.2009 Wiederholung
06.02.2009 Klausur 14.15 - 16.15

Weiterführende Informationen

Interesante Links zu JAVA:


Homepages:  DBS Institut LMU