Lehr- und Forschungseinheit für Datenbanksysteme Ludwig-Maximilians-Universität München
Institut für Informatik
Lehr- und Forschungseinheit für Datenbanksysteme
University of Munich
Institute for Computer Science
Database and Information Systems



Vorlesung Knowledge Discovery in Databases I
im WS 2007/08


Vorhergehende Jahre:
[ WS 06/07 | WS 05/06 | WS 04/05 | WS 03/04 | WS 02/03 | WS 00/01 | WS 99/00 ]


Veranstaltung Zeit Ort Beginn
Vorlesung Di, 13.00 - 16.00 Uhr Raum M 014 (Hauptgebäude) 16.10.2007
Übung


Do, 12.00 - 14.00 Uhr
Fr,  12.00 - 14.00 Uhr
Fr,   14.00 -16.00 Uhr
Raum 0.33 (Oettingenstr. 67)
Raum 0.37 (Oettingenstr. 67)
Raum 0.37 (Oettingenstr. 67)
25.10.2007
26.10.2007
26.10.2007


Klausur

Aktuelles



Inhalt:
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Meßverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekomunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.
Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, dem maschinellen Lernen, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozeß, in dem die eigentliche Analyse der Daten durchgeführt wird.
Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in sogenannten Data Warehouses gesondert verwaltet werden.
Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.
Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assozationsregeln.
Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.


- Umfang: 3 + 2 Semesterwochenstunden
- Vorlesung: Dr. Peer Kröger, Dr. Matthias Schubert
- Vorkenntnisse: Vorlesung Datenbanksysteme (wünschenswert)
- Übungen: Dr. Peer Kröger, Dr. Matthias Schubert, Markus Bundschus

Anmeldung zur Übung


Vorlesungsplan

Datum Vorlesung Datum Übung
16.10.2007 Einleitung und Merkmalsräume
25.10.2007 Merkmalsräume 26.10.2007
27.10.2007
Merkmalsräume Blatt 1
30.10.2007 Klassifikation 01.11.2007
02.11.2007
Übung entfällt wegen Feiertag
06.11.2007 Klassifikation 08.11.2007
09.11.2007
Merkmalsräume und Klassifikation Blatt 2
Cross-Validation Algorithmus
13.11.2007 Klassifikation 15.11.2007
16.11.2007
Klassifikation Blatt 3
20.11.2007 Klassifikation und Regression 22.11.2007
23.11.2007
Klassifikation Blatt 4
Lösung Regression
27.11.2007 Clustering 29.11.2007
30.11.2007
Klassifikation und Regression Blatt 5
4.12.2007 Clustering (Forts.) 6.12.2007
7.12.2007
Clustering Blatt 6 (Loesung 6-1)
11.12.2007 Clustering 13.12.2007
14.12.2007
Clustering Blatt 7 (Loesung 7-1)
18.12.2007 Outlier Detection 20.12.2007
21.12.2007
Clustering Blatt 8
08.01.2008 Assoziationsregeln 10.01.2008
11.01.2008
Wiederholung von Blatt 8 (Loesung 8-2)
Achtung: Übung am Donnerstag entfällt, bitte auf Freitag verteilen!
15.01.2008 DB-Techniken zur Leistungssteigerung 17.01.2008
18.01.2008
Clustering, Outlier Detection, Assoziationsregeln Blatt 9 (Loesung 9-1, Loesung 9-3)
22.01.2008 Data Warehousing und Wiederholung
24.01.2008
25.01.2008
entfallen!!!
29.01.2008 Ausblick und Klausurbesprechung

Weiterführende Informationen

Interesante Links zu JAVA:


Homepages:  DBS Institut LMU