Lehrveranstaltungen: Knowledge Discovery in Databases


	Ludwig-Maximilians-Universität München Institut für Informatik Lehr- und Forschungseinheit für Datenbanksysteme	University of Munich Institute for Computer Science Database and Information Systems


Vorlesung Knowledge Discovery in Databases I im WS 2008/09 Vorhergehende Jahre: [ WS 07/08 \| WS 06/07 \| WS 05/06 \| WS 04/05 \| WS 03/04 \| WS 02/03 \| WS 00/01 \| WS 99/00 ]


Veranstaltung	Zeit	Ort	Beginn
Vorlesung	Di, 13.00 - 16.00 Uhr	Raum 1.14 (Oettingenstr. 67)	14.10.2008
Übung	Fr, 12.00 - 14.00 Ühr Fr, 14.00 - 16.00 Ühr	Raum 0.37 (Oettingenstr. 67) Raum 0.37 (Oettingenstr. 67)	24.10.2008 24.10.2008

Aktuelles

Die Einsichtnahme findet am 4.3.2009 um 10.00 in Raum E1.09 statt.
Die Ergebnisse der Klausur vom 6.2.2009 stehen unter Klausurergebnis bereit.
Einzelheiten zur Klausur können sie folgendem Merkblatt zur Klausur entnehmen.
ACHTUNG: Die Klausur zu KDDI findet am Freitag den 06.02.2009 im Hörsaal B101 von 14.15-17.00 statt. Dauer ist voraussichtlich 2 Stunden.
Alternativer Übungstermin: Wir haben donnerstags einen Raum zwischen 10.00-12.00 zugewiesen bekommen. Wer lieber am Do 10.00-12.00 Übung hätte anstatt Fr. 14.00-16.00, sollte bitte bis zum 18.11.2008 eine E-Mail an mich schreiben. Wer dafür ist das die Übung Fr. 14.00-16.00 bleibt, sollte sich bitte ebenfalls bei bis mir zu diesem Termin per E-Mail melden. Als Subject für die Mail bitte "KDD-Übung" angeben.

Inhalt:
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Meßverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.

Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, dem maschinellen Lernen, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozeß, in dem die eigentliche Analyse der Daten durchgeführt wird.
Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in sogenannten Data Warehouses gesondert verwaltet werden.
Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.

Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assozationsregeln.

Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.

- Umfang: 3 + 2 Semesterwochenstunden
- Vorlesung: Dr. Matthias Schubert
- Vorkenntnisse: Vorlesung Datenbanksysteme (wünschenswert)
- Übungen: Dr. Matthias Schubert

Anmeldung zur Übung

Zum Scheinerwerb ist eine Anmeldung zum Übungsbetrieb notwendig.

Die Anmeldung ist nur bis spätestens zum 07.12.2008 möglich.

Vorlesungsplan

Datum	Vorlesung	Datum	Übung
14.10.2008	Einleitung und Merkmalsräume
21.10.2008	Merkmalsräume und Klassifikation	24.10.2008	Merkmalsräume und Klassifikation Blatt 1
28.10.2008	Klassifikation	31.10.2008	Metriken und Klassifikation Blatt 2 Cross-Validation Algorithmus
04.11.2008	Klassifikation	07.11.2008	Merkmalsräume und Klassifikation Blatt 3
11.11.2008	Klassifikation	14.11.2008	Klassifikation Blatt 4
18.11.2008	Klassifikation und Regression	21.11.2008	Klassifikation Blatt 5
25.11.2008	Clustering	28.11.2008	Klassifikation und Regression Blatt 6 Lösung 6-2
2.12.2008	Clustering (Forts.)	5.12.2008	Clustering Blatt 7 Loesung 7-1
09.12.2008	Clustering	12.12.2008	Clustering
16.12.2008	Clustering	19.12.2008	Clustering Blatt 8( Loesung 8-3)
23.12.2008	Outlier Detection	9.01.2009	Clustering und Outlier Detection Blatt 9, Loesung 9-1
13.01.2009	Assoziationsregeln,	16.01.2009	Blatt 10
20.01.2009	DB-Techniken zur Leistungssteigerung	23.01.2009	Blatt 11
27.01.2009	Data Warehousing	30.01.2009
03.02.2009	Wiederholung	06.02.2009	Klausur 14.15 - 16.15

Weiterführende Informationen

DBS Forum bei die Informatiker.net
Lehrstuhleignene Projektseiten im Bereich KDD
KDNuggets - Populärer E-Newsletter zum Data Mining
ACM SIGKDD - 'Special Interest Group' der 'Association for Computing Machinery' zum Thema KDD
Weka (Data Mining with open source Machine Learning Software in Java.)

Interesante Links zu JAVA:

The Source for Java(TM) Technology - JAVA.SUN (englisch)
Mary Campione et al.

http://java.sun.com/docs/books/tutorial/

Guido Krüger

Download:

Lokal : gj22html.zip, gj22exam.zip
Die Homepage von "Go To Java 2": http://www.javabuch.de/

Homepages: DBS Institut LMU

Vorlesung Knowledge Discovery in Databases I im WS 2008/09

Aktuelles

Anmeldung zur Übung

Vorlesungsplan

Weiterführende Informationen

Interesante Links zu JAVA:

Vorlesung Knowledge Discovery in Databases I
im WS 2008/09