Knowledge Discovery in Databases I (WS 2017/18)
Aktuelles
- [27.04.2018] Die Einsicht zur Nachholklausur wird am 11.05.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:00 stattfinden.
- [09.04.2018] Auf Wunsch eine weitere Übungsaufgabe zu Gini-Index: aufgabe
- [21.03.2018] Die Einsicht zur Klausur wird am 06.04.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:30 stattfinden.
- [19.03.2018] Die Nachholklausur wird am 13.4.2018 stattfinden. Details folgen noch.
- [26.02.2018] Die Klausur wird auf Englisch gestellt, Antworten sind auf Deutsch oder Englisch erlaubt.
- [23.02.2018] Eine Nachholklausur Anfang des nächsten Semesters ist geplant, allerdings gibt es noch keine Informationen zu Räumen und genauem Zeitpunkt.
- [08.02.2018] Die Tutorien diese Woche finden ohne neue Übungsblätter als Fragestunden statt.
- [06.02.2018] Die Vorlesung am 7.2.2018 fällt aus.
- [30.11.2017] Der Termin für die Klausur steht nun fest: 01.03.18, 10 bis 13 Uhr im Hauptgebäude
- [06.11.2017] Die Übungen am 16.11. finden ausnahmsweise in der Edmund-Rumpler-Str. 9 statt. Die erste in Raum A128, die zweite in Raum A023.
- [02.11.17] Diese Woche finden ebenfalls keine Übungen statt
- [24.10.17] Diese Woche finden noch keine Übungen statt
- Die Vorlesung startet um 9:30!
- [06.10.17] Wir sind nicht mehr auf der Suche nach Tutoren
- [04.08.17] Wir sind noch auf der Suche nach Tutoren
Organisation
Umfang: 3+2 Semesterwochenstunden
Dozent: Prof. Dr. Peer Kröger
Vorkenntnisse: Algorithmen und Datenstrukturen empfohlen, Datenbanksysteme I vorteilhaft.
Anmeldung: über UniWorX
Übungsleitung: Anna Beer, Florian Richter
Klausur: Donnerstag, 01.03.18, 10 bis 13 Uhr. Hörsäle B101, B201 und A140 im Hauptgebäude
- Raumaufteilung nach erstem Buchstaben des Nachnamens:
- A - J -> B 101
- K - R -> B 201
- S - Z -> A 140
- A - J -> A 240
- K - Z -> B 201
Termine und Ort
Veranstaltung | Zeit | Ort | Beginn |
Vorlesung | Mi, 9:30 - 12:00 Uhr | Raum S 004 (Schellingstr. 3) | 18.10.2017 |
Übung 1 | Do, 14:00 - 16:00 Uhr | Raum D Z005 (HGB) | 09.11.2017 |
Übung 2 | Do, 16:00 - 18:00 Uhr | Raum D Z005 (HGB) | 09.11.2017 |
Übung 3 | Fr, 12:00 - 14:00 Uhr | Raum A 015 (HGB) | 10.10.2017 |
Übung 4 | Fr, 14:00 - 16:00 Uhr | Raum A 015 (HGB) | 10.10.2017 |
Zeitplan und Material
Vorlesung | Übung | |||
---|---|---|---|---|
Datum | Inhalt | Datum | Inhalt | Lösungen |
18.10.17 | 01_Einleitung.pdf | --- | ||
25.10.17 | 02_DatenRepräsentation | --- | ||
01.11.17 | keine Vorlesung (Allerheiligen) | --- | ||
08.11.17 | keine Vorlesung | 09.11.17 10.11.17 |
Übungsblatt_01 | |
15.11.17 | 02_DatenRepräsentation-2 | 16.11.17 17.11.17 |
Übungsblatt_02 BilderFeaturesHausaufgabe.zip |
|
22.11.17 | 02_DatenRepräsentation-3 03_FrequentItemsetMining-1 |
23.11.17 24.11.17 |
Übungsblatt_03 | |
29.11.17 | 03_FrequentItemsetMining-2 | 30.11.17 31.11.17 |
Übungsblatt_04 | |
06.12.17 | 04_Clustering-1 | 07.12.17 08.12.17 |
Übungsblatt_05 | |
13.12.17 | 04_Clustering-2 | 14.12.17 15.12.17 |
Übungsblatt_06 | Lösung06-1 |
20.12.17 | 04_Clustering-3 | 21.12.17 22.12.17 |
Übungsblatt_07 | Lösung07-1, Lösung07-3 |
27.12.17 | keine Vorlesung (Weihnachtsferien) | 28.12.17 29.12.17 |
keine Übung (Weihnachtsferien) | |
03.01.18 | keine Vorlesung (Weihnachtsferien) | 04.01.18 05.01.18 |
keine Übung (Weihnachtsferien) | |
10.01.18 | 04_Clustering-4 | 11.01.18 12.01.18 |
Übungsblatt_08 | Lösung_08 |
17.01.18 | 05_OutlierDetection 6_Classification-1.pdf |
18.01.18 19.01.18 |
Übungsblatt_09 | Lösung09-1 Lösung09-2 |
24.01.18 | 6_Classification-2.pdf | 25.01.18 26.01.18 |
Übungsblatt_10 Lösung 10 |
|
31.01.18 | 6_Classification-3.pdf | 01.02.18 02.02.18 |
Übungsblatt_11 | |
07.02.18 | keine Vorlesung | 08.02.18 09.02.18 |
Inhalt
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Messverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.
Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, des maschinellen Lernens sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.
Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in so genannten Data Warehouses gesondert verwaltet werden. Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.
Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assoziationsregeln.
Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.