Lehr- und Forschungseinheit für Datenbanksysteme
print


Breadcrumb Navigation


Content

Knowledge Discovery in Databases I (WS 2017/18)

Aktuelles

 

  • [27.04.2018] Die Einsicht zur Nachholklausur wird am 11.05.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:00 stattfinden.
  • [09.04.2018] Auf Wunsch eine weitere Übungsaufgabe zu Gini-Index: aufgabe
  • [21.03.2018] Die Einsicht zur Klausur wird am 06.04.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:30 stattfinden.
  • [19.03.2018] Die Nachholklausur wird am 13.4.2018 stattfinden. Details folgen noch.
  • [26.02.2018] Die Klausur wird auf Englisch gestellt, Antworten sind auf Deutsch oder Englisch erlaubt.
  • [23.02.2018] Eine Nachholklausur Anfang des nächsten Semesters ist geplant, allerdings gibt es noch keine Informationen zu Räumen und genauem Zeitpunkt.
  • [08.02.2018] Die Tutorien diese Woche finden ohne neue Übungsblätter als Fragestunden statt.
  • [06.02.2018] Die Vorlesung am 7.2.2018 fällt aus. 
  • [30.11.2017] Der Termin für die Klausur steht nun fest: 01.03.18, 10 bis 13 Uhr im Hauptgebäude
  • [06.11.2017] Die Übungen am 16.11. finden ausnahmsweise in der Edmund-Rumpler-Str. 9 statt. Die erste in Raum A128, die zweite in Raum A023.
  • [02.11.17] Diese Woche finden ebenfalls keine Übungen statt
  • [24.10.17] Diese Woche finden noch keine Übungen statt
  • Die Vorlesung startet um 9:30!
  • [06.10.17] Wir sind nicht mehr auf der Suche nach Tutoren
  • [04.08.17] Wir sind noch auf der Suche nach Tutoren

Organisation

Umfang: 3+2 Semesterwochenstunden
Dozent: Prof. Dr. Peer Kröger
Vorkenntnisse: Algorithmen und Datenstrukturen empfohlen, Datenbanksysteme I vorteilhaft.

Anmeldung: über UniWorX
Übungsleitung: Anna Beer, Florian Richter

 

 

Klausur: Donnerstag, 01.03.18, 10 bis 13 Uhr. Hörsäle B101, B201 und A140 im Hauptgebäude

  • Raumaufteilung nach erstem Buchstaben des Nachnamens: 
  • A - J -> B 101
  • K - R -> B 201
  • S - Z -> A 140
Nachholklausur: Freitag, 12.04.18, 16:00 bis 18:00 Uhr. Hörsäle B201 und A240.
  • A - J -> A 240
  • K - Z -> B 201

Termine und Ort

Veranstaltung Zeit Ort Beginn
Vorlesung Mi, 9:30 - 12:00 Uhr Raum S 004 (Schellingstr. 3) 18.10.2017
Übung 1 Do, 14:00 - 16:00 Uhr Raum D Z005 (HGB) 09.11.2017
Übung 2 Do, 16:00 - 18:00 Uhr Raum D Z005 (HGB) 09.11.2017
Übung 3 Fr, 12:00 - 14:00 Uhr Raum A 015 (HGB) 10.10.2017
Übung 4 Fr, 14:00 - 16:00 Uhr Raum A 015 (HGB) 10.10.2017

Zeitplan und Material

VorlesungÜbung
DatumInhaltDatumInhaltLösungen
18.10.17 01_Einleitung.pdf ---
25.10.17 02_DatenRepräsentation ---
01.11.17 keine Vorlesung (Allerheiligen) ---
08.11.17 keine Vorlesung 09.11.17
10.11.17
Übungsblatt_01
15.11.17 02_DatenRepräsentation-2 16.11.17
17.11.17
Übungsblatt_02
BilderFeaturesHausaufgabe.zip
22.11.17 02_DatenRepräsentation-3
03_FrequentItemsetMining-1
23.11.17
24.11.17
Übungsblatt_03
29.11.17 03_FrequentItemsetMining-2 30.11.17
31.11.17
Übungsblatt_04
06.12.17 04_Clustering-1 07.12.17
08.12.17
Übungsblatt_05
13.12.17 04_Clustering-2 14.12.17
15.12.17
Übungsblatt_06 Lösung06-1
20.12.17 04_Clustering-3 21.12.17
22.12.17
Übungsblatt_07 Lösung07-1, Lösung07-3
27.12.17 keine Vorlesung (Weihnachtsferien) 28.12.17
29.12.17
keine Übung (Weihnachtsferien)
03.01.18 keine Vorlesung (Weihnachtsferien) 04.01.18
05.01.18
keine Übung (Weihnachtsferien)
10.01.18 04_Clustering-4 11.01.18
12.01.18
Übungsblatt_08 Lösung_08
17.01.18 05_OutlierDetection
6_Classification-1.pdf
18.01.18
19.01.18
Übungsblatt_09 Lösung09-1 Lösung09-2
24.01.18 6_Classification-2.pdf 25.01.18
26.01.18
Übungsblatt_10
Lösung 10
31.01.18 6_Classification-3.pdf 01.02.18
02.02.18
Übungsblatt_11
07.02.18 keine Vorlesung 08.02.18
09.02.18

Inhalt

Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Messverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.

Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, des maschinellen Lernens sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.

Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in so genannten Data Warehouses gesondert verwaltet werden. Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.

Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assoziationsregeln.

Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.