Knowledge Discovery in Databases I (WS 2017/18)

Aktuelles

[27.04.2018] Die Einsicht zur Nachholklausur wird am 11.05.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:00 stattfinden.
[09.04.2018] Auf Wunsch eine weitere Übungsaufgabe zu Gini-Index: aufgabe
[21.03.2018] Die Einsicht zur Klausur wird am 06.04.2018 im Raum 157 (Oettingenstraße) von 10:00 bis 11:30 stattfinden.
[19.03.2018] Die Nachholklausur wird am 13.4.2018 stattfinden. Details folgen noch.
[26.02.2018] Die Klausur wird auf Englisch gestellt, Antworten sind auf Deutsch oder Englisch erlaubt.
[23.02.2018] Eine Nachholklausur Anfang des nächsten Semesters ist geplant, allerdings gibt es noch keine Informationen zu Räumen und genauem Zeitpunkt.
[08.02.2018] Die Tutorien diese Woche finden ohne neue Übungsblätter als Fragestunden statt.
[06.02.2018] Die Vorlesung am 7.2.2018 fällt aus.
[30.11.2017] Der Termin für die Klausur steht nun fest: 01.03.18, 10 bis 13 Uhr im Hauptgebäude
[06.11.2017] Die Übungen am 16.11. finden ausnahmsweise in der Edmund-Rumpler-Str. 9 statt. Die erste in Raum A128, die zweite in Raum A023.
[02.11.17] Diese Woche finden ebenfalls keine Übungen statt
[24.10.17] Diese Woche finden noch keine Übungen statt
Die Vorlesung startet um 9:30!
[06.10.17] Wir sind nicht mehr auf der Suche nach Tutoren
[04.08.17] Wir sind noch auf der Suche nach Tutoren

Organisation

Umfang: 3+2 Semesterwochenstunden
Dozent: Prof. Dr. Peer Kröger
Vorkenntnisse: Algorithmen und Datenstrukturen empfohlen, Datenbanksysteme I vorteilhaft.

Anmeldung: über UniWorX
Übungsleitung: Anna Beer, Florian Richter

Klausur: Donnerstag, 01.03.18, 10 bis 13 Uhr. Hörsäle B101, B201 und A140 im Hauptgebäude

Raumaufteilung nach erstem Buchstaben des Nachnamens:
A - J -> B 101
K - R -> B 201
S - Z -> A 140

Nachholklausur: Freitag, 12.04.18, 16:00 bis 18:00 Uhr. Hörsäle B201 und A240.

A - J -> A 240
K - Z -> B 201

Termine und Ort

Veranstaltung	Zeit	Ort	Beginn
Vorlesung	Mi, 9:30 - 12:00 Uhr	Raum S 004 (Schellingstr. 3)	18.10.2017
Übung 1	Do, 14:00 - 16:00 Uhr	Raum D Z005 (HGB)	09.11.2017
Übung 2	Do, 16:00 - 18:00 Uhr	Raum D Z005 (HGB)	09.11.2017
Übung 3	Fr, 12:00 - 14:00 Uhr	Raum A 015 (HGB)	10.10.2017
Übung 4	Fr, 14:00 - 16:00 Uhr	Raum A 015 (HGB)	10.10.2017

Zeitplan und Material

Vorlesung		Übung
Datum	Inhalt	Datum	Inhalt	Lösungen
18.10.17	01_Einleitung.pdf	---
25.10.17	02_DatenRepräsentation	---
01.11.17	keine Vorlesung (Allerheiligen)	---
08.11.17	keine Vorlesung	09.11.17 10.11.17	Übungsblatt_01
15.11.17	02_DatenRepräsentation-2	16.11.17 17.11.17	Übungsblatt_02 BilderFeaturesHausaufgabe.zip
22.11.17	02_DatenRepräsentation-3 03_FrequentItemsetMining-1	23.11.17 24.11.17	Übungsblatt_03
29.11.17	03_FrequentItemsetMining-2	30.11.17 31.11.17	Übungsblatt_04
06.12.17	04_Clustering-1	07.12.17 08.12.17	Übungsblatt_05
13.12.17	04_Clustering-2	14.12.17 15.12.17	Übungsblatt_06	Lösung06-1
20.12.17	04_Clustering-3	21.12.17 22.12.17	Übungsblatt_07	Lösung07-1, Lösung07-3
27.12.17	keine Vorlesung (Weihnachtsferien)	28.12.17 29.12.17	keine Übung (Weihnachtsferien)
03.01.18	keine Vorlesung (Weihnachtsferien)	04.01.18 05.01.18	keine Übung (Weihnachtsferien)
10.01.18	04_Clustering-4	11.01.18 12.01.18	Übungsblatt_08	Lösung_08
17.01.18	05_OutlierDetection 6_Classification-1.pdf	18.01.18 19.01.18	Übungsblatt_09	Lösung09-1 Lösung09-2
24.01.18	6_Classification-2.pdf	25.01.18 26.01.18	Übungsblatt_10 Lösung 10
31.01.18	6_Classification-3.pdf	01.02.18 02.02.18	Übungsblatt_11
07.02.18	keine Vorlesung	08.02.18 09.02.18

Inhalt

Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Messverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.

Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, des maschinellen Lernens sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.

Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in so genannten Data Warehouses gesondert verwaltet werden. Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.

Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assoziationsregeln.

Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.

Search

Links and Functions

Breadcrumb Navigation

Main Navigation

Content