|
|
Fokusierte Webcrawler sind Programme, die das World Wide Web
durch sukzessives Verfolgen von
Hyperlinks nach vorgegebenen Inhalten durchsuchen. Die Erkennung dieser
Inhalte funktioniert dabei durch Methoden des maschinellen Lernens.
Bisherige Methoden des fokusierten Crawlings waren auf
das Finden einzelner relevanter HTML-Dokumente beschränkt.
Der in Kooperation mit der Simon Fraser University in Vancouver
(Kanada) entwickelte Focused Website-Crawler, sucht dagegen
gezielt nach themenspezifischen Internetdomänen. D.h. Ziel der
Suche ist die Entdeckung von Domänen, die z.B. zu bestimmten
Firmen oder anderen Organisationen gehören.
| Matthias Schubert | Raum : E 1.04 Telefon : 089 / 2180 9321 Mail : schubert@dbs.informatik.uni-muenchen.de |