Additional Content
Main Content
Do it Yourself Web Search Engine
Allgemeine Informationen
| Veranstalter: | Martin Potthast, Matthias Hagen |
| Vorbesprechung: | Der Termin wird an die Teilnehmer gemailt |
| Projektart: | Bachelor / Master |
| Umfang: | 15 ECTS |
Kurzbeschreibung
Web-Suchmaschinen sind allgegenwärtig und zentraler Gegenstand der Forschung im Information Retrieval (IR). Um die Praxistauglichkeit von IR-Algorithmen zu bewerten, benötigt man im Idealfall eine "statische Forschungssuchmaschine", die reproduzierbare Ergebnisse liefert und einen repräsentativen Web-Ausschnitt indiziert. Ziel dieses Projekts ist es, eine verteilte Suchmaschine in realistischer Größenordnung zu errichten, die 1 Milliarde Web-Seiten (25 TB) indiziert und Suchanfragen in weniger als 1 Sekunde beantwortet. Dazu werden grundlegende sowie fortgeschrittene Technologien des Information Retrieval und des Cluster-Computing (insbesondere MapReduce) eingesetzt und auf bereits in vorigen Projekten entwickelte Technologien für Netspeak aufgebaut.
Content signature
© Fakultät Medien 11.03.2011 / Kontakt / Impressum / Datenschutz / Bemerkung zu dieser Seite
Die Bauhaus-Universität Weimar verwendet Piwik zur Web-Analyse.


