Page heading
Languages and Services
  
    You are here menu
    Subpage heading
    Web Technology · Information Systems · Prof. Dr. Benno Stein
    Navigation
    Additional Content
    Main Content

    Do it Yourself Web Search Engine

    Allgemeine Informationen

    Veranstalter: Martin Potthast, Matthias Hagen
    Vorbesprechung: Der Termin wird an die Teilnehmer gemailt
    Projektart: Bachelor / Master
    Umfang: 15 ECTS

    Kurzbeschreibung

    Web-Suchmaschinen sind allgegenwärtig und zentraler Gegenstand der Forschung im Information Retrieval (IR). Um die Praxistauglichkeit von IR-Algorithmen zu bewerten, benötigt man im Idealfall eine "statische Forschungssuchmaschine", die reproduzierbare Ergebnisse liefert und einen repräsentativen Web-Ausschnitt indiziert. Ziel dieses Projekts ist es, eine verteilte Suchmaschine in realistischer Größenordnung zu errichten, die 1 Milliarde Web-Seiten (25 TB) indiziert und Suchanfragen in weniger als 1 Sekunde beantwortet. Dazu werden grundlegende sowie fortgeschrittene Technologien des Information Retrieval und des Cluster-Computing (insbesondere MapReduce) eingesetzt und auf bereits in vorigen Projekten entwickelte Technologien für Netspeak aufgebaut.

    Content signature