Additional Content
Main Content
Query Formulation
Allgemeine Informationen
| Veranstalter: | Matthias Hagen, Benno Stein |
| Vorbesprechung: | Der Termin wird an die Teilnehmer gemailt |
| Projektart: | Forschungsprojekt (Laborprojekt nach Absprache) |
| Umfang: | 16 - 24 ECTS |
Kurzbeschreibung
Websuche ist zu einer allgegenwärtigen Art der Informationsgewinnung geworden. Was aber tun, wenn die Suchmaschinen wie Google oder Bing nicht die "richtigen" Ergebnisse liefern obwohl man sich doch so sicher ist eine "gute" Anfrage formuliert zu haben? Als Benutzer hat man keine wirklich tieferen Einblicke in die Suchvorgänge als das Betrachten der erzeugten Antwortresultatliste. Suchmaschineninterna wie Rankingalgorithmen, Gewichtung von Schlüsselbegriffen etc. bleiben dem Nutzer verborgen. Anfragen können lediglich über ein standardisiertes Interface (etwa die Google-Webseite oder die Bing API) gestellt werden. Trotzdem kennt der Nutzer sein Informationsbedürfnis natürlich am besten und will sich nicht immer auf die Algorithmen auf Suchmaschinenseite verlassen müssen. In diesem Projekt sollen anhand verschiedener Szenarien Strategien entwickelt und untersucht werden, die "gute" Anfragen an die Suchmaschine generieren können und nur die aus Nutzersicht verfügbaren Suchmaschineninterfaces benutzen. Ein mögliches Einsatzgebiet der Techniken ist dabei unser Plagiatsuchdienst Picapica. Um zu einem verdächtigen Dokument ähnliche Dokumente im Web zu finden (aus denen möglicherweise plagiiert wurde), müssen Anfragen generiert werden, die sich aus Schlüsselbegriffen des verdächtigen Dokuments zusammensetzen. Ein weiteres mögliches Einsatzgebiet der Anfragestrategien ist das Wiederfinden eines nicht mehr beim Nutzer vorhandenen Dokumentes, zu dem nur noch bruchstückhafte Erinnerungen an vermutlich enthaltene Schlüsselworte vorliegen. Um dieses potentiell noch im Web verfügbare Dokument zu finden, müssen aus den erinnerten Schlüsselworten Anfragen erzeugt werden, die mit hoher Wahrscheinlichkeit das gesuchte Dokument als Resultat liefern. Ein drittes mögliches Einsatzgebiet setzt beim Nutzer der Websuchmaschinen direkt an. In einer Suchsitzung werden durch den Nutzer häufig verschiedene Anfragen gestellt, die alle das gleiche Suchziel haben. Mit welcher Strategie würde ein Nutzer aus den in den gestellten Suchanfragen benutzten Begriffen bessere Ergebnisse erzielen? Ziel beim Einsatz der zu untersuchenden Strategien ist immer die Minimierung der tatsächlich an die Suchmaschine gestellten Anfragen. Gefundene Verfahren sollen im Rahmen des Projektes auch implementiert und experimentell evaluiert werden.
Content signature
© Fakultät Medien 20.09.2010 / Kontakt / Impressum / Datenschutz / Bemerkung zu dieser Seite
Die Bauhaus-Universität Weimar verwendet Piwik zur Web-Analyse.


