Beschreibung |
Die Online-Enzyklopädie Wikipedia ist mittlerweile in über 250 Sprachen verfügbar und allein der englischsprachige Teil beinhaltet fast 3.000.000 Artikel. Das rasante Wachstum wird nicht zuletzt durch die freie Editierbarkeit der Inhalte gefördert. Diese Freiheit bringt jedoch auch gewisse Nachteile mit sich, so dass neben der Bekämpfung von Vandalismus die Qualitätssicherung eine wichtige Rolle spielt. Im Laufe der Zeit entstanden in der Wikipedia-Community diverse Regeln, die es Autoren erleichtern sollen qualitativ hochwertige Artikel zu schreiben. Artikel, die diesen Standard erfüllen werden als "exzellente Artikel" markiert. Da das manuelle Überprüfen und Überarbeiten der Artikel sehr zeitintensiv ist, erfüllen im englischsprachigen Wikipedia weniger als 0,1% der Artikel diesen Standard. In diesem Projekt sollen automatisierte Verfahren entwickelt und implementiert werden, um die Qualität von Wikipedia-Artikeln zu quantifizieren. Hierzu kommen sowohl regelbasierte Verfahren als auch Techniken aus dem Bereich des maschinellen Lernens zum Einsatz. Weiterhin sollen die entwickelten Verfahren eingesetzt werden, um schwächen in existierenden Artikeln aufzuzeigen.
|
engl. Beschreibung/ Kurzkommentar |
Information Quality in Wikipedia Short description: The online encyclopedia Wikipedia is available in over 250 languages and the English part contains nearly 3,000,000 articles. An important reason for the rapid growth is the free editable content. However, this freedom brings certain disadvantages with it, so that in addition to the fight against vandalism the quality plays an important role. Certain rules have been developed by the Wikipedia community that should help authors to write high-quality articles. Articles that meet this standard are considered as "featured articles". Since the manual review and revise of all articles is very time intensive less than 0.1% of the articles in the English Wikipedia meet this standard. The goal of this project is to develop techniques and algorithms to quantify the quality of Wikipedia articles. Therefore rule-based procedures, as well as techniques from the field of machine learning are used. Furthermore, we aim to use the developed techniques to determine weak points in existing Wikipedia articles. |