OLN | Sprachmodellen unter die Haube schauen
Projektinformationen
eingereicht von
Matti Wiegmann
Mitwirkende
Muhammed Asker, Aditya Vikram, Hevin Diken, Shubham Naik, Apoorva Gupta
Lehrende
Matti Wiegmann, Benno Stein
Fakultät:
Medien
Studiengang:
Computer Science and Media (englischsprachig) (Master of Science (M.Sc.)),
Digital Engineering (Master of Science (M.Sc.)),
Informatik (Bachelor of Science (B.Sc.))
Art der Präsentation
Forschungsprojekt
Semester
Sommersemester2025
- Bauhausstraße 11
(Webis Labor | R012)
Während der Öffnungszeiten der summaery verfügbar
Projektbeschreibung
Sprachmodelle wie ChatGPT werden gerne als abgeschlossene, uneinsehbare Systeme dargestellt, deren Verhalten nur von obskuren Trainingsprozessen und dem quasi-schamanistischen (Um)Formulieren von Prompts gesteuert werden kann. Im Detail gibt es aber viele (unsichtbare) Einzelteile, um ganz unterschiedliche Texte generieren zu können: von der Wahl der Trainingsdaten, Tokenisierung, und Modellarchitekturen und -parameter hin zu Such- und Generationsstrategien. Die Studierenden in diesem Projekt haben das Ziel, diese unsichtbaren Elemente sichtbar zu machen, auch für ein nicht-technisches Publikum.
E-Mail: matti.wiegmann[at]uni-weimar.de