OLN | Sprachmodellen unter die Haube schauen
Project information
submitted by
Matti Wiegmann
Co-Authors
Muhammed Asker, Aditya Vikram, Hevin Diken, Shubham Naik, Apoorva Gupta
Mentors
Matti Wiegmann, Benno Stein
Faculty:
Media
Degree programme:
Computer Science and Media (english) (Master of Science (M.Sc.)),
Digital Engineering (Master of Science (M.Sc.)),
Informatik (Bachelor of Science (B.Sc.))
Type of project presentation
Research project
Semester
Sommersemester2025
- Bauhausstraße 11
(Webis Labor | R012)
Available during summaery opening hours
Project description
Sprachmodelle wie ChatGPT werden gerne als abgeschlossene, uneinsehbare Systeme dargestellt, deren Verhalten nur von obskuren Trainingsprozessen und dem quasi-schamanistischen (Um)Formulieren von Prompts gesteuert werden kann. Im Detail gibt es aber viele (unsichtbare) Einzelteile, um ganz unterschiedliche Texte generieren zu können: von der Wahl der Trainingsdaten, Tokenisierung, und Modellarchitekturen und -parameter hin zu Such- und Generationsstrategien. Die Studierenden in diesem Projekt haben das Ziel, diese unsichtbaren Elemente sichtbar zu machen, auch für ein nicht-technisches Publikum.
Email: matti.wiegmann[at]uni-weimar.de