Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 
Switch to english language
Startseite    Anmelden     
Logout in [min] [minutetext]
SoSe 2024

Automatic Image Captioning - Einzelansicht

  • Funktionen:
Grunddaten
Veranstaltungsart Projekt SWS 10
Veranstaltungsnummer 422210006 Max. Teilnehmer/-innen 5
Semester WiSe 2022/23 Zugeordnetes Modul
Erwartete Teilnehmer/-innen
Rhythmus einmalig
Hyperlink  
Sprache englisch


Zugeordnete Personen
Zugeordnete Personen Zuständigkeit
Stein, Benno Maria, Prof., Dr.rer.nat.
Kiesel, Johannes , Master of Science
Gollub, Tim , Dipl.-Mediensystemwiss.
Studiengänge
Abschluss Studiengang Semester Leistungspunkte
Master Computer Science and Media (M.Sc.), PV 11 - 15
Bachelor Medieninformatik (B.Sc.), PV 11 - 15
Bachelor Medieninformatik (B.Sc.), PV 17 - 15
Bachelor Medieninformatik (B.Sc.), PV 16 - 15
Master Human-Computer Interaction (M.Sc.), PV17 - 15
Master Digital Engineering (M.Sc.), PV 17 - 12
Master Human-Computer Interaction (M.Sc.), PV15 - 15
Master Digital Engineering (M.Sc.), PV 19 - 12
Master Human-Computer Interaction (M.Sc.), PV19 - 12/18
Bachelor Informatik (B.Sc.), PV 2020 - 12
Master Computer Science for Digital Media (M.Sc.), PV 2020 - 12
Master Computer Science for Digital Media (M.Sc.), PV 17 - 15
Zuordnung zu Einrichtungen
Intelligente Informationssysteme
Fakultät Medien
Inhalt
Beschreibung

In the project, we will take a look at the state of the art in automatic image caption generation with deep neural fitting and coherent sentences. Generating image captions is a prime multimodal learning task, which connects computer vision and natural language processing. Almost all image captioning models adopt the encoder-decoder framework with a visual attention mechanism. The encoder encodes input images into fixed-length vector features, and the decoder decodes image features into descriptions word by word. Based on a survey of image caption approaches with available source code, our goal is to deploy the most promising image captioning approaches onto our GPU cluster and evaluate their performance using various benchmark datasets. The best performing approach is intended to be used in an upcoming digital humanities research project on the analysis of image feed curation algorithms in social networks.

Bemerkung

Time and place will be announced at the project fair.

Leistungsnachweis

Abschlusspräsentation und Ausarbeitung

Zielgruppe

B.Sc. Medieninformatik / Informatik

M.Sc. Computer Science for Digital Media

M.Sc. Human-Computer Interaction

M.Sc. Digital Engineering


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester WiSe 2022/23 , Aktuelles Semester: SoSe 2024

BISON-Portal Startseite   Zurück Kontakt/Impressum Datenschutz