Bildanalyse und Objekterkennung

Die Lehrveranstaltung gibt eine Einführung in die Grundlagen der Mustererkennung und Bildanalyse. Behandelt werden unter anderem die Bildverbesserung, lokale und morphologische Operatoren, Kantenerkennung, Bilddarstellung im Frequenzraum, Fourier-Transformation, Hough-Transformation, Segmentierung, Skelettierung, Objektklassifizierung und maschinelles Lernen zur visuellen Objekterkennung.

Die Veranstaltung wird über die Lernplattform Moodle verwaltet. Alle Dokumente und weitere Informationen finden Sie im Moodle-Kurs Image Analysis and Object Recognition SoSe2024.

Bitte beachten Sie: Die Unterlagen zu unseren Vorlesungen und Übungen sind nur aus dem Netzwerk der Bauhaus-Universität Weimar erreichbar.

Vorlesung

Einführung

  1. Organisation, Motivation, Definition, Anwendungsbeispiele (Folien, Druck)

Bildverarbeitung

  1. Bildrepräsentation, einfache Verbesserung, Binärbilder, Schwellwertbildung, morphologische Operatoren
  2. Begrenzungen, Füllen, Hit-or-Miss, Ausdünnen, Verdicken, verbundene Komponenten, Eigenschaften von Regionen
  3. Invariante Deskriptoren, (nicht-)lineare Filterung, Rauschen, lokale Operatoren, Gauß, Bildableitungen, Sobel
  4. Laplace, ...

Merkmalsextraktion

  1. Gaußsche Ableitungen, GoG, LoG, DoG, Kantendetektion, Eckendetektion, Interestoperator
  2. Diskrete 2D-Fouriertransform, FFT, Spektrum, Faltungssatz, Filterung im Frequenzbereich, ideale Hoch- and Tiefpassfilter, Butterworth

Formerkennung

  1. Hough-Transformation, Anpassung von Geraden, Liniensegmente, Kreise mit (un)bekanntem Radius, verallgemeinerte Hough-Transformation, Fourier-Deskriptoren, Normalisierung

Objekterkennung

  1. Schiebefenster, Template Matching, Bildpyramiden, Viola-Jones-Gesichtserkennung, Haar-Merkmale, Integralbilder, Boosting, Klassifikator-Kaskade, lokale Bildmerkmale
  2. Skaleninvariante Extraktion, Skalenraum, eindeutige Merkmalsbeschreibung und Zuordnung, SIFT
  3. Teilbasiertes Voting, Vokabelbaum, Bag of Visual Words, ...

Bildregionen

  1. Segmentierung, Clustering, k-Means
  2. Mean-Shift, Regionenwachstum, Wasserscheiden, Graph-Cut-Segmentierung, Affinitätsmatrix, Normalized-Cut, Soft-Segmentierung, Grab-Cut, ...

Machinelles Lernen

  1. Mustererkennungssysteme, Überwachung, Generalisierung
  2. Tiefgehendes Lernen für visuelle Erkennung, künstliche neuronale Netze, überwachte Faltungsnetze
  3. Klassifikatoren, k-nächste-Nachbarn, Entscheidungsbäume, Bayessche Entscheidungstheorie, Erwartungsmaximierung, Support-Vector-Maschinen, Zusammenfassung

Übung

Die erste Übung findet am 18. April statt.

Alle Dokumente und weitere Informationen finden Sie im Moodle-Kurs Image Analysis and Object Recognition SoSe2024.

MATLAB primer (Mathworks, University of Florida)

Prüfung

Klausur

  • Termin: 6. August 2024, 11:00 Uhr
  • Ort: Audimax (Steubenstraße 6) und Hörsaal 6 (Coudraystraße 9A)
    Die Einteilung in die Räume erfolgt nach Studiengang:
    - Digital Engineering (Audimax)
    - CS4DM, HCI, Medieninformatik und andere (Hörsaal 6)
  • Hilfsmittel: keine

Klausurvorbereitung