Bildanalyse und Objekterkennung

Die Lehrveranstaltung gibt eine Einführung in die Grundlagen der Mustererkennung und Bildanalyse. Behandelt werden unter anderem die Bildverbesserung, lokale und morphologische Operatoren, Kantenerkennung, Bilddarstellung im Frequenzraum, Fourier-Transformation, Hough-Transformation, Segmentierung, Skelettierung, Objektklassifizierung und maschinelles Lernen zur visuellen Objekterkennung.

Bitte beachten Sie: Die Unterlagen zu unseren Vorlesungen und Übungen sind nur aus dem Netzwerk der Bauhaus-Universität Weimar erreichbar.

Vorlesung

Introduction

  1. Organization, motivation, definition, application examples (slides, print)

Image processing

  1. Image representation, basic enhancement, binary images, thresholding, morphological operators (slides, print)
  2. Boundaries, filling, hit-or-miss, thinning, thickening, connected components, region properties (slides, print, SDC Morphology Toolbox)
  3. Invariant descriptors, (non-)linear filtering, noise, local operators, Gaussian, image derivatives, Sobel (slides, print)
  4. Laplacian, ...

Feature extraction

  1. Gaussian derivatives, GoG, LoG, DoG, edge detection, corner detection, interest point operator (slides, print)
  2. Discrete 2D Fourier transform, FFT, spectrum, convolution theorem, filtering in frequency domain, ideal high- and low-pass filter, Butterworth (slides, print)

Shape detection

  1. Hough transform, fitting of straight lines, line segments, circles with (un)known radius, generalized Hough transform, Fourier descriptors, normalization (slides, print)

Object recognition

  1. Sliding window, template matching, image pyramids, Viola-Jones face detection, Haar features, integral images, boosting, classifier cascade, local image features (slides, print)
  2. Scale invariant extraction, scale-space, unique feature description and matching, SIFT (slides, print)
  3. Part-based voting, vocabulary tree, bag of visual words, implicit shape models, ...

Image regions

  1. Segmentation, clustering (slides, print)
  2. K-means, mean shift, region growing, split and merge, watershed, graph-cut segmentation, affinity matrix, normalized-cut (slides, print)
  3. Soft segmentation, grab-cut, ...

Machine learning

  1. Pattern recognition systems, supervision, generalization, deep learning for visual recognition, artificial neural networks (slides, print
  2. Supervised convolutional nets, classifiers, generative or discriminative (slides, print)
  3. K-nearest neighbor, boosted decision tree, Bayesian decision theory, mixture of Gaussians, expectation maximization, support vector machine, summary (slides, print)

Übung

Die Übungen finden 14-tägig am Donnerstag ab 11:00 Uhr im Hörsaal A statt. Die Übungen beginnen am 11. April 2019.

Für die Übung wird die Lernplattform Moodle genutzt. Alle Unterlagen und weitere Informationen finden Sie unter dem Moodle-Kurs Bildanalyse und Objekterkennung 2019.
Das Passwort wird in der ersten Übung bekannt gegeben.

 

Bitte beachten: Auf den Rechnern im LiNT-Pool (Bauhausstraße 11, 1.OG) ist MATLAB installiert. Sollte die Bearbeitung der Übungen auf privaten Rechnern gewünscht sein, kann die Software Octave verwendet werden. Hinweise zur Installation sind in den Folien der ersten Übung zu finden.

MATLAB primer (Mathworks, University of Florida)

Klausur

Written examination

Date: Tuesday, July 17, 2018 at 11:00 am in LH B, M 13C
Auxiliary resources: None

Preparation material