Detailansicht

Bewegungsanalyse von Videos unter Berücksichtigung von Verdeckungen
Christian Ammer
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Betreuer*in
Margrit Gelautz
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.7616
URN
urn:nbn:at:at-ubw:1-30122.05332.607066-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Die Aufgabe von Motion Estimation ist, Bewegungsbereiche in einem Video zu erkennen und jedem Bildpunkt eine Bewegung zuzuordnen. Es ist eine herausfordernde Aufgabe von Computer Vision, denn viele Anwendungen des Maschinellen Sehens lassen sich erst durch eine qualitativ hochwertige Bewegungsanalyse des Videos lösen. So sind die hohen Kompressionsraten in Videos mitunter auf die Bewegungskompensation zurückzuführen, welche durch Motion Estimation möglich wird. Eine automatische Erfassung und Identifizierung von Gegenständen oder eine dreidimensionale Szenenrekonstruktion sind Anwendungen, welche eine Bewegungsanalyse voraussetzen. In dieser Arbeit wird ein Algorithmus auf Grundlage der Arbeiten von Jiangjan Xiao und Mubarak Shah entworfen, der eine kurze Videosequenz analysiert. Im Gegensatz zu anderen Arbeiten in diesem Bereich berücksichtigt der Algorithmus Verdeckungen. Das Ergebnis einer Analyse ist eine Ebenenrepräsentation des Videos, bei der jeder Ebene eine affine Bewegung zugrunde liegt. Um die affinen Bewegungen zu finden, sucht der Algorithmus im ersten Schritt Featurepoints. Jeder Featurepoint wird als Saatpunkt im folgenden Region-Growing-Schritt verwendet. In jeder Region-Growing-Wachstumsphase werden die affinen Bewegungen mit dem Newton Näherungsverfahren bis zu einem bestimmten Punkt verfeinert. Ähnliche affine Bewegungen werden zu einer zusammengefasst. Im nächsten Schritt, dem Layer Assignment Schritt, wird eine Energiefunktion entworfen und durch das Minimale-Schnitt-Verfahren minimiert. Durch die Minimierung wird jedem Bildpunkt eine affine Bewegung zugeordnet, was die Lösung des Zuordnungsproblems darstellt. Die Energiefunktion enthält neben Daten- und Smoothnesskosten auch einen Term für Verdeckungen zwischen Bildern und einen Term für Verdeckungen zwischen Bildpaaren. Das Minimale-Schnitt-Verfahren wird seit einigen Jahren häufig für Computer Vision Aufgaben eingesetzt, da es sich in der Praxis gut bewährt.
Abstract
(Englisch)
Motion estimation is used to detect motion model parameters and to assign each pixel in a video frame to one of the identified motion models. Motion estimation is a challenging task in computer vision because many applications require high qualitative motion description of the video. For example, the high compression rates of videos are largely depending on the motion compensation of video streams. The automatic identification of objects and the three dimensional scene reconstruction are also depending on motion estimation. In this work, we present an algorithm which is based on the work of Jiangjan Xiao and Mubarak Shah. The algorithm analyses a short video sequence. In contrast to previous work, it takes occlusions into account. The result of the computation is a layered representation of the video, whereby each layer represents one affine motion model. In the first step the algorithm identifies motion parameters. The algorithm selects feature points and uses a region growing method for each feature point. In every growing stage the motion model parameters of the region are re-estimated via the Newton procedure. After this step, similar motions are combined. In the layer assignment step, an energy minimization method is used to minimize a cost function and to assign each pixel to one of the previously identified motion parameters. In addition to common data and smoothness terms, the cost function includes an occlusion term. The energy minimization method is based on graph-cuts.

Schlagwörter

Schlagwörter
(Englisch)
computer vision motion estimation optical flow graph-cut
Schlagwörter
(Deutsch)
Maschinelles Sehen Bewegungsextraktion Optischer Fluss Minimaler Schnitt
Autor*innen
Christian Ammer
Haupttitel (Deutsch)
Bewegungsanalyse von Videos unter Berücksichtigung von Verdeckungen
Publikationsjahr
2009
Umfangsangabe
85 S. : Ill., graph. Darst.
Sprache
Deutsch
Beurteiler*in
Margrit Gelautz
Klassifikationen
54 Informatik > 54.74 Maschinelles Sehen ,
54 Informatik > 54.87 Multimedia
AC Nummer
AC07967153
Utheses ID
6909
Studienkennzahl
UA | 066 | 926 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1