Detailansicht

Deep probabilistic clustering for multi-view data and missing data
Donatella Novakovic
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Informatik
Betreuer*in
Sebastian Tschiatschek
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.71186
URN
urn:nbn:at:at-ubw:1-26173.03270.409424-6
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In dieser Arbeit heben wir die Bedeutung von Deep Clustering Methoden für multimodale und unvollständige Datensätze hervor. Dabei kombinieren wir zwei bestehende Methoden, das probabilistische Deep Clustering Modell für unimodale Daten, Variational Deep Embedding (VaDE), sowie den Partial Variational Autoencoder (VAE) mit der Pointnet Plus (PNP) Struktur, welcher erlaubt auch unvollständige Daten zu berücksichtigen. Wir erweitern die Architektur von VaDE um einen weiteren VAE und untersuchen zwei Methoden um multimodale Datensätze zu verknüpfen. Um mit fehlenden Datenpunkten in beiden Datenmodalitäten umgehen zu können, integrieren wir den Partial VAE mit dem PNP. Mit dieser Vorgehensweise definieren wir ein partielles Clustering-Ziel, welches ausschließlich von beobachteten Datenpunkten abhängt und stellen das Partial Multi-View Variational Deep Embedding (Partial MV-VaDE) Modell vor. Die Performance des Modells wird anhand von umfangreichen Experimenten an multimodalen Datensätzen, für welche fehlende Datenpunkte generiert werden, evaluiert. Außerdem schauen wir uns die Cluster-Wahrscheinlichkeiten im Detail an und vergleichen die Resultate mit verschiedenen Baseline-Methoden.
Abstract
(Englisch)
In this thesis, we aim to raise the importance of deep clustering methods for multi-view and missing data. We combine two state-of-the-art methods, the Variational Deep Embedding (VaDE) initially designed for deep probabilistic clustering of single-view data and the Partial Variational Autoencoder (VAE) with the Pointnet Plus (PNP) structure, a method to predict missing data points. More precisely, we extend VaDE by an additional VAE and examine two fusion techniques for creating a shared distribution between two data views. To handle missingness in both views, we integrate the Partial VAE with PNP, which enables the definition of a partial clustering objective that depends on observed data samples only. As a result, we propose the Partial Multi-View Variational Deep Embedding (Partial MV-VaDE), a deep probabilistic clustering model targeting multi-view and missing data. We evaluate the model's performance in extensive experiments with numerous multi-view data sets for which we generate different amounts of missingness. We observe the model's changes in cluster probabilities in more detail and compare the clustering results to several baseline methods.

Schlagwörter

Schlagwörter
(Deutsch)
Deep Clustering Probabilistisches Modell Multimodale Daten Unvollständige Daten VAE Erweiterung von VaDE Partial VAE
Schlagwörter
(Englisch)
Deep Probabilistic Clustering Generative Modell Multi-View Data Missing Data VAE Extension of VaDE Partial VAE
Autor*innen
Donatella Novakovic
Haupttitel (Englisch)
Deep probabilistic clustering for multi-view data and missing data
Paralleltitel (Deutsch)
Probabilistisches Deep Clustering für multimodale und unvollständige Daten
Publikationsjahr
2022
Umfangsangabe
vi, 73 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Sebastian Tschiatschek
Klassifikation
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC16541532
Utheses ID
62065
Studienkennzahl
UA | 066 | 921 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1