Detailansicht

Variational autoencoders with structured missingness
Michael Raffelsberger
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Data Science
Betreuer*in
Sebastian Tschiatschek
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.73335
URN
urn:nbn:at:at-ubw:1-12340.78043.815810-3
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Wir untersuchen und verbessern Variational Autoencoders (VAE), wenn Variablen eines Datensatzes missing at random sind. Im untersuchten Setting fehlen Werte einer oder mehrerer Variablen aufgrund der bereits beobachteten Werte anderer Variablen, die Information über die fehlenden Werte enthalten. Bei einer medizinischen Untersuchung beispielsweise könnte ein Doktor entscheiden, Folgeuntersuchungen auszulassen, da bereits vorliegende Befunde Rückschlüsse auf die Resultate der Folgeuntersuchungen ermöglichen. In diesem Fall liegt sowohl Vorwissen zum Missingness Prozess als auch zu den fehlenden Werten selbst vor. Wir zeigen, dass dieser Fall zu unerwünschten Ergebnissen führen kann, insbesondere bei kleinen Datensätzen, und dass Vorwissen zum Missingness Prozess nur eingeschränkt hilfreich ist. Unsere Kernidee besteht darin, das Vorwissen zu den fehlenden Werten direkt zu verwenden, um das Modell zu regularisieren. Diese Kombination aus Daten und Vorwissen verbessert die Ergebnisse und macht das Modell robuster und zuverlässiger.
Abstract
(Englisch)
We investigate and improve variational autoencoders (VAE) in the presence of missing at random data. In our assumed setting, certain variables of a sample are unobserved because of the values of variables recorded earlier that already carry some information about the unobserved values. Imagine a doctor deciding to skip further diagnostic tests based on already available results of other tests. In this setting, we have both knowledge about the missingness process as well as a presumption about the values of the unobserved variables. We show that such missingness leads to unsatisfactory results, especially for small datasets and that knowledge about the missingness process is barely helpful. Therefore, our core idea is to incorporate knowledge about the actual unobserved values via imputation or additional loss terms to regularize the model. This idea allows to find a sweet spot between data and knowledge, improves results and makes the model more robust and reliable.

Schlagwörter

Schlagwörter
(Deutsch)
variational autoencoders missing data prior knowledge
Schlagwörter
(Englisch)
Variational Autoencoders fehlende Daten Vorwissen
Autor*innen
Michael Raffelsberger
Haupttitel (Englisch)
Variational autoencoders with structured missingness
Paralleltitel (Deutsch)
Variational Autoencoders mit strukturiert fehlenden Daten
Publikationsjahr
2023
Umfangsangabe
xiii, 68 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Sebastian Tschiatschek
Klassifikation
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC16813592
Utheses ID
66222
Studienkennzahl
UA | 066 | 645 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1