Detailansicht

Interpreting and imitating human perception in dimensionality reduction via surrogate models
Raphael Mitsch
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Informatik
Betreuer*in
Torsten Möller
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.64636
URN
urn:nbn:at:at-ubw:1-29036.26268.553983-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Dimensionalitätsreduktion wird im akademischen sowie im industriellen Umfeld häufig verwendet, um niedrigdimensionale Projektionen hochdimensionaler Daten - sogenannte Embeddings - zu erstellen. Deren Visualisierung kann jedoch schwer zu interpretieren und eventuell irreführend sein, besonders ohne eine klar definierte Grundwahrheit. Die von Benutzern gezogenen Schlüsse über Muster in den zugrunde liegenden Daten können stark darauf beruhen, wie die korrespondierende Visualisierung wahrgenommen wird. Eine Untersuchung dessen, wie dieser perzeptionelle Prozess abläuft und wie akkurat er ist, ist daher wichtig. Die vorliegende Masterarbeit widmet sich dieser Frage. Wir stellen eine Applikation für die Interpretation, das Verständnis und die Bewertung solcher niedrigdimensionaler Embeddings vor. Diese erhielt in einer Benutzerstudie überwiegend positive Rückmeldungen und wurde von uns eingesetzt, um Bewertungen der wahrgenommenen Qualität von Embeddings zu sammeln. Wir analysieren den Grad der Korrelation zwischen wahrgenommener und objektiver Embeddingqualität. Wir zeigen, dass erstere nicht ausschließlich durch zweitere erklärt wird und dass die verbleibende Lücke durch die Einbeziehung visueller Qualitätskriterien für Cluster- und Klassen-Separabilität reduziert werden kann. Der Einfluss dieser Kriterien auf die wahrgenommene Embeddingqualität wird untersucht. Unser Ansatz setzt nicht den überwachten Fall voraus und kann mit Embeddings von Entitäten ohne Klassenzuordnung umgehen. Abschließend diskutieren wir sowohl Einschränkungen und Vorteile unserer Applikation und Analyse als auch Implikationen unserer Ergebnisse, mögliche Anwendungsfälle und zukünftige Verbesserungen.
Abstract
(Englisch)
Dimensionality reduction is widely used in both academia and industry to generate low-dimensional projections of high-dimensional datasets. Visualizations thereof can be notoriously hard to interpret and even misleading, particularly lacking a clearly defined ground truth. Users’ interpretation of and conclusions on patterns in the underlying data can be rooted in their perception of the corresponding low-dimensional embedding visualization. It is hence important to investigate how and how accurately this perceptual process operates, which is addressed in this thesis. We introduce a tool designed for the task of interpreting, understanding and rating low-dimensional embeddings, which received favourable feedback in a user study. We employed this tool to obtain perceived embedding quality (PEQ) scores. We analyze the degree to which objective quality and PEQ correlate. We show that the former is not fully explained by the latter and that the remaining gap can be narrowed by incorporating a set of visual quality criteria designed for cluster and class separation. The influence of these criteria on PEQ is examined. Our methodology does not presuppose the supervised case and handles embeddings of entities without class labels. Finally, we discuss limitations and merits of our annotation tool and analysis methodology as well as implications of our results, potential applications and future improvements

Schlagwörter

Schlagwörter
(Englisch)
Dimensionality reduction Visualization Machine Learning
Schlagwörter
(Deutsch)
Dimensionalitätsreduktion Visualisierung Maschinelles Lernen
Autor*innen
Raphael Mitsch
Haupttitel (Englisch)
Interpreting and imitating human perception in dimensionality reduction via surrogate models
Paralleltitel (Deutsch)
Interpretation und Imitation menschlicher Wahrnehmung in der Dimensionalitätsreduktion mittels Ersatzmodellen
Publikationsjahr
2020
Umfangsangabe
xii, 80 Seiten : Illustrationen, Diagramme
Sprache
Englisch
Beurteiler*in
Torsten Möller
Klassifikationen
54 Informatik > 54.72 Künstliche Intelligenz ,
54 Informatik > 54.73 Computergraphik
AC Nummer
AC16209989
Utheses ID
57354
Studienkennzahl
UA | 066 | 921 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1