Detailansicht
Interpreting and imitating human perception in dimensionality reduction via surrogate models
Raphael Mitsch
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Informatik
Betreuer*in
Torsten Möller
DOI
10.25365/thesis.64636
URN
urn:nbn:at:at-ubw:1-29036.26268.553983-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Dimensionalitätsreduktion wird im akademischen sowie im industriellen
Umfeld häufig verwendet, um niedrigdimensionale Projektionen
hochdimensionaler Daten - sogenannte Embeddings - zu erstellen. Deren
Visualisierung kann jedoch schwer zu interpretieren und eventuell irreführend
sein, besonders ohne eine klar definierte Grundwahrheit. Die von Benutzern
gezogenen Schlüsse über Muster in den zugrunde liegenden Daten können
stark darauf beruhen, wie die korrespondierende Visualisierung
wahrgenommen wird. Eine Untersuchung dessen, wie dieser perzeptionelle
Prozess abläuft und wie akkurat er ist, ist daher wichtig. Die vorliegende
Masterarbeit widmet sich dieser Frage.
Wir stellen eine Applikation für die Interpretation, das Verständnis und die
Bewertung solcher niedrigdimensionaler Embeddings vor. Diese erhielt in einer
Benutzerstudie überwiegend positive Rückmeldungen und wurde von uns
eingesetzt, um Bewertungen der wahrgenommenen Qualität von Embeddings
zu sammeln.
Wir analysieren den Grad der Korrelation zwischen wahrgenommener und
objektiver Embeddingqualität. Wir zeigen, dass erstere nicht ausschließlich
durch zweitere erklärt wird und dass die verbleibende Lücke durch die
Einbeziehung visueller Qualitätskriterien für Cluster- und
Klassen-Separabilität reduziert werden kann. Der Einfluss dieser Kriterien auf
die wahrgenommene Embeddingqualität wird untersucht. Unser Ansatz setzt
nicht den überwachten Fall voraus und kann mit Embeddings von Entitäten
ohne Klassenzuordnung umgehen.
Abschließend diskutieren wir sowohl Einschränkungen und Vorteile unserer
Applikation und Analyse als auch Implikationen unserer Ergebnisse, mögliche
Anwendungsfälle und zukünftige Verbesserungen.
Abstract
(Englisch)
Dimensionality reduction is widely used in both academia and industry to
generate low-dimensional projections of high-dimensional datasets.
Visualizations thereof can be notoriously hard to interpret and even
misleading, particularly lacking a clearly defined ground truth. Users’
interpretation of and conclusions on patterns in the underlying data can be
rooted in their perception of the corresponding low-dimensional embedding
visualization. It is hence important to investigate how and how accurately this
perceptual process operates, which is addressed in this thesis.
We introduce a tool designed for the task of interpreting, understanding and
rating low-dimensional embeddings, which received favourable feedback in a
user study. We employed this tool to obtain perceived embedding quality
(PEQ) scores.
We analyze the degree to which objective quality and PEQ correlate. We show
that the former is not fully explained by the latter and that the remaining gap
can be narrowed by incorporating a set of visual quality criteria designed for
cluster and class separation. The influence of these criteria on PEQ is
examined. Our methodology does not presuppose the supervised case and
handles embeddings of entities without class labels.
Finally, we discuss limitations and merits of our annotation tool and analysis
methodology as well as implications of our results, potential applications and
future improvements
Schlagwörter
Schlagwörter
(Englisch)
Dimensionality reduction Visualization Machine Learning
Schlagwörter
(Deutsch)
Dimensionalitätsreduktion Visualisierung Maschinelles Lernen
Autor*innen
Raphael Mitsch
Haupttitel (Englisch)
Interpreting and imitating human perception in dimensionality reduction via surrogate models
Paralleltitel (Deutsch)
Interpretation und Imitation menschlicher Wahrnehmung in der Dimensionalitätsreduktion mittels Ersatzmodellen
Publikationsjahr
2020
Umfangsangabe
xii, 80 Seiten : Illustrationen, Diagramme
Sprache
Englisch
Beurteiler*in
Torsten Möller
Klassifikationen
54 Informatik > 54.72 Künstliche Intelligenz ,
54 Informatik > 54.73 Computergraphik
AC Nummer
AC16209989
Utheses ID
57354
Studienkennzahl
UA | 066 | 921 | |
