Detailansicht

Towards making a large data set accessible for multiple different stakeholders
Raphael Sahann
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Dr.-Studium der technischen Wissenschaften (DissG: Informatik)
Betreuer*in
Torsten Möller
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.74684
URN
urn:nbn:at:at-ubw:1-14067.31723.763152-7
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Diese Dissertation ist eine Sammlung von Publikationen und Manuskripten welche die Zugänglichkeit großer Datensets für mehrere unterschiedliche Interessenträger zu verbessern. Um dies zu erreichen liegt der Fokus auf den drei wesentlichen Aspekten (i) Datenstrukturierung und Datenabstraktion, (ii) Wahrnehmung von Datenvisualis- ierungen und deren Interaktionsmöglichkeiten, und (iii) dem Nutzererlebnis. Um dies zu ergründen wird der umfassende Datensatz der Studentendaten der Universität Wien verwendet. Die erste Publikation definiert das abstrakte Konzept des Studienpfads, welches dem mentalen Modell wie Fortschritt im Studium empfunden wird entspricht. Auf Basis dieses Modells wird eine Distanzmetrik berechnet, die den Unterschied zwischen zwei Studienpfaden numerisch ausdrücken kann. Dadurch können Studienpfade gruppiert und auch für Vorhersagen verwendet werden. Diese Abstraktion macht die Studiendaten den Interessenträgern leichter zugänglich und intuitiv nutzbar. Die zweite Arbeit fokussiert sich auf die menschliche Perzeption bei der Interpretation von Datenverteilungen in Histogrammen. Sie evaluiert den perzeptuellen Fehler bei der Identifikation von Verteilungskurven im Verhältnis zur maximalen Anzahl der im Histogramm gezeigten Balken. Diese Observation wird direkt mit anderen in der Liter- atur häufig angewandten Methodiken zur Bestimmung der Klassenhäufigkeit verglichen. Unserer Arbeit zeigt, dass mit erheblich weniger Klassen bereits vergleichbar niedrige perzeptuelle Fehler erzielt werden können, und diese außerdem für den Betrachter leichter verständlich sind. Die dritte Publikation stellt eine neuartige, intuitive Markiermethode für Linien in Parallelen Koordinaten Diagrammen vor. Dafür werden bekannte Konzepte der Mar- kierung von Parallelen Koordinaten verwendet, welche mittels Reduktion der benötigten Maus-Aktionen zu einer einzelnen Klick- und Ziehinteraktion zusammengefasst werden. Die intuitive Verwendbarkeit der neuen Methode reduziert die mentale Anstrengung beim Interagieren mit Parallelen Koordinaten Diagrammen und macht diese dadurch verständlicher. Das vierte und letzte Manuskript beschreibt die Implementation und Evaluation einer nutzerfreundlichen Bedienoberfläche für die Semesterplanung von Studierenden. Anhand einer vierjährigen Designstudie wird der Mehrwert, den ein gut integriertes, leicht zu verwendendes Interface bringt, beleuchtet. In dem Manuskript wird außerdem der Prozess der Semesterplanung soweit abstrahiert, dass dieser auf eine große Bandbreite allgemeiner Planungsprozesse angewendet werden kann. Dieser abstrakte Planprozess kann als Richtlinie für die Erstellung zukünftiger Planungstools fungieren. Abschließend beleuchtet eine Analyse unterschiedliche Evaluationsmethoden im Designprozess und zeigt, wie eine Kombination dieser Methoden deren Ergebnisse noch verbessern kann. Diese vier Publikationen und Manuskripte behandeln unterschiedliche Aspekte des Zugriffs auf den gleichen darunterliegenden Datensatz aus der Perspektive mehrerer In- teressenträger. Jede der gezeigten Methoden für sich, aber auch deren Kombination, helfen dabei große Datenmengen für Experten und Nicht-Experten gleichermaßen zugänglich zu machen.
Abstract
(Englisch)
This dissertation is a compilation of publications and publication manuscripts that seek to improve the accessibility of large data sets for multiple different stakeholders. Therefore, it focuses on three essential aspects (i) data structures and abstraction, (ii) perception of data visualizations and their interactivity, and (iii) user experience. The thesis explores these facets using the extensive student data set from the University of Vienna. The first publication defines the abstract concept of a study path which represents the reported mental model of how the progress in a curriculum is perceived. This concept is then used to calculate a distance metric, making it possible to numerically express the difference between study paths. We show that this metric can then be used for clustering and predicting study paths. This abstraction makes the data approachable and intuitive to use. The second publication manuscript focuses on human perception for interpreting data distributions in histograms. It evaluates the error when judging distribution shapes in terms of the maximum number of shown bars in a histogram. We directly compare these findings to commonly used recommendations for choosing histogram binnings. Our work finds that notably fewer bins than common binning methods recommend achieve comparable perceptional errors when judging distributions but are easier to comprehend for the viewer. The third publication presents a novel intuitive brushing technique for parallel coordinate plots. It uses established concepts for highlighting lines in parallel coordinate plots and makes them easily accessible by reducing the interaction to a simple click-and-drag mouse gesture. The intuitive usage approach of this brushing method reduces the mental load when interacting with parallel coordinate plots and, therefore, makes them easier to grasp. Finally, the fourth publication manuscript describes the implementation and evaluation of a user interface for semester planning. This four-year user-centered design process shows the value of a well-integrated, easy-to-use user interface. The manuscript also abstracts the semester planning process into a broadly applicable abstract planning task that provides a guideline for future planning tools. It concludes with an analysis of different evaluation approaches for the design process and how a combination of different methods can benefit from another. These four publications and manuscripts deal with different aspects, driven by different stakeholders that all need access to the same large data set. Each individual approach and any combination of presented approaches help make large quantities of data more accessible to expert and non-expert users equally.

Schlagwörter

Schlagwörter
(Englisch)
Visualization Data Analysis Human-Computer-Interaction
Schlagwörter
(Deutsch)
Datenvisualisierung Datenanalyse Mensch-Computer-Interaktion
Autor*innen
Raphael Sahann
Haupttitel (Englisch)
Towards making a large data set accessible for multiple different stakeholders
Paralleltitel (Deutsch)
Große Datensätze einer Vielzahl unterschiedlicher Stakeholder zugänglich machen
Publikationsjahr
2021
Umfangsangabe
viii, 57 Seiten : Illustrationen, Diagramme
Sprache
Englisch
Beurteiler*innen
Eduard Gröller ,
Christopher Weaver
Klassifikationen
54 Informatik > 54.61 Datenverarbeitungsmanagement ,
54 Informatik > 54.62 Datenstrukturen ,
54 Informatik > 54.65 Webentwicklung, Webanwendungen
AC Nummer
AC16377788
Utheses ID
61132
Studienkennzahl
UA | 786 | 880 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1