Detailansicht
Associations of affect in large-scale social media aggregates and a 12-wave representative survey during the Covid-19 pandemic in Austria
Damian Bednarz
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Psychologie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Psychologie
Betreuer*in
Claus Lamm
DOI
10.25365/thesis.71914
URN
urn:nbn:at:at-ubw:1-10652.90247.851676-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Groß angelegte Umfragen sind aufwendig, ökonomisch ineffizient und ihre Qualität kann von diversen Verzerrungen beeinflusst sein. Insbesondere die Covid-19 Pandemie drängt uns, die Validität alternativer und effizienter Methoden zu evaluieren, welche emotionale Veränderungen in der Gesellschaft erfassen können. Diese Masterarbeit befasst sich mit dem Zusammenhang einer repräsentativen österreichischen Umfrage in 12 Wellen mit Sentiment Analysen der Postings zweier Plattformen sozialer Medien - Twitter und dem Onlineforum der österreichischen Zeitung Der Standard - in den ersten acht Monaten der Pandemie im Jahr 2020. Die vom Survey erfassten Variablen Depression, Wut und Angst wurden mit entsprechenden Wörterbuch-basierten Linguistic Inquiry and Word Count (LIWC) und Deep Learning-basierten German Sentiment (GS) Variablen korreliert. Die Spearman'schen Rankkorrelationen waren, bis auf den LIWC Score für Wut, durchweg positiv und mittelstark. Sie waren jedoch nicht signifikant, was an der kleinen Stichprobe aufgrund der geringen Anzahl an Wellen dieser Umfrage liegen könnte. Weitere Analysen der Twitter Daten zeigten, dass diese Ergebnisse potenziell stark durch den Einfluss von Geschlecht und Bundesstaat konfundiert sind. Weiterhin konnten wir die Ergebnisse vorheriger Studien, die von stärkeren Assoziationen zwischen Umfragen und Machine Learning-basierten Sentiment Methoden verglichen mit Wörterbuch-basierten Methoden berichten, nicht konsistent replizieren. Unsere Ergebnisse zeigen, dass die Assoziation von der Dauer der jeweiligen Emotionen abhängen kann: Schnelllebige Emotionen wie Wut sind wahrscheinlich besser durch kurze Zeitintervalle der inkludierten sozialen Medien Daten zu erfassen. Andererseits sind Emotionen, die beispielsweise mit Depressionen zusammenhängen, träge und werden in sozialen Medien über einen längeren Zeitraum hinweg vermutlich besser widergespiegelt. Weitere explorative Analysen zeigen großteils ähnliche Zusammenhänge von Umfragen und sozialen Medien Daten wie in bisherigen Publikationen, auch wenn die Korrelationen in der aktuellen Studie kleiner sind. Daher unterstützen unsere Ergebnisse aktuelle Forschung über die Validität von Sentiment Analysen teilweise, auch wenn Replikationen mit höherer statistischer Power weiterhin notwendig sind, insbesondere durch mehrwellige Umfragen mit kleineren Zeitintervallen.
Abstract
(Englisch)
Large-scale surveys are costly, effortful to conduct and suffer from a range of biases when assessing a population's emotional state. Therefore, alternative efficient and easily accessible ways of measuring emotional changes - especially during the Covid-19 pandemic - are warranted. This thesis investigated whether patterns in a 12-wave mental health survey with representative Austrian samples during the 2020 pandemic can be linked to sentiment measures based on postings from Twitter and the Austrian newspaper forum Der Standard. More specifically, we correlated self-reported depression, anxiety and anger with various dictionary-based Linguistic Inquiry and Word Count (LIWC) scores and two deep learning-based German Sentiment (GS) scores. Apart from LIWC anger, all Spearman's rank correlations between survey and social media variables were positive and medium in size. Yet, they were not significant, which may be related to the limited sample size caused by the small number of survey waves. Further exploration with Twitter data points to a substantial confounding effect of gender and federal state, which may explain a large part of the variation in the self-reported emotions. Generally, we found inconsistent evidence concerning the comparison between machine learning-based and dictionary-based methods and cannot back the claim that the former outperforms the latter in German. Our results further indicate that volatile emotional variables like anger are better understood by keeping the time window for which social media data is included short. In contrast, mental health variables that evolve more slowly in time, such as depression, are more strongly associated with survey measures when this time window is longer. Further exploratory analyses mostly affirm existing literature on the association between survey emotions and sentiment measures, although the current associations tend to be smaller. Hence, the results partly support recent research concerning the validity of emotion and sentiment measures but call for replications with higher statistical power by implementing repeated surveys at smaller time intervals.
Schlagwörter
Schlagwörter
(Deutsch)
Soziale Medien Sentiment Analysen Erhebung der psychischen Gesundheit Covid-19
Schlagwörter
(Englisch)
Social Media Sentiment Analyses Mental Health Survey Covid-19
Autor*innen
Damian Bednarz
Haupttitel (Englisch)
Associations of affect in large-scale social media aggregates and a 12-wave representative survey during the Covid-19 pandemic in Austria
Paralleltitel (Deutsch)
Zusammenhang von Affekt in sozialen Medien und einer 12-welligen repräsentativen Umfrage während der Covid-19-Pandemie in Österreich
Publikationsjahr
2022
Umfangsangabe
iii, 49 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Claus Lamm
Klassifikationen
77 Psychologie > 77.03 Methoden und Techniken der Psychologie ,
77 Psychologie > 77.46 Emotion
AC Nummer
AC16594374
Utheses ID
63333
Studienkennzahl
UA | 066 | 840 | |