Detailansicht
Analysis of an EEG database of depression patients by means of graphical Granger causality
Christina Pacher
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Informatik
Betreuer*in
Claudia Plant
Mitbetreuer*in
Katerina Schindlerova
DOI
10.25365/thesis.73585
URN
urn:nbn:at:at-ubw:1-21327.09815.817289-3
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Diese Masterarbeit ist Teil des internationalen Forschungsprojekts "Learning Synchronization Patterns in Multivariate Neural Signals for Prediction of Response to Antidepressants". Hierbei handelt es sich um ein gemeinsames Projekt der Universität Wien, der Tschechischen Akademie der Wissenschaften und des Nationalen Instituts für psychische Gesundheit der Tschechischen Republik. Ziel dieses Projekts ist es, den Erfolg von Behandlungsmaßnahmen gegen Depressionen vorherzusagen, indem Methoden aus den Bereichen Data Mining und Machine Learning auf EEG-Gehirnstrommessungen angewendet werden. In dieser Masterarbeit kommt eine auf dem Kriterium der stochastic complexity basierende Variation von graphical Granger causality zum Einsatz, die 2020 von Hlaváčková-Schindler und Plant vorgestellt wurde. Mithilfe dieser Methode werden Granger-kausale Graphen aus den EEG-Daten berechnet. Eine Python-Implementierung dieser Methode wurde im Rahmen dieser Masterarbeit entwickelt. Die Implementierung legt Fokus auf Benutzerfreundlichkeit und leichte Erweiterbarkeit und steht auf der Plattform GitHub öffentlich zur Verfügung. Sie kann somit auch für andere Anwendungen dieser Methode zukünftig eine wertvolle Unterstützung sein. Mithilfe der neuen Implementierung wurden Feature-Vektoren aus einem Datenset extrahiert, das EEG-Messungen von 176 Patient*innen mit Depressionen enthält (aufgeteilt in ein Trainingsset aus 134 und ein Testset aus 42 Patient*innen). Diese Feature-Vektoren wurden in einer explorativen Analyse als Input für das Klassifizierungsproblem zwischen Behandlungserfolg und -misserfolg verwendet. Mehrere Varianten wurden erforscht, bei denen z.B. verschiedene Methoden zur Datenvorverarbeitung zum Einsatz kamen oder unterschiedliche Teilmengen der vorhandenen Elektroden verwendet wurden. Fünf gängige Klassifizierungsmethoden (support vector, K nearest neighbors, decision tree, random forest und naive bayes) wurden mithilfe einer Kreuzvalidierung für die Vorhersage trainiert. Auf Basis des ursprünglichen Datensets war es nicht möglich, den Behandlungserfolg mit zufriedenstellender Genauigkeit vorherzusagen: Keine der Klassifizierungsmethoden konnte die Dummy-Ergebnisse übertreffen, die als Vergleichswert dienten. Die Ergebnisse konnten verbessert werden, indem das Datenset nach biologischem Geschlecht unterteilt wurde und die Klassifizierung für männliche und weibliche Patient*innen getrennt durchgeführt wurde. An dem separaten Test-Datenset ließen sich die Ergebnisse nicht reproduzieren. Dennoch handelt es sich bei der Tatsache, dass diese Aufteilung das Ergebnis für das Trainings-Datenset verbessern konnte, um eine wertvolle Erkenntnis, auch in Hinblick auf die weitere Arbeit im Rahmen des Forschungsprojekts. Weiters bespricht diese Arbeit basierend auf den gewonnenen Erkenntnissen verschiedene Möglichkeiten, die die Qualität der Ergebnisse verbessern könnten, und setzt neue Ziele für weiterführende Experimente.
Abstract
(Englisch)
This master thesis was created as part of the international research project "Learning Synchronization Patterns in Multivariate Neural Signals for Prediction of Response to Antidepressants", a joint international project by the University of Vienna, the Czech Academy of Sciences, and the National Institute of Mental Health of the Czech Republic. This project investigates possibilities to predict the response of depression patients to antidepressant treatment by applying data mining and machine learning methods to EEG data. The approach that is employed in this thesis uses graphical Granger causality based on stochastic complexity, as introduced by Hlaváčková-Schindler and Plant in 2020, to extract features in the form of Granger-causal networks from EEG recordings. A Python implementation of this method was created as part of this thesis. As it was designed with focus on ease of use and extendability and has been made publicly available at GitHub, it will hopefully also prove to be a valuable resource for other projects looking to apply the same method. The new Python implementation was used to extract features from a data set of EEG recordings of 176 depression patients, split into a training set of 134 subjects and a test set of 42 subjects. In an exploratory analysis, the extracted features were used as input for the classification problem of differentiating between treatment responders and nonresponders. A number of different variations of the feature extraction process were carried out, encompassing the application of various preprocessing methods to the EEG signal and the use of subsets of the available electrode channels. Five common classifiers (the support vector, K nearest neighbors, decision tree, random forest, and naive bayes classifiers) were trained on the resulting features using a cross-validation approach. Initially, the classifiers were not able to predict treatment response with satisfying accuracy, as they did not manage to outperform baseline results created by dummy classifiers. Splitting the data set by biological sex and training the classifiers for male and female subjects separately improved the classification quality. These results did not generalize well to the test set of previously unseen data. Still, the fact that this split improved the classification result on the training set is a valuable insight that may also inform future work within the research project. This thesis furthermore discusses possible remedies that could increase the classification quality of the approach and sets objectives for future research based on the acquired insights.
Schlagwörter
Schlagwörter
(Deutsch)
EEG Depression Granger causality Klassifizierung Behandlungsprognose
Schlagwörter
(Englisch)
EEG depression Granger causality classification treatment prediction
Autor*innen
Christina Pacher
Haupttitel (Englisch)
Analysis of an EEG database of depression patients by means of graphical Granger causality
Paralleltitel (Deutsch)
Analyse von EEG-Daten von depressiven Patient*innen anhand von graphical Granger causality
Publikationsjahr
2023
Umfangsangabe
xv, 58 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Claudia Plant
Klassifikation
54 Informatik > 54.80 Angewandte Informatik
AC Nummer
AC16863984
Utheses ID
66842
Studienkennzahl
UA | 066 | 921 | |