Detailansicht
Major depressive disorder treatment prediction using entropy-based measures
Alexander Stähle
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Data Science
Betreuer*in
Katerina Schindlerova
Mitbetreuer*in
Lukas Miklautz
DOI
10.25365/thesis.76770
URN
urn:nbn:at:at-ubw:1-14215.42572.249327-8
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Die herkömmliche 30-tägige Evaluationsphase zur Behandlung von Depressionen ist oft langwierig, was die Symptome verschlimmern und die Chancen auf eine Remission aufgrund des erschöpfenden Prozesses verringern kann. Eine frühere Vorhersage des Behandlungserfolgs auf Basis von electroencephalography (EEG)-Daten könnte die Behandlungszeit erheblich verkürzen, die Auswahl von Antidepressiva verbessern und somit die Remissionsergebnisse optimieren. Diese Arbeit untersucht den Einsatz von Machine Learning-Modellen zur Vorhersage der Behandlungsergebnisse von Depressionen durch Analyse von EEG-Daten, die nach nur sieben Behandlungstagen erhoben wurden. Wir betrachten dies als ein Klassifikationsproblem und verwenden sowohl lineare als auch nichtlineare Methoden, wobei wir den Schwerpunkt auf Entropie-basierte Techniken legen, um Feature aus EEG-Signalen zu extrahieren und die Komplexität der Dynamik des Gehirns zu evaluieren. Zunächst führen wir eine Zeit-Frequenz-Dekomposition mittels Wavelet-Transformation durch und berechnen eine umfangreiches Set an Featuren. Soweit uns bekannt ist, ist diese Arbeit die erste, die eine umfassende Reihe von entropiebasierten Metriken in die Vorhersage von Behandlungsergebnissen bei Depressionen einbezieht. Wir führen außerdem ein neue Metrik ein, das wir symbolic influence entropy (SIE) nennen, welche aus dem Konzept der Transferentropie abgeleitet ist und dazu dient, den Einfluss der Vergangenheit eines Signals auf seinen aktuellen Wert zu quantifizieren, indem externe Informationen, die mit einem anderen Signal geteilt werden, ausgeschlossen werden. Die Klassifikation erfolgt in zwei Szenarien: Einmal unter der Verwendung jeder Metrik einzeln und einmal durch Kombination eines Ensembles verschiedener Metriken. Wir bewerten die Leistung von drei Feature-Selection-Techniken: minimum Redundancy Maximum Relevance (mRMR), F-Test und L1-regularisierungsbasierte Selektion und analysieren die Ergebnisse von fünf Machine Learning-Modellen. Unser Fokus liegt darauf, wichtige Metriken, Frequenzbereiche und EEG-Kanäle zu identifizieren, die als Marker zur Vorhersage der Behandlungsreaktion bei Depressionen dienen könnten. Der Datensatz umfasst 176 Patienten und wird mittels nested cross validation (CV) aufgeteilt, um einen durchschnittlichen Testscore zu erhalten. Unter den Modellen zeigte die Support Vector Machine (SVM) die höchste Präzision und erzielte einen F1-Score von 0,646 unter Verwendung von symbolic transfer entropy (STE) als alleinige Metrik. Bemerkenswert ist, dass die Verwendung mehrerer Metriken die Präzision im Vergleich zur Verwendung einzelner Metriken nicht verbesserte. Die starke Leistung von STE stimmt mit seiner häufigen Auswahl im Multi-Measure-Ansatz und seiner Signifikanz in der statistischen Analyse überein. In den statistischen Analysen zeigt sich T6 als vielversprechender EEG-Kanal, wobei Delta-Frequenzen eine leicht bessere Unterscheidung zwischen Respondern und Non-Respondern ermöglichen. Zudem hat die Wahl der Entropie-Variante nur einen minimalen Einfluss auf die Klassifikationswerte, die in verschiedenen Tests konstant innerhalb von 0,04 des besten beobachteten Wertes bleiben. Im Gegensatz dazu führen andere lineare und nichtlineare Metriken zu variableren Ergebnissen, bei denen die Werte um 0,07 bis 0,15 Punkte unter dem besten beobachteten Wert liegen können, wodurch Entropie-Varianten zuverlässiger in der Aufrechterhaltung einer hohen Klassifikationspräzision sind. Obwohl alle Klassifikationspipelines ein gewisses Maß an Overfitting aufweisen, legen unsere Ergebnisse nahe, dass EEG-Daten dynamische Eigenschaften des Gehirns enthalten, die mittels Entropie-basierter Methoden extrahiert werden können, was möglicherweise bei der Identifizierung kritischer Marker für die Remission bei Depressionen hilfreich ist.
Abstract
(Englisch)
The traditional 30-day evaluation period for depression treatment is often lengthy, potentially worsening symptoms and reducing remission chances due to the exhaustive process. Predicting treatment response earlier using electroencephalography (EEG) data could significantly shorten treatment times, improve antidepressant selection, and enhance remission outcomes. This thesis explores the utilization of machine learning models to predict depression treatment outcomes by analyzing EEG data collected after seven days of treatment. We address this as a classification problem, employing both linear and non-linear methods, with an emphasis on entropy-based techniques to extract features from EEG signals and assess brain dynamics. We begin with time-frequency decomposition using wavelet transform analysis and calculate an extensive set of features. To our knowledge, this thesis is the first to use a comprehensive set of entropy-based measures for predicting depression treatment outcomes. We also introduce a novel measure, symbolic influence entropy (SIE), derived from transfer entropy, designed to quantify a signal’s past influence on its present value by excluding external information shared across another signal. Classification is performed in two settings: using each measure individually and combining an ensemble of measures. We evaluate the performance of three feature selection techniques: minimum Redundancy Maximum Relevance (mRMR), F-Test, and L1-regularization-based selection, and analyze results from five machine learning models. Our analysis identifies key measures, frequency ranges, and EEG channels that may serve as markers for predicting treatment response in depression. The dataset includes 176 patients, divided using nested cross validation (CV) to obtain an average test score across all folds. Among the models, the Support Vector Machine (SVM) demonstrated the highest precision, achieving an F1 score of 0.646 using symbolic transfer entropy (STE) as a single feature. Notably, using multiple measures did not improve precision compared to single measures. STE’s strong performance aligns with its frequent selection in multi-measure settings and significance in statistical analysis. T6 emerges as a promising channel through statistical analyses, with delta frequencies slightly better at discriminating between responders and non-responders. Additionally, the choice of entropy variant has only a minimal impact on classification scores, which consistently remain within 0.04 of the best-observed score across different tests. In contrast, other linear and non-linear measures can produce more variable results, with scores ranging from 0.07 to 0.15 points below the best-observed score, making entropy variants more reliable in maintaining high classification precision. Despite some overfitting, our findings suggest EEG data contain brain dynamics that can be extracted using entropy-based methods, potentially aiding in identifying critical remission markers in depression.
Schlagwörter
Schlagwörter
(Deutsch)
Entropie Klassifizierung Maschinelles Lernen Depression Feature Extraktion Behandlungserfolg Vorhersage
Schlagwörter
(Englisch)
entropy classification machine learning depression feature extraction treatment response prediction
Haupttitel (Englisch)
Major depressive disorder treatment prediction using entropy-based measures
Publikationsjahr
2024
Umfangsangabe
xii, 108 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Katerina Schindlerova
Klassifikation
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC17337233
Utheses ID
72656
Studienkennzahl
UA | 066 | 645 | |