Detailansicht

Finding needles in the Galactic haystack
towards interpretable machine learning methods to identify stellar structures in the Milky Way
Sebastian Ratzenböck
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Dr.-Studium der technischen Wissenschaften (DissG: Informatik)
Betreuer*innen
Torsten Möller ,
João Alves
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.71935
URN
urn:nbn:at:at-ubw:1-23119.98017.132325-3
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Die vorliegende Doktorarbeit beschäftigt sich mit dem Auffinden stellarer Gruppen in der Milchstraße und beabsichtigt es, neue Blickwinkel auf gebräuchliche Methoden in diesem Bereich zu eröffnen. Insbesondere sollen im Zuge der Arbeit transparente Analysemethoden bereitgestellt werden, um bisher unbekannte Sternhaufen sowie neue Mitglieder bekannter stellarer Populationen aufzudecken. Ziel ist es, Techniken für Astronom*innen bereitzustellen, welche ein vollständigeres Bild verschiedener Sternhaufen in der lokalen Milchstraße darstellen können. Im Rahmen der Dissertation wird zunächst das Verfahren Uncover vorgestellt. Uncover ist ein Verfahren zur umfangreichen Mitgliederanalyse stellarer Gruppen und kann zuvor entdeckte zugehörige Sterne dieser Gruppen einbeziehen, um nach bisher unentdeckten Sternen zu suchen. Die Methode konnte erfolgreich in zwei Anwendungsfällen durchgeführt werden: bei der kürzlich entdeckten Meingast 1 Gruppe - einem Sternhaufen, das gleichzeitig mit den Plejaden geformt wurde und etwa 120 Grad des Himmels einnimmt - und bei der bereits sehr eingehend erforschten Sternentstehungsregion rho Ophiuchus. Für diese beiden sehr unterschiedlichen Sternsysteme konnte Uncover die Anzahl der gefundenen zugehörigen Sterne um das Zehnfache, somit um etwa 200 Sterne erhöhen. Bei der zweiten Methode zur Auffindung stellarer Gruppen handelt es sich um einen innovativen Clustering-Algorithmus, Signiőcance Mode Analysis (SigMA), der die topologischen Eigenschaften der Dichteverteilung im mehrdimensionalen Phasenraum untersucht. Durch die Anwendung von SigMA auf Gaia-EDR3-Daten der Scorpius-Centaurus-Assoziation (Sco-Cen) konnten zum ersten Mal 48 sich gemeinsam bewegende und gleichaltrige Cluster in Sco-Cen gefunden werden, von denen viele bisher unbekannt waren. Diese 48 Haufen wurden unabhängig voneinander mit Hilfe von astrophysikalischem Wissen validiert. Sowohl Uncover als auch SigMA sind in einer domänenspezifischen Sprache formuliert, verwenden aussagekräftige Hyperparameter und ermöglichen eine Ergebnisvalidierung, um zuverlässige Ergebnisse sicherzustellen. Mit diesen Werkzeugen möchten wir dazu beitragen, die derzeitige Kultur des blinden Vertrauens in Machine-Learning-Tools zu verändern und Astronom*innen dabei helfen, Modelle auf Grundlage ihrer Fachkenntnisse zu erstellen und zu modifizieren.
Abstract
(Englisch)
This doctoral thesis aims to take a different look at stellar structure censuses in the Milky Way. Specifically, it aims to provide interpretable analysis methods to uncover both previously unknown stellar structures and new members of known stellar populations, providing astronomers with a more complete picture of the different stellar structures in the local Milky Way. The thesis contributions to the field are twofold: first, it introduces Uncover, an extended membership analysis technique that integrates known members of star clusters to search for yet undetected cluster members. Uncover is successfully applied to two different use cases, the recently discovered Meingast 1 stream, a Pleiades-age structure covering about 120 degrees of the sky, and the well-studied star-forming region rho Ophiuchus. For these two very different stellar structures, Uncover increased the number of members by tenfold and by about 200, respectively. Second, the thesis introduces Significance Mode Analysis (SigMA), an innovative clustering algorithm that studies the topological properties of the density field in multidimensional phase space. The application of SigMA to Gaia EDR3 data of the closest young association to Earth, the Scorpio-Centaurus (Sco-Cen) association, finds, for the first time, 48 co-moving and coeval clusters in Sco-Cen, many of them previously unknown. These 48 clusters are independently validated using astrophysical knowledge unknown to SigMA. Both Uncover and SigMA are formulated in domain-specific language, use expressive hyper-parameters, and allow for result validation to provide confidence in the results. With these tools, we seek to contribute to changing the current culture of blind acceptance of machine learning results and help astronomers build and modify models based on their expertise.

Schlagwörter

Schlagwörter
(Deutsch)
Machine Learning Clusteranalyse Designstudie Sternhaufen
Schlagwörter
(Englisch)
Machine learning Cluster analysis Design study Stellar groups
Autor*innen
Sebastian Ratzenböck
Haupttitel (Englisch)
Finding needles in the Galactic haystack
Hauptuntertitel (Englisch)
towards interpretable machine learning methods to identify stellar structures in the Milky Way
Paralleltitel (Deutsch)
Die Suche nach Nadeln im galaktischen Heuhaufen
Paralleluntertitel (Deutsch)
interpretierbare Machine Learning Methoden zur Auffindung von Sternhaufen in der Milchstraße
Publikationsjahr
2022
Umfangsangabe
xii, 122 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*innen
David W. Hogg ,
Alberto Krone-Martins
Klassifikationen
39 Astronomie > 39.23 Himmelsmechanik, Astrodynamik ,
39 Astronomie > 39.40 Sternsysteme, Sterne ,
54 Informatik > 54.61 Datenverarbeitungsmanagement ,
54 Informatik > 54.62 Datenstrukturen ,
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC16595491
Utheses ID
63729
Studienkennzahl
UA | 786 | 880 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1