Detailansicht
Exoplanet atmospheric retrieval and uncertainty estimation using machine learning
Hannah Kohlhofer
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Geowissenschaften, Geographie und Astronomie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Astronomie
Betreuer*in
Sudeshna Boro Saikia
DOI
10.25365/thesis.74018
URN
urn:nbn:at:at-ubw:1-20694.56921.664763-6
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Mit über 5000 bestätigten Exoplaneten ändert sich ihre Wissenschaft von einer Ära der Entdeckung zu einer Ära der detaillierten Charakterisierung. Neue astronomische Instrumente wie das James Webb Space Telescope (JWST; Gardner et al., 2006), ARIEL (Tinetti et al., 2021), PLATO (Rauer et al., 2014) und das Extremely Large Telescope (ELT; Neichel et al., 2018) werden noch nie dagewesene spektrale Auflösungen und Signal-zu-Rausch Verhältnisse liefern. Diese großen statistischen Studien liefern immer mehr Daten über Exoplaneten und ihre Spektren, und die Analyse dieser riesigen Stichprobe auf eine konsistente und unkomplizierte Weise ist von entscheidender Bedeutung, um die Exoplanetenforschung grundlegend zu verändern. Modernste Modelle können atmosphärische Parameter aus Exoplanetenspektren mithilfe statistischer Methoden für einzelne Exoplaneten ableiten. Bei der riesigen Menge an Daten, die wir erhalten, ist dies jedoch in geeigneten Zeiträumen nicht möglich. Ein vielversprechender neuer Ansatz ist der Einsatz von maschinellem Lernen, da die hohe Effizienz von Deep- Learning-Algorithmen für die Entdeckung komplizierter Details in Exoplanetenspektren hervorragend geeignet ist. Die Anwendung des maschinellen Lernens in den Naturwissenschaften steckt jedoch noch in den Kinderschuhen. In meiner Dissertation untersuche ich daher die Anwendung neuer, hochmoderner Deep-Learning-Tools für die Ermittlung atmosphärischer Eigenschaften aus simulierten synthetischen ARIEL-Atmosphärenspektren. Ich untersuche drei verschiedene Modellarchitekturen und konnte feststellen, dass alle von ihnen hohe Vorhersagefähigkeiten haben, gewisse Parameter aus Spektren auszulesen. Trotz ihrer häufig nachgewiesenen Genauigkeit werden Deep-neural-networks häufig als "Blackboxes" bezeichnet. Um herauszufinden, inwieweit man solchen Modellen vertrauen kann und wie gut ihre Vorhersagen wirklich sind, untersuche ich deshalb, wie Fehlerschätzungen in diese Deep-Learning-Modelle integriert werden kann, und verwende dazu ein Mixture-Density-Modell und ’Deep Evidential Regression’. Diese Modelle können zur Schätzung der gesamten, aleatorischen (Daten) und epistemischen (Model) Unsicherheiten ihrer Vorhersagen verwendet werden, was wiederum hilft die Gesamtleistung der Modelle einzuschätzen. Durch meine Arbeit stellt sich heraus, dass verschiedene maschinelle Lernmodelle zur Unsicherheitsabschätzung unterschiedlich genaue und präzise Ergebnisse produzieren. Zwar kann das "evidential" Netzwerk die Daten- und Modellunsicherheiten getrennt schätzen, doch bleibt unklar, ob dies auch wirklich die beiden Unsicherheiten genau beschreibt. Dennoch zeigen die in dieser Arbeit verwendeten Methoden, dass es grundsätzlich möglich ist, Unsicherheiten in neuronalen Netzen zu schätzen. Diese Erkenntnis wird dazu beitragen, Vorhersagen von Algorithmen des maschinellen Lernens zu interpretieren und zu bewerten und neuronale Netze weniger zu einer Blackbox zu machen.
Abstract
(Englisch)
With over 5000 confirmed exoplanets, the field of exoplanet science is moving from an era of detection to one of detailed characterization. New astronomical instruments such as the James Webb Space Telescope (JWST, Gardner et al., 2006), ARIEL (Tinetti et al., 2021), PLATO (Rauer et al., 2014), and ELT (Neichel et al., 2018) will provide unprecedented spectral resolution and signal-to-noise ratio for a wide range of exoplanets and their host stars. Specifically, these large statistical studies, as planned by the Ariel mission, will bring ever more data on exoplanets and their spectra, and analyzing this huge sample in a consistent and straightforward way is crucial to bring transformative changes to exoplanet science. Existing state-of-the-art models can retrieve atmospheric parameters from exoplanet spectra using statistical inference methods for individual exoplanets. However, for the vast amount of data, we will receive in the coming years, this is not feasible on reasonable timescales. A promising new approach is to use machine learning pipelines, as the high efficiency of deep learning algorithms is great for discovering intricate details in exoplanet spectra. However, the application of machine learning in the physical sciences is still in its early years. Therefore, in my thesis, I explore the application of new state-of-the-art deep learning tools in the retrieval of atmospheric properties from simulated synthetic ARIEL atmosphere spectra. I investigate three different model architectures to figure out how much such models can be trusted, and how good their predictions really are. Additionally, I investigate how error estimation can be included in these deep learning models, utilizing a mixture density model and deep evidential regression. I find that all three models have high predictive capabilities to perform atmospheric retrievals and that different uncertainty estimation machine learning models perform this task with varying degrees of accuracy and precision. The methods employed in this work, show that it is in principle possible to estimate uncertainties in neural networks. However, robust interpretability of the different model uncertainties is still at an early stage and is planned for future work. This will help interpret and evaluate predictions of machine learning algorithms and render neural networks less of a black box.
Schlagwörter
Schlagwörter
(Deutsch)
exoplaneten maschinelles lernen atmosphären
Schlagwörter
(Englisch)
exoplanets machine learning atmospheres
Autor*innen
Hannah Kohlhofer
Haupttitel (Englisch)
Exoplanet atmospheric retrieval and uncertainty estimation using machine learning
Paralleltitel (Deutsch)
Bestimmung atmosphärischer Parameter und deren Unsicherheiten mit maschinellem Lernen
Publikationsjahr
2023
Umfangsangabe
xi, 77 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Sudeshna Boro Saikia
Klassifikationen
39 Astronomie > 39.53 Planeten ,
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC16920334
Utheses ID
67793
Studienkennzahl
UA | 066 | 861 | |
