Detailansicht

Solving the electronic Schrödinger equation using deep neural networks and transfer learning
Leon Gerard
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Mathematik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Doktoratsstudium NAWI aus dem Bereich Naturwissenschaften (DissG: Mathematik)
Betreuer*in
Philipp Grohs
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.76403
URN
urn:nbn:at:at-ubw:1-16721.03520.711226-8
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Diese Arbeit fasst eine Reihe von Veröffentlichungen auf dem aufstrebenden Gebiet des Deep Learning basierten Variational Monte Carlo (DL-VMC) Ansatzes zusammen. DL-VMC ist eine hochgenaue ab-initio Methode zur Berechnung elektronischer Eigenschaften von Molekülen, welche man durch die Lösungen der Schrödinger Gleichung erhält. Die zeitunabhängige, nichtrelativistische Schrödinger-Gleichung ist eine Eigenwertgleichung, wobei der Schwerpunkt der folgenden Doktorarbeit auf dem kleinsten Eigenwert und der zugehörigen Eigenfunktion liegt. In DL-VMC wird auf unüberwachte Weise ein neuronales Netzwerk optimiert, um die Lösungen der Schrödinger-Gleichung, die Wellenfunktionen, zu repräsentieren. DL-VMC erreicht eine zum Teil höhere Genauigkeit im Vergleich zu anderen Berechnungsmethoden, wenn auch mit einem erheblichen Kostenaufwand aufgrund der großen Anzahl von trainierbaren Parametern im neuronalen Netzwerk und der Notwendigkeit der Monte-Carlo-Integration, um eine genaue Schätzung des Eigenwerts zu erhalten. Die folgende Arbeit leistet einen Beitrag zu den jüngsten Fortschritten bei der Verbesserung der Effizienz der Methode. Dies wird erreicht durch die Einführung einer neuartigen Technik zum effektiven Lernen von Wellenfunktionen über verschiedene Moleküle und ihren geometrischen Konformationen. Wir führen eine verallgemeinerte Wellenfunktion ein, die auf einer Vielzahl von Molekülen und deren geometrischen Konformationen vortrainiert werden kann. Dies ermöglicht die effiziente Übertragung des neuronalen Netzes auf unbekannte Moleküle, was zu genauen Ergebnissen mit nur wenigen Optimierungsschritten führt. Darüber hinaus zielt diese Arbeit darauf ab, das Verständnis für spezifische Design-Entscheidungen bei der Konstruktion von Wellenfunktionen auf der Basis neuronaler Netzwerke zu verbessern. Ein besonderes Augenmerk liegt auf der Einbeziehung eines physikalischen Priors in Form von kostengünstigeren und konventionellen Methoden mit geringerer Genauigkeit, wie ursprünglich von Hermann, Schätzle, und Noé (2020) vorgeschlagen wurde. Wir zeigen, dass dieser Ansatz zu einer signifikanten Verzerrung während der Optimierung führen kann, was eine Abnahme der Genauigkeit zur Folge hat.
Abstract
(Englisch)
This thesis comprises a series of publications in the emerging field of deep learning-based Variational Monte Carlo (DL-VMC), which offers a highly accurate ab-initio method for computing electronic properties of molecules by solving the Schrödinger equation. The time-independent, non-relativistic Schrödinger equation is an eigenvalue equation, whereas the thesis places particular emphasis on the smallest eigenvalue and its corresponding eigenfunction. In DL-VMC, in an unsupervised manner, a neural network is optimized to represent the solution of the Schrödinger equation, also called the wave function. The method has recently demonstrated superior accuracy compared to other computational methodologies, albeit at a substantial computational cost due to the large number of trainable parameters in the neural network and the need for Monte Carlo integration to obtain a precise estimate of the eigenvalue. The following thesis contributes to the recent improvements to enhance the method’s efficiency by introducing a novel technique for effectively learning wave functions for various molecules and their geometrical conformations in parallel. For the first time, we are able to optimize a wave function model on a diverse range of molecules and transfer this pretrained neural network to previously unencountered molecules, yielding competitive results with only a few fine-tuning steps. Furthermore, this work aims to improve the understanding of specific design choices involved in constructing neural network-based wave functions. In particular, we explore the effect of physical prior knowledge in the form of inexpensive, lower accuracy conventional methods, as initially proposed by Hermann, Schätzle, and Noé (2020), on the performance of the model. We demonstrate that this can lead to a deterioration of the final accuracy.

Schlagwörter

Schlagwörter
(Deutsch)
Deep Learning Quanten Chemie Variational Monte Carlo
Schlagwörter
(Englisch)
Deep Learning Quantum Chemistry Variational Monte Carlo
Autor*innen
Leon Gerard
Haupttitel (Englisch)
Solving the electronic Schrödinger equation using deep neural networks and transfer learning
Paralleltitel (Deutsch)
Lösung der elektronischen Schrödinger-Gleichung mit Deep Neural Networks und Transfer Learning
Publikationsjahr
2024
Umfangsangabe
132, 2 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*innen
Reinhold Schneider ,
Imre Kondor
Klassifikation
31 Mathematik > 31.45 Partielle Differentialgleichungen
AC Nummer
AC17255698
Utheses ID
70304
Studienkennzahl
UA | 796 | 605 | 405 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1