Detailansicht

Monte Carlo methods and machine learning for rare event sampling
Sebastian Falkner
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Physik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Doktoratsstudium Naturwissenschaften: Physik
Betreuer*in
Christoph Dellago
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.77298
URN
urn:nbn:at:at-ubw:1-12308.33600.292047-0
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In allen Bereichen der Naturwissenschaften begegnen wir seltenen Ereignissen wie Phasenübergängen, chemischen Reaktionen oder Proteinfaltung. Simulationen solch molekularer Prozesse können zu wegweisenden Erkenntnissen über Kinetik, Thermodynamik und Mechanismen führen. Anwendung findet dieses Wissen beispielsweise in der Entwicklung von Katalysatoren, um Proteinaggregation zu verstehen oder Phasendiagramme vorherzusagen. Die Simulation dieser seltenen Ereignisse wird jedoch erschwert durch die Zeitskalenseparation zwischen den schnellsten molekularen Bewegungen und der Reaktionsrate des simulierten Prozesses. Für solche Fälle wurde die Simulationsmethode Transition Path Sampling entwickelt, welche die verfügbaren Rechenressourcen alleinig auf das Ensemble von Übergangspfaden konzentriert. Die generierten Übergangspfade folgen der Gleichgewichtsdynamik des Systems, was im Gegensatz zu anderen Simulationsmethoden steht, die durch Modifikation der potenziellen Energie des Systems Simulationen beschleunigen. Das Sampling des Ensembles von Übergangspfaden wird durch ein Markow-Chain-Monte-Carlo-Verfahren erreicht, wobei ein neuer Pfad auf der Basis eines vorherigen oder intitalen Pfades generiert wird. Dabei ist der Shooting Move die am weitesten verbreitete Methode zur Generierung eines neuen Pfades. Dieser wird erzeugt durch Integration der Bewegungsgleichungen vorwärts und rückwärts im Bezug auf die Zeit von einer Konfiguration auf dem vorherigen Pfad. Dies reduziert signifikant die benötigte Simulationszeit, um einen reaktiven Pfad zu erhalten, führt aber gleichzeitig zu Korrelationen zwischen aufeinanderfolgenden Pfaden. Die Verringerung dieser Korrelationen ist für jede effiziente Samplingmethode von entscheidender Bedeutung, vor allem in komplexen Systemen mit mehreren Reaktionskanälen und kurzlebigen Intermediaten. Diese Dissertation beschäftigt sich mit der Entwicklung neuer Shooting Moves mit dem Schwerpunkt, Korrelationen zwischen generierten Pfaden zu minimieren. Dies beinhaltet die Entwicklung neuer Ansätze unter Verwendung generativer neuronaler Netze, bei denen potenzielle Startpunkte für Pfade durch Normalizing Flows erzeugt werden, was im Anschluss paralleles Sampling von Pfaden erlaubt. Auch wenn die verwendeten Netzwerke die Anwendbarkeit der Methode auf einfache Systeme beschränkt, ist die Arbeit ein erster Schritt für das unabhängige Ziehen von Übergangspfaden aus der Gleichgewichtsverteilung. Ein weiterer Fokus ist die Verwendung von Replica-Exchange Methoden für das Sampling von Pfaden. Diese Arbeit stellt eine Methode für den Austausch von Information zwischen einer beschleunigten Simulation im Konfigurationsraum und einer Pfad-Sampling-Methode vor. Damit wird der Wechsel zwischen verschiedenen Reaktionskanälen erleichtert und es kann ein umfassendes Bild der Thermodynamik und Kinetik des Prozesses erhalten werden. Zuletzt widmet sich diese Arbeit Shooting Moves, welche den Punkt, von dem der letzte Pfad generiert wurde, im Laufe des Monte-Carlo-Verfahrens wiederverwenden. Für diese Methoden wird ein allgemeiner Rahmen geschaffen, mit welchen Detailed-Balance-Bedingungen hergeleitet werden können. In der Gesamtheit trägt diese Arbeit dazu bei, Methoden für das Sampling von Übergangspfaden effizienter zu gestalten und somit die Rechenressourcen zu verringern, die nötig sind, um seltene Ereignisse auf molekularer Ebene zu verstehen.
Abstract
(Englisch)
In all domains of natural sciences, we encounter rare events such as phase transitions, chemical reactions or protein folding. Molecular simulation of these processes can lead to invaluable insights into their kinetics, thermodynamics and mechanisms. This knowledge can then be used to, for example, develop catalysts, understand protein aggregation in cells or predict phase diagrams. However, the timescale disparity between the fastest molecular motions and the rate at which the processes occur renders it nearly impossible to observe such rare events in unbiased equilibrium simulations. For these cases, transition path sampling is a method that focuses the computational resources on the ensemble of reactive trajectories that connect arbitrary states. These trajectories follow the equilibrium dynamics of the system, which is in contrast to other enhanced sampling methods that introduce a bias to the potential energy function of the system. The transition path ensemble is sampled via a Markov chain Monte Carlo procedure where a new path is generated based on a previous or initial reactive path. Here, the shooting move is the most common strategy to generate a new trajectory, where the equations of motions are integrated forward and backward in time from a point on the previous path. While this significantly reduces the computational resources necessary to obtain a reactive path compared to straightforward simulations, the shooting move introduces correlations between subsequently generated paths. Reducing these correlations is vital for any efficient path sampling scheme, particularly in complex systems with different reaction channels and many short-lived intermediate states. This thesis focuses on developing shooting schemes with the primary goal of reducing correlations between sampled paths. That includes the development of new shooting schemes using generative models, where potential shooting points are generated using normalizing flows, allowing subsequent path sampling to be parallelized. Although the flow-based sampling restricts the approach to small-scale systems for now, it is a step towards the independent sampling of transition paths. Another focus is on the use of replica exchange methods for path sampling, where this thesis proposes a method to exchange information between a biased molecular dynamics simulation and a transition path sampling simulation. By that, the sampling of different reaction channels is accelerated and a combined view of thermodynamics and kinetics can be obtained. The thesis also revisits shooting methods that evolve the shooting point from trial to trial and proposes a general framework to derive detailed balance relations for such schemes. Overall, the proposed and discussed shooting schemes aim to bring the field forward by increasing the sampling efficiency and thus lowering the computational resources required to understand rare events.

Schlagwörter

Schlagwörter
(Deutsch)
Molekulare Simulation Monte Carlo Methoden Machine Learning Rare Events
Schlagwörter
(Englisch)
Molecular Dynamics Monte Carlo Methods Machine Learning Rare Events
Autor*innen
Sebastian Falkner
Haupttitel (Englisch)
Monte Carlo methods and machine learning for rare event sampling
Paralleltitel (Deutsch)
Monte Carlo Methoden und maschinelles Lernen für das Sampling seltener Ereignisse
Publikationsjahr
2024
Umfangsangabe
xii, 100 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*innen
Jutta Rogal ,
Titus van Erp
Klassifikationen
33 Physik > 33.19 Theoretische Physik. Sonstiges ,
33 Physik > 33.25 Thermodynamik. statistische Physik ,
54 Informatik > 54.72 Künstliche Intelligenz
AC Nummer
AC17393361
Utheses ID
72299
Studienkennzahl
UA | 796 | 605 | 411 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1