Detailansicht
EvoNAPS: a database für natural parameter settings of evolutionary models
Franziska Reden
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Bioinformatik
Betreuer*in
Arndt von Haeseler
Mitbetreuer*in
Heiko Andreas Schmidt
DOI
10.25365/thesis.76008
URN
urn:nbn:at:at-ubw:1-26732.29059.556858-0
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Das Simulieren von Sequenzen spielt eine entscheidende Rolle in der phylogenetischen Forschung, da es das Evaluieren von phylogenetischen Methoden oder Modellen ermöglicht. Außerdem kann die große Menge an Daten, die für das Trainieren von sogenannten „Machine-Learning-Algorithmen“, die auch in der Wissenschaft immer mehr an Bedeutung gewinnen, durch Sequenzsimulationen generiert werden. Um sicherzugehen, dass die simulierten Sequenzen so realistisch wie möglich sind, sollten die Simulationen auf empirischen Daten basieren. Aus diesem Grund wurde EvoNAPS, eine Datenbank für Parameter-Einstellungen von evolutionären Modellen und für phylogenetische Bäume, die auf empirischen Daten basierend, entworfen und implementiert. Insgesamt wurden über 29.000 biologische Alignments aus drei unterschiedlichen veröffentlichen Quellen gesammelt. Die Alignments wurden mithilfe des IQ-Tree2 Programms, einer Software für phylogenetische Inferenz, analysiert. Eine große Menge an Eckdaten und Merkmalen der analysierten Alignments sowie der abgeleiteten Bäume und dazugehörigen Modellparametern wurde gesammelt und in der EvoNAPS Datenbank gespeichert. EvoNAPS enthält über 64.000 phylogenetische Bäume und die dazugehörigen geschätzten Modellparameter. Die Datenbank bietet typischen Parameter-Einstellungen von 286 unterschiedlichen DNA und 364 unterschiedlichen Protein Modellen. Außerdem ist die Datenbank mit verschiedenen Filteroptionen ausgestattet, die es den Nutzenden erlauben, Alignments, Bäume und/oder Parameter-Einstellungen von evolutionären Modellen zu finden, die den zu simulierenden Daten möglichst ähneln. Die EvoNAPS Datenbank stellt eine nützliche Ressource für all jene dar, die an modellbasierter Phylogenie forschen, und wird eine große Hilfestellung und Erleichterung in zukünftigen phylogenetischen Studien sein.
Abstract
(Englisch)
Sequence simulations play a vital role in phylogenetic research as they enable the evaluation of phylogenetic models or methods. Moreover, with the increasing impact of machine learning algorithms the simulations provide the huge amount of data required for their training. To ensure that the simulated sequences are as realistic as possible the simulations should be based on empirical data. For this purpose, EvoNAPS, a database providing NAtural Parameter Settings for EVOultionary models, was designed and implemented. Over 29,000 biological alignments from three different published sources were gathered. The alignments were then analysed using the phylogenetic inference software IQ-Tree 2. From the results a huge number of features regarding the alignments, the inferred phylogenetic trees as well as the respective parameter estimates of the evolutionary model were extracted and stored in the EvoNAPS database. To date EvoNAPS holds over 64,000 phylogenetic trees and the respective model parameter estimates. EvoNAPS allows the retrieval of typical parameter settings for 286 different DNA and 364 different protein models. The database comes equipped with various filter options that allow the user to find model parameter estimates, alignments and/or trees that closely match the data they want to simulate. Overall, the EvoNAPS database represents a valuable resource to those studying model-based phylogenetics and will greatly aid and facilitate future phylogenetic studies.
Schlagwörter
Schlagwörter
(Deutsch)
Phylogenie Sequenzsimulation Datenbank Evolutionäre Modelle
Schlagwörter
(Englisch)
phylogenetics sequence simulation database models of sequence evolution
Autor*innen
Franziska Reden
Haupttitel (Englisch)
EvoNAPS: a database für natural parameter settings of evolutionary models
Paralleltitel (Deutsch)
EvoNAPS: eine Datenbank für natürliche Parameter-Einstellungen von evolutionären Modellen
Publikationsjahr
2023
Umfangsangabe
106 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Arndt von Haeseler
Klassifikationen
42 Biologie > 42.21 Evolution ,
54 Informatik > 54.64 Datenbanken
AC Nummer
AC16905319
Utheses ID
67207
Studienkennzahl
UA | 066 | 875 | |