Detailansicht

Computational analysis and design of RNA based gene regulators
Birgit Tschiatschek
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Chemie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Computational Science
Betreuer*in
Ivo Hofacker
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.74773
URN
urn:nbn:at:at-ubw:1-24671.73558.247750-8
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Das Ziel dieser Arbeit ist es, numerische Features zu definieren, die individuelle RNA-Sequenzdesigns auf numerische Art beschreiben. Dadurch soll es ermöglicht werden, die Funktionalität solcher Sequenzdesigns im Vorhinein zu berechnen, bevor sie im Labor analysiert werden. Die Features wurden anhand eines wissensbasierten Ansatzes bestimmt und mit verschiedenen RNA-bezogenen Tools berechnet. Um die Vorhersagekraft der definierten Features zu beurteilen, wurden verschiedene Algorithmen des maschinellen Lernens eingesetzt. Die zugrundeliegenden Daten sind de novo designte toehold switch RNA-Sequenzen mit den zugehörigen Fluoreszenzmessungen aus Verifikationsexperimenten von Green et al.. Der Hauptteil dieser Arbeit umfasst die Berechnung und Beschreibung der Features, sowie eine Korrelationsanalyse der definierten Features mit der ON-State-Fluoreszenz der RNA-Sequenzdesigns. Aufgrund mehrerer unerwarteter Korrelationen wurde ein Feature ausgewählt, das näher untersucht wurde. Das Feature P_sw_acc_RBS_linker wurde ausgewählt, um eine mögliche strukturbedingte Erklärung für die Korrelation des Features mit der Outputvariable zu untersuchen. Einige RNA-Switch-Designs wurden aufgrund bestimmter Charakteristika ausgewählt und weiter analysiert. Dafür wurden die Sekundärstrukturen für individuelle einzelsträngige Switches berechnet und für einige wurden die Sekundärstrukturen mit der zugehörigen Trigger-RNA berechnet. Abschließend wurden die definierten Features verwendet, um prädikative Modelle zu bauen, die es ermöglichen die Funktionalität der RNA-Switches zu berechnen. Die meisten Modelle waren statistisch signifikant (Signifikanzniveau α=0.05) besser als das Baselinemodell.
Abstract
(Englisch)
The aim of this thesis is to define numerical features that describe individual RNA sequence designs in numerical manner. This should enable to predict the functionality of such sequence designs computationally in advance, before analysis in the laboratory. The features were determined by a knowledge-based approach and calculated using several RNA related tools. To evaluate the predictive performance of the defined features machine learning algorithms were applied. The underlying data are de novo designed toehold switch RNA sequences with corresponding fluorescence measurements from verification experiments from Green et al.. The main part of this thesis covers the computation and description of the features, and a correlation analysis of the defined features with the ON state fluorescence of the RNA sequence designs. Due to some unexpected correlations one feature was chosen for further analysis. The feature P_sw_acc_RBS_linker was chosen, in order to examine if there is a structure-dependent explanation for the correlation of this feature with the output variable. Based on some specified characteristics some RNA switches were chosen and further analysed. Therefore, secondary structures of individual single stranded switches were computed, and secondary structures were predicted with their cognate trigger RNA. Finally, the defined features were used to build predictive models that enable to compute the functionality of the RNA switches. Most of the models outperformed the baseline model (significance level α=0.05).

Schlagwörter

Schlagwörter
(Deutsch)
RNA Bioinformatik RNA-Sekundärstrukturen Inverse Folding Maschinenlernen In-Silico-Design Prädikative Modelle Riboregulatoren
Schlagwörter
(Englisch)
RNA Bioinformatics RNA Secondary Structure Inverse Folding Machine Learning In Silico Design Predictive Models Riboregulators
Autor*innen
Birgit Tschiatschek
Haupttitel (Englisch)
Computational analysis and design of RNA based gene regulators
Paralleltitel (Deutsch)
Computergestützte Analyse und Design RNA-basierter Genregulatoren
Publikationsjahr
2023
Umfangsangabe
vii, 90 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Ivo Hofacker
Klassifikationen
35 Chemie > 35.06 Computeranwendungen ,
35 Chemie > 35.79 Biochemie. Sonstiges ,
42 Biologie > 42.10 Theoretische Biologie ,
54 Informatik > 54.80 Angewandte Informatik
AC Nummer
AC16995016
Utheses ID
68122
Studienkennzahl
UA | 066 | 910 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1