Detailansicht

Strategies for computational noncoding RNA detection
Andreas Gruber
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Chemie
Betreuer*in
Ivo Hofacker
Alle Rechte vorbehalten / All rights reserved
URN
urn:nbn:at:at-ubw:1-30311.42957.354753-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Noncoding RNAs (ncRNAs) sind RNA Moleküle, die ihre Funktion auf Ebene von Transkripten ausüben ohne jemals in Proteine übersetzt zu werden. In den vergangenen Jahren hat sich gezeigt, dass ncRNAs Hauptakteure in vielen zellulären Vorgängen sind, einschliesslich Prozessen wie transkriptioneller und post-transkriptioneller Regulation, Chromatinmodifikation oder Epigenetik. Genomweite Annotation und bioinformatische Analysen von ncRNAs haben im letzten Jahrzehnt erhöhte Aufmerksamkeit erhalten und die RNA-Biologie ist zu einem der Hauptforschungsgebiete der modernen Molekularbiologie aufgestiegen. Im Gegensatz zu protein-kodierenden Genen weisen ncRNAs keine gemeinsamen statistisch signifikanten Eigenschaften auf. Dies macht das Auffinden von ncRNAs zu einer anspruchsvollen Aufgabe. In dieser Arbeit werden mehrere computergestützte Strategien zum effizienten Auffinden von ncRNAs präsentiert. Dabei werden sowohl Methoden zur de novo Erkennung als auch homologiebasierte Verfahren vorgestellt. Insbesondere beschäftigt sich diese Arbeit mit einer verbesserten Version des RNAz Algorithmus, einer aktualisierten Version des RNALfold Algorithmus und zwei Studien zur Homologiesuche von ncRNAs am Beispiel der beiden RNA Familien 7SK RNA und sbRNAs. RNAz ist ein Softwarepaket zum Auffinden von konservierten, thermodynamisch stabilen RNA Sekundärstrukturen. Im Zuge dieser Arbeit wurde RNAz verbessert. Eine verbesserten Erkennungsgenauigkeit wird durch Verwendung eines dinucleotidbasierten Background-Modells, eines neu zusammengestelltes Training-Set, strukturellen RNA Alignments und der Shannon Entropie als Mass für Sequenzvariation erreicht. Wenn keine oder nur begrenzte Daten aus vergleichender Genomik vorliegen, gibt es nur wenige Methoden zur de novo Vorhersage funktioneller RNA Strukturen. Für solche Fälle, ist mit RNALfoldz ein Ansatz entwickelt worden, der es erlaubt lokale, thermodynamisch stabile Strukturen in einzelnen genomischen Sequenzen effizient zu finden. Die effiziente Berechnung der thermodynamischen Stabilität wird durch einen Modifikation der Support Vector Regression erzielt. Diesem neue Ansatz führt zu einer deutlichen Reduktion der Ausführungszeit im Vergleich zu früheren Methoden. Noncoding RNAs evolvieren oft schnell und behalten häufig nur ein paar sequenzkonservierte Elemente. Da oft nur Sekundärstrukturelemente konserviert sind, stellt die RNA Homologiesuche eine extreme Herausforderung für Suchmethoden dar. In dieser Arbeit werden zwei Studien zur Homologiesuche von RNA Familien, nämlich für 7SK RNAs und sbRNAs, vorgestellt. Mit Hilfe eines computergestützten ncRNA-spezifischen Promoter-Screens gelang es 7SK Gene in der Gruppe der Arthropoden zu identifizieren, wo zuvor sowohl experimentelle als auch computergestützte Methoden gescheitert waren. Die zweite Studie behandelt die detaillierte Charakterisierung der vermeintlich neuen Familie der sbRNAs. Mit einer Reihe an verschieden Methoden gelang es 240 neue sbRNA Gene in Nematoden zu identifizieren. Eine detaillierte Analyse der strukturellen Merkmale von sbRNAs zeigte schliesslich, dass sbRNAs nicht eine neuartige RNA Familie sind, sondern homolog zur Familie der Y RNAs.
Abstract
(Englisch)
Noncoding RNAs (ncRNAs) function directly at the level of transcripts without ever being translated into proteins. During the past few years it has become evident that ncRNAs are key players in many cellular processes. The set of actions is versatile, including transcriptional regulation, post-transcriptional regulation, chromatin modification or epigenetics. Genomewide annotation and computational analysis of ncRNAs have met increased attention over the last years and RNA biology has become one of the primary research topics in modern molecular biology. Unlike protein coding genes, ncRNAs lack common statistically significant features, which makes the detection of novel ncRNAs a challenging task. In this thesis several computational strategies for noncoding RNA detection ranging from de novo detection to homology based methods are addressed. In particular, an improved version of the RNAz algorithm, an updated version of the RNALfold algorithm, and two homology search studies on the detection of new family members of 7SK RNA and sbRNAs are presented. RNAz is a software package for the detection of conserved, thermodynamically stable RNA secondary structures. In this thesis an updated version of RNAz is presented. The use of a dinucleotide background model, a newly compiled training set, the ability to score structural RNA alignments and the use of Shannon entropy as a measure of sequence variation lead to an overall improved detection accuracy. When no or limited comparative genomics data is available the set of de novo detection methods for functional RNA structures becomes very sparse. For those cases, RNALfoldz an approach to quickly evaluate the set of local, thermodynamically stable structures in single genomic sequences has been developed. Efficient evaluation of thermodynamic stability is achieved by a modified support vector regression approach that significantly reduces execution time compared to former approaches. Noncoding RNAs often evolve fast, retaining only a few sequence conserved elements. Conservation is, however, found at the level of secondary structures. This poses extreme challenges for RNA homology search methods. In this thesis, two studies on detection of new members belonging to the RNA families of 7SK RNA and sbRNAs are presented. By means of a computational ncRNA-specific promoter screen, 7SK genes are successfully identified in arthropod species, where experimental and computational studies previously failed to recover a candidate. The second study aims at the detailed characterization of the putative novel RNA family of sbRNAs. Using a set of several methods 240 new sbRNA genes are identified in nematode species. Detailed analysis of the structural features of sbRNAs shows that sbRNAs are not a novel RNA family, but are homologs of vertebrate Y RNAs.

Schlagwörter

Schlagwörter
(Deutsch)
nichtkodierende RNA 7SK RNA sbRNA Y RNA RNA Strukturvorhersage RNAz
Autor*innen
Andreas Gruber
Haupttitel (Englisch)
Strategies for computational noncoding RNA detection
Paralleltitel (Deutsch)
Strategien zur Detektion nichtkodierender RNA
Publikationsjahr
2010
Umfangsangabe
IX, 130 S. : Ill., graph. Darst.
Sprache
Englisch
Beurteiler*innen
Rolf Backofen ,
Thomas Rattei
Klassifikation
42 Biologie > 42.13 Molekularbiologie
AC Nummer
AC08447826
Utheses ID
11577
Studienkennzahl
UA | 091 | 490 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1