Detailansicht
Strategies for computational noncoding RNA detection
Andreas Gruber
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Chemie
Betreuer*in
Ivo Hofacker
Alle Rechte vorbehalten / All rights reserved
URN
urn:nbn:at:at-ubw:1-30311.42957.354753-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Noncoding RNAs (ncRNAs) sind RNA Moleküle, die ihre Funktion auf Ebene von Transkripten
ausüben ohne jemals in Proteine übersetzt zu werden. In den vergangenen Jahren hat
sich gezeigt, dass ncRNAs Hauptakteure in vielen zellulären Vorgängen sind, einschliesslich
Prozessen wie transkriptioneller und post-transkriptioneller Regulation, Chromatinmodifikation
oder Epigenetik. Genomweite Annotation und bioinformatische Analysen von ncRNAs
haben im letzten Jahrzehnt erhöhte Aufmerksamkeit erhalten und die RNA-Biologie ist zu
einem der Hauptforschungsgebiete der modernen Molekularbiologie aufgestiegen. Im Gegensatz
zu protein-kodierenden Genen weisen ncRNAs keine gemeinsamen statistisch signifikanten
Eigenschaften auf. Dies macht das Auffinden von ncRNAs zu einer anspruchsvollen
Aufgabe. In dieser Arbeit werden mehrere computergestützte Strategien zum effizienten
Auffinden von ncRNAs präsentiert. Dabei werden sowohl Methoden zur de novo Erkennung
als auch homologiebasierte Verfahren vorgestellt. Insbesondere beschäftigt sich diese
Arbeit mit einer verbesserten Version des RNAz Algorithmus, einer aktualisierten Version des
RNALfold Algorithmus und zwei Studien zur Homologiesuche von ncRNAs am Beispiel der
beiden RNA Familien 7SK RNA und sbRNAs.
RNAz ist ein Softwarepaket zum Auffinden von konservierten, thermodynamisch stabilen RNA
Sekundärstrukturen. Im Zuge dieser Arbeit wurde RNAz verbessert. Eine verbesserten Erkennungsgenauigkeit
wird durch Verwendung eines dinucleotidbasierten Background-Modells,
eines neu zusammengestelltes Training-Set, strukturellen RNA Alignments und der Shannon
Entropie als Mass für Sequenzvariation erreicht. Wenn keine oder nur begrenzte Daten
aus vergleichender Genomik vorliegen, gibt es nur wenige Methoden zur de novo Vorhersage
funktioneller RNA Strukturen. Für solche Fälle, ist mit RNALfoldz ein Ansatz entwickelt
worden, der es erlaubt lokale, thermodynamisch stabile Strukturen in einzelnen genomischen
Sequenzen effizient zu finden. Die effiziente Berechnung der thermodynamischen Stabilität
wird durch einen Modifikation der Support Vector Regression erzielt. Diesem neue Ansatz
führt zu einer deutlichen Reduktion der Ausführungszeit im Vergleich zu früheren Methoden.
Noncoding RNAs evolvieren oft schnell und behalten häufig nur ein paar sequenzkonservierte
Elemente. Da oft nur Sekundärstrukturelemente konserviert sind, stellt die RNA Homologiesuche
eine extreme Herausforderung für Suchmethoden dar. In dieser Arbeit werden zwei Studien
zur Homologiesuche von RNA Familien, nämlich für 7SK RNAs und sbRNAs, vorgestellt.
Mit Hilfe eines computergestützten ncRNA-spezifischen Promoter-Screens gelang es 7SK Gene
in der Gruppe der Arthropoden zu identifizieren, wo zuvor sowohl experimentelle als auch
computergestützte Methoden gescheitert waren. Die zweite Studie behandelt die detaillierte
Charakterisierung der vermeintlich neuen Familie der sbRNAs. Mit einer Reihe an verschieden
Methoden gelang es 240 neue sbRNA Gene in Nematoden zu identifizieren. Eine detaillierte
Analyse der strukturellen Merkmale von sbRNAs zeigte schliesslich, dass sbRNAs nicht eine
neuartige RNA Familie sind, sondern homolog zur Familie der Y RNAs.
Abstract
(Englisch)
Noncoding RNAs (ncRNAs) function directly at the level of transcripts without ever being
translated into proteins. During the past few years it has become evident that ncRNAs are
key players in many cellular processes. The set of actions is versatile, including transcriptional
regulation, post-transcriptional regulation, chromatin modification or epigenetics. Genomewide
annotation and computational analysis of ncRNAs have met increased attention over
the last years and RNA biology has become one of the primary research topics in modern
molecular biology. Unlike protein coding genes, ncRNAs lack common statistically significant
features, which makes the detection of novel ncRNAs a challenging task. In this thesis several
computational strategies for noncoding RNA detection ranging from de novo detection to
homology based methods are addressed. In particular, an improved version of the RNAz
algorithm, an updated version of the RNALfold algorithm, and two homology search studies
on the detection of new family members of 7SK RNA and sbRNAs are presented.
RNAz is a software package for the detection of conserved, thermodynamically stable RNA
secondary structures. In this thesis an updated version of RNAz is presented. The use of a
dinucleotide background model, a newly compiled training set, the ability to score structural
RNA alignments and the use of Shannon entropy as a measure of sequence variation lead to
an overall improved detection accuracy. When no or limited comparative genomics data is
available the set of de novo detection methods for functional RNA structures becomes very
sparse. For those cases, RNALfoldz an approach to quickly evaluate the set of local, thermodynamically
stable structures in single genomic sequences has been developed. Efficient
evaluation of thermodynamic stability is achieved by a modified support vector regression
approach that significantly reduces execution time compared to former approaches.
Noncoding RNAs often evolve fast, retaining only a few sequence conserved elements. Conservation
is, however, found at the level of secondary structures. This poses extreme challenges
for RNA homology search methods. In this thesis, two studies on detection of new members
belonging to the RNA families of 7SK RNA and sbRNAs are presented. By means of
a computational ncRNA-specific promoter screen, 7SK genes are successfully identified in
arthropod species, where experimental and computational studies previously failed to recover
a candidate. The second study aims at the detailed characterization of the putative novel
RNA family of sbRNAs. Using a set of several methods 240 new sbRNA genes are identified in
nematode species. Detailed analysis of the structural features of sbRNAs shows that sbRNAs
are not a novel RNA family, but are homologs of vertebrate Y RNAs.
Schlagwörter
Schlagwörter
(Deutsch)
nichtkodierende RNA 7SK RNA sbRNA Y RNA RNA Strukturvorhersage RNAz
Autor*innen
Andreas Gruber
Haupttitel (Englisch)
Strategies for computational noncoding RNA detection
Paralleltitel (Deutsch)
Strategien zur Detektion nichtkodierender RNA
Publikationsjahr
2010
Umfangsangabe
IX, 130 S. : Ill., graph. Darst.
Sprache
Englisch
Beurteiler*innen
Rolf Backofen ,
Thomas Rattei
Klassifikation
42 Biologie > 42.13 Molekularbiologie
AC Nummer
AC08447826
Utheses ID
11577
Studienkennzahl
UA | 091 | 490 | |