Detailansicht

Evaluation and improvement of annotations of virus orthologous groups
Sigrid Koizar
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Informatik
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Bioinformatik
Betreuer*in
Thomas Rattei
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.71335
URN
urn:nbn:at:at-ubw:1-29238.17419.912857-2
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Viren gehören zahlenmäßig zu den meist-repräsentierten biologischen Einheiten der Erde. Dennoch sind sie nur spärlich in öffentlichen Datenbanken anzutreffen. Die Datenbank viraler orthologer Gruppen (VOGDB) platziert entfernte homologe Virenproteine in Gruppen, die mithilfe von Sequenzähnlichkeitssuchen zu manuell kuratierten Proteinen in der UniProtKB/Swiss-Prot Datenbank annotiert werden. Die funktionale Homogenität wurde durch die Präsenz einheitlich annotierter Swiss-Prot Proteine in den VOGs bestätigt. In dieser Arbeit werden potenzielle Problematiken der Annotierung untersucht. Diese beinhalten uninformative Funktionsbeschreibungen, Annotierungen mit nur partiell von der Alinierung abgedeckten Proteinen, sowie Funktionsübertragungen von Proteinen zellulärer Organismen. Ein neuer Ansatz zur Funktionsvorhersage, basierend auf der Identifikation von manuell kuratierten Proteinen in den Gruppen, Suchstrategien für entfernte Homologien, sowie einer Domän-basierten Annotierung wurde implementiert. Die Validität der neuen Methodik konnte durch virale Proteine, welche in Publikationen beschrieben sind, verifiziert werden. Da die VOGDB in erster Linie aus Proteinen der Ordnung Caudovirales besteht, konnte sie nicht als Ressource für universale virale Markergene herangezogen werden. Als "Hauptkapsidprotein'' oder "Terminase, große Untereinheit'' beschriebene VOGs wurden als caudovirale Markergene identifiziert.
Abstract
(Englisch)
Viruses are among the most numerous biological entities on earth. Despite their wide abundance viral sequences are highly underrepresented in public databases. The Virus Orthologous Groups Database (VOGDB) clusters viral proteins obtained from NCBI RefSeq together, creating a database of remotely homologous proteins. The current consensus annotation of the groups is based on sequence similarities of VOG member proteins to the manually curated UniProtKB/Swiss-Prot database. The functional homogeneity of VOGs could be confirmed based on manually curated proteins assigned to the VOGs. In this thesis, some potential issues with the current annotation, such as uninformative descriptions, transfer of functional information from cellular to viral proteins or annotations with proteins that are only partially covered by the alignments are highlighted. A new annotation approach applying the identification of manually curated proteins in the VOGs, remote homology search tools, as well as domain-based annotations is implemented. The validity of the new annotation pipeline could be verified by producing functional annotations matching those of literature-reviewed viral proteins. As the VOGDB is heavily biased towards Caudovirales, potential marker gene VOGs for "Major Capsid Protein'' and "Terminase, large subunit'' were identified, however, universal viral marker genes could not be obtained due to the lack of diversity in the VOGDB.

Schlagwörter

Schlagwörter
(Deutsch)
virale orthologe Gruppen Annotierung Virenproteine
Schlagwörter
(Englisch)
virus ortholgous groups annotation viral proteins
Autor*innen
Sigrid Koizar
Haupttitel (Englisch)
Evaluation and improvement of annotations of virus orthologous groups
Paralleltitel (Deutsch)
Evaluierung und Verbesserung der Annotierung Viraler Orthologer Gruppen
Publikationsjahr
2022
Umfangsangabe
xx, 92 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Thomas Rattei
Klassifikationen
42 Biologie > 42.32 Virologie ,
54 Informatik > 54.99 Informatik: Sonstiges
AC Nummer
AC16554932
Utheses ID
62394
Studienkennzahl
UA | 066 | 875 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1