Detailansicht
Assessing genome quality of molluscan cephalopod genomes
David Stohlmann
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Zoologie
Betreuer*in
Oleg Simakov
DOI
10.25365/thesis.76628
URN
urn:nbn:at:at-ubw:1-22063.39884.272330-8
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Über 800 Kopffüßer-Arten (Cephalopoda), welche Perlboote, Tintenfische, Sepien und Kraken beinhalten, haben weltweit alle marinen Lebensräume kolonisiert. Trotz dieser großen Vielfalt sind bisher nur wenige Genome von Cephalopoden sequenziert worden, wobei das erste Genom vom Kalifornischen Zweipunktkraken, Octopus bimaculoides, aus dem Jahr 2015 stammt. Die in letzter Zeit ansteigenden Zahlen an sequenzierten Genomen, geht mit der Notwendigkeit einer standardisierten Vollständigkeitsbeurteilung einher. „Benchmarking Universal Single-Copy Orthologs“ (BUSCO) ist ein weit verbreitetes bioinformatisches Werkzeug für diese Vollständigkeitsbestimmung. Verfügbare Datensets für eine größere Taxabreite, wie für Eukaryota, Metazoa oder Mollusca, jedoch schneiden unzureichend mit Cephalopodengenomen ab. Das Ergebnis sind hohe Prozentsätze an Duplikationen, Fragmentierungen und fehlenden Genen, trotz der Verwendung von Genomen auf Chromosomlevel. Wir haben herausgefunden, dass diese schlechten Ergebnisse auf die Komplexität der Cephalopodengenome zurückzuführen sind. Um dies zu verbessen, haben wir ein Datenset aus 512 „single-copy“ orthologen Genen erstellt, welche mit Hilfe der hochqualitativen Genome der Arten Euprymna scolopes, Doryteuthis pealeii, Octopus bimaculoides und Nautilus pompilius, welcher als Außengruppenvergleich diente, identifiziert wurden. Diese Gene sind über alle Chromosomen dieser Arten gleichmäßig verteilt. Mit der Verwendung unseres Gendatensets in BUSCO konnten wir eine deutliche Verbesserung der Vollständigkeit feststellen, welche die Qualität der veröffentlichten Cephalopodengenome besser repräsentiert. Dies macht unser Gendatenset zu einer wertvollen und unterstützenden Ergänzung für zukünftige wissenschaftliche Forschungen.
Abstract
(Englisch)
Over 800 cephalopods, including nautiluses, squids, cuttlefishes, and octopuses, have colonized all marine oceans worldwide. Despite this extensive diversity, just a few cephalopod genomes have been sequenced, the first being the Californian octopus, O. bimaculoides, in 2015. The recent increase in the number of cephalopod genomes highlights the need for a standardized assessment approach. Benchmarking Universal Single-Copy Orthologs (BUSCO) is a widely used tool for genome quality assessment, but its current datasets for broader taxa like the eukaryotic, metazoan or molluscan underperformed in cephalopod genomes, yielding high duplications, high fragmentations, high missing genes, and especially low completeness, even in high-quality chromosome-level genomes. We found that the poor performance is due to the complex character of these genomes. To improve this, we have identified a set of 512 cephalopod-specific single-copy orthologous genes from high-quality genomes of Euprymna scolopes, Doryteuthis pealeii, Octopus bimaculoides and Nautilus pompilius. This set of genes contains orthologs that are localized on all chromosomes in these species. When our new dataset is used in BUSCO, it yields a better value of completeness that better represents the quality of the available genomes for cephalopods in public databases, making it a valuable addition to the scientific community.
Schlagwörter
Schlagwörter
(Deutsch)
Cephalopoden Genomik Mollusken Bioinformatik Genom Qualitätsanalyse Orthologe Gene
Schlagwörter
(Englisch)
Cephalopods Genomics Mollusks Bioinformatics Genome Quality Assessment Orthologous Genes
Autor*innen
David Stohlmann
Haupttitel (Englisch)
Assessing genome quality of molluscan cephalopod genomes
Publikationsjahr
2024
Umfangsangabe
65 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Oleg Simakov
Klassifikation
42 Biologie > 42.69 Spezielle Zoologie. Allgemeines
AC Nummer
AC17324542
Utheses ID
72848
Studienkennzahl
UA | 066 | 831 | |