Detailansicht

Benchmark of crosslinking-mass spectrometry workflows using a peptide library
Adrian-Daniel Vasiu
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Zentrum für Molekulare Biologie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Bioinformatik
Betreuer*in
Bojan Zagrovic
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.73815
URN
urn:nbn:at:at-ubw:1-13069.41589.458498-1
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
In jedem biochemischen Forschungsfeld ist in den letzten Jahrzehnten die Bioninformatik fast unentbehrlich geworden. Dies gilt auch für die Crosslinking Massenspektrometrie. Diese Masterarbeit konzentriert sich auf einen umfassenden Benchmark und einen quantitativen Vergleich zwischen verschiedenen bestehenden XL-MS-Datenanalysentools und die Entwicklung neuartiger Python-Skripte zur Maximierung der XL-Zahlen und Minimierung der Falschentdeckungsrate (False discovery rate or FDR). Im Laufe dieser Masterarbeit wird zunächst eine Beschreibung gängiger bioinformatischer Tools in der Proteomik gegeben, zusammen mit einer kurzen Einführung in die Crosslinking Theorie. Es werden verschiedene Algorithmen und nützliche Plattformen für sowohl die Crosslink-Suche als auch die Visualisierung präsentiert, wobei die Funktionsweise der ausgewählten gebenchmarkten Algorithmen genauer analysiert wird. Anhand mehrerer geschickt synthetisierter Peptidbibliotheken werden MeroX, MS Annika, XlinkX und pLink2 bezüglich mehrerer Parameter herausgefordert und an ihre Grenzen gebracht. Der Fokus liegt dabei auf der Maximierung von XL-Anzahl und der Minimierung von FDR-Werten. Die Einstellungen der Software wurden harmonisiert, um einen fairen Vergleich zu ermöglichen, und die Einflüsse der Nutzerparameter wurden abgebildet. Diverse Strategien, wie beispielsweise eine multiple Analyse derselben Probe mit verschiedenen Algorithmen zur FDR-Minderung, wurden vorgeschlagen und als nützlich erachtet. Bestimmte interessante falsche Annotationen wurden genauer besprochen und Faktoren, die ein Bioinformatiker bei einem in vivo Experiment berücksichtigen müsste, wurden erwähnt, wie zum Beispiel die Peptidlänge oder die Größe der Datenbank. Schließlich wurden die physikochemischen Eigenschaften der identifizierten Links untersucht, wobei sich bestimmte Muster in der Sequenz als hemmend für die Reaktion erwiesen haben. Abgesehen davon wurden Trends bemerkt, die darauf hinweisen, dass die Masse und der GRAVY-Index eines Peptidpaares eine wichtige Rolle bei der Identifizierung eines Crosslinks spielen können. All dies war möglich dank eines neuen Tools im bioinformatischen Arsenal der XL-MS-Forschung namens IMP-X-FDR, das in Python geschrieben wurde und über eine maßgeschneiderte Benutzeroberfläche verfügt.
Abstract
(Englisch)
In nearly every biochemical research field, bioinformatics became almost indispensable in the last decades. This also stands true for crosslinking mass spectrometry (XL-MS). This master thesis focuses on an extensive benchmark and quantitative comparison between several existing XL-MS data analysis tools and the development of novel Python scripts for maximizing XL counts and minimizing false discovery rate (FDR) values. Firstly, a description of common bioinformatics tools in proteomics is given, together with a brief introduction to crosslinking theory. Various algorithms and useful platforms for both crosslink search and visualization are presented, with a more detailed analysis of how the chosen benchmarked algorithms work. Using 3 synthetic peptide libraries, cleverly designed for specific crosslinker reactivities, the data analysis tools MeroX, MS Annika, XlinkX and pLink2 are benchmarked. They are challenged and pushed to their limits with regard to several parameters (such as sample complexity and user-settings). The focus is though on maximizing XL count and minimizing FDR values. Software settings were harmonized to allow a fair comparison, and user-parameter influences were mapped. Diverse strategies, such as multiple analysis of the same sample with different algorithms for FDR mitigation, were proposed and found useful. Certain interesting incorrect annotations were discussed in more detail, and factors that a bioinformatician would need to consider in an in vivo experiment were mentioned, such as peptide length or database size. Finally, the physicochemical properties of the identified links were examined, and certain patterns in the sequence were found to inhibit the reaction. Apart from this, trends were noticed indicating that the mass and GRAVY value of a peptide pair may play an important role in the identification of a crosslink. All of this was possible thanks to a newly developed tool in the bioinformatics arsenal of XL-MS research called IMP-X-FDR, which was written in Python and comes with a tailored user interface.

Schlagwörter

Schlagwörter
(Deutsch)
Massenspektrometrie Proteinestrukturbestimmung Crosslinking
Schlagwörter
(Englisch)
Mass spectrometry protein structure determination crosslinking
Autor*innen
Adrian-Daniel Vasiu
Haupttitel (Englisch)
Benchmark of crosslinking-mass spectrometry workflows using a peptide library
Paralleltitel (Deutsch)
Benchmark der Crosslinking Massenspektrometrie Workflows unter Verwendung einer Peptidbibliothek
Publikationsjahr
2023
Umfangsangabe
65 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Bojan Zagrovic
Klassifikation
30 Naturwissenschaften allgemein > 30.03 Methoden und Techniken in den Naturwissenschaften
AC Nummer
AC16875625
Utheses ID
67308
Studienkennzahl
UA | 066 | 875 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1