Detailansicht

Novel tools for structural elucidation, pathway reconstruction and functional interpretation of high-throughput HRMS metabolomics data
Hannes Dörfler
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Doctor of Philosophy-Doktoratsstudium NAWI Bereich Lebenswissenschaften (Dissertationsgebiet: Biologie)
Betreuer*in
Wolfram Weckwerth
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.37448
URN
urn:nbn:at:at-ubw:1-30064.04654.698661-9
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Obschon noch eine relativ junge Technik, hat sich die Metabolomik – definiert als die Identifizierung und Quantifizierung aller Metaboliten in einer biologischen Probe – in den letzten Jahren als Schlüsseltechnik in den Lebenswissenschaften etabliert. Gerade in Hinblick auf die ständige Verfeinerung der Instrumentierung in der chemischen Analytik kann man in der nahen Zukunft durch Anwendung der Metabolomik auf biologische Fragestellungen neue Erkenntnisse und wissenschaftliche Durchbrüche erwarten. Obwohl die Metabolomik in den letzten Jahren eine rasche Weiterentwicklung durchlaufen hat gibt es noch einige Problembereiche, die gelöst werden müssen, damit metabolische Analysenverfahren als Standardmethoden in den Laborbereich übernommen werden können. Die in dieser Arbeit vorgestellten Publikationen zielen zum einen darauf ab, durch Kombination von analytischen Methoden einen größeren Bereich von Metaboliten abzudecken, und zum anderen, die Identifikationsrate von unbekannten Molekülen in Hochauflösungs-MS-basierten Datensätzen zu verbessern. Die erste Studie demonstrierte die verbesserte Abdeckung der identifizierbaren Metabolite aus einem biologischen Sample durch Kombination der GC-TOF-MS und der LC-Orbitrap-MS – Technik, was zu einer Erhöhung der detektierbaren Moleküle in den Bereich von 40 – 2000 m/z führte, und überdies tiefergehende biologische Interpretation der Daten zuließ. Um einen geeigneten experimentellen Überbau zu gewährleisten, wurden mehrere Arabidopsis thaliana Exemplare hohem Licht- und Kältestress ausgesetzt, der dazu führen sollte, umfassendes metabolisches Reprogrammieren in der Pflanze auszulösen. Ungerichtete Metabolomanalysen durch parallelen Einsatz von GC-MS und LC-MS legten drastisch veränderte Metabolitprofile in den derart gestressten Pflanzen offen. Das darauffolgende Zusammenführen der Datensätze von den beiden unterschiedlichen analytischen Techniken ließ funktionelle Interpretation auf das darunterliegende metabolische Netzwerk zu: durch Anwendung des Granger-Kausalitätstestes konnte in den gestressten Pflanzen die Anwesenheit von mehreren typischen pflanzlichen Sekundärmetaboliten („Flavonoide“), ausgehend vom Phenylpropanoid-Metabolismus, festgestellt werden, welche mit Schlüsselsubstanzen des Primärmetabolismus, vor allem Shikimisäure und Phenylalanin, korrelierten. Während die Identifizierung von Metaboliten auf der GC-MS Seite bereits gut entwickelt und größtenteils eine Sache der Verfügbarkeit von Datenbanken ist, erbrachten die LC-Orbitrap-MS Analysen tausende von Metabolitsignalen, von denen wiederum nur einige wenige manuell annotiert werden konnten. Im Zuge dessen wurde in der zweiten Studie eine Methode entwickelt, die die Vorhersage von neuen Verbindungen aus LC-MS-Daten ermöglicht, durch Ausnutzung der Hochauflösungs-MS und dementsprechend der Möglichkeit, exakte Massen für Datensignale zu definieren: Ein MATLAB Skript (mzGroupAnalyzer) wurde entwickelt, welches imstande ist, verschiedene Summenformel-Vorschläge aus hochaufgelösten Vorläuferionenmassen auf eine metabolischen Kontext hin zu überprüfen. Durch Anwendung dieses Programm auf die MS-Daten der gestressten Pflanzen, in Kombination mit manueller Interpretation der Produktionenspektren, konnten 16 bis dato unbeschriebene Verbindungen in Arabidopsis thaliana vorausgesagt und ein kompletter Biosyntheseweg aus der Cyanidin-Familie rekonstruiert werden. Überdies wird in einer dritten Studie eine Technik zur verbesserten Extraktion von Vorläuferionen aus „omics“-Datensätzen vorgestellt: basierend auf dem MAPA (mass accuracy precursor alignment) – Algorithmus wurde eine Methode entwickelt, welche eine gezielte Extraktion und relative Quantifizierung von Vorläuferionen (im Gegensatz zu einer ungerichteten Herangehensweise) ermöglicht, welche sich im Vergleich zu anderen Quantifizierungsstrategien (etwa NSAF – normalized spectral abundance factor) in einigen Bereich als überlegen erwies.
Abstract
(Englisch)
While still a relatively young discipline, metabolomics – the identification and quantification of all metabolites present in a biological sample – has already proven to be a cornerstone technique in life sciences in recent years. Especially in view of ongoing technological advances in analytical chemistry, major scientific revelations can be expected in the near future by application of this technique to current biological questions. Even though the metabolomics field has progressed rapidly in recent years, a plethora of problems still has to be overcome to establish true metabolomic workflows for everyday analysis. The studies presented aim towards improving metabolomics in view of enhanced metabolic coverage by combination of different analytical platforms and an increased identification rate of unknowns in high-resolution MS-based metabolomics data. The first study focused on improving the metabolic coverage from the same sample by combining the GC-TOF-MS with the LC-Orbitrap-MS platform, effectively increasing the range of detectable metabolites from 40 to 2000 m/z and enabling deeper functional interpretation of the data. To provide a proper experimental frame, a set of Arabidopsis thaliana specimen were subjected to high cold and light stress, in order to trigger global metabolic reprogramming of the plants’ metabolism. Untargeted metabolomics analysis by GC-MS and LC-MS revealed highly altered metabolite profiles in the primary as well as the secondary plants metabolism compared to unstressed specimen. Subsequent data merging from both platforms revealed functional relations of metabolites deriving from the underlying metabolic network: application of the Granger causality test on the data set unfolded the presence of several typical secondary plant compounds (“flavonoids”) in the cold-stressed plants deriving from activation of the phenylpropanoid biosynthetic pathway, correlating with the key precursor molecules shikimic acid and phenylalanine. While metabolite identification on the GC-MS platform is already developed and mostly a question of database availability, the LC-Orbitrap-MS analyses yielded thousands of possible metabolite signals and only a handful of them could be manually annotated. Thus, in the second study, a method for predicting novel metabolites in LC-MS data by exploiting the potential of high-resolution MS and accurate mass acquisition was established: A MATLAB script (mzGroupAnalyzer) was developed which automatically checks a list of possible sum formulas deriving from highly resolved precursor signals for a metabolic context. By application of the program to mass spectrometric data of the cold stressed plant profiles, together with structure validation by product ion spectra, 16 putatively new substances in Arabidopsis could be predicted and complete biosynthetic pathways of secondary metabolites could be reconstructed. Additionally, for improved m/z feature extraction of “-omics”-type data, a method based on the successfully established MAPA (mass accuracy precursor alignment) algorithm was developed in the third study, which aims towards extraction and relative quantification of precursors in a targeted approach (compared to the untargeted method), which is shown to be superior compared to other quantification strategies (like NSAF – normalized spectral abundance factor) in several ways.

Schlagwörter

Schlagwörter
(Englisch)
metabolomics high-resolution high-resolution-MS mass spectrometry structure elucidation high-throughput analytical chemistry systems biology
Schlagwörter
(Deutsch)
Metabolomics Hochauflösung Hochauflösungs-MS Massenspektrometrie Strukturaufklärung Hochdurchsatz Analytische Chemie Systembiologie
Autor*innen
Hannes Dörfler
Haupttitel (Englisch)
Novel tools for structural elucidation, pathway reconstruction and functional interpretation of high-throughput HRMS metabolomics data
Paralleltitel (Deutsch)
Neue Methoden für die Strukturaufklärung, Syntheseweg-Rekonstruktion und funktionelle Interpretation von metabolomischen Hochdurchsatz/Hochauflösungs-MS-Daten
Publikationsjahr
2014
Umfangsangabe
127 S. : Ill., graph. Darst.
Sprache
Englisch
Beurteiler*innen
Robert D. Hall ,
Royston Goodacre
Klassifikationen
35 Chemie > 35.26 Massenspektrometrie ,
35 Chemie > 35.29 Chromatographische Analyse, Elektrophorese ,
35 Chemie > 35.39 Analytische Chemie: Sonstiges ,
42 Biologie > 42.17 Allgemeine Physiologie ,
42 Biologie > 42.41 Pflanzenphysiologie
AC Nummer
AC12307048
Utheses ID
33188
Studienkennzahl
UA | 794 | 685 | 437 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1