Detailansicht

An integration approach from heterogenous omics data sources for a comprehensive analysis of obesity
Caroline Brettfeld
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Doktoratsstudium NAWI aus d. Bereich Lebenswissenschaften (Dissertationsgebiet: Ernährungswissenschaften)
Betreuer*innen
Alexander Haslberger ,
Borut Peterlin
Alle Rechte vorbehalten / All rights reserved
URN
urn:nbn:at:at-ubw:1-15812.87190.585361-2
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Einleitung: Adipositas definiert sich als ein komplexer, multifaktorieller Zustand, der sich aus der Wechselwirkung von genetischen Faktoren, Ernährung, Umwelt und Lifestyle-Faktoren zusammensetzt. Er wurde mit Multiorganschäden und einer erhöhten Anfälligkeit für kardiovaskuläre Erkrankungen, verschiedene Krebsarten, insbesondere im gesamten Magen-Darm-Trakt, sowie Infektionskrankheiten und neurodegenerative Erkrankungen korreliert. Um Fettleibigkeit als eine komplexe Krankheit besser zu verstehen, ist es notwendig, allen Ebenen der Omics Daten zusammen zu betrachten. Methode: Omics Forschung ist seit kurzem von großem Interesse und ermöglicht der Forschung eine größere Menge an Daten zu Analyse zu verwenden. Im Gegensatz zu anderen Methoden zur Integration von heterogenen Omic Daten, basiert diese Integration auf genomische Positionen. Im Rahmen der Arbeit wird die Gewichtung der Daten während der ersten Analyse nicht umgestellt und alle Daten (genomische Daten, transkriptomische Daten, proteomische Daten, mikroRNA Daten und epigenetische Daten) gleichermaßen genutzt. Für die zweite Analyse werden fünf verschiedene Gewichtungen einstellt, um jeweils um die Eingabe von genomischen Daten, transkriptomischen Daten, proteomischen Daten, mikroRNA Daten und epigenetischen Daten einzeln verdoppeln und mit den anderen Datenquellen zu Vergleichen. Ergebnisse: Beide Tests ergeben priorisierte Listen der identifizierten Genregionen. Während der ersten Analyse werden 71 High-Scoring-Genregionen identifiziert (Tabelle 3), während in der zweiten Analyse werden fünf Listen von High-Scoring-Genregionen erzeugt (siehe Tabelle 4-8). Für die doppelte Eingabe von genomischen Daten und dem normalen gewogen Transkriptomischen, Proteomischen, mikroRNA und epigenetische Daten wurden 49 High-Scoring-Genregionen (Tabelle 4) identifiziert. Die doppelt gewogenen transkriptomischen Daten zeigten 132 Generegionen (Tabelle 5). Die Doppeltgewogenen proteomischen Daten ergaben 63 High-Scoring-Genregionen (Tabelle 6). Vierzig weitere Genregionen wurden für die Doppeltgewogenen mikroRNA (Tabelle 7) gefunden. Und 24 High-Scoring-Genregionen (Tabelle 8) wurden für die doppelt gewogenen epigenetischen Daten mit dem einzelnen gewogen anderen Daten identifiziert. Diskussion: Die Analyse identifiziert vier Genregionen (ADH1B, TNMD, DAPK2, ACACB), die vor kurzem mit Fettleibigkeit in Verbindung gebracht wurden. Zwölf weitere Genregionen werden zur weiteren Adipositasforschung vorgeschlagen, da sie mit Diabetes II Typ (ATP5O, ACVR1C, ATM, PRRC2A, FGF2, AIF1), Colitis ulcerosa und Reizdarmsyndrom (S100) und neurodegenerative Erkrankungen (GAPDH, IFFO1 , NCAPD2, MAOB, STOX1, PDIA5) in Verbindung gebracht wurden, und als die Highest Scoring und / oder die meisten identifiziert Genregionen der Ergebnistabellen identifiziert wurden. Die identifizierten mikroRNAs, MiR-146, miR-378, miR-143, miR-145, miR-194 konnten direkt mit Entzündungsprozessen im Fettgewebe oder fettleibigkeitsbedingten Krankheiten, wie Insulinresistenz verbunden werden. Fazit: Diese Studie hat erfolgreich eine neue Integrationsmethode auf Grundlage der genetischen Positions durchgeführt und verschiede heterogene Daten von unterschiedlichen Omics-Schichten integriert. Alle Ziele der Arbeit sind erfüllt worden, wie (1) die Identifizierung neuer Genregionen oder Pathways, (2) weitere Verbindungen zwischen anderen komplexen Erkrankungen wurden diskutiert, (3) die Verbindung von Fettleibigkeit und low-grade Inflammation konnte durch die Identifizierung von TLRs und microRNAs bestätigt werden und schließlich (4) wurden die Vorteile und Herausforderungen der Integration Tools diskutiert.
Abstract
(Englisch)
Introduction: Obesity is defined as a complex, multifactorial condition, which results from interactions among genetic, dietary, environmental, and lifestyle factor. It has been correlated with multi-organ damage and an increased susceptibility to cardiovascular diseases, various types of cancer , specifically throughout the gastro-intestinal tract, as well as infectious- and neurodegenerative diseases. To better understand obesity as a complex disease it is necessary to take in all levels of omics data. Method: Omics research has recently become of great interest and enables the research community to acquire an increasing amount of data. In contrast to previous methodologies employed for integration of heterogeneous omic data, this integration is based on genomic positions. As part of the thesis, the first analysis weighing settings are not adjusted and all data (genomic data, transcriptomic data, proteomic data, microRNA data and epigenetic data) is utilized equally. For the second analysis, five different weighing settings are used to individually double the input of genomic data, transcriptomic data, proteomic data, microRNA data and epigenetic data in comparison to all the other data sources. Results: Both tests yield prioritized lists of identified gene regions. During the first analysis, 71 high-scoring gene regions are identified (Table 3), whereas during the second analysis five lists of high-scoring gene regions are generated (Table 4-8). For the doubled input of genomic data and the normal weighed expression, proteomic, microRNA and epigenetic data, 49 high scoring gene regions (Table 4) are identified. The transcriptomic data weighed double results in 132 high scoring genes (Table 5). The double weighed proteomic data depicts 63 high scoring gene regions (Table 6). Forty high scoring gene regions were found for the double weighed microRNA (Table 7). The double weighed epigenetic with the single weighed other data sources shows 24 high scoring gene regions (Table 8). Discussion: The analysis yielded four gene regions (ADH1B, TNMD, DAPK2, ACACB) that were very recently identified to be associated to obesity could be verified. Twelve other gene regions are suggested for further obesity research, as they were associated to type II diabetes (ATP5O, ACVR1C, ATM, PRRC2A, FGF2, AIF1), to ulcerative colitis and irritable bowel syndrome (S100) and neurodegenerative diseases (GAPDH, IFFO1, NCAPD2, MAOB, STOX1, PDIA5) as they are found to be high scoring and/or most identified high scoring gene regions of the results. MiR-146, miR-378, miR-143, miR-145, miR-194 could be directly linked to adipose tissue inflammation or obesity related diseases, such as insulin resistance. Conclusion: This study successfully applied a new method of positional integrational analysis of different omic-layers and an additional validation step through weighing. All objectives of the thesis were fulfilled, as (1) new gene regions or pathways of interest were identified (2) further connections between other complex diseases were discussed, (3) the connection of obesity and low grade inflammation could be established through the identification of TLRs and microRNAs and finally (4) the advantages and challenges of the integration tool utilized was discussed.

Schlagwörter

Schlagwörter
(Englisch)
OMICs Daten Integration Obesity
Schlagwörter
(Deutsch)
OMICs Daten Integration Adipositas
Autor*innen
Caroline Brettfeld
Haupttitel (Englisch)
An integration approach from heterogenous omics data sources for a comprehensive analysis of obesity
Paralleltitel (Deutsch)
Integration heterogener OMICs Daten
Publikationsjahr
2017
Umfangsangabe
163 Seiten : Diagramme
Sprache
Englisch
Beurteiler*innen
Stefania Boccia ,
Fermin Milagor Yoldi
Klassifikation
30 Naturwissenschaften allgemein > 30.00 Naturwissenschaften allgemein: Allgemeines
AC Nummer
AC14499570
Utheses ID
43508
Studienkennzahl
UA | 796 | 610 | 474 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1