Detailansicht

Estimating relative gene expression in single cells
Martin Fahrenberger
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Doctor of Philosophy-Doktoratsstudium Molecular Biosciences Molekulare Biologie
Betreuer*in
Arndt von Haeseler
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.77568
URN
urn:nbn:at:at-ubw:1-15294.50846.228573-8
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Die single-cell RNA-Sequenzierung (scRNA-seq) ermöglicht die Messung der Genexpressionwerte in Tausenden von Zellen gleichzeitig. Diese Technologie wurde bereits erfolgreich eingesetzt, um Einblicke in die Gewebeheterogenität und in zelluläre Prozesse in Gesundheit und Krankheit zu gewinnen. Aufgrund der Komplexität der Daten und des hohen technischen Rauschens bleibt die Analyse von scRNA-seq-Daten jedoch eine Herausforderung. Im ersten Teil dieser Arbeit haben wir scRNA-seq verwendet, um die Unterschiede zwischen zwei menschlichen Krankheiten zu untersuchen, indem wir Nasenpolypen von zwei Patientengruppen vergleichen. Durch unsere scRNA-seq-Experimente und die anschließende Datenanalyse waren wir in der Lage, unterschiedliche Immunreaktionsmuster zwischen den Gruppen zu identifizieren und unser Verständnis für die Pathogenese dieser Erkrankungen zu erweitern. Im zweiten Teil dieser Arbeit wird eine Verbesserung eines wichtigen Schrittes in der scRNA-seq-Datenanalyse vorgeschlagen: die Normalisierung. Normalisierungsmethoden sind darauf ausgelegt, technisches Rauschen durch Berücksichtigung zellspezifischer Effekte zu verringern und dadurch die Genexpressionswerte zwischen den Zellen vergleichbarer zu machen. In der Regel beinhaltet dies die Berechnung der relativen Genexpressionswerte pro Zelle. Obwohl es meist nicht als solches diskutiert wird, handelt es sich dabei um eine Maximum-Likelihood-Schätzung der relativen Genexpressionshäufigkeiten. Indem wir die Berechnung des relativen Genexpressionswerte als ein Schätzungsproblem formuliert haben, waren wir in der Lage eine bessere Alternative zum derzeit verwendeten Maximum-Likelihood-Schätzer zu finden: den Good-Turing-Schätzer. Wir haben anschließend die Genauigkeit beider Schätzer anhand neuer ultra-tiefer scRNA-seq-Daten bewertet und zeigen die Vorteile des Good-Turing-Schätzers. Um die Integration in gängige scRNA-seq-Workflows zu ermöglichen, stellen wir zum Abschluss ein benutzerfreundliches R-Paket vor: GTestimate.
Abstract
(Englisch)
Single-cell RNA sequencing (scRNA-seq) enables high-resolution measurement of gene expression levels in thousands of cells simultaneously. It has successfully been employed to gain insight into tissue-heterogeneity and cellular processes in both health and disease. However, due to the complexity of the data and high amounts of technical noise, the analysis of scRNA-seq data remains challenging. In the first part of this thesis we utilized scRNA-seq to investigate the differences between two human diseases by analyzing nasal polyps from two groups of patients. Through our scRNA-seq experiments and the subsequent data-analysis we were able to identify distinct immune response patterns between the groups and increase our understanding of the pathogenesis of these conditions. The second part of this thesis suggests an improvement to a key step in scRNA-seq data analysis: normalization. Normalization methods are designed to mitigate technical noise by accounting for cell-specific effects, thereby making gene expression levels more comparable across cells. Typically, this involves the calculation of relative gene expression levels per cell. While not usually discussed as such, this is a Maximum Likelihood estimation of the relative gene expression frequencies. By framing the calculation of relative gene expression levels as an estimation problem, we identified a better alternative to the currently used Maximum Likelihood estimator: the Good-Turing estimator. We evaluated the performance of both estimators using novel ultra-deep scRNA-seq data and show the advantages of the Good-Turing estimator. Finally, to enable integration into standard scRNA-seq workflows, we present an easy-to-use R package: GTestimate.

Schlagwörter

Schlagwörter
(Deutsch)
scRNA-seq Genexpression Good-Turing Schätzer AERD CRSwNP Normalisierung
Schlagwörter
(Englisch)
scRNA-seq gene expression Good-Turing estimator AERD CRSwNP normalization
Autor*innen
Martin Fahrenberger
Haupttitel (Englisch)
Estimating relative gene expression in single cells
Publikationsjahr
2024
Umfangsangabe
vii, 76 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*innen
Marco Yannic Hein ,
Ines Hellmann
Klassifikationen
42 Biologie > 42.13 Molekularbiologie ,
44 Medizin > 44.93 Dermatologie
AC Nummer
AC17414900
Utheses ID
73106
Studienkennzahl
UA | 794 | 620 | 490 |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1