Detailansicht

Analysis of patent bioactivity data in ChEMBL
Ursula Bartuschka
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Drug Discovery and Development
Betreuer*in
Barbara Zdrazil
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.74062
URN
urn:nbn:at:at-ubw:1-11334.58066.260299-5
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Die Forschung und Entwicklung von neuen pharmazeutischen Wirkstoffen konzentriert sich meist auf nur wenige unterschiedliche Targets und Targetfamilien, während ein großer Teil des menschlichen Proteoms vergleichsweise wenig erforscht wird. Der Mangel an Daten für jene Targets führt wiederum dazu, dass sie weiterhin wenig attraktiv für die Forschung bleiben. Eine bisher wenig genutzte Datenquelle für solche wenig erforschten Targets sind Patente. Deren Anzahl und Struktur erschweren es, Bioaktivitäten für die enthaltenen Moleküle zu extrahieren. Trotzdem wurden in den letzten Jahren Anstrengungen unternommen, solche Daten in die ChEMBL Datenbank zu integrieren, und die Erforschung bisher vernachlässigter Targets zu erleichtern. Das Ziel dieser Arbeit war, den Gewinn an Informationen durch die Annotation von Patenten durch ChEMBL zu evaluieren. Für jedes Target wurden die Moleküle aus Patenten in zweierlei Hinsicht analysiert: Erstens, in Bezug auf ihre Diversität, was Schlüsse auf die Abdeckung des Targets aus Patenten in ChEMBL erlaubt, und zweitens hinsichtlich ihrer Neuartigkeit im Vergleich mit Molekülen für das gleiche Target aus anderen Datenquellen. Diese Analysen können einen Beitrag dazu leisten, Targets für die Annotation aus Patenten zu priorisieren, sodass Daten bevorzugt für jene extrahiert werden, für die noch wenig Informationen verfügbar sind, aber Patente großes Potential für neuartige bioaktive Moleküle bergen.
Abstract
(Englisch)
In drug discovery and development, there is a tendency to focus on a small subset of targets and target families, while leaving a considerable part of the human proteome relatively unexplored. A lack of knowledge for these understudied targets leaves them unattractive for further research in a self-reinforcing cycle. One previously largely untapped potential source of data on understudied targets are patents, which are both numerous and notoriously hard to extract bioactivities from. Nevertheless, in recent years efforts have been made to incorporate such data into the ChEMBL database to facilitate the study of previously underexplored targets. This thesis aimed to evaluate the gain in knowledge from ChEMBL's patent annotation efforts. Each target's patent compounds are analyzed from two perspectives: Firstly, regarding their diversity, giving an indication of the coverage of each target, and secondly regarding their novelty when compared to compounds from other sources for the same target. Going forward, such analyses may help to guide the prioritization of targets for patent annotations towards targets which are both in need of more data, and where patents hold great potential for novel compounds.

Schlagwörter

Schlagwörter
(Deutsch)
ChEMBL Bioaktivität Datenanalyse
Schlagwörter
(Englisch)
ChEMBL bioactivity data analysis
Autor*innen
Ursula Bartuschka
Haupttitel (Englisch)
Analysis of patent bioactivity data in ChEMBL
Paralleltitel (Deutsch)
Analyse von Bioaktivitätsdaten aus Patenten in ChEMBL
Publikationsjahr
2023
Umfangsangabe
93 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Barbara Zdrazil
Klassifikationen
35 Chemie > 35.06 Computeranwendungen ,
44 Medizin > 44.42 Pharmazeutische Chemie
AC Nummer
AC16922702
Utheses ID
67605
Studienkennzahl
UA | 066 | 606 | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1