Detailansicht

Development of a KNIME workflow for the retrieval of associations between orphan diseases and their possible drug repurposing candidates
Jana Gurinova
Art der Arbeit
Diplomarbeit
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Diplomstudium Pharmazie
Betreuer*in
Gerhard Ecker
Mitbetreuer*in
Daniela Digles
Volltext herunterladen
Volltext in Browser öffnen
Alle Rechte vorbehalten / All rights reserved
DOI
10.25365/thesis.55364
URN
urn:nbn:at:at-ubw:1-25150.04824.511168-4
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)

Abstracts

Abstract
(Deutsch)
Seltene Erkrankungen betreffen weltweit über 400 Millionen Menschen. Sie werden über ihre Häufigkeit beziehungsweise ihre Seltenheit definiert, und daher zwangsläufig auch über eine geringe Zahl an Patienten pro Krankheit. Im Vergleich zur hohen Gesamtzahl an Patienten mangelt es jedoch an medikamentösen Behandlungen für die rund 8,000 bekannten seltenen Erkrankungen. In den USA sind diesbezüglich rund 500 Arzneimittel auf dem Markt und in der EU sind es rund 80. Neue Arzneimittel könnten hier Abhilfe schaffen, und eine Strategie um in möglichst kurzer Zeit Arzneimittel für neue Indikationen verfügbar zu machen ist die sogenannte Umnutzung oder Neupositionierung von Arzneimitteln (eng. drug repurposing oder drug repositioning), also die Verwendung von bekannten Arzneimitteln für Indikationen abseits der ursprünglichen Zulassung. Die Neupositionierung von Arzneimitteln war Gegenstand zahlreicher wissenschaftlicher Publikationen des letzten Jahrzehnts. Der Fokus liegt bei diesen Publikationen üblicherweise auf der Neupositionierung für eine bestimmte Krankheit oder eine Gruppe von Krankheiten. Eine kleine Anzahl dieser Publikationen widmet sich in silico Methoden für eine übergreifende Neupositionierung über Krankheiten und Klassen hinweg. Um die hohe Anzahl an Patienten möglichst deckend mit Therapiemöglichkeiten versorgen zu können, liegt es nahe eine übergreifende Methode zur Neupositionierung zu verwenden. Die hier präsentierte Arbeit widmet sich dem Entwurf und der Ausführung einer solchen Methode. Die hier beschriebene Methode ist eine Dreiecksmethode. Sie erstellt Verbindungen zwischen Krankheiten, deren Zielproteinen, und den Arzneistoffen welche Wirkungen bei diesen Zielproteinen aufweisen. Die Erweiterung der Verbindung zwischen einer Krankheit und einem Arzneistoff um das Zielprotein der Krankheit ermöglicht die Entdeckung bisher unbekannter Zusammenhänge zwischen Krankheiten und Arzneistoffen. Das Workflow-Management-System welches für die Ausführung dieser Analyse verwendet wurde ist KNIME. Der Workflow beruht auf der Zusammenlegung von drei Datenbanken. Kurz gesagt beginnt der Workflow mit einer Liste seltener Erkrankungen aus der Datenbank Orphanet, verbindet die Liste mit der Open PHACTS Discovery Platform um Zielproteine abzurufen, and verknüpft diese Zielproteine zuletzt mit zugehörigen Arzneistoffen aus der Datenbank DrugBank. Bei dieser Herangehensweise wird die Tatsache genützt, dass ein Zielprotein bei mehreren Erkrankungen eine Rolle spielen kann, und dass ein Arzneimittel welches für dieses Zielprotein im Rahmen einer Erkrankung entwickelt wurde, unter Umständen auch für die Behandlung einer anderen Erkrankung herangezogen werden kann. Diese Methode basiert ausschließlich auf Daten und die daraus resultierende Anreicherung von (für eine Neupositionierung sinnvollen) Verbindungen zwischen Krankheiten und Arzneimitteln im endgültigen Datensatz beträgt rund 60%. Dieser Prozentsatz wurde durch Untersuchungen von Teildatensätzen der endgültigen Ergebnisse bestimmt. Diese Untersuchungen ergaben dass rund zwei aus drei Verbindungen entweder bereits publiziert waren, mittels manueller Überprüfung des Zusammenhangs als sinnvoll eingestuft werden konnten, klinische Studien diesbezüglich im Gang waren oder eine Verbindung bereits zugelassen war. Das Ziel dieser Arbeit war es einen Workflow zu erstellen welcher Vorschläge zur Neupositionierung von Arzneimitteln für seltene Erkrankungen erbringen kann, und dieses Ziel wurde hier erreicht.
Abstract
(Englisch)
Worldwide approximately 400 million people are affected by orphan diseases. Orphan diseases are defined by their low prevalence and therefore a low number of patients per disease. Treatments for these conditions - of which there are around 8,000 - are however few and far between, amounting to around 500 drugs with a marketing approval for an orphan disease in the US and around 80 in the EU. The need for new therapies can therefore clearly be seen. One of the possibilities to meet the needs of the rare disease patient community might lie in drug repurposing, the application of approved drugs for the treatment of new indications. A significant advantage lies in the fact that drug repurposing can provide safe drugs in a fraction of the time it would take to develop a new drug. Drug repurposing has been addressed in a number of publications in the last decade, most of them focusing on drug repurposing for specific diseases or disease classes, while a small number of them elaborates on in silico methods for comprehensive repurposing across many diseases. Given the high number of orphan diseases, the patient community could obviously profit from a general repurposing method being applied to all orphan diseases. The work described in this thesis is dedicated to the design and implementation of such a method. The method described in this thesis is a triangulation between diseases, their targets and drugs that act on these targets. Such a triangulation is able to retrieve previously unknown associations between diseases and drugs by expanding the connection between a disease and its drug through the introduction of an intermediate step where target information is taken into account. KNIME is the workflow management system that was used to execute this triangulation. The workflow is based on the integration of three powerful databases. In a nutshell the workflow starts with a list of orphan diseases from the Orphanet database, which is then connected to the Open PHACTS Discovery Platform for the retrieval of targets, and the targets are subsequently connected to respective drugs from DrugBank. The idea behind this approach is that one target can be related to multiple diseases, and that a drug that has been developed for such a target in the context of one disease can potentially be used for the treatment of another disease. The method relies exclusively on data mining and results in an enrichment of useful associations between diseases and drugs of approximately 60%. This means that in the inspected subsets of results roughly two out of three associations between a disease and a drug were found to be either mentioned in publications, determined to be useful by a manual check, under investigation in clinical trials or already approved. The aim of this work, which was to create a workflow capable of proposing drug repurposing candidates for orphan diseases, was therefore achieved.

Schlagwörter

Schlagwörter
(Englisch)
orphan diseases rare diseases KNIME workflow data mining drug repurposing drug repositioning
Schlagwörter
(Deutsch)
seltene Erkrankungen KNIME Workflow Data-Mining Neupositionierung
Autor*innen
Jana Gurinova
Haupttitel (Englisch)
Development of a KNIME workflow for the retrieval of associations between orphan diseases and their possible drug repurposing candidates
Paralleltitel (Deutsch)
Entwicklung eines KNIME Workflows für das Auffinden von Verbindungen zwischen seltenen Erkrankungen und Arzneimitteln die für eine Neupositionierung in Frage kommen
Publikationsjahr
2018
Umfangsangabe
XIX, 98 Seiten : Diagramme
Sprache
Englisch
Beurteiler*in
Gerhard Ecker
Klassifikationen
44 Medizin > 44.40 Pharmazie, Pharmazeutika ,
44 Medizin > 44.42 Pharmazeutische Chemie ,
44 Medizin > 44.48 Medizinische Genetik
AC Nummer
AC15275231
Utheses ID
48932
Studienkennzahl
UA | 449 | | |
Universität Wien, Universitätsbibliothek, 1010 Wien, Universitätsring 1