Detailansicht
Similarity based classification studies for prediction of ABCB1 (P-glycoprotein) substrates and non-substrates
Rita Schwaha
Art der Arbeit
Dissertation
Universität
Universität Wien
Fakultät
Fakultät für Lebenswissenschaften
Betreuer*in
Gerhard F. Ecker
DOI
10.25365/thesis.29514
URN
urn:nbn:at:at-ubw:1-16420.61536.151949-4
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
ABC (ATP-binding cassette) Transporter stellen membrangebundene Ausscheidepumpen dar mit dem prominentesten Mitglied ABCB1 oder P-glyco-protein. Dieses Protein ist an wichtigen Stellen wie der Blut-Hirn-Schranke, der Magenwandschleimhaut, der Plazenta und anderen Leber-Stoffwechsel-prozessen lokalisiert und spielt daher eine große Rolle bei Medikamentenwechselwirkungen und auch bei Mehrfachresistenzen von verschiedenen Arzneimittel. Deshalb ist die Erkennung von Substrat-Eigenschaften und eine zuverlässige Erkennung von Nichtsubstraten so bedeutsam.
In unserer Gruppe wurden ähnlichkeitsbasierte Deskriptoren (SIBAR) mit Fokus auf solch polyspezifische Proteine wie ABCB1 entwickelt. Diese Deskriptoren sind abhängig von einem Referenzsatz und bestehen aus den berechneten Euklidischen Distanzen in Bezug auf den Referenzsatz und die entsprechenden Training- und Testsätze. Ihre Anzahl ist daher abhängig von der Zahl der Moleküle im Referenzsatz. Vier verschiedene Referenzsätze wurden abgeleitet und ihre Anwendbarkeit diskutiert. Die ersten drei Referenzsätze basieren auf Tudor Oprea's Idee von Chemographie in Form von Satelliten-Strukturen am Rande des chemischen Raums. Der vierte Referenzsatz wurde entsprechend vorherigen Ergebnissen in unserer Gruppe auf den spezifischen Trainingssatz zugeschnitten.
Der Fokus dieser Arbeit liegt vor allem in der Erforschung der Anwendbarkeit von 3D Deskriptoren in Bezug auf SIBAR und des Nutzen von Form-Ähnlichkeit basierend auf einem konsistenten Datensatz. Außerdem wird die Entwicklung eines geeigneten Referenzsatzes zur Erstellenung eines Klassifikationsmodells für ABCB1 basierend auf 240 sehr diversen Naturprodukten diskutiert.
Um dieses Ziel zu erreichen wurde eine Vielzahl von verschiedenen Deskriptortypen und auch verschiedene Klassifikationsansätze verwendet. Diese beinhalten 2D-, VSA-, 3D Autokorrelations- und VolSurf- Deskriptoren. Um außerdem noch das Konzept von Form-Ähnlichkeit zu untersuchen wurden die Parameter, die durch das Programm ROCS von Openeye bei der Übereinanderlegung von zwei Molekülen errechnet worden waren, als Deskriptoren verwendet. Die verwendeten Klassifikationsmodelle beinhalten binary QSAR, Support Vector Maschinen und random forest.
Die Ergebnisse zeigen, dass 2D Deskriptoren im Vergleich zu 3D oder Form-basierten Methoden sehr gut abschneiden und besonders mit VSA Deskriptoren konnte das beste Modell mit 83% Genauigkeit erreicht werden. Abschließend bemerkt ist Referenzsatz B sehr gut geeignet um einen schnellen Überblick über den Datensatz zu ermöglichen, aber bei detaillierter Betrachtung ist ein spezifisch zugeschnittener Referenzsatz zu bevorzugen. In ihrer Gesamtheit waren die Ergebnisse zufriedenstellend und besonders einige von ROCS errechneten Parameter zeigten gute Leistung.
Abstract
(Englisch)
ABC (ATP-binding cassette) transporters represent membrane bound efflux pumps dependent on ATP with the most prominent member being ABCB1 or P-glycoprotein. This protein is placed at important junctions like the blood-brain barrier, the gut wall mucosa, the placenta and among others hepatobiliary pathways and consequently plays a major role in drug-drug interactions and multi-drug resistance. For this reason recognition of substrate properties and reliable labelling of non-substrates gain more and more importance.
In-house derived similarity based descriptors (SIBAR) were previously developed with focus on poly-specific proteins like ABCB1. These descriptors depend upon a set of reference compounds and consist of the calculated euclidian distance between descriptor values of the reference set and the training and test set. The number of final descriptors therefore is dependent on the number of compounds in the reference set. Four different reference sets have been derived and their usability is discussed. The first three reference sets are based on Tudor Oprea's chemography idea of satellite structures on the fringes of the chemical space. The fourth reference set is based on in-house results favouring a tailored reference set to the training set.
The focus of this work lay in the exploration of the 3D usability of the SIBAR descriptors and the impact of shape similarity based on a consistent data set. Also the establishment of a suitable reference set for a classification model for ABCB1 is discussed based on 240 highly diverse natural compounds.
In order to achieve this goal a variety of different descriptor types and machine learning approaches were performed. These include 2D descriptors, Labute's VSA descriptors, 3D Autocorrelation descriptors and VolSurf descriptors. To further explore the concept of shape similarity the parameters derived from the program ROCS of Openeye via shape overlay between two molecules were also used as descriptors. The machine learning approaches primarily encompass binary QSAR, support vector machine and random forest.
Results show that 2D descriptors compare very creditably with 3D or shape based methods and especially the VSA descriptors presented the best model so far with an overall accuracy of 83%. As appropriate reference set reference set B is preferred if a quick overview is necessary. For more detailed analysis of one's data a more time-consuming tailored reference set is the reference set of choice. The overall results were satisfying and especially some of the ROCS parameters showed good performance.
Schlagwörter
Schlagwörter
(Englisch)
ABCB1 classification random forest similarity based SIBAR support vector machine Binary QSAR
Schlagwörter
(Deutsch)
ABCB1 Klassifikation random forest ähnlichkeitsbasiert SIBAR Binäre QSAR support vector machine
Autor*innen
Rita Schwaha
Haupttitel (Englisch)
Similarity based classification studies for prediction of ABCB1 (P-glycoprotein) substrates and non-substrates
Paralleltitel (Deutsch)
Ähnlichkeitsbasierte Klassifikationsstudien zur Vorhersage von ABCB1 (P-glycoprotein) Substraten und Nicht-Substraten
Publikationsjahr
2013
Umfangsangabe
XII, 284 S. : Ill., graf. Darst.
Sprache
Englisch
Beurteiler*innen
Knut Baumann ,
Gerhard Wolber
Klassifikationen
30 Naturwissenschaften allgemein > 30.00 Naturwissenschaften allgemein: Allgemeines ,
30 Naturwissenschaften allgemein > 30.03 Methoden und Techniken in den Naturwissenschaften
AC Nummer
AC11064027
Utheses ID
26324
Studienkennzahl
UA | 091 | 449 | |
