Detailansicht
Geometric analysis of PROTAC ternary complexes
Michael Passegger
Art der Arbeit
Masterarbeit
Universität
Universität Wien
Fakultät
Fakultät für Chemie
Studiumsbezeichnung bzw. Universitätlehrgang (ULG)
Masterstudium Bioinformatik
Betreuer*in
Stefan Boresch
DOI
10.25365/thesis.72802
URN
urn:nbn:at:at-ubw:1-17996.12067.601676-4
Link zu u:search
(Print-Exemplar eventuell in Bibliothek verfügbar)
Abstracts
Abstract
(Deutsch)
Ein ’PROteolysis TArgeting Chimera’, auch bekannt als PROTAC, ist ein heterobifunktionales Molekül, das gleichzeitig an zwei Proteine binden kann: das Zielprotein und die E3 Ligase. Die E3 Ligase ist Teil eines grösseren Proteinkomplexes namens Degradationskomplex. Durch das PROTAC kommen sich das Zielprotein und die E3 Ligase näher, was zum Ubiquitintransfer auf das Zielprotein führt. So ist dieses Protein für den Abbau markiert und wird durch das Proteasom aus der Zelle entfernt. Ubiquitinierung entspricht der kovalenten Bindung von Ubiquitin an ein oder mehrere Lysine des Zielproteins. Konformationen, die zum Proteinabbau führen, basieren auf einem ternären Komplex zwischen dem Zielprotein, dem PROTAC, und der E3 Ligase. Ternäre Komplexe sind jedoch sehr beweglich und lassen sich besser als ein Konformationsensemble als eine einzige Konformation beschreiben. Das Ziel dieser Masterarbeit bei Boehringer Ingelheim in Wien ist es, ein besseres Verständnis über die geometrischen Anforderungen für eine erfolgreiche Ubiquitinierung mit PROTACs zu gewinnen, und zwar auf drei Ebenen: ternäre Komplexensembles, Degradationskomplexe, und molekulare Dynamik für ausgewählte Konformationen der ternären Komplexensembles. "Kirsten RAt Sarcoma viral oncogene homolog", besser bekannt als KRAS, erhält sehr viel Aufmerksamkeit von der Forschung, weil es das am häufigsten mutierte Onkogen ist. Zwei ternäre Komplexsysteme mit KRAS GDP G12V, die sich durch firmeneigne PROTACs und die verwendete E3 Ligase (VHL oder CRBN) unterscheiden, wurden mit den unten beschriebenen Methoden per Computer analysiert. Zuerst wurden die ternären Komplexe generiert. Die Lysinpositionen in diesen Komplexen wurden dann mit einer auf einem Gitter basierenden Methode, die wir Lysinkartierung nennen, analysiert. Ausgewählte Konformationen wurden anschliessend in den Degradationskomplex hineinmodelliert, um herauszufinden, ob sie zumindest aus geometrischer Sicht zum Zielproteinabbau führen würden. Besonders um die Lysine im ternären Komplexensemble zu analysieren, wurden Pythonskripte entwickelt. Damit wurden relevante Parameter wie die wasserzugängliche Oberfläche, kristallographische B-Faktoren, und Sekundärstrukturen extrahiert. Anschliessend wurden molekulare Dynamiken für ausgewählte Konformationen durchgeführt, um stabile ternäre Konformationen zu finden, die wichtig fürs PROTAC Design sein könnten. Mit den erwähnten Methoden wurden für jedes KRAS system vier Lysine identifiziert, die eine hohe Ubiquitinierungswahrscheinlichkeit haben: Lysine mit einer grossen wasserzugänglichen Oberfläche und einer kurzen Distanz zu Ubiquitin wurden als am wahrscheinlichsten ubiquitinierbar betrachtet. Abgesehen davon konnten die ternären Komplexensembles auf eine sinnvolle Teilmenge eingeschränkt werden, indem entweder Konformationen aussortiert wurden, in denen das Zielprotein weit weg von Ubiquitin war oder die zu Kollisionen mit Bestrandteilen des Degradationskomplexes führten. Die Vorhersage von Lysinen, die ubiquitiniert werden können, half dabei, die Anzahl der experimentell zu validierenden Lysine einzuschränken. Die Ubiquitinierung wird durch die Mitarbeiter der Ciulli Kollaboration (Centre for Targeted Protein Degradation, University of Dundee, Schottland, Vereinigtes Königreich) durchgeführt. Molekulare Dynamiken über 250 ns haben sich als nützlich herausgestellt, um die Stabilität und die Dynamik der ternären Komplexe mit PROTACs zu beurteilen, vor allem für Konformationen mit VHL mit eher flexiblen PROTACs. Für Systeme mit CRBN und PROTACs mit eher kurzen, starren Linkern, müssten wahrscheinlich längere Simulationen gestartet werden, um den Raum möglicher Konformationen besser abzudecken. Zusammenfassend werden in dieser Arbeit einige Methoden präsentiert, um ternäre Komplexe per Computer zu analysieren: vom Generieren der ternären Komplexensemble, der Kartierung der Lysinpositionen, bis zum Messen der Distanzen der Lysine in der Nähe von Ubiquitin in Degradationskomplexen. Ternäre Komplexe, die zu keinem Zielproteinabbau führen, können mit diesem Ansatz aussortiert werden. Die Stabilität und Dynamik einer verfeinerten Anzahl von Konformationen, die zum Abbau führen, kann dann per molekulare Dynamik abgeschätzt werden. Die Länge solcher Dynamiken ist abhängig von der PROTAC-Flexibilität und der Art der E3 Ligase. Schlussendlich kann man den Medizinalchemikern eine handvoll sinnvoller ternärer Komplexe als Basis für strukturbasiertes PROTAC Design zur Verfügung stellen.
Abstract
(Englisch)
A PROteolysis TArgeting Chimera or PROTAC is a heterobifunctional molecule that can bind to two proteins at once: the target protein, also known as the protein of interest, and an E3 ligase. The E3 ligase is part of a larger assembly of proteins called degradation complex. The PROTAC brings the protein of interest and the E3 ligase in close proximity, leading to ubiquitin transfer from the degradation complex to the targeted protein. In this way, this protein is ’labelled’ for degradation, and removed from the cell by proteasomal degradation. Ubiquitination corresponds to the covalent linkage of ubiquitin to one or several lysine residues of the targeted protein. Degradation-competent conformations require a ternary complex between the protein of interest, the PROTAC, and the E3 ligase to be formed. However, ternary complexes are highly dynamic entities, which are better described as an ensemble of low energy ternary complexes than one particular conformation. This Master’s Thesis, conducted at Boehringer Ingelheim in Vienna, aims at gaining a better understanding on the geometric requirements for ubiquitination in the presence of PROTACs at three levels: ternary complex ensembles, degradation complexes, and molecular dynamics for selected conformations of the ternary complex ensembles. Kirsten RAt Sarcoma viral oncogene homolog, better known as KRAS, has drawn considerable attention for being the most frequently mutated oncogene. Two ternary complex systems involving KRAS GDP G12V, and differing by the proprietary PROTACs and the E3 ligase (either VHL or CRBN) used, were analyzed in silico. After having generated the ternary complex ensembles, lysine residue positions were analyzed using a grid-based approach called lysine mapping, and selected conformations were then modelled into entire degradation complexes to check whether they would be degradation-competent, at least from a geometric point of view. Specifically for assessing the lysine residues in the ternary complex ensembles, Python scripts were developed. They were used to extract relevant parameters such as the solvent-accessible surface area, crystallographic B-factors, and secondary structure elements. To identify stable ternary complexes which could be relevant for PROTAC design, molecular dynamics on selected conformations was then carried out. Using the above-mentioned methods, four lysine residues with a high ubiquitination probability were identified for each KRAS system: Lysine residues with a high solvent accessibility and a short distance to ubiquitin in the degradation complex were considered to have the highest ubiquitination likelihood. Besides, ternary complex ensembles could be restricted to meaningful subsets by sorting out PROTAC conformations which either caused the POI to be far apart from Uq or led to conformational clashes with degradation complex components. The prediction of ubiquitination-prone lysine residues helped in restricting the number of lysine residues to be tested experimentally for ubiquitination by collaborators in the Ciulli Lab, Centre for Targeted Protein Degradation (University of Dundee, Scotland, UK). Molecular dynamics simulations of 250 ns revealed to be useful for assessing the stability and dynamic behavior of PROTAC ternary complexes, particularly for VHL-based conformations with rather flexible PROTACs. For CRBN-based systems with PROTACs featuring rather short, rigid linkers, longer simulations would likely need to be run to better sample the accessible conformational space. In conclusion, this work presents a set of approaches to analyze PROTAC ternary complexes in silico by generating ternary complex ensembles, mapping lysine positions, and measuring distances of lysine residues in proximity to ubiquitin in the degradation complexes. Conveniently, ternary complexes which are not degradation-competent can be sorted out with this approach. The stability and dynamic behaviour of a refined set of degradation-competent conformations can then be assessed by molecular dynamics, the required length of which depending on PROTAC flexibility and the E3 ligase used. Finally, Medicinal Chemists can be provided with a handful of reasonable ternary complexes as a basis for structure-based PROTAC design.
Schlagwörter
Schlagwörter
(Deutsch)
Computergestützte Chemie Biomolekulare Simulation PROTAC Ternäre Komplexe Strukturanalyse von Makromolekülen Moleküldynamik Krebsforschung
Schlagwörter
(Englisch)
Computational Chemistry Biomolecular Modelling PROTAC Ternary Complexes Structural Research Molecular Dynamics Cancer Research
Autor*innen
Michael Passegger
Haupttitel (Englisch)
Geometric analysis of PROTAC ternary complexes
Paralleltitel (Deutsch)
Geometrische Analyse von PROTAC ternären Komplexen
Publikationsjahr
2022
Umfangsangabe
xi, 118 Seiten : Illustrationen
Sprache
Englisch
Beurteiler*in
Stefan Boresch
Klassifikation
54 Informatik > 54.76 Computersimulation
AC Nummer
AC16709881
Utheses ID
65439
Studienkennzahl
UA | 066 | 875 | |