Title: Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions
1Proseminar BioinformatikTheoretical Analysis of
Protein-Protein-Interactions
Scoring Functions
Silke Ruzek
22.Juni.2004
2Überblick
- Einleitung
- 1.Modell Paar Potentiale zur Bewertung
- möglicher Docking-Komplexe
- 2.Modell Kombination von Scoring Funktionen
-
- Fazit
- Diskussion
3Einleitung
- Ziel von Protein-Protein-Docking Bestimmung der
detaillierten Struktur des Komplexes ausgehend
von den ungebundenen Komponenten - Docking Methoden verwenden rigid-body-Strategien
und erzeugen eine große Anzahl von
Docking-Komplex-Kandidaten - Aus vielen möglichen Konformationen sollen die
stabilsten Komplexe ausgewählt werden - Scoring Funktionen bewerten Konformationen unter
Berücksichtigung der chemischen Aktivität
zwischen den Molekülen und der Größe der
Kontaktfläche
4Modell 1 Paar Potentiale
- Residue-Residue-Paar Potentiale sind ein
einfaches - Modell um die Vielfachheit der Interaktionen
zwischen - Residuen darzustellen
- Anwendung zur Identifizierung des nativen
Protein- - Komplexes aus der Menge der möglichen
- Konformationen
- Ein Komplex ist nahe an der nativen
Konformation, - wenn der RMSD der C -Atome im Interface
kleiner als - 2.5Å ist
5Modell 1 Paar Potentiale
- Methode
- 4 Typen von Paar-Potentialen
- basierend auf C -Atomen von Residuen
- basierend auf allen Atomen von Residuen
- basierend auf allen Seitenketten-Atomen
- Atom-level Potential
- Jedem Atom in jeder Residue wird
einer von 40 - Atomtypen zugewiesen
- Paar c existiert zwischen Residue/ Atomtyp i
und j wenn die Atome der beiden Residuen/ die
Atomtypen innerhalb einer Cutoff-Distanz liegen
6Modell 1 Paar Potentiale
- 3 Datensätze werden getestet
- Interdomän-Paarungen nicht-redundanter
Heterodimere - 11 Strukturen mit RMSD von 2.5Å
oder besser - Interdomän-Paarungen nicht-redundanter
Homodimere - 23 Strukturen mit RMSD von 2.5Å
oder besser - Intramolekulare Residuen-Paarungen
nicht-homologer - Protein-Domänen
- 385 Domänen mit RMSD von 2.5Å
oder besser - Für jede Superfamilie der
Klassen a,ß,a/ß,aß aus - SCOP wurde die beste
Struktur genommen
7Modell 1 Paar Potentiale
- Generierung des Potentials
- Bestimmung der Anzahl der Paarungen zwischen
jedem Residuen-Typ - Kalkulation der erwarteten Anzahl von Paaren
zwischen Residue i und j - Nur Werte größer 5 werden berücksichtigt
Vorkommen jeder Residue
8Modell 1 Paar Potentiale
- Paar-Potential-Matrix
- Score für jedes Paar entspricht dem log von
tatsächlicher Anzahl durch erwartete Anzahl - Dadurch ergibt sich der
- Gesamtscore als Summe
- der individuellen Scores
9Modell 1 Paar Potentiale
- Bewertung der Docking-Komplex
- Für jeden Komplex wird ein Gesamtscore durch
Addieren der Scores der Paare, die das Interface
des Komplexes bilden, berechnet. - Zusatzbedingung
- Minimum relative surface accessibility
(MRSA) - Residuen,die nicht zugänglich sind können
- ausgeschlossen werden
- Komplexe werden nach ihren Scores geordnet und
die Position des nativen Komplexes in der Liste
wird - bestimmt
10Modell 1 Paar Potentiale
- Testsysteme
- 5 Enzym-Inhibitor-Systeme und
- 4 Antikörper-Antigen-Systeme
- Parameter
- Distance-Cutoff - C -Atome 5 -15 Å in 1Å
Schritten - - sonst 4
-10 Å in 1Å Schritten - MRSA 0, 5, 20
- Nur Komplexe aus mindestens 20 Paaren werden
- berücksichtigt
11Modell 1 Paar Potentiale
Resultate
Tabelle I alle Resultate
12Modell 1 Paar Potentiale
Resultate
Enzym-Inhibitor Systeme Antikörper-Antigen
Systeme
13Kombination mit Multidock
- Multidock Methode die Bewegungen von
Seitenketten nach Komplex-Bildung in einen
niedrigeren Energiezustand berücksichtigt - Produziert vergleichbare Ergebnisse,ordnet aber
auch richtige Docking-Komplexe komplett falsch
ein - Paar-Potential filtert Docking-Komplexe aus
- Multidock bewertet die restlichen Komplexe
14Kombination mit Multidock
Kombinierter Rang bringt deutliche Verbesserung
gegenüber Paar-Potential oder Multidock
alleine
15Fazit
- Paar Potentiale können die stabile
Docking-Konformation aus einer Liste von
möglichen Komplexen auswählen - Ein korrektes Docking wird am oberen Ende der
Hit-Liste plaziert - Beste Resultate durch intermolekulare Paarungen
in einem Datensatz nicht-homologer
Protein-Domänen - Paar Potentiale können eine Liste mit möglichen
Komplexen verkleinern, bevor detailliertere
Prozeduren angewendet werden können - Paar Potentiale ordnen auch falsch-positive
Komplexe hoch ein, bewerten aber ein korrektes
Docking nicht komplett falsch
16Modell 2 Kombination von Scoring Funktionen
- Struktur-basierte Potentiale werden zum Filtern,
Rescoring und Einordnen der ausgewählten
Konformationen verwendet. - Atomic Contact Potential (ACP)
- Residue Potential Score (RPScore)
- Kombination der Potentiale mit Energie-Termen
- Anwendung auf
- 13 Protein-Test-Sets
- Docking-Resultate von 10 Paaren ungebundener
Proteine
17Motivation
- Frühere Studie Kombinierten Potentialen aus
elektrostatischen, Desolvations- und van der
Waals-Energien liefern bessere Ergebnisse - Entwicklung des Residue-Potential-Scores (Paar
Potential) erlaubt Verbesserung der bisherigen
Ergebnisse - ACP konnte durch Hinzufügen von elektrostatischem
und van der Waals Term verbessert werden - Test mehrerer kombinierter Potentiale auf
Verbesserungen
18ACP
- Atomic Contact Potential
- Freie Energie die benötigt wird um
Atom-Wasser-Kontakte durch Atom-Atom-Kontakte zu
ersetzten. - ACP-Energien wurden für 18 Atom-Typen aus 89
nicht-homologen Proteinstrukturen abgeleitet -
- ACP-Energie der wechselwirkenden Atome
- i und j , wobei alle Paare mit weniger
als 6Å - Abstand beachtet werden
191.Test-Studie
- Methode
- Trainings-Sets aus 99 Konformationen für 13
Komplexe generiert mit FTDock - Minimierung der Konformationen in CHARMM
- Bewertung der Testsets mit 16 verschiedenen
Scoring Funktionen
201.Test-Studie
211.Test-Studie
- Bewertung der Scoring-Funktionen durch
- Ø RMSD der 10 top-plazierten Strukturen
- Anzahl der Strukturen innerhalb 10Å RMSD der
- nativen Struktur (Hits)
- Rang des ersten Hits
- RMSD der best-bewertesten Struktur
221.Test-Studie
232. Docking Studie
- Scoring Funktionen aus der Test-Studie werden an
10 Sets aus 20.000 Konformationen getestet - (generiert durch rigid-body Docking Programm
DOT)
(b) Distributionof the 10 decoy sets generated
by DOT, each comprising 20,000 structures.
242.Docking Studie
- Anwenden von zwei verschiedenen Filtern
- ACPElec Filter
- 500 Strukturen mit niedrigsten ?G
Werten - 1500 Strukturen mit niedrigsten ?E
Werten - Kalkulierung von ?E
berücksichtigt die - strukturellen
Unsicherheiten beim Docking besser - 2. RPScore Filter
- 500 Strukturen mit niedrigsten ?G
Werten
252.Docking Studie
262.Docking Studie
Filterleistung in Abhängigkeit von der Ladung der
Komplexe
272.Docking Studie
- Minimierung der gefilterten Strukturen in CHARMM
- Pro Komplex entstehen 2 Test-Sets
- Rescoring der Test-Sets anaolg zur ersten Studie
28 2.Docking Studie
Ergebnisse
RPScore Filter
ASPElec Filter
29Fazit
- Verfeinerung der Strukturen durch
Energieminimierung - Zusätzlicher van der Waals Term verbessert die
Einordnung der Konformationen - ?G findet beim Filtern die meisten Hits und
ist besonders für geladene Komplexe geeignet - Beste Strategien
- RPScore Filter ACP Scoring Funktion
- ACPElec Filter RPScore Scoring
Funktion - Durch Kombination von mehreren Potentialen in
mulitstage postprocessing Prozeduren besseres
Auffinden von möglichen stabilen Komplexen möglich
30Referenz
- Moont, G., Gabb, H.A., and Sternberg, M.J.E.,
(1999) Proteins, 35, 364-373. Use of Pair
Potentials Across Protein Interfaces in Sreening
Predicted Docked Complexes. - Zhang, C., Vasmatzis, G., Cornette, J.L., and
DeLisi, C., (1997) J. Mol. Biol., 267, 707-726.
Determination of Atomic Desolvation Energies from
the Structures of Crystallized Proteins. - Murphy, J., Gatchell, D.W., Prasad, J.C., and
Vajda, S., (2003) Proteins, 53, 840-854.
Combination of Scoring Functions Improves
Discrimination in Protein-Protein Docking.