V4: Energiehyperfl

About This Presentation

Title:

V4: Energiehyperfl

Description:

Title: Computational Chemistry Author: Volkhard Helms Last modified by: Bioinformatik Created Date: 12/20/2002 11:03:41 AM Document presentation format – PowerPoint PPT presentation

Number of Views:64

Avg rating:3.0/5.0

Slides: 44

Provided by: Volk96

Category:

more less

Transcript and Presenter's Notes

Title: V4: Energiehyperfl

1
V4 Energiehyperflächen, Methoden zur
Energieminimierung und zum Konformationssampling
Die Eigenschaften und möglichen Wechselwirkungen
von organischen Molekülen hängen eng mit ihren
zugänglichen Konformationen zusammen. Die
Wahrscheinlichkeit, daß eine bestimmte
Konformation bei Raumtemperatur eingenommen wird,
hängt über die Boltzmann-Verteilung von ihrer
Energie ab. In Anwendungen wie der Vorhersage
von Drug-Aktivitäten ist man daher daran
interessiert, alle Konformationen mit einer
Energie nahe des globalen Energie-minimums zu
identifizieren (z.B. innerhalb von 10 kJ
mol-1). Dies ist das Problem der
Konformationssuche. Allerdings ist die
Dimension des Konformationsraums 3N-6, wobei N
die Anzahl der Atome eines Moleküls ist. Bereits
für kleine Moleküle gibt es daher eine enorme
Anzahl an lokalen Energieminima. Lesehinweis
Kapitel 10 aus Schlick

2
Warum kT ?
Entsprechend dem Äquipartitionsprinzip hat jeder
Freiheitsgrad eines Moleküls (d.h. eine bestimmte
Bindungslänge, ein Bindungswinkel etc.) im Mittel
die Energie k?T, wobei k ? kB die
Boltzmann-Konstante ist kB 1,381 ? 10-23 J
K-1 und T die herrschende Temperatur. Bei
Raumtemperatur (25 º C) ist kT ? 2.5 kJ
mol-1 Ein Molekül ist ständig in Bewegung, d.h.
es fliessen ständig kleine Energiebeiträge
zwischen den einzelnen Freiheitsgraden hin und
her. Das Molekül ist also stets in der Lage,
kleine Energiebarrieren in der Grösse von ein
paar kT zu überwinden.

Ludwig Boltzmann 1844 - 1906
3
Energiehyperflächen, Methoden zur
Energieminimierung und zum Konformationssampling

kleine Moleküle mit wenigen Freiheitsgraden
systematische Durchsuche des Konformationsraums
(Sampling) möglich
große Moleküle (Proteine) mit vielen
Freiheitsgraden
verwende stochastische Suchmethoden
Energieminimimierung findet lokales Minimum
Die Frage ist, was wir möchten
globales Energieminimum
alle Minima geringer Energie
die gesamte Oberfläche der PES einschliesslich
Sattelpunkte und Maxima
Einzelmoleküle oder Molekül-Ensembles
unterschiedliche Aufgaben erfordern
unterschiedliche Methoden
und unterschiedlich viel Aufwand

4
Interne Koordinaten ? kartesische Koordinaten

Interne Koordinaten definieren die Positionen
aller Atome eines Moleküls relativ zur Position
eines ausgezeichneten Atoms (Aufpunkt) durch
Angabe von Bindungslängen, Bindungswinkeln und
Torsionswinkeln.
z-Matrix begegnet uns wieder in Vorlesung 7.
Kartesische Koordinaten definieren Position
jedes Atoms i im Raum
durch 3 Koordinaten (xi,yi,zi).
Ein Molekül mit N Atomen hat daher 3N unabhängig
voneinander variierbare Koordinaten
Freiheitsgrade.
Üblicherweise hält man den Gesamtschwerpunkt des
Systems im Raum fest.
Damit legt man 6 Koordinaten fest 3
Translations- und 3 Rotationsfreiheitsgrade.
Es bleiben also 3N 6 Freiheitsgrade übrig.

5
Energiehyperfläche
6
Energiehyperfläche
Einfache Energiehyperflächen kann man entweder
als Hyperfläche (links) oder als Contour-Plot
(rechts) darstellen.
Ran Friedman bioinfo.tau.ac.il/Protein_Visualizati
on_01-02/ Lesson207/Introduction_Prot_Simul.ppt
f (x-2)2 (y1)2
7
Energiehyperfläche Drehung um 2 Torsionswinkel
Vom globalen Minimum links unten geht es in beide
Richtungen bergauf. Gerader Verlauf ? die
Drehung um beide Torsionswinkel ist energetisch
recht unabhängig voneinander.
http//www.brunel.ac.uk/depts/chem/ch241s/ re_view
/gridview/paper/paper.htm
8
Energiehyperfläche
Wo ist Sattelpunkt? Was erwarten Sie im Bereich
von 0 bis 180 Grad für beide Diederwinkel?
http//www.brunel.ac.uk/depts/chem/ch241s/ re_view
/gridview/paper/paper.htm
9
Energiehyperfläche
Energiehyperfläche für eine chemische Reaktion.
http//www.brunel.ac.uk/depts/chem/ch241s/ re_view
/gridview/paper/paper.htm
10
Energiehyperfläche Gradient

Gradient die erste Ableitung der Energie E
bezüglich der Koordinaten
kartesische Koordinaten x, y, z
interne Koordinaten l, ?, ?
Kraft
Stationäre Punkte - Punkte auf der
Energiehyperfläche, in denen der Gradient (bzw.
die Kraft) gleich Null ist.
Dies sind Maxima, Minima, Übergangszustände und
Sattelpunkte.

11
Energiehyperfläche Hesssche Matrix

Für eine stetige und zweimal differenzierbare
Funktion f ist
g(x) (g1, ..., gN) der Gradientenvektor der
ersten Ableitungen
Die N ? N Matrix der zweiten Ableitungen heisst
Hesssche-Matrix.
In einem Minimum ist die Krümmung positiv.
In höheren Dimensionen wird Konvexität in einem
Punkt x als positive Definitheit der Hessschen
Matrix bezeichnet
Positive Definitheit garantiert, daß alle
Eigenwerte in x positiv sind.

12
Energiehyperfläche Definitionen

Eine positiv-semidefinite Matrix hat
nichtnegative Eigenwerte.
Eine negativ-semidefinite Matrix hat
nichtpositive Eigenwerte.
Eine negativ-definite Matrix hat lediglich
negative Eigenwerte.
Ansonsten ist die Matrix indefinit.

Stationäre Punkte sind fett markiert.
13
Vorzeichen der zweiten Ableitungen

Durch Diagonalisierung der Hessschen Matrix
erhält man Eigenvektoren, die die normalen (
orthogonalen) Schwingungsmoden des Moleküls sind.
Die zugehörigen Eigenwerte sind proportional zum
Quadrat der jeweiligen Schwingungsfrequenz..
Das Vorzeichen der zweiten Ableitungen
entscheidet, ob es sich bei stationären Punkten
auf der PES um Maxima oder um Minima handelt, da
mit einer Frequenzrechnung das Vorzeichen der
Schwingungsfrequenzen bestimmt wird. Damit lässt
sich auch endgültig klären, ob eine Konformation
tatsächlich ein Minimum auf der PES ist
Minima auf der PES besitzen nur positive
Eigenwerte bzw. reelle Schwingungsfrequenzen
Maxima oder Sattelpunkte (Maximum in einer
Richtung, aber Minima in allen anderen
Richtungen) besitzen eine oder mehrere imaginäre
Schwingungs-frequenzen. (Die Quadratwurzel aus
einer negativen Zahl ergibt eine imaginäre Zahl).

14
Algorithmen zur Energieminimierung
Lokales Minimum Für einen Vektor x mit n
Komponenten xi lautet das Minimierungsproblem mi
nx f(x) , x ?D ? ?n. Dann ist x ein lokales
Minimum und f( x) lt f(y) ? y ?D ? ?n, y ? x
Globales Minimum x ? ?n ist ein globales
Minimum ? f( x) lt f(y) ? y ? ?n ? x
Schlick 10.2.4
15
Methode, die nur die Energiewerte verwendet ...

Am einfachsten zu implementieren.
Läuft in eine Richtung bis die Energie ansteigt,
dreht dann um die Suchrichtung um 90º, etc.
ist am wenigsten effizient
viele Schritte notwendig
Schritte sind nicht gerichtet
wird daher selten verwendet.

16
Grundlegende algorithmische Konzepte
Die grundlegende Struktur von iterativen, lokalen
Optimierungsalgorithmen ist die des greedy
descent. D.h. ausgehend von einem Startpunkt x0
wird eine Sequenz von Schritten xk erzeugt,
wobei bei jeder Iteration versucht wird, den Wert
der Zielfunktion f(x) zu verringern. Es gibt 2
Klassen von Algorithmen line-search und
trust-region. Beide sind weitverbreitet und sind
Bestandteile von Optimierungsmethoden, die von
jedem Startpunkt aus die Konvergenz zu einem
lokalen Minimum garantieren. Beide Methoden sind
gleichermaßen empfehlenswert.
17
Line-Search basierender Descent Algorithmus A1
Von einem gegebenen Anfangspunkt x0 aus, führe
für k 0, 1, 2, die folgenden Schritte so
lange aus bis Konvergenz eintritt. (1) Überprüfe
xk auf Konvergenz (2) Berechne eine
Abstiegs-Richtung pk (3) Bestimme eine
Schrittweite ?k durch eine 1-dimensionale Suche
so dass für den neuen Positionsvektor xk1 xk
?k pk und den entsprechenden Gradient gk1
gilt (ausreichende Abnahme) (ausr
eichende Verringerung der gerichteten
Ableitung) z.B. ? 10-4, ? 0.9 in
Newton-Methoden (4) Setze xk1 xk ?k pk und
k ? k 1 und gehe zurück nach (1)
18
A1 (2) Richtung der Abnahme
Eine solche Richtung pk ist eine Richtung,
entlang derer die Funktion f lokal abnimmt.
Solch einen Vektor kann man durch definieren.
Für genügend kleine ? gilt dann
19
Steepest Descent (SD)
Die einfachste Möglichkeit, eine gültige
Abnahme-Richtung vorzugeben, ist zu
setzen Damit ist automatisch erfüllt
20
Steepest Descent (SD) Methode in der Praxis

Ist die einfachste häufig verwendete Methode
folgt wie oben erwähnt jeweils dem negativen
Gradienten g (also der grössten Kraft)
d - g
man legt meist einen minimalen und maximalen Wert
für die Verschiebung der Koordinaten fest
jenach, wie steil der Gradient ist, wird die
Schrittweite vergrössert oder verkleinert
SD ist die schnellste Methode, wenn man eine
schlechte Startgeometrie besitzt
konvergiert langsam in der Nähe des Minimums
kann dort um das Minimum oszillieren

21
Conjugate Gradient (CG) Methode

verwendet die Geschichte der Minimierung, also
den vorherigen Wert di-1.
di - gi ?i-1 di-1
Im Gegensatz zu SD wird also implizit die
Information der zweiten Ableitungen verwendet um
die Suche zu steuern.
Es gibt viele Varianten von CG wie
Fletcher-Reeves, Davidon-Fletcher-Powell und
Polak-Ribiere Methoden.
CG konvergiert wesentlich schneller in der Nähe
des Minimums als SD!

22
Methoden mit zweiter Ableitung

Die zweite Ableitung der Energie E bezüglich der
(kartesischen) Koordinaten r die Hesssche
Matrix H(r) bestimmt den Suchpfad.
Entwickle E(r) um r
Dann ist der Newton-Raphson Schritt
fi ist die Projektion des Gradienten entlang des
Hessschen Eigenvektors mit Eigenwert ?i.
Ist rechenaufwendiger, aber gewöhnlich
schnell und zuverlässig, besonders in
der Nähe des Minimums.
Varianten Quasi-Newton (QN), Newton-Raphson ...

23
Trust-Region basierender Descent Algorithmus A2
Nimm an, daß in einer inneren Region eine
quadratische Funktion qk als Näherung an f
existiert, der man vertrauen kann. Es reicht
dann aus, das Minimum dieser quadratischen
Funktion zu finden. Algorithmus Von einem
gegebenen Anfangspunkt x0 aus, führe für k 0,
1, 2, die folgenden Schritte so lange aus bis
Konvergenz eintritt. (1) Überprüfe xk auf
Konvergenz (2) Berechne einen Schritt sk durch
Lösen des Subproblems wobei qk das quadratische
Model der Zielfunktion ist Dies gilt für s
innerhalb einer Schranke ?k gt 0. Ausgedrückt
mit einer Skalierungsmatrix Dk gilt (3) Setze
xk1 xk sk und k ? k 1 und gehe zurück nach
(1)
24
praktische Empfehlungen

Benutze viele Startwerte
Vergleiche Ergebnisse mehrerer Algorithmen (bzw.
mehrerer Kraftfelder)
überprüfe Eigenwerte im Minimum.
Bis auf 6 Eigenwerte, die fast gleich Null sein
sollten und die Translations- und
Rotationsinvarianz wiederspiegeln, sollten alle
positiv sein.
Schlick, Kap. 10.7

25
Verfahren um das globale Energie-Minimum zu finden

Systematische Variation der Torsionswinkel
Randomization-minimization (Monte Carlo)
Moleküldynamik (Newtonsche Bewegungsgleichung)
Simulated Annealing (reduziere Temperatur während
MD Simulation)
Genetische Algorithmen (man startet wird einer
Menge von Konformationen kleine Veränderungen
behalte die der geringsten Energie wiederhole
diese Schritte)
Reine Zufallssuche (funktioniert am schlechtesten)

26
Systematische Variation der Torsionswinkel

Für N rotierbare Bindungen eines Moleküles, die
mit Auflösung d abgesucht werden sollen, gibt es
Nd Konformationen.
Dies geht nur bei kleiner Anzahl von
Freiheitsgraden, da sonst kombinatorische
Explosion.

NIH guide to molecular modelling http//cmm.info.n
ih.gov/modeling/ guide_documents/sybyl
27
Systematische Variation der Torsionswinkel
Gridsuche
Vorgabe Struktur soll bestimmte Distanzen aus
NMR-Messung erfüllen.
Lisa T. Kellogg PhD thesis, MIT
28
Systematische Variation der Torsionswinkel
Baumsuche
Lisa T. Kellogg PhD thesis, MIT
29
moderne Verfahren Teile und Herrsche
(Divide-and-Conquer)

schließe Regionen des Konformationsraums aus
aufgrund der Bewertung von Unterproblemen
niedriger Dimensionalität
verbessere Baumsuche
bewerte jedes Stück bevor neue Aufgabe in Angriff
genommen wird
nachdem Unterproblem gelöst ist, speichere
Ergebnis
durch Zerlegung in Unterprobleme sind diese im
Mittel leichter zu lösen als bei der Baumsuche

Lisa T. Kellogg PhD thesis, MIT
30
Stochastische Methoden

Stochastische Suchverfahren, die nur wichtige
Bereiche des Konformationsraums durchsuchen
("importance sampling) können wesentlich
effizienter für Konformationssampling in grossen
Molekülen sein als systematische Methoden.
Beginne mit Anfangskonfiguration minimiere
diese Struktur bezüglich Energie
Wähle beliebige Anzahl an Torsionswinkeln
dieser Konformation und variiere sie zufällig.
Dann minimiere die Konformation
Benutze ein Energiekriterium um zu entscheiden,
ob die neue Konformation akzeptiert wird. Falls
ja, fahre fort, sonst gehe zurück zu 1.
Vergleiche die neue Struktur gegen die Menge
aller alten Strukturen. Falls es eine neue
Konformation ist, speichere sie ab.
Gehe zurück zu Schritt 2
Beende die Suche wenn keine neuen Strukturen
mehr gefunden werden.

31
Anmerkungen zu Strukturen minimaler Energie

Was bedeutet die Struktur des globalen
Energieminimums eigentlich?
Sie ist bei Raumtemperatur nämlich gar nicht
populiert/besetzt/zugänglich.
Benutzen Reaktionen/Wechselwirkungen
notwendigerweise diese Geometrien minimaler
Energie?
Welche anderen Konformationen niedriger Energie
sind verfügbar?
? Boltzmann-Ensemble

32
Boltzmann-Verteilung

In einem System mit N Teilchen sei Teilchenzahl
konstant.
Gesamtenergie des Systems sei konstant.
D.h. es gibt Energieaustausch zwischen den
Teilchen, aber nicht mit der Umgebung.
Wenn solch ein System im Gleichgewicht ist, ist
die Energie der Teilchen E
entsprechend einer Boltzmann-Verteilung
populiert

Boltzmann-verteilte Systeme findet man in vielen
Bereichen der Physikalischen Chemie.
33
Phasenraumdichte

Die Wahrscheinlichkeitsdichte im Phasenraum (
kurz die Phasenraumdichte) ist im kanonischen
Ensemble proportional zum Boltzmann-Faktor

wobei E die Gesamtenergie des Systems ist und ?
kBT. Für zwei Zustände des Systems X und X
lautet das Verhältnis ihrer Wahrscheinlich-keiten
34
Phasenraumdichte

Der Normalisierungsfaktor der ersten Gleichung
ist die Zustandssumme des gesamten Phasenraums
(Raum der 3N Koordinaten und 3N
Geschwindigkeiten)

Der Erwartungswert einer Observablen A des
Systems lässt sich darstellen als
Im Metropolis-Algorithmus erzeugt man eine
geeignete Markov-Kette von Konfigurationen, so
dass der Erwartungswert von A als einfacher
Mittelwert folgt
35
Markov-Kette

Betrachte Markov-Kette von N molekularen
Zuständen X1, X2, X3, ... mit einer Verteilung
?NVT(X) für N ???.
In einer Markov-Kette gehört jeder Zustand zu
einer endlichen Menge an Zuständen aus dem
Zustandsraum D0 ? D.
Für die konditionelle Verteilung jedes Zustands P
bezüglich aller vorherigen Zustände gilt

d.h. das Ergebnis Xn1 hängt nur von Xn ab. Der
Metropolis-Algorithmus erzeugt eine stochastische
und ergodische Übergangsmatrix für die
Markovkette, so dass die Verteilung für jeden
Zustand Xi im Limit ?i ?NVT (Xi) ist. So wird
eine Phasenraumtrajektorie im kanonischen
Ensemble erzeugt.
36
mikroskopische Reversibilität (detailed balance)

Lege Übergangsmatrix fest durch Definition einer
Übergangswahrscheinlichkeit für jeden Übergang
von Xi nach Xj, so dass mikroskopische
Umkehrbarkeit erfüllt ist

Das Verhältnis der Übergangswahrscheinlichkeiten
hängt damit nur vom Energieunterschied zwischen
den Zuständen i und j ab
37
Metropolis Algorithmus

Die am häufigsten verwendete Technik zur Auswahl
von Konformeren (importance sampling) mittels
Monte-Carlo-Methoden ist der Metropolis
Algorithmus
konstruiere Anfangskonfiguration des Moleküls
führe zufällige Änderung eines Freiheitsgrades
(z.B. eines Torsionswinkel) durch.
berechne Änderung der Energie ?E aufgrund dieser
Änderung der Konformation.
falls ?E lt 0 akzeptiere die neue Konfiguration
falls ?E gt 0 berechne die
Wahrscheinlichkeit
erzeuge Zufallszahl r im Intervall 0,1
akzeptiere die neue Konfiguration, falls w ? r,
sonst verwerfe sie.
Da die Boltzmann-gewichtete Energiedifferenz mit
einer Zufallszahl verglichen wird, werden auch
vereinzelt Konformere hoher Energie akzeptiert.
Daher erhält man ein Ensemble (Menge) von
Konformationen mit einer Energieverteilung
entsprechend einer Boltzmann-Verteilung.

38
Moleküldynamik-Simulation

Basiert auf Newtonscher Bewegungsgleichung für
ein Atom i eines Moleküls
wobei Fi die Kraft, mi seine Masse und
die Beschleunigung ist, die auf Atom i wirkt.
Die Kräfte lassen sich aus den Ableitungen der
Energie nach den kartesischen Koordinaten
ausrechnen.
Die Trajektorie eines Systems ist die
Aneinanderreihung der einzelnen Koordinaten und
Geschwindigkeiten, also ein Film, der die Dynamik
des Systems zeigt.
Ein Ensemble ist eine Menge von Konfigurationen,
aus den man Eigenschaften des Systems berechnen
kann (mittlere Energie, Wärmekapazität ...)
mehr zu MD-Simulationen folgt in Vorlesung 4

39
was bedeutet Moleküldynamik ?
Energie, die dem minimierten System zu Beginn der
Simulation mitgeben wird.
Startkonfiguration
Energie potentielle Energie kinetische Energie
lokales Minimum
Konformation kann nicht durch Standard-MD
erreicht werden MD ist also nicht optimal für
Suche des Konformationsraums!
Konformationelle Koordinate
40
Simulated Annealing

Beginne Konformationssampling (z.B. mit
Moleküldynamik) bei hoher Temperatur um
Energiebarrieren leicht zu überwinden. Kühle
Simulationstemperatur dann ab.
Viele verschiedene Abkühlstrategien möglich

Temperatur
Simulationszeit
Davon ist keine richtig oder falsch. Wichtig
ist, was praktisch funktioniert.
http//members.aol.com/btluke/simanf1.htm
41
Genetische Algorithmen (GA)

Genetische Algorithmen basieren auf dem Prinzip
der Vererbung und dem Überleben des am besten
Angepassten, survival of the fittest.
Starte Konformationssuche in lokalem Minimum
(lokalen Minima). Eine Generation i enthalte N
Konformationen (z.B. N 100).
Die nächste Generation i1 unterliegt natürlicher
Selektion, d.h. wir behalten die N/Faktor
Strukturen aus Generation i mit den niedrigsten
Energien und erzeugen im Sinne der Evolution
neue Konformationen durch kleine Mutationen der
Elternkonformationen, also z.B. Änderungen der
Bindungswinkel und Torsionswinkel.
Interessant werden GAs durch Genduplikation und
Cross-over.

42
Genetische Algorithmen (GA)

Bsp. lineares n-mer Peptid mit 2n Diederwinkeln
des Rückgrats.
Angenommen, es wurden 2 Konformationen gefunden,
in denen entweder die erste Hälfte des Peptids
eine energetisch günstige Konformation einnimmt
oder die zweite.
Eine vorteilhafte cross-over Mutation
kombiniert nun die zwei günstigen Hälften des
Moleküls miteinander.

43
Sampling des Konformationsraums