Title: MOLECULAR DYNAMICS
1M.Orozco J.L.Gelpí M.Rueda J.R.Blas
2Clase 2 Introducción a la Dinámica Molecular
3The long range goal of molecular approaches to
biology is to describe living systems in terms of
chemistry and physics
- Prof. Dirac. Proc.Roy.Soc., 123, 714 (1929)
4Dinámica molecular
- Técnica para obtener una visión en el tiempo de
un sistema molecular. - Permite seguir sistemas que evolucionan en el
tiempo (transiciones) - Permite guiar sistemas a zonas de energía óptima
- Permite obtener visiones promediadas de sistemas
en equilibrio Promedios de Boltzman (lt gt)
5Que es la dinámica molecular
- Técnica para muestrear espacio conformacional en
zonas delimitadas - Técnica para representar interacciones
moleculares - Herramienta para seguir transiciones
conformacionales. - Técnica que permite analizar el efecto de
perturbaciones en el sistema
- Una caja negra
- Una técnica que permite encontrar transiciones
dramáticas - Una técnica competitiva con NMR o X-Ray en
resolución de estructura - Una herramienta de uso universal
6No olvidar!
- Experimento mal ? No hay resultado
- Experimento correcto ? Resultado correcto
- Cálculo MD mal ? Hay resultado!
- Cálculo MD mal ? Resultado incorrecto
- Cálculo MD correcto ? ?
7Dinámica molecular Ideas antiguas, métodos nuevos
8Apuntes históricos
Isaac Newton desarrolló el esqueleto formal de
la dinámica molecular siglo XVIII
9Apuntes históricos (2)
- Primer intento de trayectoria HH2?H2H
Hirschfelder 1936. (J.A. Hirschfelder, H.Eyring
and B.Topley. J.Chem.Phys, 4, 170 (1936)). - Trayectoria líquidos ideales Alder Wainright
1959. (B.J.Alder and T.E.Wainwright, J.Chem.Phys,
31, 459 (1959)). - Trayectoria argón liquida Rahman 1964. (A.Rahman,
Phys.Rev., A136, 405 (1964)). - Trayectoria agua líquida Stillinger Rahman
1974. (F.H.Stillinger and A.Rahman, J.Chem.Phys.,
60,1545 (1974). - Trayectoria de la primera proteína (10 ps BPTI).
McCammon Karplus 1977. (J.A.McCammon, B.R.Gelin
and M.Karplus, Nature, 267, 585 (1976))
10Apuntes históricos (3)
- Van Gunsteren Berendsen introducen constrains
en dinámica proteínas (BPTI) 1977. (W.F.van
Gunsteren, and H.J.C.Hermans, Molecular Physics,
34, 1311 (1977)). - Introducción del efecto del entorno van Gunsteren
(20 ps BPTI) 1983. (W.F.van Gunsteren,
H.J.C.Berendsen, J.Hermans and W.G.J. Postma
PNAS, 80, 4315 (1983)). - Desarrollo de los primeros programas de MD
(CHARMM, GROMOS) 1976-1978. - Berendsen desarrolla métodos para mantener P y T
constante 1984. (H.J.C.Berendsen, J.P.M.Postma
and W.F.van Gunsteren, J.Chem.Phys., 81,3684
(1984). - Primer cálculo MD/FEP. McCammon 1985.
(T.P.Lybrand, I.Ghosh and J.A.McCammon,
J.Am.Chem.Soc, 107, 7793 (1985))
11Dinámica molecular
- Su base física es la dinámica de Newton en
cualquiera de sus formulaciones.
12El Hamiltoniano(La función de energía potencial
V)
- Puramente cuántico
- H(x) H(R,r)
- Los electrones están en equilibrio. Solo se
integra explícitamente el movimiento de núcleos
(BO). - Se integran los movimientos de núcleos y
electrones.
13Dinámica de Carr-Parrinello
- Se integra el movimiento de núcleos y de
orbitales. - Funciona con ondas planas.
- Permite estudiar sistemas reactivos, efectos de
transferencia de carga, conductividad,... - Simulan procesos en escalas del picosegundo
- Su uso en biología es restringido.
- Acc. Chem. Res., 35, 455, 2002
14El Hamiltoniano
- Mixto QM/MM
- H(x) H(Rext,r) H(Rext) HQM/MM(Rint,Rext)
- Se integran los movimientos de núcleos.
- Los electrones están en equilibrio. Solo se
integra el movimiento de núcleos (BO).
15Colominas et al., JACS, 118, 6811, 1996
16Métodos QM/MM
- Se acoplan a cálculos de MD o métodos de Monte
Carlo. - Permiten estudiar reactividad en macromoléculas
donde se pueda trazar la frontera entre la parte
clásica y la cuántica. - Han tenido un uso moderado
- La partición QM/MM no es siempre fácil
- Lentos
- El cálculo QM de referencia es bajo y a menudo
requiere reparametrización - El acoplamiento QM/MM no es trivial
17El Hamiltoniano
- Clásico
- H(x) H(R)
- Solo se integran los movimientos nucleares.
- Los electrones están en equilibrio y su efecto
sobre el sistema se introduce paramétricamente
Force-Field
18La MD permite a priori simular cualquier sistema
de impacto biológico, aún los no descritos
estructuralmente e inabordables por cualquier
otra técnica (teórica o experimental)
19La mayoría de los datos que se obtienen en
proyectos de genómica y proteómica se realizan
en medios muy diferentes de los
fisiológicos Tienen estos resultados valor?
20MS-ELECTROSPRAY Determination of mass for large
macromolecules with high accuracy Does it
provide structural information?
21Although DNA duplex ions have been observed for
seven years, the nature of interaction between
strands in the gas phase remains a major
unanswered question S.A.Hofstadler and R.H.
Griffey Chem. Rev. 101, 377 (2001)
22(No Transcript)
23PROBLEMAS INTRÍNSECOS DE LA DINÁMICAMOLECULAR
(Clásica)
24- El force-field clásico está limitado a estudiar
cambios conformacionales e interacciones débiles. - Típicamente la información estructural de partida
debe ser de alta calidad. - El sistema de simulación se suele limitar a unos
miles o decenas de miles de átomos. - Escala de simulación limitada (state of the art
10 ns, sistemas modelos hasta 1 ms). Ello conduce
a problemas de muestreos insuficientes. - El cálculo inunda de información difícil de
desencriptar (data mining).
25E(stab) DNA pairs
Hobza et al., JCC,18,1136, 1997
26MUESTREO INCOMPLETO
27Mejorar general de la capacidad de muestreo
- Aumento de temperatura
- Suavización del force-field
- Introducir penalizaciones de visita
- Van Gunsteren J.Comput., 8, 695, 1994
- Parrinello PNAS, 99, 12562, 2002
- Cálculos paralelos (M ns ? nm ns)
- Pande JMB., 323, 927, 2002
28Mejorar de la capacidad de muestreo en una
dirección
- Modificación función potencial. Brooks, Ann.Rev.
Phys.Chem., 52, 499, 2001. - Multiple-copies. LES Elber Karplus JACS, 112,
9161, 1990 - Método intercambio de réplicas a distintas
temperaturas. Berne PNAS, 98, 14931, 2001. - Sesgo por replica seleccionada (M-evil)
- Introducción de fuerzas (steered-MD), simulando
experimento AFM. Schulten PNAS, 99, 1351, 1999.
Karplus PNAS, 97, 6521, 1997.
29MEJORA DEL MUESTREO ASOCIADO A CÁLCULOS DE
ENERGÍA LIBRE
30CÁLCULO DE ENERGÍA LIBRE
- Una trayectoria de equilibrio permite calcular
- Alternativamente la Mec. Estadística nos dice
31PROBLEMAS CALCULO DG DIRECTO
- Aunque en algún caso es aplicable en general es
difícil - Problemas para tener muestreo simultáneo de los
dos estados A y B - Problemas para construir la función partición
global para A y B. - Es necesario sesgar la trayectoria para mejorar
el muestreo y buscar fórmulas alternativas
32MD/TI y MD/FEP calculations
33OTRAS TÉCNICAS RELACIONADAS
- Umbrella sampling. TorrieValleau J.Comp.Phys.,
23, 187, 1977 - Adaptative umbrella sampling. Karplus cow.
J.Chem.Phys., 111, 8048, 1999. - Weigthed hystogram analysis (WHAM). Rosenberg
J.Comp.Chem., 13, 1011, 1992.
34ALGUNAS IDEAS RECIENTES
- Steered-MD acoplada a cálculos energía libre.
- Hummer-Szabo PNAS, 98, 3658, 2001. (EFM)
- Schulten Science, 296, 525, 2002.
- Método de penalizaciones de visita acoplado a
cálculos de energía libre - Laio-Parrinello. PNAS, 99, 12562, 2002
35OTRAS APROXIMACIONES PARA MEJORAR EL MUESTREO
36Mejorar la velocidad de cálculo
- Uno de los cambios mayores en la aplicación útil
de la MD va a venir de la mejora en los
ordenadores - Procesadores más rápidos
- Procesadores dirigidos únicamente a MD
- Mejora en los algoritmos de paralelización
- Aumento capacidad de almacenamiento
37En nuestra experiencia,...
- En Tirado et al., Biochemistry, 36,7313, 1997
presentamos trayectorias de 2 ns de una proteína
lt 100 residuos. En nuestra mejor máquina
recogíamos 5 ps x día. - En Cubero et al., JACS, 121, 8653, 1999
presentamos 1 trayectoria de 5 ns de un 12-mer
(PME). En nuestra mejor máquina recogíamos 25 ps
x día. - Nuestro standard actual de trabajo son 2-6
simulaciones de 10-15 ns sobre DNAs o proteínas
(PME). En nuestra mejor máquina recogemos gt 100
ps x día. - Nuestras máquinas más rápidas eran WS
(10Mltpreciolt5M), ahora son AMD(2 GHz)
(0.5Mltpreciolt0.3M).
3890s 100 ps
95s 500 ps -1 ns
02s 10-25 ns
00s 5 ns
05s 100 ns 1 ms
39Almacenamiento
- Las trayectorias generan una gran cantidad de
datos, pero la densidad de información es pobre - Problemas de disco.
- El coste de los post-análisis puede ser mayor que
el costo de la simulación. - El data minning es muy complejo.
40EL PROBLEMA DEL ANÁLISIS DE LAS TRAYECTORIAS
- Buscar una aguja en billón de pajares
41Análisis de las trayectorias
- Geometría/conformación
- Determinación pautas de interacción con solvente.
- Energética del sistema
- Cálculos de energía libre
- Cálculos de flexibilidad y entropía
42Análisis de las trayectorias
- Datos de geometría del sistema.
- RMS, Rg, size-descriptors, Y, F,..., secondary
structure, helical analysis, interaction maps,
H-bond population,... - Datos interacción sistema-solvente.
- Solvent maps, rdf, solvent-population,...
43Surco reactivo
Shields et al., JACS, 119, 7463, 1997
44SOLVATION MAPS
5'-CCAA(GC)CTTGG-3' 5'-CCAA(GT)CTTGG-3
5'-CCAA(OC)CTTGG-3' 5'-CCAA(OT)CTTGG-3'
Hernández et al., NAR 28, 4873, 2000.
45Analysis of the trajectories
- Flexibility
- Principal component analysis? Essential dynamics
(Berendsen) - Comparison of frequencies
- Comparison of eigenvalues
- Entropy calculations ? Karplus-van Gunsteren
- Schlitters method (van Gunsteren)
- Extrapolation to infinite (Laughton-Orozco)
46Principal component analysis(PCA)
Trayectoria
Matriz covarianza
Diagonalización
Val. propios? frecuencias
Vect. propios? Nat. movimiento
47Naturaleza eigenvector
48Comparación de eigenvectors
Para un conjunto
Medida relativa
5GATTAATTAATTAATC3
0.94
0.77
2.72
0.72
5GATTAATTAATTAATC3
0.30
0.51
0.85
0.62
0.81
0.81
0.14
g 2.72/5 0.54
2.72
49Entropías configuracionales
- Karplus
- S 0.5 k ln(det s)
- s covariance matrix of set of important
coordinates - Schlitter
- S 0.5 k S ln1 (kTe2/h2) ltqi2gt
- ltqi2gt eigenvalues of diagonalized mass-weighted
cartesian coordinate covariance matrix
50Entropías configuracionales
- Los valores de S calculados son sensibles al
tiempo de simulación - Ajuste de una función 1/x para estimar S para una
simulación infinita SSo-a/tb (Harris et al.,
2001)
51Cálculos de energía libre total
MD-PB/SA (Kollman)
Gtot Eintra Gsolv T Sintra DGA-Btot
(EAintra EBintra) (GAsolv GBsolv)
Gtot. Total free energy Gsolv. Solvation free
energy Eintra. Intramolecular energy
Cubero et al., JACS. 123, 12018. 2001
52Cálculo directo ltEintgt
GB/SA o PB/SA Calc. solvatación ltXgt
Trayectoria de equilibrio (MD)
Cálculo S a partir de Slitter ltXgt
53Parallel duplexes
- Poly d(AT)
- 5,6,7,8,9,10,11,12,15-mer
- parallel duplexes
- Reverse WC
- Hoogsteen
- 5,7,9,11,15-mer antiparallel duplexes
Cubero et al., JACS. 123, 12018. 2001 Cubero et
al., JACS. 124, 3133, 2002
Pattabiraman, N. Biopolymers, 25, 1603 (1986)
54Total free energy (kcal/mol)
WC G -343.2(0.5)x 84.6(4.9) R21.0000 rWC G
-342.0(0.4)x 81.3(2.9) R21.0000 H G
-341.9(0.2)x 93.5(1.7) R21.0000
Estabilization Estabilization
WC -343.2(0.5)
rWC -342.0(0.4)
H -341.9(0.2)
Enucleation Enucleation
WC 84.6(4.9)
rWC 81.3(2.9)
H 93.5(1.7)
E
(n-2) residues
Cubero et al., JACS. 123, 12018. 2001
55EJEMPLOS DE APLICACIONES RECIENTES DE LA DINÁMICA
MOLECULAR
56Campos de aplicación más activos
- DNA? MD puede ser tan potente como las técnicas
experimentales. - Estudio de flexibilidad conformacional en
proteínas y ácidos nucleicos. - Folding/unfolding de péptidos/proteínas modelo.
- Estudios de termodinámica de unión y reacción.
- Dinámicas en condiciones límites grandes
sistemas o grandes escalas temporales.
57Dinámicas en grandes sistemas
- Se estudian sistemas gt 100000 átomos con
condiciones de simulación realistas. - Típicamente sistemas de alto impacto biológico
(bombas, canales, receptores,...) - Trayectorias en el rango 2-10 ns
- Requieren recursos computacional enormes
- En algunos casos se utilizan perturbaciones o
dinámicas sesgadas para simular procesos en
escalas de tiempo ms.
58Dinámicas en grandes sistemas (1)
- Simulaciones de aquaporinas (PNAS, 99, 6731,
2002 Science, 296, 525, 2002) - Estudian el mecanismo de paso de glicerol y agua
por estos canales. - Sistema proteico con membrana y solvente (106000
átomos). - Trayectorias libres y forzadas de 7-12 ns
59Dinámicas en grandes sistemas (2)
- Simulaciones de F1-ATP sintasa (Nature Struct.
Biol., 9, 198, 2002) - Mecanismo de transferencia de energía por cambio
conformacional. - Sistema con 260000 átomos (proteína agua)
- Trayectorias forzadas de 7-ns
- 280000 horas CPU Power 3 (32 años CPU)
60Dinámicas en grandes sistemas (3)
- Simulaciones de unfolding de fibronectina FN-III.
Gao et al., JMB, 323, 939, 2002. - Simulaciones de steered molecular dynamics
- Simulaciones 10 x 12 ns
- Sistema con 126000 átomos (proteína agua)
- 652000 horas CPU Athlon 1.3 GHz (74 años)
61Dinámicas en grandes escalas temporales
- Simulaciones que cubren escalas cercanas al
microsegundo con solvente explicito. - Típicamente son dinámicas no sesgadas.
- Normalmente se enmarcan en estudios de folding de
proteínas. - Son de utilidad dudosa como técnica general?
probe of concept.
62Dinámicas en grandes escalas temporales (ejemplos)
- Simulaciones de folding reversible de péptidos
(20-200 ns) (ej Daura et al., Angew. Chem., 38,
236, 1999) - Coleccionan eventos de folding reversible de
pequeños péptidos ? DGfolding - Simulaciones de 1 ms de folding de una proteína
modelo (Duan-Kollman Science, 277, 1793, 1998) - Consiguen representar usando primeros
principios el inicio del folding de una pequeña
proteína
63Dinámicas en pseudo-grandes escalas temporales
(ejemplos)
- Simulaciones distribuidas de folding de Villin
(36-residues) Zagrovic et al., JMB, 323, 927,
2002. - GB/SA (no solvente explicito).
- Equivalente a 300 ms.
- RMSd 1.7 Angs estructura experimental.
- 10000 procesadores 2.5 x 1011 integraciones
- C.a 1000 años CPU (PIII-500 MHz)
64y ahora las ecuaciones,....