Title: RMN de proteinas
1- RMN de proteinas
- Ahora mas o menos conocemos las tecnicas que se
utilizan - en la determinacion de redes de acoples
(estructura quimica) - y distancias internucleares (estructura 3D,
conformacion). - Vamos a ver como se utilizan en el estudio de
estructura - 3D y preferencias conformacionales de
macromoleculas, en - particular proteinas. Vamos a tratar de cubrir
en dos calses - algo para lo que se han escrito muchos libros
- Hay ciertas cosas que tenemos que mencionar
antes de - hacer una analisis de las tecnicas de RMN de
proteinas - 1) La informacion que obtenemos no es ni mejor ni
peor que - los datos de rayos-X. Nos da una imagen que
puede ser - considerada complemetaria a la
cristalografica. En ciertos - aspectos experimentales es mas rapido que los
rayos-X.
2- Breve resumen de estructura de proteinas
- Antes de ver como determinamos la estructura 3D
de una - proteina por RMN, vamos a repasar un poco de
bioquimica - Las proteinas/peptidos estan armados de 20
aminoacidos. - Esto nos va a hacer la vida mas facil
- La estructura quimica de la proteina es la
secuencia de - aminoacidos que la forman. Siempre la
escribimos del NH2 - libre al COOH libre
Ha
residuo
H
O
O
H
N
N
N
N
O
H
H
Ha
Ha
grupo peptidico
3- Estructura de proteinas (continuado)
- La forma en que los residuos de la proteina se
organizan lo- - calmente es la estructura secundaria. Los
elementos mas - comunes de estructura secundaria son la
a-helice y la hoja - plegada b (paralela o antiparalela)
4- Las basicas de la RMN de proteinas
- La estructura terciaria es como todo se acomoda
(o no) en - solucion, o como los distintos elementos de
estructura secun- - daria se organizan espacialmente entre ellos.
- Lo primero que tenemos que saber es donde
aparecen los - picos de los 1Hs de los aminoacidos en el
espectro - Como estan muy cerca unos de otros, despues de 3
o 4
agua
Aromaticos
Iminas Amidas
HCb, g, d, ...
HCa
10 9 8 7 6 5
4 3 2 1 0
5- Asignacion de sistemas de espines
- Para hacer esto, nos valemos de los espectros 1H
1D (si es - un peptido), COSY, y TOCSY. Ya hemos visto como
un - TOCSY nos permite identificar todo un sistema
de espines. - En proteinas, cada aminoacido nos va a dar una
linea inde- - pendiente en el TOCSY empezando en el NH y
llendo hasta - el ultimo proton de su cadena lateral.
- Las unicas excepciones son Phe, Tyr, Trp, e His,
donde - el sistema de espines de la cadena lateral esta
dividido en - dos por un carbono cuaternario.
- Con suerte podemos asignar todas las señales a
amino- - acidos, pero lo mas probable es que nos queden
algunas sin - asignar porque esten solapadas. Si pasa esto
necesitamos - mas dimensiones y/o proteina marcada (mas
luego).
6- Patrones NOE caracteristicos
- Las mas simples de identificar son correlaciones
interesi- - duales y secuenciales, que corresponden con
NOEs entre - protones de un residuo a protones de residuos
(i 1) - Aparte de estos, regiones de estructura
secundaria definida - van a dar NOE caracteristicos. En ?-helices y
hojas ?
dNN
daa
daN
Ha
H
O
O
H
N
N
N
N
O
H
H
Ha
Ha
dNb, dNg,
daa
dab, dag,
da(i)N(j)
i4
C
N
i3
dab(i, i3) daN(i, i3) dNN(i, i3) daN (i, i4)
i2
da(i)a(j)
N
C
C
N
i1
dN(i)N(j)
i
N
C
i-1
7- Asignacion secuencial
- En el metodo de asignacion secuencial tratamos
de atar sis- - temas de espines por medio de conectividades
NOE secuen- - ciales (de un residuo a residuos i 1 y/o i -
1). - La idea es elejir un residuo cuyas señales esten
bien resuel- - tas en el TOCSY y despues buscar en el NOESY
correlacio- - nes NOE secuenciales de sus protones a protones
en otros - sistemas de espines.
- Estas son generalmente correlaciones dNN, daN,
and dbN. En - este momento tambien podemos buscar
correlaciones dbd - para establecer la identidad de los residuos
aromaticos, Asn, - Arg, Gln, etc
- Despues de encontrar esos, volvemos al TOCSY
para identi- - ficar a que residuo corresponden las
correlaciones que vimos - en el NOESY. Esos protones van a estar en
residuos i 1.
8- Asignacion secuencial (continuado)
- Esto lo podemos ver en un diagrama simple (no
encontre - nada muy lindo entre lo mio).
- Digamos que estamos miarando cuatro lineas en el
TOCSY - que corresponden a Ala, Asn, Gly y Leu. Tambien
sabemos - que tenemos Ala-Leu-Gly en el peptido, y no en
otro orden.
TOCSY NOESY
HC
HC
Gly
Gly
Asn
Asn
Ala
Ala
NH
NH
Leu
Leu
9- Metodo de cadena principal
- Este metodo fue propuesto por Wüthrich (el
abuelo del RMN - de proteinas y ganador del Nobel en Quimica del
2003 por su - trabajo en el area). Ya hemos visto que
regiones de estructu- - ra secundaria definidas dan patrones de NOE
regulares. - Qut tal si, en vez de hacer la asignacion
secuencial y perder - tiempo en regiones que tengan estructura
indefinida, nos - concentramos en buscar estos patrones de NOE
regulares? - Esto es exactamente lo que hace este metodo.
Buscamos - patrones de NOE ciclicos, que se dan
generalmente cuando - tenemos estructura secundaria definida.
- Cuando encontramos estos patrones de NOE,
tratamos de - correlacionarlos con fragmentos de la
estructura primaria de - la proteina/peptido. Es ideal para hacer por
computadora
10- Estructura secundaria y terciaria
- A pesar de que el metodo de cadena principal
encuentra - patrones de estructura secundaria, el fin es
identificar los - residuos en el espectro (i.e., asignar sistemas
de espines). - Todavia hay que buscar la estructura
secundaria/terciaria. - Si usamos el metodo de cadena principal, ya
tenemos casi - todo el trabajo hecho (casi el 90 ), porque
las regiones de - estructura secundaria definida (a-helices,
hojas b) ya las - tenemos identificados.
- Si usamos el metodo secuencial tenemos casi
todos los NOE - entre el residuo i e i 1 y i - 1, o de rango
corto. Solo nos - queda buscar correlaciones NOE de rango medio
(i 2, 3, - y 4) y de rango largo (gt i 5).
- La cantidad y tipo de NOEs de rango largo
obviamente de- - pendera de la estructura secundaria/terciaria
del peptido.
11- Lo que el NOE nos dice y lo que no nos dice
- Ahora tenemos casi todo Los sistemas de espines
identifi- - cados, sus NOEs secuenciales, medios, y largos
medidos, y - sus intensidades tabuladas.
- A esta altura vamos a tener algunos conflictos
en las asig- - naciones. En particular, hay casos en los
cuales vamos a ver - ciertos NOE pero no otros que tendrian que
estar alli - Esto es debido a que los NOE no solo dependen de
la dis- - tancia entre dos protones, pero tambien de la
dinamica entre - ellos (osea, el grado de movimiento de uno con
respecto al - otro). Esto va a ser importante en peptidos
chicos, porque en - estos casos tenemos mucha movilidad en las
cadenas late- - rales y en el esqueleto peptidico.
- Lo mas importante a tener en cuenta siempre es
que no ver - un NOE no significa que dos protones esten a
mas de 5 Å.
Aparente
Real
dij 3 Å
dij lt 3 Å
dij gt 6 Å
12- Acoples y angulos diedros
- Hasta ahora hemos visto como usar algunos datos
de RMN - para obtener parametros estructurales usados en
la determi- - nacion de estructuras 3D de macromoleculas en
solucion. - En particular, los NOE nos permiten determinar
distancias - aproximadas entre protones cercanos. Son muy
utiles si los - vemos entre protones que estan en residuos que
esten dis- - tantes uno de otro en la estructura primaria.
- Sin embargo, los NOE no nos permiten, en
general, decir na- - da acerca de la conformacion de enlaces con
libre rotacion. - Para determinar esto podemos usar acoples 3J
que se obser- - van en peptidos (o azucares, ADN, y ARN). Se
pueden usar - acoples 3J/2J homo/heteronucleares, pero nos
vamos a con- - centrar en el acople 3J homonuclear.
- Estos incluyen 3JNa, que nos da informacion
acerca de la
H
O
f
w
N
3JNa f 3Jab c
c
N
y
Hb
Ha
H
Hb
AA
13- Acoples y angulos diedros (continuado)
- Como vimos, la constante de acoplamiento 3J
esta relacio- - nada con el angulo diedro por la ecuacion de
Karplus. - Como vimos antes, la ecuacion es una suma de
cosenos, y - dependiendo de la topologia (H-N-C-H or
H-C-C-H) tenemos - distintos parametros
- Los parametros han sido derivados de moleculas
rigidas y - datos de rayos-X. Graficamente
3JNa 9.4 cos2( f - 60 ) - 1.1 cos( f - 60 )
0.4 3Jab 9.5 cos2( y - 60 ) - 1.6 cos( y - 60
) 1.8
3J (Hz)
f - 60
14- Acoples y angulos diedros ()
- Como medimos las 3J? Si tenemos pocos
aminoacidos, - directamente del 1D. Tambien las podemos medir
de espe- - ctros HOMO2DJ, o de espectros tipo COSY de alta
resolu- - cion (MQF-COSY y E-COSY).
- El problema mas grande de la ecuacion de Karplus
es que - introduce ambiguedades. Si tenemos acoples 3JNa
menores - de 4 Hz y los pongo en la grafica vemos que
podemos tener - hasta 4 valores posibles para el angulo f
9.4
5.0
-60
0
110
170
4.0
0.0
f - 60
15- Acoples y angulos diedros ()
- Otra cosa que se puede hacer es usar solo los
angulos que - son mas comunes que conocemos de estructuras de
- rayos-X. Para f, los angulos estandar tienen
valores ne- - gativos de -60 y -170). Usando rangos
- Para las cadenas laterales tenemos also similar,
pero en este - caso hay que elegir entre tres posibles
rotameros (como en - etano). Como se pueden medir dos acoples 3Jab
(hay 2 - protones b), nos permiten elegir el conformero
adecuado
3JNa lt 5 Hz -80 lt f lt -40 3JNa gt 8 Hz
-150 lt f lt 170 (-190)
N
N
N
Hb1
Hb2
Hb2
Cg
Cg
Hb1
C
C
Ha
Ha
C
Ha
Hb1
Cg
Hb2
3Jab1 3Jab2 lt 5
3Jab1 lt 5 (o vice versa) 3Jab2 gt 8
16- Introduccion al modelado molecular
- Ahora tenemos casi toda la informacion
estructural que pode- - mos sacar por RMN de nuestra muestra tablas de
NOEs con - distintas intensidades (distancias), constantes
de acople 3J, y - rangos de angulos derivados de los acoples 3J.
- Tenemos que ver como usar toda esta informacion
para ob- - tener una imagen de la molecula en solucion.
- Contrario a los rayos-X, con los que vemos la
densidad - electronica de la molecula y pueden ser
considerados como - un metodo directo, con RMN solo obtenemos
informacion in- - directa acerca de la estructura, y esta
informacion la dan - unos pocos atomos (basicamente los 1Hs).
- Por lo tanto nos valemos de un modelo teorico
para repre- - sentar a la macromolecula. En general, esto es
un modelo - molecular generado por computadora.
17- Modelado molecular (continuado)
- Aca estamos lidiando con proteinas (miles de
atomos), osea - que usamos mecanica molecular (MM).
- El corazon de la MM es el campo de fuerza (force
field) o - las ecuaciones que describen la energia del
sistema en fun- - cion de las coordenadas xyz. En general es una
suma de - distintos terminos de energia
- Cada termino depende de una forma u otra con la
geometria - del sistema. Por ejemplo, Een, o potencial de
enlace del sis- - tema (bond stretching), es
Etotal EvdW Een Ean Etor Eelec
Een Si Keni ( ri - roi )2
18- Incorporacion de datos de RMN
- Lo bueno de los campos de fuerza para MM es que
si tene- - mos una funcion que relacione nuestros datos
experimenta- - les con las coordenadas xyz la podemos sumar
directamen- - te a la ecuacion del potencial total del
sistema. - Esto es lo que hacemos con los datos derivados
de RMN. - Para NOEs usamos rangos de distancias en vez de
valores - unicos porque podemos tener otros fenomenos de
relajacion - en juego, y/o promediado de NOEs
- La funcion de energia potencial relacionada con
estos rangos
NOE fuerte 1.8 - 2.7 Å NOE medio 1.8 - 3.3 Å NOE
debil 1.8 - 5.0 Å
ENOE KNOE ( rcalc - rmax )2 si
rcalc gt rmax ENOE 0 si rmax
gt rcalc gt rmin ENOE KNOE ( rmin - rcalc )2
si rcalc lt rmin
19- Incorporacion de datos de RMN (continuado)
- De manera similar podemos incluir restricciones
en el rango - de angulos o constantes de acoplamiento
- Graficamente, las funciones tienen este aspecto
EJ KJ ( Jcalc - Jmax )2 si Jcalc gt
Jmax EJ 0 si Jmax gt Jcalc gt Jmin EJ
KJ (Jcalc - Jmin )2 si Jcalc lt Jmin
E 0
rmax fmax Jmax
rmin fmin Jmin
Rcalc, fcalc, o Jcalc
20- Optimizacion de estructuras
- Ahora tenemos todas las funciones incluidas en
el potencial - de la molecula, incluyendo interacciones
covalentes (enlace, - angulos, y torsiones), no covalentes (vdW,
electroestatica), y - restricciones NOE y 3J derivadas de RMN.
- Para obtener un modelo estructural del peptido
decente hay - que minimizar la energia del sistema, lo que
implica encon- - trar un conforermo de baja energia (o el de mas
baja energia) - o una familia de conformeros de baja energia.
- En una funcion con la cantidad de variables que
tenemos - en un peptido esto es laborioso, porque tenemos
una super- - ficie de n dimensiones (cada uno de las
variables que esta- - mos optimizando). Para ? y ? en un disacarido
E (Kcal/mol)
y
f
21- Optimizacion de estructuras (continuado)
- Minimizar la funcion implica bajar en la
(hiper)superficie - de energia de la molecula. Para esto neceitamos
calcular - las derivadas CRA xyz (las variables) de todos
los atomos - Esto nos permite ver como vamos para abajo
para todas - las variables, y por lo tanto determinar que
direccion hay - que tomar para minimizar la energia del
sistema. - La minimizacion solo baja. Podemos tener
muchos minimos - locales en la superficie, y si solo usamos
minimizaciones el - sistema puede quedar atrapado en uno de estos.
Esto es lo
?Etotal ?Etotal gt 0 Etotal lt 0
Etotal ?xyz ?xyz
22- Dinamica molecular y enfriamineto simulado
- En las DMs calentamos el sistema a una
temperatura fisica- - mente razonable, 300 K. La energia por mol
a esta tempe- - ratura es RT, donde R es la constante de
Boltzmann (por - mol). Si hacemos los numeros, esto es 0.5
Kcal/mol. - Esto puede ser suficiente para ciertas barreras,
pero no para - otras que seguramente vamos a tener en el
sistema. Para - estos casos necesitamos un metodo de busqueda
conforma- - cional mas drastico, como ser el templado
simulado. - Calentamos el sistema a temperaturas
ridiculamente altas - (2000 K), y despues lo dejamos enfriar
lentamente. La idea - es que este proceso permite que el sistema pase
por barre- - ras energeticas considerables, y al enfriarse
produzca con- - formeros estables y de baja energia.
Conformeros calientes Conformeros frios
T
Tiempo (generalmente ps)
23- Geometria de distancia
- Otro metodo compleatmente diferente a la DM y al
TS es la - geometria de distancias. Vamos a presentar solo
lo que - nos da pero no como funciona.
- Basicamente, randomizamos las coordenadas xyz de
los - atomos del peptido dandoles limites altos y
bajos por fuera - de los cuales los atomos no pueden estar. Aca
incluimos los - enlaces y las restricciones de RMN.
- Esto nos da una matriz de distancias limite, que
es optimi- - zada por medio de un algoritmo SIMPLEX
(desigualdades de - trinagulos), lo que se conoce como suavizado de
la matriz. - Las estructuras que salen de esto no estan
optimizadas, y - generalmente las mejoramos por DM y/o
minimizacion. - Este esquema da un resumen de como los distintos
metodos - hacen que la estructura se mueva en la
superficie de energia
ME
DM TS
GD
24- Presentacion de resultados
- La idea es samplear el espacio conformacional al
que la - proteina tiene acceso bajo los efectos de las
restricciones - estructurales que obtuvimos de los NOE y los
acoples. - Las estructuras que obtenemos por estos metodos
que no - muestren violaciones grandes de las
restricciones que inclu- - imos se dicen ser consistentes con los datos de
RMN. - Como ninguna de estas estructuras se puede
descartar, lo - que hacemos es presentarlas como un set de
estructuras de - baja energia superimpuestas en las regiones mas
rigidas
N-termini
C-termini