Title: SCD08
1Modelos booleanos de regulación genética
2Extendiendo el paradigma
Redes de regulación qué es qué modelos
booleanos atractores, transientes, grafo de
transiciones arabidopsis kauffman, el
applet otros tipos de redes biológicas Importancia
topologÃa Motifs, redes complejas
3Redes de regulación
A pesar de tener el mismo genoma, las células
pueden ser muy distintas.
Además, puede estar haciendo cosas distintas en
un momento y en otro.
4Redes de regulación
- Lo que distingue la naturaleza y estado de una
célula son las moléculas que contiene. - En relación al genoma, lo que interesa es qué
genes están siendo expresados, y en qué cantidad.
5Redes de regulación
- Para modelar la relación entre todas esas
entidades, se han propuesto diversos modelos, con
distintos - Niveles de continuidad (variables binarias,
discretas, continuas) - Niveles de estocasticidad (deterministas o
probabilistas) - ...que a su vez los hacen diferir en
- Realismo
- Cantidad de parámetros (?cantidad de datos!)
- Asà que hay desde redes booleanas hasta
ecuaciones diferenciales parciales estocásticas.
6Redes de regulación
- En estos modelos las entidades pueden ser
- Moléculas (proteÃnas, RNA, etc.)
- Componentes celulares
- Condiciones ambientales
- Reacciones quÃmicas
- Etc.
7Redes de regulación
- Y las interacciones pueden ser
- Transformación en una reacción
- Relación catalÃtica
- Regulación de transcripción
- Regulación de traducción
- Activación / desactivación
- Etc...
8Redes de regulación
9Redes de regulación
Para entender una célula, habrÃa que entender
algo asÃ
10Redes de regulación
Aún estamos muy lejos. ? Los modelos
funcionales hoy en dÃa no pasan en general de una
docena de nodos (entidades). Para hacernos una
idea del tipo de comportamiento y dificultades
que aparecen, hablaremos del tipo más simple de
modelo redes booleanas.
11Redes booleanas
Asumimos -estados binarios para las entidades
(nodos) -funciones booleanas para las
relaciones Por lo general también se asume
iteración paralela (todos los nodos se actualizan
al mismo tiempo).
12Redes booleanas
- Ventajas
- Permiten analizar comportamientos cualitativos de
la red - Su construcción requiere relativamente pocos
datos. - Desventajas
- No es cuantitativo
- No puede modelar señales con intensidad variable
- Ergo, no es realista.
- Es difÃcil incluir el ruido (azar) del sistema
vivo.
13Redes booleanas
- Ventajas
- Permiten analizar comportamientos cualitativos de
la red - Su construcción requiere relativamente pocos
datos. - Desventajas
- No es cuantitativo
- No puede modelar señales con intensidad variable
- Ergo, no es realista.
- Es difÃcil incluir el ruido (azar) del sistema
vivo.
14Redes booleanas
Las redes booleanas son el caso más simple de
redes de autómatas (MEF puestas en un
grafo). Las podemos ver como un digrafo (G,V)
con estados booleanos en los nodos, y funciones
de actualización que dependen de los nodos
incidentes. O como funciones F0,1n?0,1n. Mo
do de iteración en el caso más simple, es
paralelo (sÃncrono) ? todos los nodos se iteran a
la vez, asà que simplemente se aplica F.
15Redes booleanas
Como el sistema es finito, siempre caemos en
ciclos de algún largo p (es decir, un punto fijo
de Fp). Y podemos visualizar ciclos y
transientes haciendo el grafo de transiciones del
sistema.
f1 x4 f2 x4 ? x3 f3 x2 ? x4 f4 x2 ? x1 ?
x3
16Grafo de transiciones
17Grafo de transiciones
18Grafo de transiciones
- Nota la cantidad de estados del sistema es 2n
- crece exponencialmente con n
- Hay una serie de problemas NP duros asociados a
la dinámica. - Por ejemplo dada una RB, encontrar un punto
fijo. - ? NP completo.
19Modos de iteración
- Aparte de la iteración más simple (paralela,
determinÃstica), se usan varias alternativas. - Iteración secuencial iteramos primero el nodo 1,
luego el 2, ..., hasta el n-ésimo, y luego
volvemos al 1. - Iteración por bloques le asignamos a cada nodo
un bloque de iteración, y ponemos un orden a esos
bloques. Iteramos los bloques uno después de
otro, pero cada bloque se itera en paralelo.
20Modos de iteración
- Eso agota las opciones determinÃsticas que iteran
todos los nodos 1 y sólo 1 vez por vuelta. - Alternativas probabilistas
- Iteración asÃncrona en cada paso escogemos un
nodo al azar y lo iteramos. - Combinaciones varias.
21Modos de iteración
- Nota
- los puntos fijos no dependen del modo de
iteración. - Ergo, el cambio en el modo de iteración afecta
sólo los ciclos y transientes del sistema. - En lo que sigue asumiré iteración paralela, salvo
que se indique otra cosa.
22Tipos de funciones
- Conviene distinguir algunos tipos de funciones
booleanas que aparecen al modelar (y le dan a la
red dinámicas particulares). - Funciones de umbral se pueden escribir como
donde los wij son pesos y los ?i son
umbrales. Es el tipo de función que aparece en
las redes neuronales discretas.
23Tipos de funciones
Funciones canalizadoras existe algún input que,
con un valor, determina el resultado. Si está en
el otro valor, no lo determina.
- Canalizadoras anidadas existe un orden en los
inputs uno es canalizador, en su defecto el
siguiente lo es, etc. - En general las funciones canalizadoras aumentan
la estabilidad de la dinámica.
24Tipos de funciones
Una red canalizadora anidada
f1 x4 f2 x4 ? x3 f3 x2 ? x4 f4 x2 ? x1 ?
x3
25Tipos de funciones
- Funciones monótonas fi es monótona en el input j
si se verifica siempre
o si se verifica siempre la desigualdad contraria
(monótona creciente, o decreciente).
Una red en que todas las funciones son monótonas
en todos sus argumentos tiene la gracia de que se
pueden asociar signos a los arcos el efecto de
un nodo sobre otro siempre es, ora positivo (1),
ora negativo (-1). Nota tanto las funciones de
umbral como las canalizadoras son monótonas.
26Tipos de funciones
- Ejemplo de red con funciones monótonas
f1 x2 f2 ?(x1 ? x3) f3 x1 ? (x2 ? x3)
Un circuito de largo L es un camino cerrado en el
grafo xc(1)xc(2)...xc(L), (xc(i),xc(i1))?V
para todo i, (xc(L),xc(1))?V Asà que tiene L
nodos, y L arcos. Es simple si no repite nodos.
27Circuitos positivos y negativos
Circuitos simples Negativos 1 ? 2 1 ? 3 ? 2
2 ? 3 Positivos 3
Decimos que un circuito es positivo si el
producto de los signos de sus arcos es 1, y
negativo en caso contrario.
28Circuitos positivos y negativos
- Un circuito representa una acción de un estado
sobre si mismo (feedback loop). - La presencia de circuitos positivos está asociada
a la existencia de atractores múltiples (en un
atractor, el nodo está "bajo" y se refuerza asÃ
en el otro, está "alto") - "multiestacionaridad"
- La presencia de circuitos negativos está asociada
a la estabilidad (si el valor está alto, tiende a
bajo, y viceversa) - ? "homeostasis"
29Problemas de estudio tÃpicos
- Algunos problemas clásicos
- Analizar la dinámica (atractores, estabilidad,
etc.) de una red dada. - Estudio estadÃstico de clases de redes (definidas
a través de su conectividad, topologÃa, tipo de
funciones, etc.) - Reconstrucción de redes a partir de información
parcial sobre su dinámica (atractores, algunas
interacciones, ...)
30Redes booleanas aleatorias
Estudio estadÃstico clásico Random Boolean
Networks (RBN), o "redes de Kauffman". ? Stuart
Kauffman, 1969
Las redes son determinÃsticas. ? Lo "random"
viene de su generación aleatoria, para estudiar
estadÃsticamente el comportamiento.
31Redes booleanas aleatorias
- Preguntas (entre otras)
- Qué tanta estabilidad sale de la estructura de
la red? - Entender los roles relativos del azar y de la
selección natural en la construcción de las GRN. - Modelo NK
- N nodos
- K inputs por nodo (desde otros nodos), al azar
- Funciones booleanas escogidas al azar
- Para N8, k2, 270 redes distintas (muchas
equivalentes, pero aún asÃ, hartas).
32Redes booleanas aleatorias
- Encuentra varios tipos de comportamiento
- Orden ( k 1 )
- La mayorÃa de los nodos se puede perturbar, sin
modificar el atractor alcanzado. - Perturbaciones pequeñas provocan cambios
pequeños. - Casi todos los nodos se estabilizan rápido.
- El atractor alcanzado es corto, O(1). La cantidad
de atractores es O(2N).
33Redes booleanas aleatorias
- Caos ( k ? 3 )
- Muy sensible a perturbaciones
- ? cambios pequeños se amplifican
exponencialmente. - Pocos nodos se estabilizan.
- Pocos atractores, pero largos O(2N)
- recordar que 2N es el tamaño del espacio de
configuraciones, "espacio de fase" para los
fÃsicos
34Redes booleanas aleatorias
- Pero para k 2
- Sensibilidad intermedia a perturbaciones
- ? Algunos cambios afectan poco, otros afectan
harto. - Muchos nodos se estabilizan, pero persisten
"zonas de actividad". - Si se dibuja la red poniendo cerca los nodos que
están linkeados, lo que se ve son "islas" de
actividad dentro de un "mar" de nodos
constantes.
35Redes booleanas aleatorias
- Pero para k 2
- Ciclos lÃmite no son largos, duran O(?n) pasos.
- Cantidad de atractores también escala como O(?n).
- ?Hay una reducción efectiva del espacio de fase
- Para n100, de 2100 configuraciones posibles, el
sistema "escoge" quedarse en 10 atractores, de
largo 10 ? un conjunto de 100 configuraciones!
36Redes booleanas aleatorias
k2 es aprox. el promedio en redes de regulación
genética reales. Kauffman identifica los
atractores con tipos de células, alcanzados
después de la diferenciación (glóbulos blancos,
neuronas, etc.), y el transiente con el proceso
de desarrollo. Para las cantidades de genes, y
la cantidad de tipos de células, que se estimaban
en los 70, cuadraban las cantidades.
37Redes booleanas aleatorias
- Más tarde se ha visto que habÃan problemas
- La cantidad de tipos celulares estaba
sub-estimada. - La cantidad de genes estaba sobreestimada.
- Hay más formas de regulación (y más compleja) que
lo que se suponÃa. - La topologÃa no parece ser aleatoria, y su
estructura especÃfica parece ser relevante para
la dinámica. Sobre eso, volveremos. - Pero de todos modos lo de Kauffman fue una buena
aproximación, y hasta hoy es punto de referencia.
38Redes booleanas aleatorias
- Qué tiene de especial k2 ?
- Un cálculo vÃa aproximación "mean field" (cosas
de fÃsicos, tomar el promedio de los estados y
las interacciones). - Consideremos dos configuraciones iniciales X e Y
que están a distancia de Hamming D. - En promedio, cada nodo controla (incide sobre) k
nodos. - En promedio, las nodos que difieren entre X e Y
controlan kD nodos.
39Redes booleanas aleatorias
- Qué tiene de especial k2 ?
- En cada uno de esos nodos cuya preimagen diferirá
entre X e Y, hay probabilidad ½ de que eso afecte
el nuevo valor. - Por lo tanto en promedio los nodos que diferirán
entre F(X) y F(Y) serán kD/2. - ? La distancia entre Ft(X) y Ft(Y) será
40Redes booleanas aleatorias
Qué tiene de especial k2 ?
- Para klt2, las órbitas se acercan.
- Para kgt2, se alejan exponencialmente.
- k2 es el valor crÃtico la distancia no se
mantendrá constante, pero dependerá de
fluctuaciones locales no capturadas por esta
aproximación mean field.
41Redes booleanas aleatorias
Nota sólo se supuso que k era el grado
promedio. Los experimentos confirman esto basta
que la cantidad promedio de inputs sea
k. Complicando un poco más el modelo Supongamos
ahora que al escoger la función booleana al
azar, no se toma probabilidad ½ de 1 y 0 en cada
item de la tabla, sino probabilidad p de poner un
1. En tal caso k2 ya no es crÃtico. Un
desarrollo un poco más complicado ver el apunte
de Gross muestra que en ese caso
42Redes booleanas aleatorias
Los dibujos ilustran la dinámica para distintos
regÃmenes (horizontal nodos vertical hacia
arriba tiempo).
43Redes booleanas aleatorias
Derrida y Pomeau (1986) hicieron este análisis, y
mostraron que efectivamente hay un cambio de fase
en la frontera entre el orden y el caos. En
realidad lo demostraron suponiendo que las
funciones se vuelven a escoger al azar a cada
vuelta sin embargo mostraron después que para
N?? el comportamiento coincide con el usual
(funciones escogidas sólo al comienzo).
44Redes booleanas aleatorias
- Por qué k2 en las redes biológicas? Por qué la
vida escogió (al parecer) el borde del caos? - kgt2
- la dinámica se vuelve inestable malo para una
célula! - ? La selección natural lo eliminará.
- klt2
- hay poca flexibilidad
- poco orden, con O(2N) atractores
- además, hay "espacio" para agregar conexiones
- ? La selección natural hara crecer k.
45Redes booleanas aleatorias
- El efecto de perturbaciones en la red (N,2) sigue
leyes de potencia - muchas con poco efecto (tÃpicamente, entre 80 y
95) - unas pocas con grandes efectos.
- Es el régimen óptimo para el procesamiento de la
información - hay donde guardarla (a diferencia del caso
caótico) - y tiene como propagarse (a diferencia del caso
ordenado, donde perturbaciones pequeñas sólo
provocan cambios pequeños).
46Redes de regulación génica
- Pero volviendo al caso de los genes qué tan
sencillo es modelar fenómenos biológicos con RB? - Problemas
- A veces simplemente no se puede (pero en ese caso
es útil demostrar que no se puede, i.e., mostrar
que el comportamiento del sistema requiere un
modelo de otro tipo). - Por lo general no se tiene información completa,
asà que hay que resolver alguna forma del
problema inverso (RB, dados los atractores, y
algunas interacciones conocidas).
47Redes de regulación génica
Ejemplo cascada de la caspasa, generando
apoptosis (muerte celular). TÃpico mono de
paper biológico. Bastará modelar booleanamente
las interacciones?
48Redes de regulación génica
En este caso al parecer sà el modelo
"booleanizado" permitió predecir de manera
efectiva el efecto de dos posibles medicamentos
para intervenir en el proceso.
49Redes de regulación génica
Otro caso (un modelo "clásico") formación de la
flor en Arabidopsis thaliana
Cuatro zonas, concéntricas
correspondientes a los traslapes de tres genes
50Redes de regulación génica
Fenotipos mutantes
51A
C
Red de Mendoza et al.
B
52Redes de regulación génica
- Red booleana, funciones tipo umbral
53Redes de regulación génica
54Redes booleanas aleatorias
Cuadraba, pero no predecÃa todos los fenotipos
experimentales.
A la izquierda, una red más reciente para el
mismo caso. No sólo agrega nodos además algunos
tienen tres estados. Se está trabajando en otra
mucho mayor.
55La importancia de la topologÃa
- Recordemos cómo era la topologÃa que usó
Kauffman - Cada nodo recibe input desde k nodos, al azar.
- Ergo, el grado de entrada de los nodos es k, y el
de salida es una binomial con media k. Ó,
aproximando, una Poisson de parámetro k.
- No hay nodos "escogidos", que se salgan mucho de
la norma. - No hay grupos de nodos que estén especialmente
conectados entre sÃ. Es "todos con todos".
56La importancia de la topologÃa
- No es realista. Incluso en 1970 se sabÃa que
- Algunos grupos de genes interactúan más entre sÃ,
que con el resto de lo genes de la célula. - Algunos genes regulan mucho más que la media
(proteÃnas que se dedican a regular ? "factores
de transcripción). - La duda era esos rasgos de la topologÃa,
influirán en la dinámica? - ?No habÃa teorÃa. Ni modelos alternativos para un
grafo aleatorio.
57La importancia de la topologÃa
- Veamos un ejemplo para una dinámica bastante
simple. - k 7.
- Función booleana idéntica en todos los nodos
- Sea s la suma de los 7 inputs en el tiempo t
- En t1 paso a 1 si 1 ? s ? 6, a 0 si s 0 ó s 7.
- Evalúo, después de cada iteración, la proporción
de nodos que están en 1. - Los siguientes gráficos son con N10.000
58La importancia de la topologÃa
Resultado caótico.
De hecho, si hacemos una aproximación mean field
se ve que para r de 1's en tiempo t, la
proporción en t1 es 1-(1-r)7-r7. Y se demuestra
que la función r?1-(1-r)7-r7 es caótica (como lo
era la logÃstica de parámetro 4).
59La importancia de la topologÃa
Como la regla es homogénea, podemos aplicarla
como autómata celular. Es decir, irnos al extremo
contrario e imponer una topologÃa completamente
regular.
Ponemos entonces los N nodos en un cÃrculo, y
cada uno recibirá input de sus tres vecinos en
cada dirección (y de sà mismo). La función es la
misma.
Resultado orden! La fluctuación es un efecto
del tamaño finito tiende a desaparecer con N??.
60La importancia de la topologÃa
- Son casos extremos, por cierto.
- Cómo podemos interpolar entre un caso y otro?
- Introducimos un parámetro p en la construcción de
la red. - Asignamos los 7 inputs más cercanos, como en el
segundo caso. - "Repensamos" ahora cada uno de ellos. Con
probabilidad p, lo reasignamos de modo que venga
de un nodo escogido al azar. - ?Con p1, tenemos el primer caso (grafo
aleatorio). - ?Con p0, tenemos el segundo (malla regular).
61La importancia de la topologÃa
p 0.3
p 0.45
62La importancia de la topologÃa
de 1's
Diagrama hecho con N1.500.000.
p
63La importancia de la topologÃa
- Moralejas
- Incluso para funciones muy simples, la topologÃa
puede ser decisiva para la dinámica. - Hay diferencia entre un grafo aleatorio, y uno en
que haya algún nivel de orden. - Puede haber sensibilidad dinámica a variaciones
pequeñas en un parámetro que define la topologÃa. - Y eso que el caso que vimos no se metió con otras
formas de modificar la topologÃa por ejemplo, el
modelo siguió siendo "democrático" (no habÃa
nodos especialmente conectados).
64Redes complejas
65Redes complejas
- El énfasis pasa definitivamente a la topologÃa.
- Incluso sin dinámica (sin T) las
caracterÃsticas de la topologÃa son tema de
estudio (no trivial reciente hot).