Title: Modelado Inductivo
1Modelado Inductivo
- En esta presentación, estudiaremos técnicas más
generales para la identificación de modelos no
lineales complejos a partir de observaciones de
comportamientos de entradas y salidas. - Estas técnicas intentan imitar las habilidades
humanas del aprendizaje vicario, es decir, de
aprender a partir de observaciones. - Estas técnicas deberían funcionar en general, es
decir, los algoritmos deberían ser capaz de
capturar una relación funcional arbitraria y
reproducirla fielmente. - La técnicas además no tendrán ninguna
inteligencia, es decir, su habilidad de
generalizar patrones a partir de observaciones es
casi nula.
2Contenido
- Modelado basado en conocimientos y en
observaciones - Taxonomía de metodologías de modelado
- Modelado basado en observaciones y optimización
- Modelado basado en observaciones y complejidad
- Redes neuronales artificiales
- Modelado paramétrico y no paramétrico
- Modelado cuantitativo y cualitativo
- Modelado borroso
- Razonamiento inductivo borroso
- El sistema cardiovascular
3Modelado Basado en Conocimientos y Observaciones
- Hasta ahora usamos casi exclusivamente técnicas
de modelado basadas en conocimientos a priori. - En muy pocas situaciones generamos modelos a
partir de observaciones. - La única vez cuando intentamos hacerlo
identificando un modelo estilo Lotka-Volterra de
la población de insectos Zeiraphera diniana
(Guenée), no nos funcionó muy bien. - Por otro lado, si usamos conocimientos a priori,
como en el caso de modelar un resistor eléctrico
usando la ecuación u Ri, no estamos modelando
verdaderamente estamos usando modelos ya hechos
por otra gente.
4Taxonomía de Metodologías de Modelado
Técnicas basadas en conocimientos
Técnicas basadas en observaciones
Modelos profundos
Modelos superficiales
SD
Redes neuronales
Razonadores inductivos
FIR
5Modelado Basado en Observaciones y Optimización
- Cada metodología de modelado basada en
observaciones está relacionada íntimamente a una
optimización. - Veamos otra vez más nuestro modelo
Lotka-Volterra - Si aceptamos esta estructura para modelar la
dinámica de la población de los insectos,
capturamos el conocimiento de observaciones
disponible en los valores de los parámetros del
modelo Lotka-Volterra, es decir, a, b, c, k,
xprey0 y xpred0. - Modelando aquí implica identificar los valores de
estos parámetros, es decir, minimizar el error
entre los comportamientos observados y simulados
usando optimización.
6Modelado Basado en Observaciones y Complejidad
- El modelado basado en observaciones es muy
importante, especialmente cuando tratamos con
sistemas desconocidos o solamente conocidos de
forma parcial. Si modelamos nuevos tipos de
sistemas, realmente no tenemos opción. Estos
sistemas tienen que modelarse de forma inductiva,
es decir, usando las observaciones disponibles. - Cuanto menos sabemos de un sistema, más generales
tienen que ser los métodos de modelado que
usamos. Si no sabemos nada, tenemos que
prepararnos para cualquier cosa. - Para modelar un sistema totalmente desconocido,
debemos permitir una estructura del modelo de
complejidad arbitraria.
7Redes Neuronales Artificiales (ANN) I
- Una técnica popular y exitosa para el modelado de
sistemas a partir de observaciones es usando
redes neuronales artificiales (ANNs). - ANNs se modelan copiando ciertos aspectos de las
neuronas del cerebro.
8Redes Neuronales Artificiales (ANN) II
- Muchas neuronas se agrupan en una estructura de
matriz - Las matrices de pesos y los vectores de sesgos
capturan la información de la función que
requiere modelarse.
9Redes Neuronales Artificiales (ANN) III
- Se puede mostrar que una ANN con una sola capa
escondida y bastante neuronas puede aprender
cualquier función con un dominio compacto de
variables de entrada. - Con al menos dos capas escondidas, pueden
aprenderse incluso funciones arbitrarias con
agujeros en sus dominios de entrada y salida.
10Modelos Paramétricos y no Paramétricos I
- Las ANN representan modelos paramétricos. El
conocimiento de observaciones del sistema se
mapea al (posiblemente muy grande) conjunto de
parámetros de la ANN. - Una vez entrenada la ANN, el conocimiento
original se descarta. En su lugar se usa el
comportamiento aprendido de la ANN para hacer
predicciones. - Eso puede ser peligroso. Si los datos de prueba,
es decir, los patrones de entrada encontrados
mediante el uso de la ANN son fuera del dominio
de los datos de entrenamiento, la ANN
probablemente predice basura, pero no se da
cuenta de ello, ya que el conocimiento original
se descartó.
11Modelos Paramétricos y no Paramétricos II
- Por otro lado, los modelos no paramétricos
siempre hacen referencia a los datos de
entrenamiento originales, y por consecuencia
pueden programarse de tal manera que rechacen
datos de prueba incompatibles con los datos de
entrenamiento. - El motor del Razonamiento Inductivo Borroso (FIR)
que introducimos en esta presentación, es no
paramétrico. - Mediante la fase del entrenamiento, el FIR
organiza los patrones observados y los deposita
en una base de datos. - Mediante la fase de prueba, FIR busca los cinco
patrones de entrenamiento más similares (los
cinco vecinos más próximos) en la base de datos
comparando el nuevo patrón de entrada con los
almacenados antes. Luego FIR predice la nueva
salida como promedio ponderado de las salidas de
los cinco vecinos más próximos.
12Modelos Cuantitativos y Cualitativos I
- Entrenar un modelo (sea paramétrico o no) implica
resolver un problema de optimización. - En el caso paramétrico, hay que resolver un
problema de identificación de parámetros. - En el caso no paramétrico, hay que clasificar los
datos de entrenamiento, y guardarlos de una
manera óptima en la base de datos. - Entrenar tal modelo puede ser atrozmente lento.
- Por eso, tiene sentido buscar técnicas que ayuden
a acelerar el proceso de entrenamiento.
13Modelos Cuantitativos y Cualitativos II
- Cómo puede controlarse la velocidad de la
optimización? De alguna forma hay que reducir el
espacio de búsqueda. - Una manera de lograr esto es convertir las
variables continuas en variables discretas
equivalentes antes de la optimización. - Por ejemplo, si una de las variables de interés
es la temperatura ambiente, podríamos considerar
clasificar los valores de la temperatura en un
espectro que vaya desde muy frío hasta
extremadamente caliente tal como el siguiente
conjunto discreto
temperatura helado, frío, fresco, moderado,
templado, caliente
14Variables Cualitativas
- Una variable que sólo toma valores en un conjunto
discreto se denomina variable discreta. A veces,
se denomina también variable cualitativa. - Evidentemente, debe ser más barato buscar en un
espacio discreto de búsqueda que en un espacio
continuo de búsqueda. - El problema con los esquemas de discretización,
tales como el antes propuesto, es que en el
proceso se pierde mucha información detallada
potencialmente valiosa. - Para evitar este inconveniente, L. Zadeh propuso
un enfoque diferente denominado borrosificación
(fuzzification).
15Variables Borrosas I
- La borrosificación actúa de la siguiente forma.
Una variable continua se borrosifica al
descomponerla en un valor de clase discreta y en
un valor de pertenencia borrosa. - Para el propósito del razonamiento, se tiene en
cuenta sólo el valor de clase. Sin embargo, para
el propósito de la interpolación, el valor de
pertenencia borrosa también se tiene en cuenta. - Las variables borrosas no son discretas, sino que
se consideran cualitativas.
16Variables Borrosas II
Los pares Clase, pertenencia de menor
verosimilitud deben considerarse también, ya que
de otra forma el mapeo no sería único.
17Variables Borrosas en el FIR
El FIR realiza un enfoque algo distinto para
resolver el problema de la unicidad. En lugar de
mapear en reglas borrosas múltiples, el FIR mapea
en una única regla, la que tiene mayor
verosimilitud. Sin embargo, para evitar el
problema de ambigüedad mencionado, el FIR guarda
una información más el valor de lado. Éste
indica si el punto del dato está a la izquierda o
a la derecha del pico del valor de pertenencia
borrosa de una clase dada.
18Redes Neuronales y Razonamiento Inductivo
19Razonamiento Inductivo Borroso (FIR) I
- Discretización de Información Cuantitativa
(Recodificación Borrosa) - Razonamiento sobre categorías discretas (Modelado
Cualitativo) - Inferencia de consecuencias sobre categorías
(Simulación Cualitativa) - Interpolación entre categorías vecinas utilizando
lógica borrosa (Regeneración Borrosa)
20Razonamiento Inductivo Borroso (FIR) II
21Borrosificación en el FIR
22Modelado Cualitativo en el FIR I
- Tras recodificar los datos, hay que determinar
cual de los conjuntos posibles de variables de
entrada representa mejor el comportamiento
observado. - Entre todas las combinaciones posibles de
entrada, tomamos la que da una relación de
entrada/salida tan determinística como sea
posible. Esto es, cuando se observa varias veces
el mismo patrón de entrada en los datos de
entrenamiento, queremos que los patrones de
salida obtenidos sean tan consistentes como sea
posible. - Cada patrón de entrada debe observarse al menos
cinco veces.
23Qualitative Modeling in FIR II
24Modelado Cualitativo en el FIR III
- El modelo cualitativo es la máscara óptima, o
sea, el conjunto de entradas que mejor predice
una salida dada. - Generalmente, la máscara óptima es dinámica, es
decir, la salida actual depende de los valores
actuales y pasados de las entradas y salidas. - La máscara óptima puede aplicarse a los datos
para obtener un conjunto de reglas borrosas que
se pueden ordenar de manera alfanumérica. - La base de reglas borrosas es nuestra base de
datos de entrenamiento.
25Simulación Cualitativa en el FIR
26Predicción de Series Temporales en el FIR
Demanda de agua de la ciudad de Barcelona, Enero
85 Julio 86
27Resultados de la Simulación I
28Modelado Cuantitativo y Cualitativo
- Técnicas de Modelado Deductivas
- tienen un gran rango de validez en
muchas aplicaciones, incluso en algunas
previamente desconocidas - son frecuentemente inexactas en sus
predicciones a causa de simplificaciones en los
modelos (dinámicas no modeladas) - Técnicas de Modelado Inductivas
- tienen un rango de validez limitado y
sólo pueden usarse para predecir el
comportamiento de sistemas bien conocidos - son frecuentemente muy precisas en sus
predicciones si aplicadas cautelosamente
29Modelado Mixto Cuantitativo y Cualitativo
- Es posible combinar técnicas de modelado
cualitativas y cuantitativas.
30Aplicación Sistema Cardiovascular I
- Aplicamos esta técnica a un sistema bastante
complejo el sistema cardiovascular humano. - El sistema cardiovascular es compuesto de dos
sub-sistemas el sistema hemodinámico y el
control nervioso central. - El sistema hemodinámico trata con la física del
flujo de sangre a través el corazón y los vasos
sanguíneos. - El control nervioso central sincroniza el control
del flujo de sangre a través el corazón y los
vasos sanguíneos.
31Aplicación Sistema Cardiovascular II
- El sistema hemodinámico es esencialmente un
sistema hidrodinámico. El corazón y los vasos
sanguíneos pueden describirse por bombas,
válvulas y tubos. Por con-secuencia, gráficos de
ligaduras sirven para su descripción. - El control nervioso central aún no se entiende
completamente. El modelado cualitativo basado en
observaciones puede ser la herramienta más
apropiada para describirlo.
32El Sistema Hemodinámico I
Las cavidades del corazón y los vasos sanguíneos
son los contenedores de la sangre. Cada
contenedor almacena masa y por eso se describe
por un elemento C.
Algunos de los elementos C son no lineales y en
el caso de las cavidades del corazón dependen del
tiempo.
El elemento mSe del lado izquierdo representa el
volumen residual del vaso o de la cavidad.
El elemento mSe del lado derecho representa la
presión torácica que está influenciada por la
respiración.
33El Sistema Hemodinámico II
34El Sistema Hemodinámico III
35El Sistema Hemodinámico IV
- Los contenedores son representados por cajas.
Terminan en uniones 0. - Los flujos entre contenedores son representados
por flechas. Terminan en ligaduras. - Mientras los contenedores y los flujos
intercambian, pueden conectarse entre sí sin
ligaduras. - Algunos de los flujos contienen inductores,
mientras que otros solamente contienen
resistores. Algunos también contienen válvulas
que son representadas por elementos Sw.
36El Corazón
El modelo del corazón contiene las cuatro
cavidades y las cuatro válvulas del corazón la
válvula pulmonaria y la válvula aórtica a las dos
salidas de los ventrículos, y la válvula mitral y
la válvula tricúspide entra las aurículas y los
ventrículos.
El bloque del ritmo sinusal controla las
contracciones y relajaciones del músculo cardíaco.
Los vasos coronarios son responsables de
suministrar oxígeno al músculo cordíaco.
37El Tórax
El tórax contiene el corazón y los vasos
san-guíneos más importantes.
La función tabular por debajo calcula la presión
torácica en función de la respiración.
La sangre arterial es representada en rojo,
mien-tras la sangre venosa es representada en
azul.
A la izquierda se ven las señales llegando desde
el control nervioso central.
38Las Partes del Cuerpo
- De forma similar se modelan también las demás
partes del sistema circulatorio de la sangre.
Incluyen la cabeza y los brazos (el tronco
braquiocefálico y sus vasos), el abdomen (las
arterias y venas gastrointestinales) y las
extremidades inferiores. - Todos juntos forman el sistema hemodinámico.
- Faltan todavía las funciones del control nervioso
central.
39El Sistema Cardiovascular
Control Nervioso Central (Modelo
cualitativo)
Sistema Hemodinámico (Modelo cuantitativo)
Controlador del ritmo cardíaco
Corazón
Controlador de la contractilidad del miocardio
Controlador de la resistencia periférica
Dinámica de flujos circulatorios
Controlador de la elasticidad de las venas
Presión sanguínea de la carótida
Controlador de la resistencia coronaria
Presión de las arterias del cerebro.
Recodificar
40Resultados de Simulación II
41Discusión I
- El gráfico de arriba muestra el controlador de
resistencia periférica, Q4, durante una maniobra
de Valsalva. - Los datos medidos están superpuestos con los de
simulación. Los resultados de simulación son en
general muy buenos. Sin embargo, en el centro del
gráfico los errores son algo mayores. - Debajo hay dos gráficos que muestran la
estimación de la probabilidad de que la
predicción sea correcta. Puede verse que el FIR
se da cuenta que los resultados de simulación en
la zona central tienen poca probabilidad de tener
alta calidad.
42Discusión II
- Esto puede aprovecharse. Se pueden realizar en
paralelo varias predicciones junto con sus
estimaciones de la probabilidad de que sean
correctas. - Pueden entonces conservarse las predicciones que
están acompañadas por el mayor valor de
confianza. - Esto se muestra en el siguiente gráfico. Dos
modelos distintos (máscaras subóptimas) se
comparan entre sí. La segunda máscara funciona
mejor, y además sus valores de confianza
asociados son más altos.
43Resultados de Simulación III
44Conclusiones I
- El modelado cuantitativo, es decir, basado en los
primeros principios, es la herramienta más
adecuada para las aplicaciones que se comprenden
bien, y donde las meta-leyes están bien
establecidas. - El modelado físico es lo más deseable, ya que
ofrece una mayor comprensión y se puede extender
más ampliamente más allá del rango de los
experimentos previos. - El modelado cualitativo es adecuado en áreas que
no se comprenden muy bien, y donde todo el
conocimiento que hay consiste esencialmente en
observaciones crudas, es decir, donde aún no se
han extraído meta-leyes a partir de observaciones
previas.
45Conclusiones II
- El modelado borroso es un enfoque de modelado
inductivo muy atractivo, ya que permite obtener
medidas de confianza de las predicciones. - El FIR es uno de los varios enfoques del modelado
borroso. Ha sido aplicado extensa y exitosamente
en una gama bastante amplia de aplicaciones de la
ingeniería y de las ciencias blandas. - Los modelos cualitativos no aportan conocimiento
sobre el funcionamiento de un sistema. Sólo
pueden usarse para predecir el comportamiento
futuro, siempre y cuando los patrones de
comportamiento se mantengan dentro de sus normas
observadas.
46Aplicaciones industriales
- Modelado del Sistema Cardiovascular para
Clasificación de Anomalías. - Modelo de Anestesiología para Control del Nivel
de Anestesia Durante Cirugías. - Modelo de Crecimiento de Gambas para el criadero
de gambas El Remolino en el norte de México. - Predicción de la Demanda de Agua en Barcelona y
Rotterdam. - Diseño de Controlador Borroso para el manejo de
Buques Petroleros. - Diagnóstico de fallos en Centrales Nucleares.
- Predicción de Cambios Tecnológicos en la
Industria de Telecomunicaciones.
47Referencias I
- Cellier, F.E. (1991), Continuous System Modeling,
Springer-Verlag, New York, Chapter 13. - Cellier, F.E. (1991), Continuous System Modeling,
Springer-Verlag, New York, Chapter 14. - Cellier, F.E., A. Nebot, F. Mugica, and A. de
Albornoz (1996), Combined Qualitative/Quantitativ
e Simulation Models of Continuous-Time Processes
Using Fuzzy Inductive Reasoning Techniques,
Intl. J. General Systems, 24(1-2), pp.95-116.
48Referencias II
- Nebot, A., F.E. Cellier, and M. Vallverdú (1998),
Mixed Quantitative/Qualitative Modeling and
Simulation of the Cardiovascular System,
Computer Methods and Programs in Biomedicine,
55(2), pp.127-155. - Cellier, F.E. (2006), The Dymola Cardiovascular
System Model, Version 2.0.
49Tesis de Doctorado Recientes
- Nebot, A. (1994), Qualitative Modeling and
Simulation of Biomedical Systems Using Fuzzy
Inductive Reasoning. - Mugica, F. (1995), Diseño Sistemático de
Controladores Difusos Usando Razonamiento
Inductivo. - de Albornoz, A. (1996), Inductive Reasoning and
Reconstruction Analysis Two Complementary Tools
for Qualitative Fault Monitoring of Large-Scale
Systems. - López, J. (1999), Qualitative Modeling and
Simulation of Time Series Using Fuzzy Inductive
Reasoning. - Mirats, J.M. (2001), Large-Scale System Modeling
Using Fuzzy Inductive Reasoning.