Title: Sistemas de razonamiento probabilstico
1Sistemas de razonamiento probabilÃstico
2Red de creencias caracterÃsticas
La principal ventaja del razonamiento
probabilÃstico sobre el razo-namiento lógico es
que el primero permite tomar decisiones
racio-nales aún en los casos en que no haya
suficiente información para probar que cualquier
acción dada funcionará.
- La red de creencias es un grafo dirigido y
acÃclico en el cual - Un conjunto de arcos dirigidos o flechas, conecta
pares de nodos. - Un conjunto de variables representa los nodos de
la red. - Cada nodo tiene una tabla de probabilidad
condicional que cuantifica los efectos que los
padres tienen sobre el nodo.
3Ejemplo de Red de creencias
4Representación de la distribución de probabilidad
conjunta
5Distribución de probabilidad conjunta (cont.)
Probabilidad condicional por definición P(x1,
x2, ...,xn) ? P(xi? xi-1, ...,x1) 2
Comparando con la ecuación 1 vemos que la
especifica-ción es equivalente a la aseveración
general 3 P(Xi? Xi-1,..., X1)P(Xi?Padres(Xi
)) siendo Padres(Xi )?xi-1, ...,x1 La
ecuación anterior nos dice que la red de
creencias es una representación correcta del
dominio solo si cada nodo es condicionalmente
independiente de sus predecesores, en el orden de
los nodos, dados sus padres. Intuitivamente,
padres del nodo Xi deberÃa contener todos
aquellos nodos en X1, . . ., Xi-1 que influencian
directamente a Xi.
n
i1
6Procedimiento para la construcción de la red
- Elegir el conjunto de variables Xi relevantes que
describen el dominio. - Elegir un orden para las variables.
- Mientras queden variables
- a) Tomar una variable Xi y agregar un nodo a la
red para dicha variable. - b) Hacer que Padres(Xi) sea un conjunto mÃnimo
de nodos ya existente en la red, tal que la
propiedad de independencia condicional 3 sea
satisfecha. - c) Definir la tabla de probabilidad
condicional para Xi.
7Representación de tablas de probabilidad
condicional
- Nodo determinÃstico su valor queda especificado
exactamente por los valores de sus padres, sin
incertidumbre. - Las relaciones con incertidumbre pueden a veces
ser caracterizadas por las llamadas relaciones
con ruido. El ejemplo estándar es el llamado
OR-ruidoso que es una generalización del OR
lógico. - En lógica proposicional, podÃamos decir Fiebre
es verdadero si y solo si ResfrÃo, Gripe o
Malaria es verdadero. El modelo OR-ruidoso agrega
alguna incertidumbre a este enfoque estrictamente
lógico. - El modelo asume tres cosas
- Cada causa tiene una chance independiente de
causar el efecto. - Todas las causas posibles están listadas.
- Cualquier cosa que inhibe, por ej. a Gripe, de
causar Fiebre, es inde-pendiente de lo que inhiba
a ResfrÃo de causar Fiebre. Estos inhibid. no se
representan como nodos sino que se resumen
comoparám.de ruido.
8Representación de tablas de probabilidad
condicional (continuación)
9Relaciones de independencia condicional en redes
de creencias
Separación dependiente de la dirección o
d-separación Dada una red, es posible
determinar si un conjunto de nodos X es
independiente de otro conjunto Y, dado un
conjunto de nodos evidencia E.
Si todo camino no dirigido
desde un nodo en X a un nodo en Y es
d-separado por E, luego X e Y son condicionalm.
independ., dada E. Un conjunto de nodos E
d-separa dos conjuntos de nodos X e Y si cada
camino no dirigido desde un nodo en X hasta un
nodo en Y está bloqueado dado E. Un camino está
bloqueado dado un conjunto de nodos E si hay un
nodo Z en el camino para el cual se cumple una de
las tres condiciones siguientes
1 Z
está en E y Z tiene una flecha ingresando y otra
saliendo. 2 Z está en E y tiene
ambas flechas del camino hacia afuera.
3 Ni Z ni ningún descend.de Z está en E,y ambas
flecha apuntan a Z.
10Relaciones de independencia condicional en redes
de creencias (continuación)
Z
E
Y
X
Z
Z
Tres formas en que un camino desde X hasta Y
puede ser bloqueado, dada la evidencia E.
Ejemplo
BaterÃa
Radio
Ignición
Nafta
Arranca
Se mueve
11Inferencia en redes de creencias
- La tarea básica de cualquier sistema de
inferencia probabilÃstico es computar la
distribución de probabilidad posterior de un
conjunto de variables de Query, dados los valores
exactos de algunas variables de evidencia
P(Query?Evidencia), Ej. P(Hurto?JuanLlama) - En general, un agente toma valores para
variables de evidencia, de sus percepciones (o de
otro razonamiento), y pregunta sobre valores
posibles de otras variables de modo que puede
decidir qué acciones tomar. - Las redes de creencias pueden realizar cuatro
tipos de inferencias - Inferencias diagnósticas (de efectos a causas)
- Inferencias causales (de causas a efectos)
- Inferencias intercausales (entre causas de un
efecto común) - Inferencias mezcladas (combinando dos o más de
las anteriores)
12Posibles usos de las redes de creencias
- Además de permitir calcular la creencia en
variables de Query, dados los valores definidos
para variables de evidencia, las redes de
creencias pueden ser usadas para lo siguiente - Tomar decisiones basadas en probabilidades en la
red y en las uti-lidades del agente. - Decidir qué variables de evidencia adicionales
deberÃan ser obser-vadas para ganar información
útil. - Realizar análisis de sensibilidad para entender
qué aspectos del modelo tienen el mayor impacto
sobre las probabilidades de las va-riables de
Query. - Explicar al usuario los resultados de la
inferencia probabilÃstica.
13Inferencia en redes de creencias con múltiples
conexiones
- Hay tres clases básicas de algoritmos para
evaluar redes de conexiones múltiples - Agrupamiento (clustering), métodos que
transforman la red en un polytree equivalente
probabilÃstico (pero diferente topológicamen-te),
uniendo nodos ofensivos. - Condicionamiento por conjunto de corte, métodos
que realizan la transformación dando valores
concretos a las variables, y luego eva-luando un
polytree para cada particularización posible. - Simulación estocástica, métodos que usan la red
para generar un gran número de modelos concretos
del dominio que son consisten-tes con la
distribución de la red.
14Red con conexiones múltiples con tablas de
probabilidad condicional
P(N) 0.5
Nublado
N
P(Ll)
N
P(R)
Regador
Lluvia
V
V
0.80
0.10
F
0.20
F
0.50
Pasto Húmedo
P(H)
R
Ll
V
0.99
V
V
0.90
F
V
F
0.90
F
0.00
F
15Equivalente de la red con conexiones múltiples
usando agrupamiento (clustering)
Pasto Húmedo
16Método de condicionamiento por conjunto de corte
Transforma la red en varios polytrees más
simples. Cada red simple tiene una o mas
variables particularizadas a un valor definido.
El conj. de variables que puede ser
particularizado se llama conjunto de corte. Nota.
Polytree red simplemente conectada, en tal red
hay como máxi-mo un camino no dirigido entre dos
nodos cualesquiera.
17Método de simulación estocástica
Se corren simulaciones repetidas del mundo
descripto por la red de creencia, y se estima la
probabilidad en que es-tamos interesados,
contando las frecuencias con las cuales los
eventos relevantes ocurren. La mayor dificultad
con es-te método es que toma un largo tiempo
obtener probabili-dades precisas para eventos
poco probables.
18IngenierÃa del conocimiento para razonamiento con
incertidumbre
- Decidir sobre qué hablar. Es importante decidir
qué factores serán modelados, y cuáles serán
resumidos por enunciados probabilÃsticos. - Decidir sobre un vocabulario de variables al
azar. - Codificar conocimiento general acerca de la
dependencia entre variables. - Codificar una descripción del caso particular
especÃfico del problema. - Presentar Queries al procedimiento de inferencia
y obte-ner respuestas.
19Otros enfoques de razonamiento con incertidumbre
- Razonamiento por omisión (default)
- Trata a las conclusiones como creÃbles hasta
que se haya encontra-do una razon mejor para
creer en algo más. Exhibe no monotonici-dad
porque el conjunto de creencias no crece
monotónicamente a medida que se obtiene nueva
evidencia. Estos tipos de sistemas comparten un
cierto número de temas problemáticos - Cuál es el status semántico de las reglas por
omisión? Cuál es el conjunto adecuado de reglas
por omisión que se debe tener? - Qué ocurre cuando la evidencia coincide con las
premisas de dos reglas por omisión con
conclusiones en conflicto? - Algunas veces un sistema puede llevar a un
número de conclusiones basándose en una creencia
que es retractada más tarde. Cómo puede el
sistema hacer un seguimiento de qué conclusiones
necesitan ser retractadas? - Cómo las creencias que tienen status por
omisión pueden ser usadas para tomar decisiones?
20Métodos basados en reglas para el razonamiento
con incertidumbre
- Además de la monotonicidad, los sistemas de
razonamiento lógico tienen otras tres propiedades
que los razonadores probabilÃsticos no poseen - Carácter local A ? B podemos concluÃr B dada A
sin preocupar-nos acerca de cualquier otra regla. - Desapego Una vez que se ha encontrado una
prueba lógica para una proposición B, esta puede
ser usada sin importar cómo fue derivada. - Funcionalidad de la verdad En lógica,la verdad
de sentencias com- plejas se puede computar a
partir de la verdad de sus componentes. - Las propiedades antes mencionadas no son
apropiadas para el razonamiento con incertidumbre.
21Métodos basados en reglas para el razonamiento
con incertidumbre (continuación)
Ejemplo funcionalidad de la verdad. Los eventos
H1, H2 y T1 tienen la misma probabilidad 0.5,
entonces un sistema verdad-funcional debe asignar
la misma creencia a la dis-yunción de cualquier
par de ellos. Pero, podemos ver que la
probabilidad de la disyunción depende de los
eventos, y no de sus probabilidades
22TeorÃa Dempster - Shafer
Trata la distinción entre incertidumbre e
ignorancia. En vez de computar la probabilidad de
una proposición, com-puta la probabilidad de que
la evidencia soporte la propo-sición. Una
interpretación de esta teorÃa es que define un
interva-lo de probabilidad en el ejemplo de RN
el intervalo para Cara es 0,1 antes del
testimonio del experto,y 0.45,0.55 después.