Title: Sin t
1Diagramas de influencia en Elvira II
2ÍNDICE
1.- Diagramas de Influencia 2.- Métodos de
evaluación 3.- Clases disponibles 4.-
Asimetrías 5.- Aproximación
31.- Diagramas de influencia
- Los diagramas de influencia permiten
representar problemas de decisión, - tal y como los percibe el decisor. Permiten tanto
representar la información del problema como
abordar su análisis - Los diagramas de influencia son grafos dirigidos
y acíclicos, con tres tipos de nodos - nodos de azar
- nodos de decisión
- nodos de valor
41. Diagramas de Influencia (II)
Nodos de azar variables aleatorias o eventos
aleatorios influyentes en el
proceso de toma de
decisión. Si el nodo es determinístico, su
valor queda determinado en
función de los valores de sus padres Nodos
de decisión variables bajo control del
decisor Nodos de valor cuantifican las
preferencias de los expertos
51. Diagramas de Influencia (III)
- Los arcos entre nodos representan las relaciones
entre sus variables asociadas, y pueden ser - informativos inciden sobre nodos de decisión.
Información - disponible en el momento de decidir
- condicionales inciden sobre nodos de azar y
sobre el nodo de - utilidad. Representan dependencia
probabilística (o funcional) - entre nodos (y no necesariamente causalidad)
Marginales P(Enf1), P(Enf2), P(Peso), P(Edad)
Condicionadas P(CHmgEnf1, Enf2), P(CBrbCHmg),
P(DañoCBrb, Peso, Edad)
61. Diagramas de Influencia (IV)
Distribuciones P(Coste 1.....) P(Coste
2.....) P(Coste 3.....)
Función Coste total k1(Coste 1) k2(Coste 2)
k3(Coste 3)
Utilidad V1 V2 V3 D1
D2 -------------------------------------------
100 v11 v21 v31 d11 d21 39
v11 v21 v31 d11 d22 ....................
...................................... 45
v1n v2m v3p d1q d2r
71. Diagramas de Influencia (V)
Métodos de evaluación - evaluación
directa (Shachter, Shachter y Peot, Zhang y
Poole, Zhang et al, etc). Idea original Olmsted
(1983) - evaluación indirecta transforman
previamente el DI en alguna otra estructura
árboles de decisión, grafos de de- cisión,
redes bayesianas, ... (Howard y Matheson, Cooper,
Qi y Poole, Qi, etc)
82.- Métodos de evaluación
- Método de inversión de arcos
- Mientras haya antecesores del nodo de valor
- - Eliminar nodo de azar
- (herencia sobre el nodo de valor)
92. Métodos de evaluación (II)
- Eliminar nodo de decisión
Sumidero
102. Métodos de evaluación (III)
- Invertir arco
P(AB, C, D, E, F) P(BC, D, E, F)
P(AC, D) P(BA, E, F)
112. Métodos de evaluación (IV)
- Método de eliminación de variables
- - Determinar orden temporal, en función de los
- arcos informativos
In los nodos que no son antecesores de ningún
nodo de decisión In-1 nodos antecesores de
Dn ...............................................
........ I0 nodos antecesores de D1
122. Métodos de evaluación (V)
Se van seleccionando variables a eliminar
respetando el orden parcial anteriormente
determinado. Cuando se selecciona una
variable X, los potenciales se actualizan
de la siguiente forma
Si X es una variable de azar
132. Métodos de evaluación (VI)
Si X es una variable de decisión
El conjunto final de potenciales, tras la
eliminación de X queda
143.- Clases disponibles en Elvira
A) Clase IDiagram
- Comprobación de características y acceso a
nodos a) hasCycles b) directedLinks c)
pathBetweenDecisions d) onlyOneValueNode e)
numberOfDecisions Métodos f) decisionReadyToRemove
g) firstDecision h) getDecisionList i)
getBarrenNode j) getValueNode k) getNode l)
getProblemSize
Bnet
IDiagram
153. Clases disponibles en Elvira (II)
- Manipulación sobre el DI m)
addNonForgettingArcs n) eliminateRedundancy ñ)
removeBarrenNodes o) addLinks Métodos p)
copy q) qualitativeCopy r) evaluate (mediante
ArcReversal) s) save t) print
163. Clases disponibles en Elvira (III)
B) Clase ArcReversal
- Constructores a)
ArcReversal() b) ArcReversal(IDiagram) -
Comprobación de características y acceso c)
getInitialRelations Métodos d) initialConditions
- Evaluación y manipulación del DI e)
evaluateDiagram f) removeChanceNode g)
removeDecisionNode h) reverseArc i)
modifyUtilityRelation j) modifyUtilityLinks
Propagation
ArcReversal
IDiagram
RelationList
173. Clases disponibles en Elvira (IV)
- Evaluación y manipulación del
DI k) modifyRelations l) modifyLinks
m) getExpectedUtility n) maximizeUtility
ñ) getPosteriorDistributions o)
storeDecisionTable p) giveInstantiationOrder
q) getMarginalsNames r) checkInstantiationO
rder s) variablesInDecisionTables
183. Clases disponibles en Elvira (V)
C) Clase QualitativeArcReversl
- Constructores a)
QualitativeArcReversal(IDiagram) - Acceso
a datos miembro b) getOrderOfElimination Método
s c) getOrderOfInstantiation - Evaluación
y manipulación del DI d) produceOrderOfInstanti
ation e) evaluateDiagram
f) removeChanceNode g) removeDecisionNode h)
reverseArc
Propagation
ArcReversal
QualitativeArcReversal
193. Clases disponibles en Elvira (VI)
D) Clase ARWithPotentialTree
Propagation
- Constructores a)
ARWithPotentialTree(IDiagram) -
Transformación de relaciones Métodos b)
transformInitialRelations Este método
convierte los valores de
utilidades y
probabilidades de PotentialTable a
PotentialTree (con la
posibilidad de
aplicar los métodos de árboles que
permiten aproximar)
ArcReversal
ARWithPotentialTree
203. Clases disponibles en Elvira (VII)
E) Clase VariableElimination Funcionalidad
compartida para redes Bayesianas y diagramas de
influencia
- Métodos relacionados con DI a)
getPosteriorDistributionsID b)
combinePotentialsOfNode c) propagate Incorpor
ación de método nextToRemoveId en la
clase PairTable, que determina la próxima
variable a eliminar. Este método
de evaluación no altera la estructura
del diagrama trabaja con sus potenciales,
sobre una copia de las relaciones.
Propagation
VariableElimination
213. Clases disponibles en Elvira (VIII)
F) Clase VEWithPotentialTree
- Constructores a)
VEWithPotentialTree(Bnet,Evidence) a)
VEWithPotentialTree(Bnet) - Transformación
de relaciones Métodos b) transformInitialRelatio
ns Este método
convierte los valores de utilidades y
probabilidades de
PotentialTable a
PotentialTree (con la posibilidad de
aplicar los métodos de
árboles que permiten
aproximar)
Propagation
VariableElimination
VEWithPotentialTree
224.- Asimetrías
Dado un valor de un nodo X el nodo Y sólo puede
tomar ciertos valores. La restricción
origina una matriz de restricciones MR(X,Y).
Y1 Y2 ....... Yn --------------------------
----------------- X1 1 0 .......
0 X2 1 1 .......
0 ................................................
.......... Xm 0 1 ....... 1
El tratamiento de las restricciones simplifica la
evaluación
234. Asimetrías (II)
- Asimetrías en Elvira
- forma general, de modo que se pueda expresar
- cualquier tipo de relación. Expresiones
lógicas - b) las restricciones, asimetrías, se
convierten en - potenciales que se utilizan en la
evaluación del - DI
- c) al usar árboles se pueden producir podas
244. Asimetrías (III)
Clases para tratar las asimetrías
A) ValuesSet
Permite definir un conjunto de valores para un
nodo (deben estar incluidos en su dominio, aunque
también pudiera ser vacío). El tipo de operación
a realizar se reduce a ver si un valor para la
variable está incluido en este conjunto. Es
decir, dado un valor xi para la variable X, esta
clase permite determinar si Se puede
establecer un flag de negación, de forma que
la comprobación a realizar sería
ValuesSet
Node
Vector
254. Asimetrías (IV)
- Datos miembro
- Node node
- Vector values
- boolean negated
- Métodos
- Constructor (Node, Vector, boolean)
- checkValue (String)
Este es el elemento básico que permite componer
expresiones lógicas, mediante las clases
LogicalNode y LogicalExpression
264. Asimetrías (V)
B) LogicalNode
Datos miembro a) int kind (si el nodo es
operador u operando) b) int operator (clase de
operador AND, OR, NOT, etc) c) boolean
negated d) LogicalNode leftOperand e)
LogicalNode rightOperand f) ValuesSet
valuesSet g) Vector variables h) Vector
index i) boolean result j) int observedValue
LogicalNode
ValuesSet
Vector
LogicalNode (operator)
LogicalNode (operand)
LogicalNode (operand)
274. Asimetrías (VI)
- Métodos
- Constructor (int operator)
- Constructor (ValuesSet values)
- indexVariables
- evaluateConfiguration
La idea es que esta clase permita crear
objetos que representen relaciones lógicas entre
variables, para expresar las relaciones que se
pueden establecer entre las variables del modelo.
Por encima de esta clase está LogicalExpression, q
ue vincula dos relaciones lógicas en el esquema
clásico antecedente ?
consecuente El antecedente y el consecuente son
objetos de la clase LogicalNode
284. Asimetrías (VII)
C) LogicalExpression
Datos miembro a) LogicalNode consecuent b)
LogicalNode antecedent c) int operator d)
Vector index e) PotentialTable result
Potential
LogicalExpression
LogicalExpression (operator)
LogicalNode
LogicalNode (antecedent)
LogicalNode (consecuent)
Vector
PotentialTable
294. Asimetrías (VIII)
- Métodos
- Constructor (LogicalExpression,
LogicalExpression) - Constructor (LogicalNode, LogicalNode, int)
- evaluate
- buildIndex
El resultado es un PotentialTable que contiene
todas las configuraciones válidas según esta
restricción. Del PotentialTable se puede
pasar fácilmente a un PotentialTree, de forma
que se pueda incorporar a la evaluación de DI
mediante árboles. Para mejorar el tratamiento
de las restricciones se debería hacer una poda
del PotentialTree, de forma que se redujera
al máximo su tamaño y la expresión de la
restricción fuera lo más compacta posible.
304. Asimetrías (IX)
Expresión de restricciones
Relation var1 var2 var3 var4
kindconstraint valueslogical-expression
(var1var11,var12
!(var2var21 var3 ! var33)
-gt
var4var41)
también podría ser una doble implicación lt-gt
315.- Aproximación
En problemas complejos, pese a aprovechar todo
el conocimiento del problema, los potenciales
obtenidos pueden ser enormes. En esta
situación se puede aprovechar el uso de
árboles reduciendo el número de hojas mediante
aproximación. La idea consiste en organizar
el árbol, de forma que las variables más
significativas aparezcan cerca de la raíz del
árbol, de forma que si se produce una poda se
pierda la menor información posible.
325. Aproximación (II)
Árboles de probabilidad medida de
significación distancia de Kullback-Leibler Árbo
les de utilidad medida de significación
métrica L2 (raíz cuadrada de las diferencias
al cuadrado entre las utilidades de las
configuraciones en los árboles podado y expandido)
X
Y
X
x1
x2
y1
y2
x1
x2
Y
Y
545
66
675
53
y1
y2
y1
y2
100
35
9
97
335. Aproximación (III)
X
x1
x2
X
x1
x2
Y
Y
675
53
y1
y2
y1
y2
100
35
9
97
Y
y1
y2
545
66
345. Aproximación (IV)
La inclusión de restricciones limita el tamaño
del modelo, al indicar las configuraciones
admitidas y prohibidas. Al aproximar un árbol
hemos de ordenar en significación las variables
que participan en él. Esta información
quizás puede utilizarse como explicación en las
tablas de decisión, indicando qué variables
resultan más significativas para la valoración
del proceso de toma de decisiones.
35(No Transcript)
36(No Transcript)
373. Estructuración del problema (VII)
Alternativas para las decisiones
Asimetrías válidas 12.58 de combinaciones
38(No Transcript)
39(No Transcript)
404.- Adquisición del conocimiento
A) INCERTIDUMBRE Fuentes principalmente
entrevistas con los expertos Metodología
protocolo SRI, procedimiento formal
para la codificación de probabilidades a
partir de entrevistas estructuradas. Objetivo
eliminar las posibles inconsistencias y sesgos en
los juicios de los expertos. Entrevistas
motivación, estructuración, condicionamiento,
asignación, verificación y agregación de
juicios Variables de azar 68
Variables de decisión
5 Probabilidades 13521 parámetros
Utilidades 5400 parámetros
414. Adquisición del conocimiento (II)
Mecanismos usados para simplificar la
asignación 1) Discretización de variables (a
propuesta de los expertos) 2) Modelos de
agregación parcial, mediante variables intermedias
42525 parámetros. Con restricciones 5350. Con
modelo final 700
424. Adquisición del conocimiento (III)
3) Reglas cualitativas. Conocimiento sobre el
problema Ejemplo CEco123 ? CEco12
Parámetros que no hay que asignar
434. Adquisición del conocimiento (IV)
4) Modelos causales. Formas prototipo de
agregación de probabilidades. Puerta-OR
y Puerta-OR graduada (Pearl, 1988 Henrion,
1989 Díez, 1993 Pradhan et al., 1994)
C1
C2
Ck
Condiciones de la OR-graduada a) En ausencia de
causa no hay efecto b) Causas actuando
independientemente c) grado de X es el máximo de
los grados producidos por las causas
actuando de forma independiente
X
C configuración de valores para todas las causas
444. Adquisición del conocimiento (IV)
Probabilidades 13521 parámetros Formas de
obtención - historias clínicas y bibliografía
médica (sólo 3.12 del total) - juicios
subjetivos (96.88) El uso de puertas-OR
supone un notable ahorro. En las
distribuciones en que se usa se
necesitaría la especificación de 9216
parámetros. Con este mecanismo basta
con 163 (el 1.66 del total)
455.- Implementación de IctNeo
PROBLEMAS A) Representación del conocimiento
gramática y compilador B) Evaluación del modelo
espacio de memoria - tiempo b1)
Evaluación cualitativa heurísticas
genético b2) Evaluación cuantitativa
eliminación de redundancia
restricciones instanciación
recursividad SOLUCIÓN C) Arquitectura general
del sistema
465. Implementación de IctNeo (II)
A) Representación del conocimiento gramática y
compilador
Diagrama nombre_diagrama Objeto NodoAzar1
codigo1 tipoVARIABLE discreta_SI valo
res(valor 1, valor 2, ....., valor
n) padres() / Nodo sin padres
/ probs(P(1)0.3, P(2)0.05, .....
P(n)0.24) ..........................
..................................................
...
Objeto Decisión1 codigo70 tipoDECI
SIÓN valores(alternativa1, alternativa2) padr
es(NodoAzar1, NodoAzar2) Objeto
NodoUtilidad codigo71 tipoUTILIDAD di
screta_SI padres(NodoAzar1, NodoAzar2,
Decision1) utilidades(U(1,1,1)100, .....
U(n,m,2)34)
475. Implementación de IctNeo (III)
B) Evaluación del modelo espacio de memoria
necesario para
evaluar el modelo y almacenar los
resultados b1) Evaluación cualitativa
heurísticas genético b2) Evaluación
cuantitativa eliminación de redundancia
restricciones instanciación
recursividad b1) Evaluación cualitativa
Sólo se realizan las operaciones de
modificación de la estructura del DI
(no se actualizan probabilidades ni
utilidades). Escaso coste computacional. Permite
validar el modelo y estudiar las secuencias
de borrado.
485. Implementación de IctNeo (IV)
Orden de borrado afecta al coste computacional
de la evaluación. Problema NP-completo.
Heurísticas Kong, 1986 Ezawa, 1986, etc. No
dan resultados aceptables en problemas de gran
tamaño o son de difícil aplicación. Alternativas
intento de búsqueda exhaustiva y algoritmo
genético
495. Implementación de IctNeo (V)
- Algoritmo genético evidencia empírica sobre
obtención de soluciones - aceptables en tiempos razonables (Mitchell, 1998)
- Individuo cada secuencia de operaciones para
evaluar el DI - Operadores específicos de cruce y mutación
- Dependencias entre los nodos.
- Individuos que implican evaluación
con menor coste - computacional tienen más probabilidad de
propagar sus genes - Mejora la solución aportada por las
heurísticas y permite obtener - secuencias válidas para problemas de gran tamaño
505. Implementación de IctNeo (VI)
b2) Evaluación cuantitativa Realiza
cambios estructurales y cuantitativos,
actualizando valores de probabilidades y
utilidades. Gran coste computacional. Como
resultado proporciona las políticas óptimas
a) Eliminación de redundancia (Fagiuoli y
Zaffalon, 1998)
Dk
515. Implementación de IctNeo (VII)
b) Restricciones Dado un valor de un nodo X el
nodo Y sólo puede tomar ciertos valores. La
restricción origina una matriz de
restricciones MR(X,Y).
Y1 Y2 ....... Yn --------------------------
----------------- X1 1 0 .......
0 X2 1 1 .......
0 ................................................
.......... Xm 0 1 ....... 1
Restricciones , -, La existencia de
restricciones simplifica la evaluación
525. Implementación de IctNeo (IIX)
c) Instanciación Reducir el tamaño del problema
reduciendo la incertidumbre (Ezawa, 1998)
B
B
A
A
X x1
X x1
G
G
E
E
F
F
P(EX)
Incorporación de evidencia sobre X (X x1)
Descomposición del problema original en
subproblemas
535. Implementación de IctNeo (IX)
e) Recursividad tiempo de cálculo por espacio de
almacenamiento
- DTer, DHBRb ? fu(Dter,DHBrb) () - DTer ?
P(DTerDTer1,DTer2) - DTer1, DTer2, DHBRb ?
fu(DTer1,DTer2,DHBrb) (-) - DTer 1 ?
P(DTer1Terapia1) - DTer2, DHBrb, Terapia1 ?
fu(DTer2, DHBrb, Terapia1) (-) DHBrb ? P(DHBrb
DHBrb1, DHBrb2) - DTer2, DHBrb1, DHBrb2,
Terapia1 ?
fu(DTer2, DHBrb1, DHBrb2, Terapia1) (-) DHBrb1
? P(DHBrb1 CBrb1, EH1) -DTer2, DHBrb2,
Terapia1, CBrb1, EH1 ?
fu(DTer2, DHBrb2, Terapia1, CBrb1, EH1) (-)
DHBrb2 ? P(DHBrb2 CBrb2, EH2)
Operación a realizar
545. Implementación de IctNeo (X)
C) Arquitectura general del sistema
Compilador
Interfaz de usuario sistema de consulta y
explicación
Ayuda de IctNeo
Nombre
CHgb1
Fichero de sintaxis
Código Objeto
Base de conocimiento
Edad
CHgb2
Peso
CHgb3
.............................
.............................
Historias clínicas
Datos clínicos considerados
Criterios de explicación
Evaluador
Evaluación cuantitativa restricciones, recursivid
ad, instanciación, KBM2L
Eliminación de redundancia
Evaluación cualitativa genético
Solución con mínimo requerimiento de espacio de
memoria
556.- Resultados
Tablas de decisión de enorme tamaño orden de
1017 valores para la mayor de ellas. Condición
de no olvido alternativa LIMIDS (condición
rechazada en el caso médico) Para poder evaluar
se necesitan todas las técnicas vistas -
búsqueda orden de borrado - eliminación de
redundancia - restricciones -
recursividad - instanciación
integración con KBM2L
566. Resultados (II)
Instanciación selección de variables a
instanciar. 18 representando los datos
administrativos que siempre van a estar
disponibles. Con sus dominios, representa
resolver 42.467.328 modelos simplificados.
Simplificación raza de la madre, niños nacidos
a término, test exactos
Al final se necesitan resolver 165.888
instancias. Las tablas generadas en cada
evaluación contienen 3,13107 valores. Tiempo
total de computación (usando 4 máquinas) 5000
horas Tablas resumidas mediante KBM2L
permiten evaluar el problema completo de forma
incremental, ahorra espacio de almacenamiento y
sirve como forma de explicación.
576. Resultados (III)
a) Situación clara de no ingreso. -
Concentraciones (nivel no patológico) b)
Situación dudosa de ingreso. -
Concentraciones valores algo elevados -
Buen estado del paciente tests Coombs
negativos, buen valor test de Apgar, no
asfixia perinatal - Coste social, coste
emocional, riesgo ingreso c) Ingreso
observación - Concentraciones (niveles
patológicos) - Coloración amarillenta
apreciable - Buen estado del paciente d)
Ingreso fototerapia - Concentraciones
- mal estado del paciente - presencia de
isoinmunización
Ejemplo de perfil
586. Resultados (IV)
596. Resultados (V)
Validación durante la construcción del modelo y
con un modelo estable ya disponible. -
Construcción del modelo evaluación
cualitativa - Modelo estable análisis de
sensibilidad
Diagramas tornado
EVPI sobre diagrama reducido - simulación
Montecarlo variando valores de los
parámetros considerados (de acuerdo a
ciertas distribuciones) - elevado coste
computacional - considera cambios en
utilidades esperadas y políticas
Conclusiones gran interrelación entre parámetros
considerados. Confirmar la presencia o ausencia
de variables con listas KBM2L (pirámide)
607.- Conclusiones y líneas futuras
A) CONCLUSIONES - Desarrollo de SAD algo muy
complejo - Necesidad de aprovechar todo el
conocimiento - Gran esfuerzo para
modelizar las preferencias y creencias
pero muy útil - Aplicabilidad
real de DI y técnicas del AD en problemas
complejos - Evaluación muy costosa tiempo
y espacio - Desarrollo de herramientas útiles y
reutilizables - Resultados validados
mediante perfiles de tratamiento - Variables
relevantes más allá de las inicialmente usadas
617. Conclusiones y líneas futuras (II)
B) LÍNEAS FUTURAS - Uso de imprecisión en
probabilidades - Adaptabilidad de las
preferencias - Mejorar mecanismos de búsqueda de
secuencias de borrado - Posible manejo de
potenciales para facilitar la evaluación -
Aproximación de matrices dispersas - Evaluación
mediante técnicas de simulación - Mecanismo de
explicación - Mecanismo de aprendizaje -
Arquitectura paralela de evaluación