Aproximaci - PowerPoint PPT Presentation

About This Presentation
Title:

Aproximaci

Description:

... una confianza C. Entonces podemos 'rellenar' ese valor con e2 con una confianza C. ... Asignar a ese valor el CF obtenido seg n el modelo. ... – PowerPoint PPT presentation

Number of Views:50
Avg rating:3.0/5.0
Slides: 16
Provided by: Wal60
Category:
Tags: aproximaci | ese

less

Transcript and Presenter's Notes

Title: Aproximaci


1
Aproximación de Missing Values utilizando Mycin y
Reglas de asociación
  • Rafael Morales Bueno
  • Jorge Wallace Ruiz

2
Introducción
  • Tratamiento actual de los Missing Values
  • Técnicas de clasificación
  • Eliminación del conjunto de datos
  • Reglas de Asociación
  • Solución Natural a este problema
  • Modelos simples

3
Reglas de Asociación
  • Supongamos que tenemos un valor desconocido
    perteneciente al dominio D1 y existe una regla de
    asociación tal que e1 ? D2 ? e2 ? D1 con una
    confianza C. Entonces podemos rellenar ese
    valor con e2 con una confianza C.
  • Mecanismo simple, efectivo y natural.
  • Problemas
  • Conjunción y disyunción de reglas de asociación
  • Tiende a reducir la entropía natural del conjunto
    de datos

4
Mycin
  • Desarrollado entre 1972 y 1980 en la Universidad
    de Stanford.
  • Sistema interactivo experto que ayudaba a los
    físicos en la selección de un apropiada terapia
    antimicrobiana para los pacientes de los
    hospitales.
  • Velocidad, accesibidad y facilidad de uso.
  • Basado en Factores de Certeza (CF)

5
Reglas en Mycin
  • Factores de Certeza (CF) asociados a reglas y a
    hechos
  • Si a ? b donde
  • a puede ser un hecho simple o un hecho compuesto
    b?c, a?b,
  • Rango de los CF ? -1 , 1 donde
  • CF gt 0 indica Confianza
  • CF 0 indica ignorancia
  • CF lt 0 Confianza en lo contrario del hecho

6
Fórmulas para el cálculo de los CF
  • Modus Ponens Incierto
  • E ? H
  • E_____
  • H
  • CF(R1) f(CF(E), CF(R1))

Ejemplo Donde CF (tos) 0.9 CF (gripe) 0.9
0.6 0.54
7
Fórmulas para el cálculo de CF (II)
  • Combinación de evidencia
  • E1 ? H
  • E2 ? H
  • CF(R1,R2) f(CFR1(H),CFR2(H))

Ejemplo Donde CF (tos) 0.6
CF (gripe) 0.9 CF R1,R2 0.81 0.48 0.480.81
8
Fórmulas para el cálculo de CF (III)
  • Antecedentes Compuestos
  • E1?E2 CF(E1?E2) min (CF(E1),CF(E2))
  • E1? E2 CF(E1?E2) max (CF(E1),CF(E2))
  • ?E CF(?E) - CF(E)

9
Mycin y Reglas de Asociación
  • Traducción automática modelo CF ? Reglas de
    asociación
  • Factor de Certeza en Reglas
  • Coincide con el valor de confianza de la regla de
    asociación
  • Posible inclusión del soporte como parte de la
    función f
  • Confianza en hechos
  • CF 1 para aquellos valores no desconocidos
  • Desconfianza en ciertos datos

10
Mycin y Reglas de Asociación (II)
  • Algoritmo
  • Escoger entre las reglas de asociación iniciales
    aquellas en las cuales en el consecuente aparezca
    un valor perteneciente al dominio del missing
    value.
  • Aplicar el modelo Mycin y escoger el valor
    perteneciente al dominio con mayor CF.
  • Asignar a ese valor el CF obtenido según el
    modelo.
  • Continuar con el siguiente missing value de la
    tupla.

11
Optimizaciones
  • Verificación de hipótesis
  • Si existe una regla de asociación tal que e1 ?
    D2 ? e2 ? D1 y a su vez e2 ? D1 ? ei ? Di
    (siendo ei un valor NO desconocido) entonces
    podemos ponderar el acierto o fallo en esta
    predicción.
  • Vuelta atrás
  • Es posible en algunos casos volver a clasificar
    missing values ya establecidos si encontramos
    otro valor con mayor CF a otro nivel.

12
Ventajas
  • Rapidez
  • Simplicidad
  • Modelo más que probado
  • Razonamiento Natural

13
Inconvenientes
  • Modelo Mycin no está bien construido
  • Tratamiento de la disyunción
  • No considera correlaciones entre proposiciones
  • Obtención del conjunto de reglas de asociación

14
Bibliografía
  • Davis, R.,Buchanan, B.G. and Shortliffe,E.H.,
    "Production Systems as a Representation for a
    Knowledge-based Consultation program", Artificial
    Intelligence, 8, (1), pp. 15-45, 1977.
  • Rule-Based Expert Sytem The MYCIN Experiment at
    the Stanford Heuristic Programming Project
  • Pete Chapman (NCR), Julian Clinton (SPSS), Randy
    Kerber (NCR),Thomas Khabaza (SPSS), Thomas
    Reinartz (DaimlerChrysler),Colin Shearer (SPSS)
    and Rüdiger Wirth (DaimlerChrysler) - CRISP-DM
    1.0
  • Fast Algorithms for Mining Association Rules
    (1994) Rakesh Agrawal, Ramakrishnan Srikant Proc.
    20th Int. Conf. Very Large Data Bases, VLDB

15
Esquemas
Write a Comment
User Comments (0)
About PowerShow.com