Title: Racioc
1Raciocínio Baseado em Casos (CBR)
Plano de aula
- Críticas aos sistemas baseados em regras
- Conceitos fundamentais
- Funcionamento ciclo dos REs
- Aplicações
- Balanço
2Sistemas baseados em regras críticas
- aquisição de conhecimento muito difícil
- regras nem sempre são intuitivas
- desenvolvimento é muito longo
- não aprende
- não é robusto
- tratamento de incerteza complicado
- manutenção e refinamento são delicados
- é lento
- dificuldades com problemas under constraint
- muitas soluções para o mesmo problema
3Soluções atuais
- Aquisição
- sistemas especialistas de 2a geração
- abandono da hipótese da transferência de
conhecimento - aquisição baseada em modelos
- utilização de aprendizagem automática simbólica
- Robustez
- tratamento de incerteza
- Tempo de desenvolvimento
- Ferramentas (shells)
- Aprendizado (on-line)
- EBL, chunking, ... (sem sucesso)
4Soluções atuais Conclusões
- As soluções propostas ainda são insatisfatórias
- Porque, então, não mudar paradigma?
5Compreensão de histórias (Sistema IPP)
- IRA guerrilas ambushed a military patrol in west
Belfast yesterday killing one british soldier and
badly wounding another Army quarters - a suspected IRA gunman killed a 50-year old
unarmed security guard in east Belfast early
today the police said - A gunman shot and killed a part-time policeman at
a soccer match Saturday and escaped through the
crowd...
situação-explicação ou problema solução
6Experiência vivida
- Classificação Os problemas de ouvido deste
paciente são casos típicos de otite média - Soluções compiladas Os sintomas de coração do
paciente X podem ser explicados da mesma maneira
que aquele paciente Y - Avaliando medidas Minha casa é como aquela que
foi vendida mais em baixo nesta rua por
R25.000,00 mas ela tem uma vista melhor - Concepção (design) para projetar este hospital,
vou me basear naquele que já fiz com um número de
leitos parecido, embora tenha de adaptá-lo pois
este é de esquina - Avaliando opções se nós atacássemos as
instalações dos mísseis cubanos/russos, seria
como no caso de Pearl Harbor
7Experiência o que o especialista tem de mais
valioso
- Sistemas Especialistas convencionais
- (alguns) Sistemas Especialistas de segunda
geração
8Experiência o que o especialista tem de mais
valioso
- Case-based reasoning system
- Um método de resolução de problemas onde novos
problemas são resolvidos adaptando-se soluções de
antigos problemas similares - Raciocínio analógico intra-domínio
- aprendizado incremental on-line
- suaviza necessidade de aquisição de conhecimento
Experiência
Experiência
9Raciocínio baseado em casos
- Historicamente
- Wittgenstein (conceituação em extensão)
- Edel Tulving (memória episódica)
- Gentner (analogia), ....
- Roger Schank (scripts)
- Janet Kolodner (memória dinâmica)
- Um caso
- é um episódio vivido
- contém a descrição de problema solução
- exemplos um paciente, um projeto arquitetônico,
uma situação, uma causa jurídica, uma melodia,
etc.
10Find Me http//infolab.cs.uchicago.edu/entree
11Exemplo Valor de Venda de Casas
12Funcionamento do CBR ciclo dos 4 REs
Recuperar
novo caso (alvo)
novo caso (alvo)
Indexar
caso recupe-rado (fonte)
problema
base
Reutilizar
caso aprendido
caso solução
solução sugerida
Reter
caso testado e corrigido
solução final
Revisar
13Desenvolvimento de um sistema CBR
- Qual a natureza e conteúdo dos casos?
- Como representá-los?
- Como indexá-los de maneira a poder encontrá-los
adequadamente e rapidamente mais tarde? - Qual são os critérios para a escolha do melhor
caso e como recuperá-lo? - Como estruturar (organizar) os casos da base?
- Como adaptar o caso recuperado?
14Natureza e conteúdo dos casos
- Pergunta chave
- O que é um caso no domínio abordado?
- Conteúdo
- Mínima descrição do problema e da solução
- Extensões avaliação da solução (falhas, sucesso,
etc.) , contexto (justificação, links com outros
casos, etc.), - Outros
- Tamanho e composição (casos compostos)
- Quantidade de casos
- distribuir bem no espaço de problema
n-dimensional (n atributos)
15Representação dos casos
- Várias linguagens
- de vetores de características
- Atributo-valor (frames, redes semânticas,
objetos, ...) - lógica de primeira ordem
- Depende da natureza do que se quer representar
- Velho problema da expressividade x eficiência
- ex.
- situaçãoDeMediação(c1, disputa) ? protagonistas
(c1, criança11, criança20, criança32) ?
objetoDisputado (c1, chocolate) ? ... - ex.
- objeto disputa
- atributos protagonistas, objetoDisputado
16Indexação
- Objetivo dar ao sistema conhecimento sobre como
estocar e comparar (match) casos - Vocabulário de indexação
- índice atributo, característica, predicado, ...
- Pode ser feita manual ou automaticamente
- Checklist, difference-based, inductive learning,
... - Conselhos
- concreto x abstrato
- levar em conta a utilização que se quer fazer
(propósito) - ex. para um mecânico e para um cliente de
locadora, a descrição de um automóvel é bem
diferente
17Indexação (cont.)
- Interpretação de situação
- os índices realmente relevantes para um
problema/situação em particular - ex. em uma disputa entre crianças a profissão não
conta, enquanto na disputa entre adultos, ela
conta
18Critério para escolha dos casos
- A recuperação é baseada na similaridade entre
caso alvo e casos fontes - Dois tipos de cálculo de similaridade explícito
ou indireto - Medida explícita (mais usado!)
- independente da estratégia de recuperação ou da
organização da memória - k vizinhos mais próximos (knn)
- Medida indireta
- dependente da estratégia de recuperação e/ou da
organização da memória - memória dinâmica (hierárquica)
19k vizinhos mais próximos (knn)
- Observações
- similaridade global 0-1, sem ordem de testes
- mais fácil introduzir conhecimento do domínio
pesos - os pesos podem ser definidos manualmente ou por
métodos automáticos
20Exemplo
Carro 2
Carro 1
Carro 3
ano 1996 modelo Golf marca VW cor
azul Preço 1500
ano 1997 modelo Gol marca VW cor
vermelho Preço 1000
ano 1995 modelo Tempra marca Fiat cor
azul Preço 1300
- Pesos
- ano 2, modelo 3, marca 2, cor 1, preco 1
- Funções primitivas
- ano (diferença ? 2) gt 1 (2 lt dif ? 4) gt 0,5
(dif gt 4) gt 0 - modelo igual gt 1 diferente gt 0
- marca igual gt 1 diferente gt 0
- cor igual gt 1 parecida gt 0,5 diferente gt 0
- preço (dif ? 250) gt 1 (250 lt dif lt 1000) gt
0,5) (dif gt 1000) gt 0
21Organização da memória
- Memória plana
- Implementação lista simples (1 nível de
indexação) - Métodos de recuperação
- Busca serial (custa caro)
- Busca paralela
- Medida de similaridade
- explícita (knn)
- Memória hierárquica
- Implementação
- características compartilhadas
- redes de discriminação
- Métodos de recuperação Medida de similaridade
- implícita (basta percorrer!)
22Características compartilhadas
23Organização da memória
- Trade-offs
- eficiência x completude
- eficiência na inserção x eficiência na consulta
- ordem fixa dos testes pode levar a a recuperação
do caso que não é o mais similar - plausibilidade x facilidade de introduzir
conhecimento - Organizações alternativas de memória
- template trees, z-trees, ...
24Similaridade e recuperação
- O casamento é parcial !!!! gtMais robustez
- Etapas da recuperação
- Matching encontrar os N casos mais similares ao
caso alvo - Ranking Escolher o melhor caso MC em relação o
alvo - Questão a similaridade basta?
- nas tarefas de design (projeto), não basta!
- É preciso adaptation-based retrieval
25Reutilização
- Objetivo compensar as diferenças entre o
problema-alvo e problema-fonte escolhido - Adaptação 3 tipos
- Cópia usada normalmente em classificação
- Adap. Estrutural a partir da própria solução
recuperada - Adap. Derivacional a partir da maneira com que a
solução recuperada foi gerada - Para as duas últimas as operações são
- ajuste de parâmetros, abstração e especialização,
substituição,... - Problema
- depende do domínio,coordenação do conjunto de
operadores de transformação
26Exemplo de reutilização I
- JULIA precisa criar uma refeição italiana (e que
não contenha carne) composta de entrada, massas,
refeição principal e sobremesa - Baseando-se em casos anteriores, JULIA escolhe
lasanha como prato principal. Porém - a refeição original inclui um prato de massas.
Para simplificar, JULIA elimina o prato de
massas - lasanha inclui carne. Devido à restrição do
problema, uma lasanha vegetariana é proposta
27Exemplo de reutilização reinstanciação
- Determine os papéis dos envolvidos no caso
retido - Faça a correspondência dos papéis no problema
proposto - Reinstancie os atributos e relações do caso
retido de acordo com as respectivas
correspondências - Ex. MEDIATOR
- resolução de conflitos como dividir uma laranja
entre duas crianças interessadas? - caso anterior método utilizado por pescadores
- reinstanciação identificação dos papéis de cada
entidade envolvida (pescador ? criança, peixe ?
laranja, objetivo ? divisão)
28Outros Métodos
- Ajuste de parâmetros
- ex. cálculo de novo valor de um imóvel
- Substituição baseado em casos
- encontrar outro caso que sugira uma alternativa
- por que não utilizar logo este caso?
29Revisão e retenção
- Revisão
- 1) Avaliar a solução (automáticamente ou não)
- 2) Consertar o caso
- Retenção
- 1) Extração da informação a reter
- 2) indexação
- 3) inserção do caso na base
30Aplicações estado da arte
- Todas as classes de problemas dos SEs
- diagnóstico, planejamento, scheduling,
interpretação, cozinha, design, seleção,
ensino,.... - Existem ferramentas (shells)
- ReMind, CAsePOint,CASUEL, ART, ReCall,
CBR-Express,... - Exemplos
- Machine Tool Fault Diagnosis
- Computer Network Diagnosis
- Credit Analysis
- Geological Deposit Prediction
- Battle Planning
31Mais aplicações...
- Bank Telex Classification
- Natural Language Understanding
- Network Management
- Legal Reasoning
- Claims Settlement
- Medical Diagnosis
- Weather Prediction
- Fraud Detection
- Industrial Planning and Scheduling
- Residential Domain
- Aircraft Maintenance Domain
- Helpdesk Systems for PC Network Diagnostics
32Algumas aplicações na WEB
- FindMe agents
- sugere filmes e carros em locadoras
- raciocino através de exemplos
- busca não hierárquica
- Buttler agents
- sugere hotéis, restaurantes, oficinas, ...
- Correspondent agents
- usa técnicas de recuperação de casos para
encontrar textos FAQ-finder - Analog Devices
- help desk o sistema responde às dúvidas mais
simples, restringindo a necessidade em contatar
seus engenheiros
33Problemas
- Aquisição descrição dos casos
- nem sempre é trivial além de demandar
conhecimento do domínio! - O controle da medida de similaridade é fraco pois
o matching é parcial - o acúmulo de semelhanças irrelevantes faz com
que certos casos sejam escolhidos em detrimento
dos outros - como ter certeza que as propriedades A e B serão
determinantes na recuperação de um caso que
contém 20 atributos? - A explicação
- pode ser prejudicada quando a recuperação é
baseada em uma medida de similaridade numérica
34Balanço e conclusões
- Apesar das limitações, é bem mais fácil e rápido
desenvolver e manter um sistema CBR. E ele é mais
robusto! - CLAVIER na Lockheed (fornos) - de 60 para 10,
taxa de erro - General dynamics (barcos) - 5 homens-ano x 2
homens-ano. - CANASTA da DEC 8 vezes mais rápido
35Quando usar CBR?
- Existe uma grande volume de dados históricos
- Os especialistas falam sobre seus domínio dando
exemplos - A experiência vale tanto quanto o conhecimento
dos livros texto - Os problemas não são completamente formalizáveis
- fraca compreensão do problema, dificuldade de
verbalização - Existem conhecimento para adaptação de casos
- adequado para tarefas de projeto (design)
- Existem muitas exceções às regras
- É preciso aprender on-line
36Referências básicas
- Aamodt, A Plaza, E. (1994). Case-Based
Reasoning Foundational Issues, Methodological
Variantions, and System Approaches. Em AI
Communications, Vol. 7, nr. 1 - Kolodner, J. (1993) Case Based Reasoning. Morgan
Kaufmann. - Web
- AI-CBR Home Page http//www.ai-cbr.org/theindex.h
tml - CBR archive http//www.ai-cbr.org/cases.html
- CBR in the Web http//wwwagr.informatik.uni-kl.de
/lsa/CBR/CBR-Homepage.html - CBR Bibliography http//www.surveying.salford.ac.
uk/AI-CBR/biblio/search.html