Introdu

About This Presentation

Title:

Introdu

Description:

Introdu o An lise de Agrupamentos (Abordagem Num rica e Conceptual) Prof. Francisco de A. T. de Carvalho fatc_at_cin.ufpe.br – PowerPoint PPT presentation

Number of Views:90

Avg rating:3.0/5.0

Slides: 65

Provided by: IBMAP5

Category:

more less

Transcript and Presenter's Notes

Title: Introdu

1
Introdução à Análise de Agrupamentos(Abordagem
Numérica e Conceptual)

Prof. Francisco de A. T. de Carvalho
fatc_at_cin.ufpe.br

2
Agrupamento (Clustering)

Métodos usados para a construção de grupos de
objetos com base nas semelhanças e diferenças
entre os mesmos de tal maneira que os grupos
obtidos são os mais homogêneos e bem separados
possíveis.
Duas grandes classes de problemas em
classificação classificação supervisionada ?
classificação supervisionada
A classificação não supervisionada se propõe a
encontrar classes
homogêneas a partir de um conjunto de indivíduos
Objetivo os indivíduos semelhantes devem
pertencer a mesma
classe
É um objetivo intuitivo mas não é uma definição
precisa da
noção de classe

3
Agrupamento (Clustering)

Agrupar para que?
Existe classes naturais e o desafio é
encontra-las
Deseja-se construir as classes segundo
estruturas classificatórias (impostas)
Encontrar classes úteis para o usuário
Simplificação dos dados
Geração de Hipóteses
Predição com base nos grupos formados
O que é um grupo? Não existe uma única definição
satisfatória
Coesão interna
Isolamento externo

4
(a)
(b)
(c)
(d)

a) Grupos coesos e isolados
b) Grupos isolados mas não coesos
c) Grupos coesos com vários pontos intermediários
d) Não existência de grupos naturais

5
Principais Etapas da Formação de Agrupamentos

a) aquisição dos dados
1) Seleção das observações (indivíduos, objetos,
casos, itens)
2) Seleção das variáveis (caracteres,
descritores) e das correspondentes escalas
3) Construção da Tabela de Dados
b) Pré-processamento dos dados
1) Mudança de escala
2) Normalização
3) Extração de caracteres
c) Construção da Tabela de Dados
d) Cálculo da Proximidade
1) Escolha de um Índice de Proximidade
2) Construção da Matriz de Proximidades
e) Seleção de um Algoritmo de Formação de Grupos
em
função do tipo de agrupamento desejado
f) Análise e Interpretação dos Resultados

Indivíduo
? conjunto das indivíduos (população, amostra)
?? ? indivíduo (especimen) ou grupo de
indivíduos
(espécie)
Variáveis
A cada característica (escolhida pelo usuário ou
por um especialista), pode-se associar uma ou
mais variáveis
Di Domínio da variável yi

7
As variáveis podem ser quantitativas contínuas
(ex, Peso, Altura) discretas (ex, numero de
antenas, número de filhos) qualitativas (ex,
sexo, grau de instrução) binárias (ex, presença
de asas) com escala nominal (ex, sexo
(masculino, feminino)), ordinal (ex, Grau de
instruçãoprimário, segundário,
superior) intervalar (ex, grau
celsius) proporcional (ex, grau kelvin, idade)
8
Representação do Conhecimento (lista de pares
atributo-valor) Y Y1, , Yp Conjunto de
variáveis (descritores, atributos, ) D D1,
, Dp Conjunto dos domínios das variáveis ?
?1, , ?p Conjunto das OTUs (indivíduos,
casos, objetos, observações)
9
Espaço de descrição
elemento de ?
valor em D
Yj
Y

Yp

Y1
W
D
10
Tabela de Dados
N objetos ou individuos ??1,, ?i ,, ?N
Y1 Yj Yp
w1

wi

wN
p descritores YY1,, Yj,, Yp
A cada objeto ?i de ? é associado um vetor de
descrição
representando as p medidas
A cada variável ou parametro Yj é associado um
vetor
Que representa o conjunto de valores observados
de ? sobre Yj
11
Tipos de Tabelas quantitativas qualitativas binár
ias heterogêneas Exemplo
12

Índices de Proximidade
Similaridade
Dissimilaridade
Índice de Similaridade
É uma função
tal que
Quanto mais próximo dois indivíduos mais elevado
é o valor da medida
de similaridade entre eles

13
Índice de Dissimilaridade É uma função tal
que Quanto mais próximos dois
indivíduos menor é o valor da medida
de dissimilaridade entre eles
14
Exemplos de Índices de Proximidade a) Tabelas de
variáveis quantitativas
b) Tabelas de variáveis binárias
15

Outros aspectos relativos aos índices de
proximidade
Escala das Variáveis
Correlação entre as Variáveis
Descrições heterogêneas (Variáveis de diferentes
tipos)
Índices de proximidade entre padrões descritos
por strings ou árvores
Índices de proximidade dependentes do contexto
Índices de proximidade conceptual

16
Estruturas classificatórias
Partição
Cobertura
17
Estruturas Classificatórias
Piramide
Hierarquia
18
Métodos de AgrupamentoEm Taxinomia Numérica
distingue-se três grupos de métodosTécnicas de
OtimizaçãoObjetivo obter uma partição. Número
de grupos fornecido pelo usuárioTécnicas
hierárquicasObjetivo obter uma hierarquia (ou
uma pirâmide) Pode-se obter uma partição
cortando-se a hierarquia em um determinado
nível.Técnicas de CoberturaObjetivo obter
grupos que eventualmente podem partilhar
indivíduos.
19
Outros Aspectos Relativos aos Métodos de
AgrupamentoMétodos Aglomerativos versus Métodos
DivisivosMétodos Monotéticos versus Métodos
PoliteticosAgrupamento Hard versus Agrupamento
FuzzyMétodos Incrementais versus Métodos não
IncrementaisMétodos Paramétricos versus Métodos
não ParamétricosMétodos Geométricos versus
Métodos não Geométricos
20
Classificação Hierarquica
Diagrama de Venn sobre os dados bi-dimensionais
Dendograma
21
Métodos Hierárquicos
Parte-se de uma tabela de dados e calcula-se uma
distância entre os individuos de ?
Os métodos ascendentes hierárquicos tem por
objetivo a construção de uma sequencia de
partições encaixadas chamada hierarquia. A
representação gráfica dessas hierarquias é
realisada por uma arvore hierarquica ou
dendrograma.
22
Hierarquia com índice
Hierarquia com indice (H,f)
Hierarquia H
23
Índices de agregação entre as classes
ligação minima
ligação maxima
Aumentação da inercia ou indice de WARD
gA é o centro de gravidade da classe A m
corresponde a ponderação das classes
24
Relação entre f e D
f é um indice sobre a hierarquia H, D é um
indice de agregação entre classes
Para os indices D usuais (H,f) é uma hierarquia
com indice (não há inversão)
Senão, pode-se utilisar
Nesse caso (H,f) é sempre uma hierarquia com
indice
25
Técnicas de Hierárquicas Algoritmo Geral de
Agrupamento Hierárquico AglomerativoPasso 1
Iniciar o agrupamento formado por grupos
unitáriosPasso 2 Encontre, no agrupamento
corrente, o par de grupos de dissimilaridade
mínimaPasso 3 Construa um novo grupo pela
fusão desse par de grupos de dissimilaridade
mínimaPasso 4 Atualize a matriz de
dissimilaridades suprima as linhas e as colunas
correspondentes aos grupos fusionados e adicione
uma linha e uma coluna correspondente as
dissimilaridades entre o novo grupo e os grupos
antigosPasso 5 Se todos os objetos estão
grupados, pare senão vá para o passo 2
26
Exemplo E01(SonoPouco,TCarro,ConicSim,Alcool
Não,SairNão,FomeSim) E02(SonoPouco,TCarona,
ConicNão,AlcoolNão,SairSim,FomeSim)
E03(SonoSim,TCarro,ConicNão,AlcoolSim,SairS
im,FomeNão) E04(SonoSim,TOutros,ConicSim,Alc
oolSim,SairSim,FomeNão) Passo 1
C1E01, C2E02, C3E03, C4E04Passo 2
dmin 2 ? C5 C3 ? C4 E03,E04 Passo 3
27
Exemplo (CONT.)Passo 4 dmin 3 ? C6 C1 ? C2
E01,E02 Passo5 Passo 6 dmin 4 ? C7
C5 ? C6 E01,E02,E03,E04
C07
C6
C5
E04
E03
E02
E01
28
Métodos de Partição
A estrutura classificatória deseja é a partição.
Definindo-se uma função de homogeneidade ou um
critério de qualidade sobre uma partição, o
problema de classificação torna-se um problema
perfeitamente definido em otimização
discreta. Encontrar, entre o conjunto de todas as
partições possíveis, uma partição que otimize um
critério definido à priori. ? é finito e,
portanto, existe um conjunto finito de partições.
Esse problema é sempre soluvel por enumeração
completa. Na pratica isso é irrealisável pois
temos, com um conjunto de N objetos em K classes,
aproximadamente soluções possiveis.
29
Problema de Otimização
Seja um critério U, definido de
, onde é o conjunto de todas as partições
em K classes não vazias ?. O problema de
otimização se exprime sob a forma
30
Otimização iterativa
Parte-se de uma solução realizável
Escolha
Na etapa t1, tem-se uma solução realizável
procura-se uma solução realizável
Escolha
que verifica
O algoritmo para assim que
31
Algoritmo de vizinhança

Uma das estattégias mais utilisadas para contruir
a função g é
associar a toda solução realzável Q um conjunto
finito de soluções realisáveis V(Q), chamada
vizinhança de Q,
Depois selecionar a solução ótima segundo esse
critério U nessa vizinhança (solução localmente
ótima).

Por exemplo pode-se tomar como vizinhança de Q
todas as partições obtidas a partir da partição Q
mudando um só indivíduo de classe
Dois exemplos bem conhecidos desse tipo de
algoritmo são o algoritmo das transferências e o
algoritmo k-means
32
Algoritmo das transferências
O critério U associado à partição Q é a soma das
inércias de cada uma das classes, isto é, a
inércia intra-classes
d é a distância euclidiana, nj representa o
numero de elementos e wj é o centro de gravidade
da classe Qj.
Se o indivíduo ei é afetado em uma classe Ql,
diferente da sua classe de afetação atual tem-se
33
Algoritmo
(a) Initialisação No início, tem-se uma partição
Q. O número de elementos nj e o centro de
gravidade wj são calculados para cada uma das
classes.
(b) Etapa Iterativa test?0 Para todo i
de 1 à N faça a classe de i é s determinar l
tal que
test?1
(c) Se test ? 0 então vá para (b)
34
Algoritmo k-means
Com um algoritmo de vizinhança, não é necessário,
para obter a diminuição do critério, de tomar
sistematicamente a melhor solução, basta tomar
nessa vizinhança uma solução melhor do que a
solução em curso. No algoritmo k-means a etapa
(b) torna-se
A diminuição do criterio U da inércia
intra-classe está assegurada graças ao teorema de
Huygens
É impossivel demonstrar que uma das estratégias
fornece sistematicamente uma melhor solução.
35
Afetação de um novo indivíduo
Uma função de afetação f de D em C1,..,Kdefine
uma partição do
espaço de representação com
Na convergência desses algoritmos, a função f é
construida da seguinte maneira
36
Algoritmos que possuem duas etapas de optimisação

A primeira etapa é a etapa de représentation, ela
consiste em definir um representante ou prototipo
para cada uma das classes.
A segunda etapa é a etapa de afetação, ela
modifica a classe de fetação de cada um dos
indivíduos.

Obsevações
A atualisação será realizada após a apresentação
de todos os indivíduos de ?. A ordem de
apresentação dos indivíduos não tem mais nenhuma
influência sobre os resultados.
37
Algoritmo dos centros móveis
(a) initialisação No início tem-se uma partição Q
ou um subconjunto de K elementos de ?. (b)
Etapa de afetação test?0 Para todo i de 1 a N
faça determinar l tal que
test?1
(c) Etapa de representação Para todo j de 1 a
K faça calcular o centro de gravidade e o
efetivo da nova classe Qj (d) se test ? 0 vá para
(b)
38
Exemploy1 1.0 1.5 3.0 5.0 3.5 4.5 3.5y2 1.0 2.0
4.0 7.0 5.0 5.0 4.5 Passo 1 k 2 e
G11,2,3 e G24,5,6,7Passo2 g1 (1.83,
2.33) e g2 (4.13, 5.38)Passo3d(wi,g1) 1.57
0.47 2.04 5.64 3.15 3.78 2.74d(wi,g2) 5.38 4.28 1
.78 1.83 0.74 0.53 1.08Grupo G1 G1 G2 G2 G2 G2 G2
Passo 4 G11,2 e G2 3,4,5,6,7 Houve
modificação dos grupos? Sim. Vá para o passo
2Etc.
39
Métodos ParamétricosAbordagem
probabilistaOs dados D são uma mistura de k
distribuições normais uni-variadas de mesma
variância ?2Cada observação é descrita pelo
vetor (xi, zi1, , zik), ondea) xi é o valor da
i-ésima observação b) zij 1 se a observação é
proveniente do j-ésimo grupo e zij 0,
senãoDiz-se também que xi é a variável
observada e zi1, , zik são as variáveis
ocultasTrata-se de estimar (aprender) as médias
de cada uma das k distribuições normais a)
encontrar a hipótese h lt ?1,, ?k gt que
maximiza a verossimilhança dessa médias, isto é,
encontrar a hipótese h lt ?1 ?k gt que maximiza
p(D/h)
40
Métodos ParamétricosO Algoritmo EM
(Expectation, Maximisation)Inicialização h lt
?1,, ?k gt, onde ?1,, ?k são valores iniciais
arbitráriosEtapa 1 Calcular o valor esperado
Ezij de cada variável oculta zij, supondo
verdadeira a hipótese atual h lt ?1,, ?k
gtEzij é a probabilidade de que a observação xi
tenha sido gerada pela j-ésima distribuição
normal
41
O Algoritmo EM (Expectation, Maximisation)Etapa
2 Calcular a nova hipótese h lt ?1,, ?k gt
de máxima verossimilhança, supondo que os valores
de cada variável oculta zij é o seu valor
esperado Ezij calculado no Passo 1. Substituir
a hipótese h lt ?1,, ?k gt pela hipótese h lt
?1,, ?k gt e recomeçar. Nesse caso, a
hipótese de máxima verossimilhança é dada
porEsse algoritmo converge para uma
hipótese h que representa um máximo de
verossimilhança local
42
Agrupamento ConceptualUm grupo pode ser
descrito em extensão (enumeração dos seus
membros) ou em compreensão (conjunto de
propriedades que definem a pertinência de um
elemento à um grupo)Agrupamento não conceptual
fornece apenas descrição em extensão de cada
grupo. a obtenção dos grupos leva em conta
apenas as descrições dos indivíduos.Agrupamen
to conceptual fornece também a descrição em
compreensão (intencional) de cada
grupo. formação dos grupos levam em consideração
também a qualidade da descrição em compreensão
de cada grupo
43
Agrupamento Conceitual funciona em 2
fasesagregação encontrar grupos de um
conjunto de indivíduos segundo uma estrutura
considerada e um ou mais critérios
fixadoscaracterização determinar uma descrição
(conceito) de cada um dos grupos obtidos na fase
de agregaçãoEm aprendizagem de máquina
caracterização aprendizagem à partir de
exemplos As 2 fases podem ser simultâneas s
eqüenciais (na maioria dos casos)
44
Geração de k Agrupamentosem competição
Iniciar com ? (Conjunto de Individuos)
Agrupamento 1

Agrupamento k
C11, , C1m1
Ck1, , Ckmk
Iniciar com um Agrupamento
Geração de descrições conceituais em competição
par o Agrupamento

D1(C1), ... D1(C1m1) ... Dn(C1), ... Dn(C1m1)
45
Tipos de abordagens em Agrupamento Conceitual3
dimensõesEstrutura do espaço de
observação partição, hierarquia,
coberturaAlgoritmo incremental (Formação de
Conceitos) ou batch (Descoberta de
Conceitos)Linguagem de descrição (representação
do conhecimento) Lógica de Atributos (ordem
0) Lógica de Predicados de 1a Ordem Lógica de
predicados de 2a Ordem
46

Caracterização (descrição) dos grupos em lógica 0
Seja ? um conjunto de observações descritas por p
atributos (variáveis) y1, , yp cujos domínios
são D1, , Dp.
Um objeto simbólico a y1 ? A1 ? ? y1 ?
Ap, onde Ai ? Di, ?i ? 1, , p, expressa a
condição
atributo y1 toma seus valores em A1 e e
atributo yp toma os seus valores em Ap
Pode-se associar a a uma função fa ??1, 0 tal
que
fa(?) 1 ? yi (?) ?Ai, ?i ? 1, , p, ? ??
A extensão de a é definida como ext ?(a) ? ??
/ fa(?)1

Exemplo

variáveis
Domínios
azul, vermelho, verde
Cor
Tamanho
grande, médio, pequeno
Forma
esfera, bloco, triângulo
Considere o seguinte objeto simbólico a Cor ?
az,vm ?Tam ?g ?Forma ?e,b a é uma
generalização de qualquer conjunto de objetos
cuja cor é azul ou vermelho, cujo tamanho é
grande e cuja forma é esfera ou bloco
48

? ?? esta na extensão de a (é membro de a)se
fa(?)1
isto é, se sua cor é azul ou vermelha, seu
tamanho é grande e sua forma é esfera ou bloco
Dizemos que um objeto simbólico a é uma
generalização de um conjunto de indivíduos ? se
?? ??, fa(?)1
Sejam dois objetos simbólicos a ?i yi ? Ai e
b ?i yi ? Bi.
Diz-se que b lt a se Bi ?? Ai ?i. Nesse caso
diz-se que a é mais geral do que b e b é menos
geral do que a
Diz-se que um objeto simbólico a é maximamente
especifico de um conjunto de indivíduos ? se
a é uma generalização de ? e não existe um outro
objeto simbólico b generalização de ? tal que b lt
a

Sejam os individuos
?1 Cor ? az ?Tam ?g ?Forma ?e
?2 Cor ? az ?Tam ?m ?Forma ?e
?3 Cor ? az ?Tam ?p ?Forma ?b
Três possíveis generalizações desses conjuntos
por um objeto simbólico
a Cor ? az ?Tam ?g,m,p ?Forma ?e,b
b Cor ? az ?Tam ?g,m,p ?Forma
?e,b,t
c Cor ? az,vm,vd ?Tam ?g,m,p ?Forma
?e,b,t
c é mais geral do que b que é mais geral do que a
a é maximamente especifico do conjunto de
indivíduos acima.

Um objeto simbólico a é uma descrição
discriminante de um conjunto ?1 de indivíduos em
relação à um outro conjunto ?2 de indivíduos se
a é uma generalização de ?1 e não existe ? ??2
tal que fa(?)1
Um objeto simbólico a é uma descrição maximamente
discriminante de um conjunto ?1 de indivíduos em
relação à um outro conjunto ?2 de indivíduos se
a é uma descrição discriminante de ?1 em relação
à ?2 e não existe um outro objeto b i) que seja
uma descrição discriminante de ?1 em relação à ?2
e ii) que seja mais geral do que a (b gt a)

Exemplo
Grupo 1 (G1)
?1 Cor ? az ?Tam ?l ?Forma ?e
Grupo 2 (G2)
?1 Cor ? vm ?Tam ?l ?Forma ?b
?1 Cor ? vm ?Tam ?l ?Forma ?t
Descrições maximamente discriminantes de G1 em
relação à G2
a Cor ? az,vd ?Tam ? l,m,p ?Forma ?
e,b,t
b Cor ? az,vm,vd ?Tam ?l,m,p ?Forma ?
e
Descrições maximamente discriminantes de G2 em
relação à G1
c Cor ? vm,vd ?Tam ? l,m,p ?Forma ?
e,b,t
d Cor ? az,vm,vd ?Tam ? l,m,p ?Forma ?
b,t

Atribuição de descrições maximamente
discriminantes aos Grupos 1 e 2

Grupo1
Grupo 2
Descrições disjuntas
b ?Forma ?e
d ?Forma ?b,t
Descrições não disjuntas
a Cor ? az,vd ?
c Cor ? vm,vd ?
a Cor ? az,vd ?
d ?Forma ?b,t
b ?Forma ?e
c Cor ? vm,vd ?
Em geral conjuntos disjuntos da mesma variável
implicarão em descrições maximamente
discriminantes de um grupo em relação à outros
grupos
53
Algoritmo CLUSTER/2

Descoberta de Conceitos (em batch)
Dois módulos
Partição
Hieraráquico
Exemplo

54
Módulo partição

Formando Agrupamentos inicias

Semente 1
???
Semente 2
Semente k
Encontrar descrições maximamente discriminantes
???
D11
D12
D21
D1n1
D21
D2n2

???
Atribuir os objetos à cada descrição Dij obtendo
as classes Cij

C12
C1n1
C21

C11
C21
C2n2
55

seleção de k(2) sementes aleatoriamente

encontrar descrições maximamente discriminantes
de cada um dos k (2) grupos à partir das sementes
Semente 1
Semente 2
a1Cobertura do Corpopelos, penas, pele
úmida??
b1Cobertura do Corpopenas, pele seca, pele
úmida??
a2?? Cavidades do Coração 3, 4??
b2?? Cavidades do Coração 3, 4
imperfeitas??
b3?? Temperatura do Corpo não regulada??
a3?? Temperatura do Corpo regulada??
56

Atribuição dos objetos à cada descrição Dij
obtendo as classes Cij

Semente 1
Semente 2
a2?? Cavidades do Coração 3, 4??
b2?? Cavidades do Coração 3, 4
imperfeitas??
G1Ext(a2)Mamífero, Pássaro, Anfíbio-1,
Anfíbio-2
G2Ext(a2)Réptil, Anfíbio-1, Anfíbio-2
Obtendo descrições dos grupos Tornando os grupos
disjuntos
G2
G1
Lista de exceções
Anfíbio-1, Anfíbio-2
G1Mamífero, Pássaro
G2Réptil
57

Obtendo descrições maximamente específicas de
cada grupo

G1 Mamífero, Pássaro
G2 Réptil
a2 Cobertura do Corpo pelos, penas ?
Cavidades do Coração 4 ? Temperatura do
Corpo regulada ? Fertilização interna
b2 Cobertura do Corpo pele seca ?
Cavidades do Coração 4 imperfeitas ?
Temperatura do Corpo não regulada ?
Fertilização interna
58
Inserindo o primeiro objetos da lista de exceções
nos grupos e obtendo descrições maximamente
específicas de cada grupo
59
Avaliação dos Agrupamentos obtidos em função da
qualidade das descrições Critério a) para cada
par de descrições de agrupamentos diferentes
calcula-se o número de variáveis cuja interseção
é vazia b) faz-se a soma para cada par o
agrupamento escolhido é aquele cuja soma é
máxima ? o Agrupamento B é selecionado O
segundo objeto da lista de exceções é inserido no
agrupamento B um processo semelhante ao descrito
para a incorporação de anfíbio-1 é realizado O
processo descrito deve ser realizado para todas
as 9 combinações de descrições maximamente
discriminantes Das 9 possibilidades, escolhe-se
a melhor partição em dois grupos Em seguida,
novas sementes são selecionadas e o processo
continua
60
Módulo Hierarquico

O módulo hierárquico construi uma árvore de
classificação
Nessa árvore os arcos representam as descrições e
nós a extensão de cada grupo

mamífero, pássaro, réptil, anfíbio-1, anfíbio-2
Cobertura do Corpo pelos, penas ?
Cavidades do Coração 4 ? Temperatura do
Corpo regulada ? Fertilização interna
Cobertura do Corpo pele úmida, pele seca ?
Cavidades do Coração 3,4 imperfeitas ?
Temperatura do Corpo não regulada ?
Fertilização interna, externa
mamífero, pássaro
réptil,anfíbio-1,anfíbio-2
61

Classificação politética
Construção de árvore de cima para baixo
O módulo hierárquico usa o módulo partição como
uma subrotina
o módulo partição fornece partições de vários
tamanhos (2, 3 e 4) e seleciona a melhor
O módulo hierárquico construí um nível da árvore
de cada vez
A construção da árvore finaliza quando a
qualidade da partição obtida no nível seguinte
não é melhorada

62
IFCS

BCS
GfKl
CSNA
SFC
JCS
Congressos Bianuais da IFCS Congressos anuais das
Associações Nacionais http//edfu.lis.uiuc.edu/cl
ass/ifcs
63

Referências
Fisher, D.H. and Langley, P. W., Methods of
Conceptual Clustering and their relation to
Numerical Taxonomy, Technical Report 85-26,
University of California, Irvine, 1985
Fisher, D. H., Knowledg Acquisition via
Incremental Conceptual Clustering, Machine
Leaning, Vol2, No. 2, pp. 139-172, 1987
Guenoche, ª , Generalization and Conceptual
Classification Indices and Algorithms,
Proceedings of the Conference on Data Analysis,
Learning symbolic and Numeric Knowledg, pp.
503-510, INRIA, Antibes, 1989
Kodratoff, Y. and Ganascia, J., Improving the
Generalization Step in Learning, Chapter in the
book, Machine LearningAn Artificial Intelligence
Approach, R. S. Michalski, J.G. Carbonell and
T.M. Mitchell (Eds.), TIOGA Publishing Co.,
PaloAlto, pp. 215-244, 1983.

Lebowitz, M., Experiments with Incremental
Concept Formulation
UNIMEN, Machine Learning, Vol. 2, No. 2, pp.
103-138, 1987.
Michalski, R. S., Stepp, R., and Diday, E., "A
Recent Advance in Data Analysis Clustering
Objects into Classes Characterized by Conjunctive
Concepts," Chapter in the book Progress in
Pattern Recognition, Vol. 1, L. Kanal and A.
Rosenfeld (Editors), North-Holland, pp. 33-55,
1981
Michalski, R. S. and Stepp, R., "Learning from
Observation Conceptual Clustering," Chapter in
the book, Machine LearningAn Artificial
Intelligence Approach, R. S. Michalski, J.G.
Carbonell and T.M. Mitchell (Eds.), TIOGA
Publishing Co., PaloAlto, pp. 331-363, 1983.
Michalski, R.S. and Kaufman, K.A., "Data Mining
and Knowledge Discovery A Review of Issues and a
Multistrategy Approach," Reports of the Machine
Learning and Inference Laboratory, MLI 97-2,
George Mason University, Fairfax, VA, 1997.