Title: Apresenta
1Reconhecimento off-line de Assinaturas
Extração de Características
Classificação
2Reconhecimento off-line de Assinaturas
- Esquemas de conexão entre as técnicas de extração
de características
Assinatura Pré-processada cinza/binária
Imagens
Borda cinza/binária
Esqueleto cinza/binária
Regiões de Pressão cinza/binária
Vetores de Características
Inclinação
Momentum
Fatores de Pressão
3Reconhecimento off-line de Assinaturas
- Esquemas de conexão entre técnicas de extração
de características e reconhecimento
Imagem binária
Imagem cinza
Vetor de Características
4Reconhecimento off-line de Assinaturas
- Base de Dados
- 50 classes (autores)
- 20 assinaturas verdadeiras por classe
- 20 assinaturas falsas por classe
- 10 simples ou randômicas
- 10 habilidosas
- Total de 2000 amostras
5Reconhecimento off-line de Assinaturas
- Segmentação
- Do formulário e das assinaturas individuais
- A partir das projeções vertical e horizontal
- Pré-processamento
Equalização de Background
Amortecimento
Extração da imagem
Binarização
6- Extração de características
7Momentum
8Bordas e Inclinação
9Regiões de Pressão
10Reconhecimento off-line de Assinaturas
- Armazenamento
- Imagens
- Original, segmentada e pré-processada, esqueleto,
borda e pressão - Formato GIF
- Vetor de características híbrido
- Momentum padrão (6 valores)
- Número de componentes verticais
- Inclinações (negativa, vertical, positiva)
- Limiar de alta pressão (THP)
- Fator de pressão (PF)
11Reconhecimento off-line de Assinaturas
- Experimentos
- Apenas verificação
- Classificadores K vmp, MLP MP e Neuro-Fuzzy
- Treinamento 1 a 5 verdadeiras
- Teste 15 verdadeiras 20 falsas
- Criterio de rejeição Neuro-Fuzzy e K vmp
- rejeitar X Û (C - R) lt X lt (C R)
- Performance Acerto - (ErroI ErroII)
C
C-R
CR
12Reconhecimento off-line de Assinaturas
Tipo de Falsificação Acerto Erro I Erro II
Rejeição Performance K todas
60.51 13.70 20.00 23.69 26.81
2 simuladas 35.57 10.60
10.00 49.13 4.97 3 randômicas
82.30 7.40 14.40 6.80
60.50 1
13Reconhecimento off-line de Assinaturas
- MLP Backpropagation
- Investigadas 3 arquiteturas
- (a) entradas12, escondida12, saída1
- (b) entradas12, escondida6, saída1 --
melhor - (c) entradas12, escondida3, saída1
Tipo de Falsificação Acerto Erro I Erro II
Rejeição Performance todas
50.22 58.60 32.13 0.00 -40.51
simuladas 52.23 63.40
32.13 0.00 -43.30 randômicas
57.03 53.80 32.13 0.00
-28.90
1o. padrão
Tipo de Falsificação Acerto Erro I Erro II
Rejeição Performance todas
69.04 31.50 29.87 0.00 7.68
simuladas 64.27 41.60
29.87 0.00 -7.20 randômicas
74.37 21.40 29.87 0.00
23.10
melhor padrão
14Reconhecimento off-line de Assinaturas
- Classificador neural difuso
Tipo de Falsificação Acerto Erro I Erro II
Rejeição Performance todas
70.87 16.10 11.60 14.53 43.17
simuladas 70.87 30.00
11.60 1.27 29.27 randômicas
70.87 2.20 11.60 1.27
57.07
15Reconhecimento off-line de Assinaturas
Pesquisa bibliográfica nas áreas de redes
neurais, processamento de imagens e
reconhecimento de padrões
Estudo teórico enfatizando técnicas para extração
de características e reconhecimento
Construção de uma base de dados de assinaturas
utilizando técnicas para aquisição,
pré-processamento e segmentação
Investigação experimental de algumas
configurações de técnicas sobre a base de dados
16Sistemas de Visão Biologicamente Inspirados
- Mechanisms from Biology
- Foveated vision retina-like image representation
(log-polar) has useful properties - Visual attention fixation gives insights where
object features (or components) are likely to be
found - Primal sketch provides more compact
representations for image data and cues for an
attention mechanism
17Sistemas de Visão Biologicamente Inspirados
18Sistemas de Visão Biologicamente Inspirados
- Image representation
- Gaussian receptive field function
- Local contrast normalisation for estimating
original reflectance information - Primal sketch features (edges, bars, blobs and
ends) learned and extracted using a neural
network approach - Log-polar
19Sistemas de Visão Biologicamente Inspirados
- Traditional image feature extraction operators
- Cartesian domain (artefact of sensor
architecture) - Work independently of each other
- Designed by hand
- Primate visual system
- Mapping from retina to visual cortex is log-polar
- Learning
- Primal sketch Marr82
- Features like edges, bars, blobs, ends detected
at a number of orientations and contrasts - Grouping processes
20Extração de Características
- Related Work
- Neural network learning of Edge features
CTR95,PB92 - Limited to edges
- Comparable to Sobel or Canny performances
- Arbitrary features in the log-polar domain GF96
- Operators manually designed
- Poor sensitivity to the features contrast
- Limited to a fixed window size
Edge_at_0 ABS(fab-c-d-e)/3 Edge_at_60
ABS(abc-d-e-f)/3 ... Blob
MIN(x-a,x-b,x-c,x-d,x-e,x-f)
a
f
b
x
e
c
d
21Extração de Características
recep. field windows
Normalise Orientation
Compute Projection
Build Training Set
Train Neural Networks
Exemplars of Features
Training Set
feature class and contrast
22Extração de Características
position
orientation
Extract Recep. Fields
Normalise Orientation
Apply Neural Networks
Compute Feature Planes
Compute Projection
Feature class, position contrast and
orientation
Test Images
Planes
Edge
Bar
Blob
End
23Extração de Características
- Principal Components from a set of synthetic
features
24Extração de Características
- Neural network architecture
PCA projected window
Principal components
Receptive field window
Neural network
Edge
...
Bar
N
Ñ
Blob
End
1x19
19x17
1x17
25Extração de Características
- Evaluation
- Ground truth for untrained synthetic features
26Extração de Características
- Output of the Edge neural module
27Extração de Características
- Testing on synthetic images
Edges
Bars
-Blobs
Blobs
Output
Retinal
Input
28Extração de Características
Neural Outputs
Retinal Image
Logical Operators
Input Image
29Extração de Características
- Conclusions
- New learning-based approach to extracting primal
sketch features - Better results when compared to a previous
approach - More correctly classified features
- Good estimate for the features contrast
- Can be easily applied to different window sizes
and new feature types - Successfully being used as the core
representation in the problem of learning
structural relationships from sets of 2D
image-based models
30Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Base de Dados Minolta
- Objetivo avaliar o comportamento de SVM diante
do problema. - Base de dados Minolta - da Universidade do
Estado de Ohio, disponível em sampl.eng.ohio-state
.edu/sampl/data/3DDB/RID/minolta. - Foram selecionadas 10 classes de objetos (angel,
brain, bottle, duck, face, frog, horn, lobster,
pooh e valve). - 20 visões diferentes de cada classe
31Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Preprocessamento todas as imagens foram
convertidas para níveis de cinza e re-escalonadas
para o tamanho 100x100 pixels. -
Figura 6 Objeto angel
Figura 7 Objeto horn
32Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Ferramenta OSU SVM toolbox Matlab,
eewww.eng.ohio-state.edu/maj/osu_svm - Tipo de kernel Polinomial de grau 2.
- Tipo de algoritmo classificador padrão.
- Foi utilizada a estratégia de construção de
conjuntos de treinamento e teste com diferentes
tamanhos - Cada conjunto de treinamento usou T amostras por
classe e cada conjunto de teste usou (20-T)
amostras por classe, onde T1,2,...,19.
33Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Taxa média de reconheci-mento foi 90
- Melhor taxa 98, para T13
- Pior taxa 71 para T1
Figura 8 Desempenho de SVM na base Minolta
34Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Base de dados COIL100 disponível em
www.cs.columbia.edu/CAVE. - É uma das melhores bases para investigar
algoritmos de reconhecimento baseado na
aparência. - Consiste de 7.200 imagens coloridas de 100
objetos. - Cada imagem foi adquirida em uma variação de 5o,
formando 72 visões para cada imagem, com dimensão
128x128.
35Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Pré-processamento todas as imagens foram
convertidas para níveis de cinza e re-escalonadas
para o tamanho 32x32 pixels. - Dependendo do ângulo algumas imagens parecem
maiores.
Figura 9 Alguns objetos da COIL100
Figura 10 Visões do objeto 44 , do ângulo 260o a
300o
36Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Ferramentas
- Para SVM LIBSVM, disponível em
www.csie.ntu.edu.tw/cjlin/libsvm. - Para Redes Neurais SNNS (Stuttgart Neural
Network Simulator), disponível em
www-ra.informatik.uni-tuebingen.de/SNNS.
37Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Testando diferentes Kernels
- Objetivo fazer uma avaliação prática sobre a
precisão, comportamento e número de vetores de
suporte produzidos por três tipos de kernel
polinomial - linear
- quadrático
- cúbico.
38Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Treinamento/teste Foram construídos conjuntos
de treinamento/teste de diferentes tamanhos. - todas as 100 classes foram utilizadas e todas as
visões - um total de 71 conjuntos de treinamento e de
teste foram criados - T amostras (visões aleatórias) para treinamento e
(71-T) para testes, por classe, onde T1,2,...,71.
39Reconhecimento de Objetos Baseado na Aparência
Usando SVM
Figura 11 Número de vetores de suporte criados
versus tamanho do conjunto de treinamento (100T)
para os três tipos de kernel.
40Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Resultados pequena superioridade para o kernel
quadrático. - Foi realizada a estratégia k-fold cross
validation para reforçar os resultados obtidos - valor de k10
- precisão média alcançada 87,55
41Reconhecimento de Objetos Baseado na Aparência
Usando SVM
Figura 12 Curvas de reconhecimento para os
kernels linear, quadrático e cúbico
42Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Estudo Comparativo SVM x Redes Neurais
- Objetivo Comparar experimentalmente SVM e Redes
Neurais do tipo Multilayer Perceptron
Backpropagation - Considerou apenas aspectos relativos à precisão
- Estratégia de classificação multiclasses
um-versus-um - A estratégia multiclasses produziria um elevada
quantidade de classificadores - Foi necessário portanto, reduzir a quantidade de
classes. - O número de classes utilizadas foi 10
43Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Estudo Comparativo SVM x Redes Neurais
- Treinamento/teste Foram construídos conjuntos
de treinamento/teste de diferentes tamanhos - Todas as 10 classes foram utilizadas e todas as
72 visões - Foram produzidos 45 classificadores binários para
cada tamanho de conjunto de treinamento/teste (71
conjuntos) - Arquitetura da Rede
- Camada de Entrada 1024 neurônios
- Camada Escondida 4 neurônios
- Camada de Saída 2 neurônios.
44Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- As técnicas apresentaram
- desempenho semelhante
Figura 13 Curvas de reconhecimento para SVM e
Redes Neurais
45Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Conclusões
- Apresentou SVM como como uma opção para realizar
reconhecimento de objetos baseado na aparência - Investigou o desempenho da técnica nesse
problema - Comparou três tipos de SVM
- Comparou SVM com Redes Neurais
- Procurou apresentar a teoria de formaliza SVM
utilizando uma linguagem mais didática e
acessível
46Reconhecimento de Objetos Baseado na Aparência
Usando SVM
- Perspectivas de Trabalhos Futuros
- Realizar o estudo comparativo entre SVM e Redes
Neurais utilizando todas as 100 classes - Testar extensões de SVM
- Estudo comparativo entre metodologias
multiclasses - Extender o domínio de aplicação de SVM para
problemas como Regressão e Detecção de Novidades.
47Reconhecimento de Placas de Sinalização
- Descrição do problema
- Dirigir ? processamento intensivo da informação
visual - Sistemas de Apoio ao Motorista (Driver Support
Systems DSS) - Segurança
- Conforto.
- Segurança de tráfego ??Sinalização
- Desatenção
- Tráfego intenso
- O sistema como um co-piloto
48Reconhecimento de Placas de Sinalização
- Objetivos e Relevância
- Escopo do trabalho
- Objetivos principais
- Estudar e implementar um mecanismo de atenção
visual - Investigar a utilização de uma Rede Neural para a
tarefa de classificação. - Contribuições
- Perspectiva de geração de conhecimentos para o
desenvolvimento de tecnologia nacional em DSS - Proposta de um modelo híbrido biologicamente
inspirado - Mecanismo de Atenção Visual Redes Neurais.
49Reconhecimento de Placas de Sinalização
- Objetivos e Relevância
- Contribuições
- Demonstração da aplicabilidade de um mecanismo de
atenção visual à tarefa de localização de placas - Perspectiva de parcerias.
50Reconhecimento de Placas de Sinalização
Reconhecimento de Placas de Sinalização
- Trabalhos relacionados
- Detecção de obstáculos
- Detecção de marcas da pista
- Sistemas Integrados
- Detecção e reconhecimento de sinais de tráfego
- Busca reduzida através de algum conhecimento a
priori - Análise geométrica das arestas da imagem
- Reconhecimento ? Correlação cruzada
Piccioli e Colegas, 1996
51Reconhecimento de Placas de Sinalização
- Trabalhos relacionados
- Detecção e reconhecimento de sinais de tráfego
- Segmentação de cor (Color Structure Code)
- Reconhecimento ? controle fuzzy
- Parceria Daimler-Benz e Universidade
Koblenz-Landau
Priese e colegas, 1993
52Reconhecimento de Placas de Sinalização
53Reconhecimento de Placas de Sinalização
- Experimentos preliminares
- Seleção manual de Placas
- Classe placas pare, proibido ultrapassar e
imagens sem placas 14 imagens - Pré-processamento
- Treinando com T padrões e testando com 14-T
- Resultados
- Melhor taxa 100
- Pior taxa 56,41
- Indicaram a possibilidade de classificar imagens
pequenas (20x20 pixels).
54Reconhecimento de Placas de Sinalização
- Definição da Arquitetura Neural
- Camada de entrada 400 neurônios ? tamanho das
imagens - Camada de saída número de classes ?
winner-takes-all - Camada escondida
No de Neurônios SSE/1000 Épocas
7 29,8216
14 3,2632
21 1,0610
28 0,1326
35 0,1261
42 1,0976
49 1,0945
56 0,9165
63 0,7991
70 1,0807
Classes Saídas Desejadas
1 1 0 0 0 0 0 0
2 0 1 0 0 0 0 0
3 0 0 1 0 0 0 0
4 0 0 0 1 0 0 0
5 0 0 0 0 1 0 0
6 0 0 0 0 0 1 0
7 0 0 0 0 0 0 1
55Reconhecimento de Placas de Sinalização
- Módulo de Detecção
- Imagens com placas ? 15 imagens ? 16 placas
- Número fixo de regiões selecionadas (K)
- Resultados
- K5 ? 75 de localização (12 imagens)
- K19 ? 93,75 de localização (15 imagens)
- Análise a partir da complexidade da busca
- K5 ? 0,0059 dos pontos da imagem
- K19 ? 0,0225 dos pontos imagem
- Comparação com a geração randômica de pontos de
interesse
56Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Formação de novos conjuntos de treinamento e
teste - Ocorrência de placas durante o vídeo
- Poucas ocorrências ? escolhidas 2 por classe
- Quadros sucessivos microsacadas 85 imagens
por classe - 7 classes
- Uma classe de imagens sem placas
57Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Resultados Módulo de Detecção
- Mesmo método utilizado no primeiro experimento
- Máscara com raio menor (5) ? menor risco de
inibição inesperada ? aumento no número de pontos
analisados - K33 ? 100 de localização ? 0,039 dos pontos da
imagem - Regiões selecionadas ? formam o conjunto de teste
para o Módulo de Reconhecimento.
58Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Resultados Módulo de Reconhecimento
- Arquitetura definida através de experimentos
anteriores - Taxa de acerto no treinamento ? 100
- Baixas taxas de acerto nos testes
Classe Taxa de Acerto
1 12,94
2 28,23
3 2,35
4 1,18
5 12,94
6 57,64
7 8,23
59Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Resultados Módulo de Reconhecimento
- Motivos principais
- Falta de uma pré-processamento mais robusto e uma
representação mais compacta dos padrões - Dimensionalidade do espaço de características
- A limitação da arquitetura MLP-BP em relação a
translação dos objetos na imagem ( Kröner, 1996). - Classificadores Binários ? combinação de classes
duas a duas - Arquitetura ? baseada nos experimentos
anteriores - Treinamento ? 100 de acerto para todas as redes.
60Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Resultados
Classe Classe Taxa de Acerto
1 2 90
1 3 40
1 4 60
1 5 60
1 6 60
2 3 50
2 4 80
2 5 60
2 6 100
3 4 60
3 5 60
3 6 60
4 5 40
4 6 50
5 6 80
Módulo de Reconhecimento
ANÁLISE POR VOTAÇÃO
61Reconhecimento de Placas de Sinalização
- Integração dos módulos
- Resultados
Classe Classe Taxa de Acerto
1 2 84,12
1 3 40,59
1 4 54,12
1 5 52,94
1 6 57,64
2 3 41,17
2 4 58,82
2 5 53,52
2 6 80,58
3 4 51,17
3 5 63,53
3 6 52,35
4 5 43,52
4 6 52,35
5 6 55,88
Módulo de Reconhecimento
ANÁLISE ABSOLUTA
62Reconhecimento de Placas de Sinalização
- Análise dos resultados
- Alto desempenho do mecanismo de atenção na
localização das placas - Inibição de placas ? redução no raio da máscara
- Regiões de fronteira com alta saliência
- Possível classificar as regiões selecionadas
através da abordagem neural - Aumento no número de padrões
- Pré-processamento mais robusto
- Representação através de características
invariantes.
63Reconhecimento de Placas de Sinalização
- Conclusões
- O Trabalho apresentou
- Estudo e implementação de uma mecanismo de
atenção - Investigação preliminar no uso de Redes Neurais.
- Caráter multidisciplinar
- Inteligência Artificial, visão Computacional,
Atenção Visual, Neurofisiologia etc. - Objetivos alcançados
- Módulo de Detecção eficiente
- Demonstrando a utilidade na aplicação do
mecanismo de atenção no problema investigado.
64Reconhecimento de Placas de Sinalização
- Objetivos alcançados
- Investigação da abordagem neural
- Resultados características das imagens ?
possível alcançar taxa melhores de classificação. - Contribuições
- Estratégia de microsacadas
- Aplicação do mecanismo de atenção na área de DSS
- Experimentos com imagens reais de ruas e estradas.
65Reconhecimento de Placas de Sinalização
- Dificuldades
- Nível experimental da área de atenção visual
- Limitação dos recursos materiais
- Veículos adaptados, câmeras apropriadas,
hardwares dedicados, processamento paralelo,
computadores de bordo, conservação das rodovias. - Trabalhos futuros
- Finalizar a integração dos classificadores
binários - Aquisição de novas imagens
66Reconhecimento de Placas de Sinalização
- Trabalhos futuros
- Implementação do Módulo de Detecção em uma
arquitetura dedicada (ex. FPGA) - Aplicar pré-processamento mais completo
- Utilizar uma representação mais compacta das
imagens - Investigar outras arquiteturas neurais para a
tarefa de classificação (Kröner, 1996)