Title: Procesamiento Digital de Imgenes y Visin
1Procesamiento Digital de Imágenes y Visión
- M.C. Juan Carlos Olivares Rojas
2Agenda
- Transformaciones punto a punto.
- Transformaciones de 2 imágenes.
- Operaciones de vecindad.
- Transformaciones lógicas.
- Transformaciones geométricas.
3Agenda
- Detección de bordes.
- Extracción de Regiones.
- Detección de Movimiento.
- Detección de objetos 3D.
4Introducción
- El Procesamiento Digital de Imágenes es un área
de la graficación por computadora muy importante. - Los fundamentos del Procesamiento Digital de
Imágenes están íntimamente relacionados con el
tratamiento de señales, por lo que se les puede
aplicar elementos como filtros, transformación,
detección, extracción de elementos, entre otras
cosas.
5Introducción
- La función principal de la visión artificial es
reconocer y localizar objetos en el ambiente
mediante el procesamiento de las imágenes. - La visión computacional es el estudio de estos
procesos, para entenderlos y construir máquinas
con capacidades similares. - Se tienen muchas áreas de aplicación como
robótica, procesos industriales, etc.
6Introducción
Arquitectura de un Sistema de Visión Artificial
7Introducción
- A continuación se muestran las etapas del proceso
de visión artificial.
8Introducción
- La adquisición de la imagen consiste en la
obtención de una señal visual del mundo analógico
al digital (cámara fotográfica, video, escáner,
etc.). - La limpieza consiste en eliminar aspectos como el
ruido al aplicar filtros o bien mejorar la
calidad de la imagen.
9Introducción
- El proceso de segmentación consiste en dividir la
imagen en sus partes principales. - Presentación y Descripción en base a la
segmentación se describe cada parte. - Interpretación y Reconocimiento dado el
descriptor de un objeto se compara con la
descripción que se cuenta en la base de
conocimientos y se realiza una acción.
10Introducción
- Base de Conocimientos es un repositorio donde se
almacén la descripción de diversos objetos que
serán útiles en el reconocimiento de patrones
(formas visuales).
1 punto en 8 píxel
Normal
11Introducción
4 Niveles de Gris
256 Niveles de Gris
12Introducción
Valores del Ojo
Ojo de Lena
13Características de las Imágenes
- Antes de entrar a los algoritmos y métodos de
procesamiento digital de imágenes es conveniente
ver las características de las imágenes. - Histograma es una gráfica en el cual se cuenta la
frecuencia de color, es útil para cambiar la
intensidad de luz de una imagen respetado sus
atributos característicos.
14Histograma
Histograma de Lena Normal
Histograma de Lena Obscuro
15Ruido
- Se considera ruido a toda aquella variación de la
tonalidad de la imagen no debida a la luz
recibida. - Existen diversos tipos de ruidos correlados
(cuando depende de la posición del pixel), no
correlados (cuando depende de la posición del
pixel, se basan en distribuciones de probabilidad
como la Gaussiana) y los ruidos aleatorios o de
sal y pimienta.
16Ruido
Normal
Ruido Gaussiano
Ruido Correlado
Ruido Aleatorio
17Brillo
- Se define como brillo al nivel medio de gris de
una imagen.
Brillo 104
Brillo 56
18Contraste
- Es la variación de gris de un punto respecto al
brillo de la imagen. Se puede definir de forma
aproximada con bajo consumo de recursos
computacionales como - La definición correcta es
19Contraste
C1 95.81 C2 26.45
C1 94.42 C2 10.56
20Nitidez
- Es la respuesta de la imagen ante cambios bruscos
de iluminación.
21Nitidez
- La baja nitidez de una imagen puede estar
motivada por - Objetos fuera del rango de enfoque de la óptica.
- Deficiencias en el elemento sensor.
- Efectos de algoritmos de tratamiento de imágenes.
22Nitidez
Nitidez 18.245
Nitidez 9.777
23Diferencia Cuadrática de Dos Imágenes
- La diferencia es útil cuando se desea calcular el
grado de variación de una imagen obtenida con un
algoritmo de procesamiento de imagen con respecto
a la original. - En donde Fr es la imagen base y f la imagen que
se desea analizar.
24Diferencia Cuadrática de Dos Imágenes
ECT28.957, ECN26.536
25Transformaciones Punto a Punto
- Son las transformaciones más simple sobre una
imagen o señal. - Las imágenes se pueden representar como matrices
de puntos, donde cada punto tiene asociado un
modelo de color. - Un ejemplo básico sería la multiplicación por un
escalar.
26Transformación Punto a Punto
- Algunos ejemplos de transformaciones puntuales
- Suma.
- Resta.
- Multiplicación.
- División.
- Máximo.
- Mínimo.
- Umbralización.
- Inversa.
27Transformación Punto a Punto
Inversa
Original
28Transformaciones de 2 imágenes
- La transformación de dos imágenes generalmente
hace referencia a que se utiliza otra matriz para
modificar cierto aspecto de los atributos de la
señal original. Por ejemplo la intensidad, los
tonos de luz, etc. - Se pueden utilizar algunos operadores como la
multiplicación, suma de matrices, entre otras.
29Transformación de Dos Imágenes
- Algunos ejemplos de operaciones son
- Suma.
- Resta.
- Multiplicación.
- División.
- Máximo.
- Mínimo.
- AND.
- OR.
- XOR.
30Transformación de dos Imágenes
Imagen con ruido Gausiano
original
Diferencia multiplicada por 6
Diferencia entre las imagen
31Transformaciones de Dos Imágenes
Original Umbralizada 128
Imagen Inversa de la Umbralizada 128
Mínimo de la Inversa Umbralizada 128 y la original
32Transformaciones Globales
- La transformación depende de todos los puntos de
la imagen. Pueden utilizarse estadísticos como en
la ecualización o máximos y mínimos para el
escalado de imágenes.
33Transformaciones Globales
Imagen Ecualizada
Imagen Original
34Operaciones de vecindad
- Antes de ver los operadores de vecindad conviene
recalcar las formas en que ésta se da.
Vecindad a 4
Vecindad a 8
35Reducción de Ruido
- Los operadores de vecindad permiten definir
filtros para la eliminación de ruido en las
imágenes. - El promedio del entorno de vecindad es un filtro
lineal en el cual se promedian los valores de
intensidad de un punto en base a sus vecinos.
36Reducción de Ruido
Entorno de vecindad
Imagen con ruido gausisano s5
Imagen Filtrada
37Reducción de Ruido
- Existen otros filtros como los no lineales o
estadísticos. Donde el algoritmo y los entornos
de vecindad cambian. - No todos los filtros aplican de la misma manera a
las imágenes por lo que se debe probarlos.
38Transformaciones lógicas
- Generalmente se utilizan máscaras para poder
encontrar alguna característica útil en las
imágenes - AND.
- OR.
- XOR.
39Transformaciones geométricas
- La imagen se transforma, realizándose un cambio
de variables pero no de dominio. - La posición de cada píxel es función de la
posición del píxel correspondiente en la imagen
original, y viene determinada por una
transformación geométrica.
40Transformaciones Geométricas
- Entre las más empleadas están
- Homotecia.
- Zoom.
- Traslación.
- Rotación. Transformación de Hotelling.
- Warping. Corrección de distorsiones.
- Morphing.
41Transformaciones Globales
- La imagen se transforma en globalmente, sin
considerar los píxels de forma individual,
realizándose un cambio de dominio. Entre las más
empleadas están - Transformada de Fourier.
- Transformada de Hadamard-Walsh.
- Transformada de Karhunen-Loève (KLT).
- Transformada discreta del coseno (DLT).
42Transformaciones Globales
- Transformada de Hough.
- Cambio entre modelos del espacio de colores.
- Y sus correspondientes transformadas inversas.
43Detección de bordes.
- Se denomina borde en una imagen a cualquier
discontinuidad que sufre alguna función de
intensidad sobre los puntos de la misma. - En la proyección bidimensional de una escena
tridimensional intervienen distintos tipos de
bordes
44Detección de Bordes
- Cambio brusco en la distancia cámara-objetos, con
normal continua (dc) o con discontinuidad en la
normal (dnc). - Cambio en la normal del objeto (n).
- Cambio en la reflectancia del objeto (r).
- Cambio en la proyección de la luz incidente (s).
45Detección de Bordes
46Detección de Bordes
Realce de Bordes Operador Sobel
Aplicación del Umbral
Imagen Original
47Detección de Bordes
- También se utilizan los gradientes.
- La detección de bordes es la primera parte para
la segmentación. Consiste en determinar los
cambios de intensidad de los pixeles, es muy
sensible al ruido. - Esta técnica nos permitirá más adelante extraer
características de las regiones de la imagen.
48Extracción de Regiones
- Una vez que se ha podido segmentar una imagen, es
posible extraer toda la información de una
imagen, la cual no es otra cosa que otra matriz. - A esa matriz se le pueden hacer comparaciones
como por ejemplo para detectar el reconocimiento
de escritura en un PDA o el reconocimiento de una
huella digital.
49Detección de Movimiento
- La detección de movimientos ocurre cuando se
realiza una comparativa entre dos imágenes muy
similares. - Se debe realizar una segmentación de la imagen
para poder ubicar un área sobre la cual trabajar
y notar las diferencias. - Las imágenes deben tener las mismas
características.
50Detección de Movimiento
- Cualquier dispositivo de adquisición de video
debe permitir el poder almacenar y manipular
imágenes de manera individual. - Al detectar movimiento surgen algunas preguntas
de interés -
- Cómo detectar el movimiento de un ojo?
- Cómo detectar el movimiento de una persona?
51Detección de Movimiento
- Qué ocurre cuando una imagen es totalmente
diferente a otra? - Para auxiliarse en la detección de movimiento se
suele utilizar puntos clave que ayuden a detectar
los movimientos. En un cuerpo humano esos puntos
clave son generalmente las extremidades codos,
rodillas, tobillo, dedos, etc. y depende de lo
que se va a tratar de detectar.
52Detección de objetos 3D
- Para poder detectar figuras en 3D se ocupan tener
conocimiento de cómo está formado la imagen. - En imágenes bidimensionales se tienen que
detectar bordes que puedan definirnos el volumen
de un objeto. - Tambien se pueden utilizar imágenes del mismo
objeto desde diferentes puntos de vista.
53Detección de objetos 3D
- En algunos casos se analizan las imágenes desde
diferentes ángulos y se trata de reconstruir las
imágenes en 3D. - Por ejemplo se trata de aplicar las tomografías
desde diferentes cortes para poder definir un
modelo en 3D del cerebro.
54Referencias
- Súcar, E, Gómez, G, Procesamiento de Imágenes y
Visión Computacional, Departamento de
Computación, Tecnológico de Monterrey Campus
Cuernavaca. - http//isa.umh.es/titere/tutorial/vision/
55Preguntas?