Title: Maestr
1Maestría en Tecnologías de la Información
Trabajo de Tesis
Análisis de la propagación de la señal
paroxística en EEGs utilizando técnicas de Data
Mining sobre múltiples canales
Directora Dra. Alicia Mon
Integrantes E. Santiago, P. Valenti
2Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
3Objetivo
- Extender el trabajo realizado sobre detección
automática de paroxismos en EEG utilizando
técnicas de Data Mining analizando todos los
canales, y aportando información del canal
principal sobre el cual se propaga la señal
paroxística.
- Beneficios
- Disminución considerable del tiempo de análisis
por parte de los expertos - Facilitar a los expertos la detección de la
topología de la crisis epiléptica
4Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
5Introducción a EEG y Epilepsia
- Definición de Epilepsia
- ElectroEncefaloGrama (EEG)
- EEG aplicado a la epilepsia
- Paroxismos
- Algunas definiciones
6Epilepsia
- Afección neurológica crónica, recurrente y
repetitiva, de fenómenos paroxísticos ocasionados
por descargas de neuronas cerebrales de forma
desordenada y excesiva
7Electroencefalograma (EEG)
Ejemplo de EEG
8EEG aplicado a la Epilepsia
- Confirmación del diagnóstico clínico
- Predicción de posibles recurrencias tras la
disminución / supresión del tratamiento
antiepiléptico - Tipo y etiología de las crisis
- Detección de actividad Paroxística
9Paroxismos
Ciertos grafoelementos que se presentan en un
muy alto porcentaje en pacientes epilépticos,
denominados grafoelementos epileptiformes
Punta onda Onda aguda Polipuntas
10Alguna definiciones
- Actividad de base es el registro de la actividad
eléctrica cerebral en condiciones de reposo o
durante el sueño espontáneo, también llamada
señal de base. - Periodo Ictal El comienzo de la crisis o periodo
ictal se define por el primer cambio eléctrico en
el ritmo de base del EEG o alguna manifestación
clínica que indica el inicio de la misma. - Período Interictal Los periodos interictales son
aquellos entre ataques de epilepsia (crisis), que
pueden contener actividad de base o actividad
paroxística.
11Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
12Data Mining
- Data Mining o KDD es la extracción no trivial de
información implícita, previamente desconocida y
potencialmente útil de los datos - Búsqueda de relaciones y patrones globales
existentes en una gran base de datos, pero que
están ocultos a simple vista, debido a la gran
cantidad de información almacenada
13Data Mining
- Fases del proceso de DM
- Selección de los datos
- Preprocesamiento de la información
- Data Mining
- Validación del modelo generado
14Metodología sobre la que se basa la Tesis
- Detección de señales paroxísticas (punta onda,
ondas agudas y polipuntas) sobre un mono-canal de
un EEG utilizando un algoritmos de clasificación
de Data Mining.
15Metodología Paso 1
Los archivos de datos utilizados son señales EEG
de pacientes epilépticos asistidos en el Centro
de Epilepsia del Hospital Ramos Mejía de la
ciudad de Buenos Aires.
16Metodología Paso 2
17Metodología Paso 3
- Árboles de decisión J4.8
- Naive Bayes
18Metodología Paso 4
- Matriz de confusión
- Cobertura de las marcas
- Curvas ROC
19Metodología Validación contra expertos
20Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
21Definición del problema
- Necesidad
- Detección de la zona del cerebro donde se origina
la crisis en aquellos pacientes epilépticos
candidatos a cirugía. - Problema
- Los estudios que se realizan tienen una duración
bastante prolongada, llegando en muchos casos a
72 horas de grabación de señal EEG. - Esto hace muy tedioso y agotador el trabajo de
los expertos para el análisis de los mismos. - Es fundamental en estos casos, poder confirmar
que el foco está cercano a la lesión.
22Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
23Procesamiento y análisis de los canales
Etapa 1
24Procesamiento y análisis de los canales
Etapa 2
25Procesamiento y análisis de los canales
- Selección de los datos
- Preprocesamiento de la información
- Aplicación de los modelos de detección de
paroxismos - Análisis de todos los canales
26Selección de los datos
- Archivo de datos EEG
- Archivos de detecciones
27Selección de los datos
28Preprocesamiento de la información
- Windowing
- Funciones de transformación
- R2 y I2
- sqr(R2 I2) y atan(I/R)
Hanning
Cuadrada
29Preprocesamiento de la información
30Aplicación de los modelos de detección de
paroxismos
Canal 0
Archivo preprocesado
Canal 1
Canal N-1
Modelo 1
Canal N
31Agrupamiento de marcas
32Casos a Procesar
33Análisis de todos los canales
- Detección del canal principal
- Cálculo de la cobertura de las marcas
- Gráfica de todos los canales
34Detección del canal principal
35Cálculo de la cobertura de las marcas
Cobertura del canal principal
36Gráfica de todos los canales
37Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
38Análisis de los resultados
39Análisis de los resultados
40Análisis de los resultados
Análisis de las relaciones entre canales
41Análisis de los resultados
42Análisis de los resultados
43Conclusiones
- Se ratificó la detección automática de paroxismos
en EEGs de pacientes epilépticos, utilizando
técnicas de Data Mining. - Se pudo ratificar la existencia de una relación
entre los canales, y determinar los grupos de
canales asociados. - Se desarrolló una herramienta que permite la
detección automática de paroxismos y asistir a
los expertos para determinar la propagación de la
señal desde el canal principal hacia los demás
involucrados.
44Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
45Trabajos futuros
- Mejorar los modelos de detección, marcando los FP
como señal de base y agregando los VP para
aumentar la detección y mejorar la clasificación - Modificar la herramienta para permitir
seleccionar rangos de tiempo abarcando todos los
canales, agruparlos y exportarlos - Modificar la herramienta para eliminar un canal
ruidoso del análisis
46Agenda
- Objetivo de la Tesis
- Introducción a EEG y Epilepsia
- Data Mining y la metodología sobre la que se basa
la Tesis - Definición del problema
- Procesamiento y análisis de los canales
- Análisis de los resultados y Conclusiones
- Trabajos futuros
- Herramienta desarrollada
47Preguntas
48Archivo preprocesado
Declaración de los atributos o campos
Datos procesados
49Archivo de marcas generadas
- La primera columna representa el número de
registro - La segunda columna representa la clasificación
realizada por el modelo - La tercera columna representa la probabilidad
del registro a pertenecer a la clase asignada - La cuarta columna representa la clasificación
original
50Archivo de detecciones
- Los registros se agrupan de a pares,
identificando una detección - La primera columna representa el número de
muestra - La segunda columna representa la el canal donde
se encuentra el paroxismo - La tercera columna representa un identificador
de inicio (ISI) o fin (F) del paroxismo
51Herramienta desarrollada
52Herramienta desarrollada
53Herramienta desarrollada
- Selección del EEG a graficar
54Herramienta desarrollada