Title: Jecas2008 ISTAC: Ponencia TEIDE2
1TEIDE 2 Técnicas de Edición e Imputación de
Datos Estadísticos Rafael Betancor Villalba
(ISTAC) Mª Salomé Hernández García (ULL)
2- Índice
- Presentación
- Fundamentos
- Caso práctico
- Demostración
- Conclusiones
3TEIDE 2
- TEIDE es fruto de una colaboración entre el
Instituto Canario de Estadística (ISTAC), que
aporta las necesidades y la experiencia como
usuario, y el Departamento de Estadística,
Investigación Operativa y Computación de la
Universidad de La Laguna (Tenerife), que lo
desarrolla e implementa. - El objetivo de TEIDE es hacer más rápido y cómodo
el desarrollo de las tareas de edición e
imputación de datos.
4TEIDE 2
- Fundamentos
- TEIDE nació como un software que intenta
facilitar la depuración de encuestas. No
sustituye a la persona, sino que le simplifica su
trabajo validando e imputando de forma automática
errores. - TEIDE1 fue una herramienta desarrollada en
Borland Builder C/C para Microsoft Windows
desde el año 2003.
5TEIDE 2
- Fundamentos
- TEIDE2 es una nueva herramienta que contiene
todas las características positivas de la versión
anterior, además de otras mejoras que han surgido
en los últimos años con su uso. Por ejemplo, la
nueva implementación se ha desarrollado bajo la
filosofía de código abierto sin usar ninguna
herramienta comercial multiplataforma (Linux,
Windows, Mac, etc.) lee/escribe en formatos
Access y Oracle, y próximamente también en XML.
6TEIDE 2
- Fundamentos
- TEIDE2 trabaja sobre encuestas con variables
cuantitativas y/o cualitativas, admite cualquier
tipo de regla de coherencia de tipo
lógico-matemática (ej si X7 e Y?4 entonces
Z3 o UW2 ) - TEIDE2 asiste mediante funciones gráficas durante
todo el proceso de desarrollo de la encuesta,
facilitando la detección de posibles
incoherencias en la fase de recogida de datos.
7TEIDE 2
- Fundamentos
- Aunque TEIDE2 tiene un módulo de imputación, es
una herramienta útil para seguir el buen
desarrollo de la recogida de los datos. - La imputación se basa en metodologías clásicas
(donante más próximo y regresión múltiple)
construidas sobre el paradigma de Fellegi Holt
(Journal of the American Statistical Association
1976).
8TEIDE 2
Caso práctico Encuesta Condiciones de Vida
2007 Hogares canarios 134 variables (13
continuas), 8.342 registros, 34 reglas (30
filtros). Detectados 1.521 registros incorrectos
corregidos en 47 segundos Individuos canarios
178 variables (15 continuas), 23.150 registros,
197 reglas (158 filtros). Detectados 7.187
registros incorrectos corregidos en 1.245
segundos
9TEIDE 2
Demostración En esta demostración del software
usamos datos aleatorios pero que destacan
algunas funciones de TEIDE2. La encuesta viene en
una base de datos Microsoft Access, concretamente
en 3 tablas variables, microdatos, edits En
la tabla edits están todas las reglas de
coherencia, salvo las del tipo si X?NoProcede
entonces ltcondicióngt, que se llama filtro y
se coloca en la descripción de X en la tabla de
variables.
10TEIDE 2
Conclusiones Hemos presentado una nueva
herramienta informática para automatizar en lo
posible la depuración de encuestas. La
herramienta nace de la experiencia del uso de una
versión anterior sobre encuestas reales por parte
de técnicos. Animamos a su uso en nuevas
encuestas, y a que nos hagan llegar sus críticas
y sugerencias de mejora. Sin duda las
implementaremos esperando que cada día TEIDE2 sea
una herramienta mejor. http//www.gobiernodecanari
as.org/istac http//www.goma.ull.es
11(No Transcript)