Title: Diapositiva 1
1Tidap 2003 INEGI Almacén de datos (data
warehouse)
2Evolución
Proceso de Maduración de la Informática
3Definiciones de un dwh
Colección de datos variante en el tiempo, no
volátil, Integrada, orientada a temas de
interés para el soporte a la toma de decisiones.
(Bill Inmon)
4Definiciones de un dwh
Un almacenamiento de datos sencillo e integrado,
utilizado para la toma de decisiones y
planeación, que provee bases para la
infraestructura de toda la empresa. Es
importante resaltar que no se debe considerar al
data warehouse como un producto, sino más bien
como un procedimiento para ordenar y manejar de
manera apropiada información de fuentes
dispersas (www.ncr.com)
5Características de un dwh
- Integrado (Consistencia entre diferentes
fuentes). - Orientado al área de interés (Temático).
- Variante en el tiempo (Histórico).
- No volátil (No se actualiza, se incrementa).
6Estructura de un dwh
Datos Fuente
Transformación de Datos
Warehouse Empresarial
Consultoria Tecnología Capacitación
Metadatos Modelo Lógico Diseño Físico de la
B.D. Dicc. de Datos
Administración de Red Administración de B.
D. Admón de Sistemas
Data mart dependientes
Descubrimiento del conocimiento
????????????
Acceso a la información/aplicaciones
Analista
Clientes/Usuarios
Usuarios
Ingeniero de Conocimiento
Servidor De aplicaciones
7Data Warehouse Estadístico del INEGI
8En qué consiste el proyecto?
- Repositorio de información estadística del país
para consulta y análisis que permita a los
usuarios tomar mejores decisiones como parte del
Sistema Nacional de Información Estadística y
Geográfica. - Sus elementos principales son
- Procesos automáticos de extracción,
transformación y carga para mantener la
información actualizada. - Información
- Integrada
- Validada
- Documentada
- Única
- Facilidades de acceso a la base de datos desde
cualquier punto de la red INEGI para la consulta,
explotación y análisis de la información.
9Necesidades por atender con el proyecto.
Consultar, analizar y difundir información
estadística en una forma distribuida, homogénea e
intuitiva a través de diferentes herramientas.
Información oportuna y confiable disponible en
cualquier punto de la red INEGI o desde internet
a través de redes privadas virtuales.
Generación de modelos multidimensionales en
estrella para facilitar la consulta y la
generación de cubos para el sitio del INEGI en
Internet. Datos y metadatos independientes de
las aplicaciones. Capacidad de ejecutar
consultas a la medida y para la generación de
productos y servicios. Permisos de acceso en
base al perfil de los usuarios. Capacidad de
obtener datos de diferentes proyectos
estadísticos (censos, encuestas y registros
administrativos). Acceso de personal de otras
instituciones (conapo, sedesol). Incremento en
el aprovechamiento de la información.
Retroalimentación a los procesos para su mejora.
10Esquema general
Cadena de valor actual (producción de información
estadística básica)
Planeación
Diseño Conceptual
Captación de la información
Definición de proced. de captación
y procesamto.
Diseño Muestral
Atención a requerimientos especiales
Presentación de resultados
Procesamiento
Nueva cadena de valor
Planeación
Diseño Conceptual
Captación de la información
Definición de proced. de captación
y procesamto.
Diseño Muestral
Gestión del Almacén
Almacén de datos
Presentación de resultados
Explotación y sistemas de consulta
Procesamiento
Productos comerciales y portal INEGI
...AGREGANDO VALOR A LA CADENA
11Arquitectura de datos
Portal del INEGI en Internet
MOLAP
Procesos de sumarización
MOLAP
ROLAP
Información fuente (BD relacional)
ROLAP
Metadatos
Programas de extracción, transformación y carga
Archivos (planos, delimitados, dbf, etc.)
Sistemas Operacionales
12Almacén de Datos Estadísticos (data warehouse)
Herramientas de consulta y análisis
Desarrollos INEGI
Herramientas comerciales
Herramientas estadísticas
- Oracle Discoverer
- Brio
- Excel
- SQL
Análisis estratégico
- Sitio del INEGI
- INEGI en PDA
-
- Sistema de Consulta en Intranet
- SCAI
Análisis táctico
Consultas no planeadas
- SQL
- PL/SQL
- Delphi
- JSP
- ASP
Programación de reportes
Desarrollo de aplicaciones
13Eventos estadísticos incorporados
-
- XII Censo General de Población y Vivienda, 2000.
- Cuestionario ampliado del XII CGPV 2000.
- XI Censo General de Población y Vivienda, 1990.
- Censos Económicos 1999.
- Estadística de Educación ciclo 1998-1999.
- Encuesta sobre Seguridad y Orden Público 1998 a
2001. - Estadística de mortalidad 1985 a 2001.
- Estadística de nacimientos 1985 a 2001.
- Encuesta Nacional de Empleo 2000-2003.
- Encuesta Nacional de Ingreso Gasto de los Hogares
1996, 1998 y 2000. - Encuesta Industrial Mensual 1998 a 2002.
- Estadística de Comercio Exterior Junio 2002
(Hacienda). - Censo Ejidal y de Comunidades Agrarias 2001.
- Estadística de Comercio Exterior mensual (Banco
de México). - Estadística de Comercio Exterior anual (Banco de
México).
14Eventos estadísticos a incorporar 2003-2004
- Censos Económicos 1994 (comercio y servicios).
- Conteo de Población y Vivienda 1995.
- Estadística de Cultura 1995-2001.
- Estadística de Relaciones Laborales 1990-2001.
- Estadística de Matrimonios y Divorcios 1985-2001.
- Encuesta Nacional de Ingreso Gasto de los Hogares
2002. - Censos Agropecuarios 1991.
- Cuenta satélite de turismo.
- Módulos ENEU.
- MONACO 2001.
- PONRE 2001.
- ENVIF 1999.
- ENPINF 1999.
- DINAF 1998.
- ERMEU 1998.
- ENEZI 1997.
- ENSS 1996.
- PROBECAT 1996.
- SEGDES 1993.
- EMPED 1993.
- ENAMFIR 2002.
- ENAMIN 92,94,96 Y 98.
- ENCUP 2001.
- ENASEM 2001.
- ENSS 2000.
- ENPECYT 2001.
- ENECE 2001.
15Lineamientos en el desarrollo de dwh
16Lineamientos para el desarrollo de data warehouse
en la APF
- Generales
- Los datos deben estar claramente separados de las
aplicaciones para garantizar la flexibilidad del
acceso. - Los modelos de datos deben ser homogéneos para
facilitar la conexión desde diferentes
herramientas. - Los datos deben estar homologados.
- Se deben incorporar metadatos suficientes para
garantizar la correcta interpretación de la
información. - Definir diferentes niveles de resumen y
agregación de la información para los distintos
tipos de usuario. - - Garantizar la seguridad de la información.
17Lineamientos para el desarrollo de data warehouse
en la APF
- En el contexto del SNIEG
- Facilitar el compartir información con diferentes
generadores y usuarios a través de estándares de
intercambio de información como XML y con
metadatos integrados. - Proporcionar interfaces que permitan ligar la
información con la de otras fuentes. - - Incorporar las metodologías de generación y
procesamiento de los datos.