Diapositiva 1 - PowerPoint PPT Presentation

1 / 17
About This Presentation
Title:

Diapositiva 1

Description:

Proceso de Maduraci n de la Inform tica. Definiciones de un dwh. Colecci n de datos variante en el tiempo, ... Un almacenamiento de datos sencillo e integrado, ... – PowerPoint PPT presentation

Number of Views:65
Avg rating:3.0/5.0
Slides: 18
Provided by: jessgonz
Category:
Tags: diapositiva | enc

less

Transcript and Presenter's Notes

Title: Diapositiva 1


1
Tidap 2003 INEGI Almacén de datos (data
warehouse)
2
Evolución
Proceso de Maduración de la Informática
3
Definiciones de un dwh
Colección de datos variante en el tiempo, no
volátil, Integrada, orientada a temas de
interés para el soporte a la toma de decisiones.
(Bill Inmon)
4
Definiciones de un dwh
Un almacenamiento de datos sencillo e integrado,
utilizado para la toma de decisiones y
planeación, que provee bases para la
infraestructura de toda la empresa. Es
importante resaltar que no se debe considerar al
data warehouse como un producto, sino más bien
como un procedimiento para ordenar y manejar de
manera apropiada información de fuentes
dispersas (www.ncr.com)
5
Características de un dwh
  • Integrado (Consistencia entre diferentes
    fuentes).
  • Orientado al área de interés (Temático).
  • Variante en el tiempo (Histórico).
  • No volátil (No se actualiza, se incrementa).

6
Estructura de un dwh
Datos Fuente
Transformación de Datos
Warehouse Empresarial
Consultoria Tecnología Capacitación
Metadatos Modelo Lógico Diseño Físico de la
B.D. Dicc. de Datos
Administración de Red Administración de B.
D. Admón de Sistemas
Data mart dependientes
Descubrimiento del conocimiento
????????????
Acceso a la información/aplicaciones
Analista
Clientes/Usuarios
Usuarios
Ingeniero de Conocimiento
Servidor De aplicaciones
7
Data Warehouse Estadístico del INEGI
8
En qué consiste el proyecto?
  • Repositorio de información estadística del país
    para consulta y análisis que permita a los
    usuarios tomar mejores decisiones como parte del
    Sistema Nacional de Información Estadística y
    Geográfica.
  • Sus elementos principales son
  • Procesos automáticos de extracción,
    transformación y carga para mantener la
    información actualizada.
  • Información
  • Integrada
  • Validada
  • Documentada
  • Única
  • Facilidades de acceso a la base de datos desde
    cualquier punto de la red INEGI para la consulta,
    explotación y análisis de la información.

9
Necesidades por atender con el proyecto.
Consultar, analizar y difundir información
estadística en una forma distribuida, homogénea e
intuitiva a través de diferentes herramientas.
Información oportuna y confiable disponible en
cualquier punto de la red INEGI o desde internet
a través de redes privadas virtuales.
Generación de modelos multidimensionales en
estrella para facilitar la consulta y la
generación de cubos para el sitio del INEGI en
Internet. Datos y metadatos independientes de
las aplicaciones. Capacidad de ejecutar
consultas a la medida y para la generación de
productos y servicios. Permisos de acceso en
base al perfil de los usuarios. Capacidad de
obtener datos de diferentes proyectos
estadísticos (censos, encuestas y registros
administrativos). Acceso de personal de otras
instituciones (conapo, sedesol). Incremento en
el aprovechamiento de la información.
Retroalimentación a los procesos para su mejora.
10
Esquema general
Cadena de valor actual (producción de información
estadística básica)
Planeación
Diseño Conceptual
Captación de la información
Definición de proced. de captación
y procesamto.
Diseño Muestral
Atención a requerimientos especiales
Presentación de resultados
Procesamiento
Nueva cadena de valor
Planeación
Diseño Conceptual
Captación de la información
Definición de proced. de captación
y procesamto.
Diseño Muestral
Gestión del Almacén
Almacén de datos
Presentación de resultados
Explotación y sistemas de consulta
Procesamiento
Productos comerciales y portal INEGI
...AGREGANDO VALOR A LA CADENA
11
Arquitectura de datos
Portal del INEGI en Internet
MOLAP
Procesos de sumarización
MOLAP
ROLAP
Información fuente (BD relacional)
ROLAP
Metadatos
Programas de extracción, transformación y carga
Archivos (planos, delimitados, dbf, etc.)
Sistemas Operacionales
12
Almacén de Datos Estadísticos (data warehouse)
Herramientas de consulta y análisis
Desarrollos INEGI
Herramientas comerciales
Herramientas estadísticas
  • Oracle Discoverer
  • Brio
  • Excel
  • SQL

Análisis estratégico
  • Sitio del INEGI
  • INEGI en PDA
  • Sistema de Consulta en Intranet
  • SCAI
  • SAS
  • SPSS

Análisis táctico
Consultas no planeadas
  • SQL
  • PL/SQL
  • Delphi
  • JSP
  • ASP

Programación de reportes
Desarrollo de aplicaciones
13
Eventos estadísticos incorporados
  • XII Censo General de Población y Vivienda, 2000.
  • Cuestionario ampliado del XII CGPV 2000.
  • XI Censo General de Población y Vivienda, 1990.
  • Censos Económicos 1999.
  • Estadística de Educación ciclo 1998-1999.
  • Encuesta sobre Seguridad y Orden Público 1998 a
    2001.
  • Estadística de mortalidad 1985 a 2001.
  • Estadística de nacimientos 1985 a 2001.
  • Encuesta Nacional de Empleo 2000-2003.
  • Encuesta Nacional de Ingreso Gasto de los Hogares
    1996, 1998 y 2000.
  • Encuesta Industrial Mensual 1998 a 2002.
  • Estadística de Comercio Exterior Junio 2002
    (Hacienda).
  • Censo Ejidal y de Comunidades Agrarias 2001.
  • Estadística de Comercio Exterior mensual (Banco
    de México).
  • Estadística de Comercio Exterior anual (Banco de
    México).

14
Eventos estadísticos a incorporar 2003-2004
  • Censos Económicos 1994 (comercio y servicios).
  • Conteo de Población y Vivienda 1995.
  • Estadística de Cultura 1995-2001.
  • Estadística de Relaciones Laborales 1990-2001.
  • Estadística de Matrimonios y Divorcios 1985-2001.
  • Encuesta Nacional de Ingreso Gasto de los Hogares
    2002.
  • Censos Agropecuarios 1991.
  • Cuenta satélite de turismo.
  • Módulos ENEU.
  • MONACO 2001.
  • PONRE 2001.
  • ENVIF 1999.
  • ENPINF 1999.
  • DINAF 1998.
  • ERMEU 1998.
  • ENEZI 1997.
  • ENSS 1996.
  • PROBECAT 1996.
  • SEGDES 1993.
  • EMPED 1993.
  • ENAMFIR 2002.
  • ENAMIN 92,94,96 Y 98.
  • ENCUP 2001.
  • ENASEM 2001.
  • ENSS 2000.
  • ENPECYT 2001.
  • ENECE 2001.
  • ...

15
Lineamientos en el desarrollo de dwh
16
Lineamientos para el desarrollo de data warehouse
en la APF
  • Generales
  • Los datos deben estar claramente separados de las
    aplicaciones para garantizar la flexibilidad del
    acceso.
  • Los modelos de datos deben ser homogéneos para
    facilitar la conexión desde diferentes
    herramientas.
  • Los datos deben estar homologados.
  • Se deben incorporar metadatos suficientes para
    garantizar la correcta interpretación de la
    información.
  • Definir diferentes niveles de resumen y
    agregación de la información para los distintos
    tipos de usuario.
  • - Garantizar la seguridad de la información.

17
Lineamientos para el desarrollo de data warehouse
en la APF
  • En el contexto del SNIEG
  • Facilitar el compartir información con diferentes
    generadores y usuarios a través de estándares de
    intercambio de información como XML y con
    metadatos integrados.
  • Proporcionar interfaces que permitan ligar la
    información con la de otras fuentes.
  • - Incorporar las metodologías de generación y
    procesamiento de los datos.
Write a Comment
User Comments (0)
About PowerShow.com