Title: Data Warehousing
1Data Warehousing
Ricardo Martín Pérez rmartin_at_solcomla.com Tel
56118222
rmartin_at_solcomla.com
2Qué es Business Intelligence?
- Es el proceso de extraer y recolectar información
de los diferentes sistemas de la organización,
almacenarlos para producir conocimiento y
analizar diferentes áreas del negocio, que
permitan tomar mejores decisiones y obtener
mejores resultados proporcionando un fácil acceso
a la información
Con las Repuestas Correctas los Resultados
son Alcanzables
De acuerdo con estudios de Bloor Research y
Pricewaterhouse Coopers los errores en la
información para toma de decisiones cuestan entre
10,000 y 100,000 dólares por decisión por mes.
3Conocimiento, El Activo mas Valioso
- Las organizaciones son sistemas cognitivos que
acumulan información con base en la experiencia
CONOCIMIENTO
Decidir
Analizar
Actuar
Capturar
DATOS
4Utilización de Información
Al Conocimiento
De los Datos
5Transformar la Información en Acción
Datos Duros (Raw Data)
Análisis, Reporteo y Medición con Business
Intelligence
Análisis lento, difícil y propenso a errores.
No permite identificar problemas y
oportunidades. Difícil Mantenimiento
6Data Warehouse
- El concepto de Data Warehouse existe desde hace
más de quince años, sin embargo, muchas empresas
grandes y pequeñas, aún no logran consolidar su
información de manera útil en un depósito central
de datos. - El Data Warehouse es el cerebro de todo proyecto
de Business Intelligence. - De su diseño correcto depende la capacidad de la
empresa para analizar la información fácil y
oportunamente.
7Un Data Warehouse debe..
- Hacer que la información de una empresa y
organización esté fácilmente accesible. - Presentar la información de forma consistente.
- Ser adaptable y resistente al cambio.
- Proteger la información confidencial.
- Servir como la piedra angular para una mejor toma
de decisiones.
8Arquitectura de una Solución de BI
9Proceso
Crecimiento
Plan de Proyecto
Puesta en Producción
Proceso de Carga
Diseño Físico
Definición Detallada de Requerimientos
Modelo Dimensional OLAP
Desarrollo de Aplicación de BI
Mantenimiento
Administración de Proyecto
10Temas Importantes (factores críticos de éxito)
- Fase de Análisis
- Es la fase en donde se crean los planos del
módulo a construir. Participar es clave.
Definición detallada de Requerimientos - Calidad de Datos
- La calidad de la información de los sistemas
fuente es importante y rara vez es perfecta. El
sistema maneja algunas inconsistencias pero no
modifica nunca la fuente - Hay que aprender algo nuevo - OLAP
- Es importante que todos estemos dispuestos a
aprender una nueva forma de trabajar y analizar
la información.
11OLAP On Line Analytical Processing
12Componentes de una Base de Datos de OLAP
13Diferencias OLPT vs DWH
Sistema Tradicional
Data Warehouse
- Predomina la actualización.
- La actividad más importante es el análisis y la
decisión estratégica.
- La actividad más importante es de tipo operativo
(día a día).
- Predomina el proceso puntual.
- Predomina el proceso masivo.
- Datos en distintos niveles de detalle y
agregación.
- Datos en general desagregados.
- Importancia del dato actual.
- Importancia del dato histórico.
- Importante del tiempo de respuesta de la
transacción instantánea.
- Importancia de la respuesta masiva.
- Usuarios de perfiles altos.
- Usuarios de perfiles medios o bajos.
- Explotación de toda la información interna y
externa relacionada con el negocio.
- Explotación de la información relacionada con la
operativa de cada aplicación
14Ventajas de usar un Data Warehouse
- Transforma datos orientados a las aplicaciones en
información orientada a la toma de decisiones.
- Permite un análisis inmediato de los resultados
de compras, ventas...
- Agilidad en el control de stocks.
- Capacidad de analizar y explorar las diferentes
áreas de trabajo.
- Relación total con el cliente.
- Facilidades en la gestión y análisis de recursos.
- Conexionar departamentos empresariales ( que
antes formaban islas ).
- Reaccionar rápidamente a cambio del mercado.
15Minería de Datos (Data Mining - DM)
- Data Mining o Minería de Datos es un área que se
agrupa en torno a la gestión del conocimiento y
que es un conjunto de metodologías y herramientas
que permiten extraer el conocimiento útil
(patrones de comportamiento, modos de operación,
información útil para descubrir fallos,
tendencias, etc.). - La minería de datos es considerara como un gran
soporte para la toma de decisiones, comprensión y
mejora de procesos o sistemas, etc. partiendo de
grandes cantidades de datos.
16Fases de un proceso de DM