bodegas de datos - mineriadedatos-uniciencia

Download Report

Transcript bodegas de datos - mineriadedatos-uniciencia

OBTENER CONOCIMIENTO
Conocimiento
Minería
Bodega de Datos
ETL
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
La toma de decisiones empresarial requiere una vista unificada de
Todos los datos de la organización
Ing. Andrés Vargas - [email protected]
http://jimenezshaw.wordpress.com/2010/04/20/introduccion-a-las-comunicaciones-unificadas/
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
Las bodegas de datos son bases de datos que
soportan la toma de decisiones a nivel
empresarial
Toma de
Decisiones
Sistemas
Operacionales
Bodegas de Datos
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
Obtener la vista empresarial tiene varios retos:





Existen diferentes tipos de estructuras de datos
Sinónimos
Datos estructurados y no estructurados
Valores de datos inconsistentes
Valores faltantes
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
La bodega de datos es un repositorio de
información conformado desde múltiples
fuentes, guardado bajo un esquema unificado
en un solo sitio
Area1
Área de
Staging
BD
Arean
Herramientas de Consulta
Bodegas de Datos
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERISTICAS
Permite aislar las consultas OLTP de las OLAP
OLTP
OnLine Transactional
Processing
OLAP
OnLine Analitical
Processing
La bodega es orientada a un tema en particular
No orientada a aplicaciones
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERISTICAS
La bodega tiene una vista integrada de datos
 Datos desde diferentes aplicaciones son
integrados, removiendo las inconsistencias
(unificados, limpios y estandarizados)
Sistemas
Operacionales
Bodega de Datos
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERÍSTICAS
Incluye datos históricos
 Lo cual permite hacer análisis de tendencias
Para los análisis se espera que la base de datos
tenga la mayor cantidad de datos posible
 Bases de datos de gran tamaño
En las bodegas se guardan solo datos en
formato de lectura, se realiza un refresco
periódico y se mantiene registro de los cambios
Se afina para consultas y no para operación
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BENEFICIOS
Calidad de datos
Vista unificada de los datos
Integración de datos
Reportes ad-hoc
Provee capacidades para inteligencia de
negocios
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
CONSTRUCCIÓN
Antes de construir una bodega es necesario
resolver las siguientes preguntas:
 Aproximación top – down o bottom up
• Bodega de Datos o Almacén de Datos
 Alcance departamental o empresarial
• Bodega de Datos o Almacén de Datos
TOP DOWN
Bill Inmon es uno de los proponentes
Una bodega es un repositorio centralizado de
toda la empresa
Los datos son almacenados en el mas bajo
nivel de granularidad basado en un modelo de
datos normalizado
TOP DOWN
La Bodega es el Centro
Imagen: http://tecnoxml.wikidot.com/oracle
TOP DOWN
Ventajas
 Vista empresarial de los datos
 Almacén centralizado de datos
 Control y reglas centralizadas
 Desventajas




Toma mucho tiempo construirlo
Altamente expuesto a fallos
Se requiere conocimiento integral del negocio
La inversión es muy alta y una prueba de
concepto es compleja
BOTTOM UP
Ralph Kimball es uno de los proponentes
La bodega de datos corporativa es una
colección conformada de almacenes de datos
ALMACEN DE DATOS
Una bodega de datos de alcance departamental
Guarda solo datos relevantes de un área de
negocio.
Imagen: http://www.monografias.com/trabajos75/inteligencia-negocios/inteligencia-negocios3.shtml
BOTTOM UP
Los almacenes contienen datos de mas bajo
nivel de granularidad y agregados dependiendo
las necesidades de análisis.
BOTTOM UP
Ventajas
 Implementación fácil y rápida en piezas de
negocio manejables
 Favorable ROI y prueba de concepto
 Menor riesgo de fallas
 Inherentemente incremental
 Desventajas
 Cada almacén tiene su propia vista de datos
 Podría tener redundancia de datos