bodegas de datos - mineriadedatos-uniciencia
Download
Report
Transcript bodegas de datos - mineriadedatos-uniciencia
OBTENER CONOCIMIENTO
Conocimiento
Minería
Bodega de Datos
ETL
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
La toma de decisiones empresarial requiere una vista unificada de
Todos los datos de la organización
Ing. Andrés Vargas - [email protected]
http://jimenezshaw.wordpress.com/2010/04/20/introduccion-a-las-comunicaciones-unificadas/
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
Las bodegas de datos son bases de datos que
soportan la toma de decisiones a nivel
empresarial
Toma de
Decisiones
Sistemas
Operacionales
Bodegas de Datos
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
Obtener la vista empresarial tiene varios retos:
Existen diferentes tipos de estructuras de datos
Sinónimos
Datos estructurados y no estructurados
Valores de datos inconsistentes
Valores faltantes
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BODEGAS DE DATOS
La bodega de datos es un repositorio de
información conformado desde múltiples
fuentes, guardado bajo un esquema unificado
en un solo sitio
Area1
Área de
Staging
BD
Arean
Herramientas de Consulta
Bodegas de Datos
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERISTICAS
Permite aislar las consultas OLTP de las OLAP
OLTP
OnLine Transactional
Processing
OLAP
OnLine Analitical
Processing
La bodega es orientada a un tema en particular
No orientada a aplicaciones
Ing. Andrés Vargas - [email protected]
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERISTICAS
La bodega tiene una vista integrada de datos
Datos desde diferentes aplicaciones son
integrados, removiendo las inconsistencias
(unificados, limpios y estandarizados)
Sistemas
Operacionales
Bodega de Datos
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
CARACTERÍSTICAS
Incluye datos históricos
Lo cual permite hacer análisis de tendencias
Para los análisis se espera que la base de datos
tenga la mayor cantidad de datos posible
Bases de datos de gran tamaño
En las bodegas se guardan solo datos en
formato de lectura, se realiza un refresco
periódico y se mantiene registro de los cambios
Se afina para consultas y no para operación
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
BENEFICIOS
Calidad de datos
Vista unificada de los datos
Integración de datos
Reportes ad-hoc
Provee capacidades para inteligencia de
negocios
Ing. Andrés Vargas - [email protected]
Definición: http://www3.uji.es/~mmarques/f47/apun/node83.html
Corporación Universitaria de
Ciencia y Desarrollo
CONSTRUCCIÓN
Antes de construir una bodega es necesario
resolver las siguientes preguntas:
Aproximación top – down o bottom up
• Bodega de Datos o Almacén de Datos
Alcance departamental o empresarial
• Bodega de Datos o Almacén de Datos
TOP DOWN
Bill Inmon es uno de los proponentes
Una bodega es un repositorio centralizado de
toda la empresa
Los datos son almacenados en el mas bajo
nivel de granularidad basado en un modelo de
datos normalizado
TOP DOWN
La Bodega es el Centro
Imagen: http://tecnoxml.wikidot.com/oracle
TOP DOWN
Ventajas
Vista empresarial de los datos
Almacén centralizado de datos
Control y reglas centralizadas
Desventajas
Toma mucho tiempo construirlo
Altamente expuesto a fallos
Se requiere conocimiento integral del negocio
La inversión es muy alta y una prueba de
concepto es compleja
BOTTOM UP
Ralph Kimball es uno de los proponentes
La bodega de datos corporativa es una
colección conformada de almacenes de datos
ALMACEN DE DATOS
Una bodega de datos de alcance departamental
Guarda solo datos relevantes de un área de
negocio.
Imagen: http://www.monografias.com/trabajos75/inteligencia-negocios/inteligencia-negocios3.shtml
BOTTOM UP
Los almacenes contienen datos de mas bajo
nivel de granularidad y agregados dependiendo
las necesidades de análisis.
BOTTOM UP
Ventajas
Implementación fácil y rápida en piezas de
negocio manejables
Favorable ROI y prueba de concepto
Menor riesgo de fallas
Inherentemente incremental
Desventajas
Cada almacén tiene su propia vista de datos
Podría tener redundancia de datos