OLAP vs OLTP

Download Report

Transcript OLAP vs OLTP

OLAP vs OLTP
OLAP vs. OLTP
• OLTP (On Line Transaction Processing)
(Procesamiento de transacción en línea)
Bases de datos orientadas al
procesamiento de transacciones.
• OLAP (On Line Analytic Processing)
(Procesamiento analítico en línea)
Bases de datos orientadas al
procesamiento analítico.
OLTP
OLAP
Insert
Update
Select
ACID
Delete
OLAP
• Permite a los usuarios de negocio examinar
minuciosamente los datos a su antojo.
• Normalmente, los datos en una organización se
distribuyen en múltiples fuentes de datos y son
incompatibles entre sí.
• Un ejemplo de venta:
– Los datos de punto de ventas y las ventas realizadas a
través del call-center o en la web se almacenan en lugares
y formatos diferentes. Para un ejecutivo obtener informes
OLAP como - ¿Cuáles son los productos más populares
comprados por clientes entre las edades de 15 a 30? es un
proceso que lleva tiempo.
• Parte del proceso de implementación OLAP
consiste en extraer los datos de diferentes
repositorios y hacerlos compatibles.
• Hacer compatibles los datos consiste en
garantizar que el significado de los datos en un
repositorio coincida con el de otros repositorios.
• Un ejemplo de datos incompatibles:
– Las edades de los clientes se pueden almacenar como
fecha de nacimiento en las compras realizadas a
través de Internet y almacenarse en categorías de
edad (es decir, entre 15 y 30) para ventas en las
tiendas.
OLAP vs. OLTP
Sistema Operacional (OLTP)
Data Warehouse (Basado en Modelos
Dimensionales: OLAP)
Almacena datos actuales.
Almacena datos históricos.
Almacena datos de detalle.
Amacena datos de detalle y datos
agregados a distintos niveles.
Los datos son dinámicos (actualizables).
Los datos son estáticos.
Las transacciones son repetitivos.
Los procesos no son previsibles.
El número de transacciones es elevado.
El número de transacciones es bajo o
medio.
Dedicado al procesamiento de
transacciones.
Dedicado al análisis de datos.
Orientado a los procesos de la
organización.
Orientado a la información relevante.
Soporta decisiones diarias.
Soporta decisiones estratégicas.
Sirve a muchos usuarios administrativos.
Sirve a técnicos de dirección.
Data Warehouse
• El objetivo del almacenamiento de datos es generar un
front-end de análisis que apoye a los ejecutivos de
negocios y gerentes de operaciones.
Pre-Data Warehouse
• Proporciona los datos para el Data Warehouse.
• Metadatos garantiza la exactitud de los datos
que entran en el proceso de ciclo de vida de los
datos. Asegura que los datos tienen el formato y
relevancia.
Limpieza de Datos
• Antes de que los datos entren en el almacén de
datos, la extracción, transformación y limpieza
(ETL) asegura que los datos pasan el umbral de
calidad de datos.
• ETLs son también responsables de las tareas
programadas que extraer los datos de los OLTPs.
Repositorios de Datos
• El Data Warehouse es la base de datos que almacena datos activos
de valor de negocio para una organización.
• Hay variantes de Almacenes de Datos - Data Marts y ODS.
• Los Data Marts no son físicamente diferentes de los almacenes de
datos.
– Pueden ser vistos como pequeños data warehouses basados en un
departamento en lugar de a nivel de toda la compañía.
• Un Data Warehouse recoge datos y es el depositario de datos
históricos. Por lo tanto, no siempre es eficiente para proporcionar
análisis hasta la fecha . Aquí es donde los ODS, almacenes de datos
operativos, ayudan.
• Los ODSs se utilizan para mantener los datos más recientes antes
de la migración hacia el Data Warehouse.
• ODS se utilizan para almacenar datos que tienen una historia más
profunda que OLTPs. Mantener grandes cantidades de datos en
OLTPs puede reducir la velocidad de procesamiento – imaginen
esperar en el cajero automático 10 minutos entre las indicaciones
para las entradas.
Análisis Front End
• Las aplicaciones de front-end que los usuarios de negocio a utilizan
para interactuar con los datos almacenados en los repositorios.
• Data Mining: es el descubrimiento de patrones útiles en los datos.
Por ejemplo, ¿Cuál es la probabilidad de que un cliente migre a un
competidor?
• OLAP, procesamiento analítico en línea, se utiliza para analizar
datos y a menudo son utilizados por los gerentes de marketing. Por
ejemplo: ¿Cuántos clientes entre los 24-45 años de edad, que viven
en la provincia del Guayas, compran más de $1000 dólares en el
supermercado en un mes?
• Las Herramientas de informes se utilizan para proporcionar
informes sobre los datos.
• Las Herramientas de visualización de datos se usan para mostrar
datos de un repositorio de datos. A menudo, la visualización de
datos se combina con la minería de datos y herramientas OLAP. La
Visualización de datos puede permitir al usuario manipular los
datos para mostrar la relevancia y los patrones.
OLTP
• Ejemplos de OLTPs pueden
incluir ERP, CRM, SCM,
aplicaciones de Punto de
Venta, Call Center.
• Están diseñados para una
velocidad de transacción
óptima.
• Los datos no se almacenan
por un período prolongado
en OLTPs, por costos de
almacenamiento y las
razones de velocidad de
transacciones.
Modelo de Datos para un OLTP
OLAP
Modelo Dimensional de Datos
• OLAPs están diseñados para
ofrecer un análisis general de
lo que sucedió.
• Por lo tanto el
almacenamiento de datos (es
decir, el modelado de datos)
tiene que establecerse de
manera diferente.
• El método más común es el
diseño de la estrella.
• Son distintos a la tercera
forma normal, utilizados en
sistemas OLTP.
El supervisor que dio la mayoría de los descuentos.
La cantidad enviada en una fecha determinada, mes, año o trimestre.
En cual código postal el producto A se vende más.
OLAP
Para obtener respuestas, como las anteriores, a partir
de un modelo de datos cubos OLAP se crean.
Para los usuarios es llamado cubo mientras que para
los desarrolladores modelo multidimensional.
Cubos OLAP no son estrictamente cuboides - es el
nombre dado al proceso de vinculación de datos desde
las diferentes dimensiones.
Tiempo
Cliente
Producto
Conceptos
• Dimensión: Es una categoría de información, por
ejemplo, la dimensión del tiempo.
• Atributo: Es un nivel único dentro de una dimensión,
por ejemplo Mes en la dimensión del tiempo.
• Jerarquía: La especificación de niveles que
representa la relación entre los diferentes atributos
en una dimensión, por ejemplo, Año->Trimestre>Mes->Día
Conceptos
• Tabla de hechos: La tabla de hechos contiene
las medidas de interés. Por ejemplo, el monto
de ventas puede ser esta medida. Esta medida
puede ser almacenada en la tabla de hechos
con la granularidad apropiada. Por ejemplo
puede ser monto de ventas en cada tienda
cada día.
Conceptos
• Granularidad: Se refiere al mínimo nivel de
información que será almacenada en la tabla
de hechos. Es el nivel de detalle.
Conceptos
• Tabla LookUp: Provee información detallada acerca
de los atributos. Por ejemplo, una tabla LookUp para
el atributo Trimestre incluiría una lista de
información de todos los trimestres disponibles en el
datawarehouse, y cada columna (cada trimestre)
incluiría muchos campos entre ellos un id que
identifique al Trimestre, y campos adicionales que
especifiquen que tan particular es el trimestre
(primer trimestre del año, etc.)
Enfoque Tecnológico
• Desktop OLAP (DOLAP)
– El cubo se forma en el cliente
– Las operaciones las realiza el cliente una vez que
se extrae la información de las bases.
Motor
Cubo
Motor
Cliente
Enfoque Tecnológico
• Relational OLAP (ROLAP)
– El visualizador pregunta al cubo creado dónde
está la base, ambos creados por el RDMS (motor),
si se requiere algo de otra base, los motores
interactúan y el cubo se forma con esos datos.
Cliente
Enfoque Tecnológico
• Multidimensional OLAP (MOLAP)
– El MDBMS forma la base, abstrayendo datos de
otras bases RDBMS.
– El cubo es creado por el MDBMS
– WAC permite la manipulación del cubo.
RDBMS
MDBMS
Cliente
RDBMS
Enfoque Tecnológico
• Hibrid OLAP (HOLAP): Mezcla el
multidimensional con el ROLAP.
Visualizando el Cubo..
Ana
250 100 250 300
10
15
17
100
100
50
30
20
300
400 200 100
Juan
Mia
Pablo
Gye Uio Cue Rio
El punto cartesiano
es un conjunto de
valores.
El cubo siempre va
a tener la dimensión
del tiempo.
Visualizando el Cubo..
Drill UP, Drill Down,
subo y bajo según mi
granularidad lo
permita.
Ana
Cuando se quiere
cambiar de columna,
se lo hace bajo
ciertas condiciones,
como el efecto de la
columna de pivoteo,
al cambiarla, cambian
sus coordenadas.
Juan
Mia
Pablo
2001
2002
2003
Gye Uio Cue Rio