3. DW_modello_dati - Dipartimento di Informatica
Download
Report
Transcript 3. DW_modello_dati - Dipartimento di Informatica
Datawarehousing
Basi dati dei sistemi decisionali:
! Insieme di dati +
! strumenti per effettuare vari tipi di
interrogazioni a carattere statistico e
analitico (operatori OLAP)
Business Intelligence
Modello dei dati
Federica Cena
Modello dei dati
!
!
Analisi dimensionale
DW basati sul concetto di FATTO di INTERESSE
Si basa su modello dei dati multidimensionale
! Modello
-
-
-
2
dimensionale
Semplice da capire
Non ambiguo
Riflette il modo in cui i decision maker pensano
Federica Cena
Domande cui vogliono rispondere i decisori:
! Informazioni riassuntive, con la possibilità di
dettagliare i riassunti
! Analisi delle informazioni riassuntive in base a
componenti organizzative come “aree” e
“dipartimenti”
! Possibilità di “slice”(affettare) and “dice” (tagliare
a dadini) delle informazioni
! Possibilità di vedere le informazioni nel tempo
! Vedere le informazioni sia in forma tabulare che
grafica
3
4
Federica Cena-
1
Analisi dimensionale
Modello dei dati multidimensionale
È un metodo di progettazione del DW
!
Consiste nell’intervistare i decision maker e
chiedere in quale
!
-
-
Subject area sono maggiormente interessati
Quali sono le più importanti dimensioni di analisi
!
!
Fatto: concetto di interesse per il processo
decisionale (ad esempio, vendite)
Misure: proprietà numerica di un fatto, descrive
un aspetto quantitativo (quantità venduta,
incasso)
Dimensioni: proprietà con un dominio finito di
un fatto, descrive una coordinata di analisi
(luogo, prodotto)
Un fatto è analizzato attraverso tante dimensioni.
5
Federica Cena
Federica Cena-
Modello multidimensionale
Esempio di analisi
Fatti: behavioural, dati comportamentali, derivano
da interazione utente con il sistema, dinamici,
cambiano
Dimensioni: circumstances (attributi), cambiano
meno
! Possibili
6
dimensioni
Prodotto (tipo di prodotto)
" Tempo (mese, bimestre, anno)
" Cliente (dettaglio, grossista, diretto)
" Responsabilità (punto vendita, rivenditore)
"
! Lo
schema multidimensionale favorisce la
multidimensionalità del ragionamento
Ma i cambiamenti dei behavioural dipendono da
circumstances: bisogna gestire il cambiamento
delle dimensioni
- Tempo di validità: da .. A..
- Tabella in relazione 1:m con la dimensione
"
7
Che cosa? chi? Quanto? Come? Dove?
8
Federica Cena-
2
Esempio di analisi
Esempio di analisi
I dati vengono analizzati per identificare
tendenze e, quindi, facilitare il processo
decisionale
"
"
Quale e’ il mese con le maggiori vendite?
Quali sono stati i primi cinque prodotti venduti
a Pisa?
Interessano non solo i dati ma anche le loro
aggregazioni (media, il minimo,
massimo, somma, etc)
9
10
Datawarehouse: obiettivi
! Rappresentazione
Federica Cena
11
a matrice
Federica Cena
12
3
Modello multidimensionale
! Le
dimensioni possono essere più di tre,
ma non è intuitivo immaginarlo
! Anche le misure possono essere più di una
(nella cella ci saranno più valori)
14
Federica Cena
15
16
4
Caratteristiche dei DW
Cubo
Assi: tempo, cliente, prodotto
misura: vendita
Ogni elemento del cubo (minicubo) contiene i valori
di vendita per un particolare cliente, prodotto at
un tempo particolare
17
Federica Cena-
Federica Cena
Gerarchia delle dimensioni
Gerarchia delle dimensioni
! Ogni
esempio dimensione tempo
dimensione può essere strutturata in
una gerarchia di variabili che rappresentano
diversi livelli di aggregazione
! esempio dimensione punto vendita
19
18
20
5
Gerarchia delle dimensioni
esempio dimensione prodotto
Modello Concettuale
21
Modello concettuale dei dati
Modello concettuale: tipi
! Dimensional
! A
Fact Model [GolfarelliRizzi] (DFM) e’ un modello concettuale
grafico per DW che contiene fatti,
dimensioni, gerarchie. DFM definisce una
visione concettuale astratta di ogni fatto
disponibile nel sistema
! A
stella
fiocco di neve (snowflakes)
!
23
Federica Cena
24
6
Modello concettuale: modalità di
rappresentazione
Modello concettuale (E-R)
! Si
puo’ rappresentare con
Schema E-R
" DOT model (rappresenta i fatti come
punti)
"
Punto
vendita
prodotto
1:n
N:1
vendita
1:n
tempo
25
26
Modello concettuale (Dot Model)
Sesso
Stato Civile
Dimensione
Operatori
Localizzazione città
Clienti
Regione
Provincia_dest
Localizz_dest
Provincia
Professio
ne
Modello Logico
Regione
Categoria
Viaggi
Mezzi
Sistemazione
Periodo
7
1) Modello a stella
1) Modello a stella implementato
29
2) Modello a snowflake
30
Modello a sowflakes implementato
31
32
8
Modello logico
! Prodotto
(id_prodotto, nome)
(id_punto, città, regione)
! Tempo (id_tempo,mese, anno)
! Vendite (id_prodotto, id_punto, id_tempo,
quantità)
! Punto_vendita
Federica Cena
33
9