Radboud University Nijmegen

Download Report

Transcript Radboud University Nijmegen

Get the facts, or the facts will get you.
And when you get them,
get them right, or they will get you wrong.
Dr. Thomas Fuller, Gnomologia, 1732
British physician (1654 - 1734)
Data Vault, The new Datawarehouse
Supermodel
Martijn Evers
Datawarehouse Architect Radboud University Nijmegen &
President Dutch Data Vault User group.
HUB
SAT.
HUB.
LINK
SAT
Introduction
• Welcome
• Who is ME?
• My Job
• My Employer
• Data Vault
This presentation
• Basic Introduction
- Core Concepts
- Not enough for deploying a working Data Vault!
• Giving Directions
- Understanding Usability
- Further study
• Fun 
• Alas no demo’s 
• Contains bonus slides 
• Do ask questions!
Agenda
• Cosmology of Data warehousing
• Data Vault
- Modelling
- Loading
• Data Vault Considerations & Comparisons
• Example of a Data Vault Analysis &
Transformation(METIS)
• Example DWH Data Vault Architecture
• Conclusion & wrap-up
• Star (schema’s)
- Aggregates as Planets
• Data Marts as Constellations
• Galaxies as
(Conformed) Data Marts
• Where is the Data Vault ?
• Information paradox
• Event Horizon
• Holographic Universe
• Elementary Particles
Data Vault
HUB
SAT.
vs.
Black Hole
HUB.
LINK
SAT
Data is retained indefinitely 
Vault  matter is trapped
Temporal, Accessible  Information Holographic ‘Visible’ and Frozen
Elementary facts Elementary  Elementary Particles
Integration points  Integrated  Singularity
Flexible, extensible Expandable  Expands on Matter/Information
Central EDW  Central Point Spinning point of the Galaxy
Historic Overview
© (Linstedt, Graziano, & Hultgren, The New Business Supermodel, The Business of Data Vault Modeling, 2008, p. 36)
•
•
•
•
•
•
Created By Dan Linstedt
Released in 2000
Formally Introduced in the Netherlands in 2007
First DV Book: The Business of Data Vault Modeling 2008
First (Dutch) User group in 2010
Technical book from Dan Linstedt in 2011
Data Vault Components
• Modeling
• ETL/Load architecture
• Kimball or Inmon ETL
- Complex ETL
- Truth oriented
- Business Rules before
EDW
ETL/Load Architecture
- 100% of the data
(within scope) 100%
of the time
- Source driven
/Auditable:
- “Fact Oriented”
- Template/metadata
driven
- No Business Rules
Pictures: Dan Linstedt ©
Data Vault Architecture
•
•
•
•
•
Central EDW
No Business Rules
Incremental/Non destructive Loading
100% of the data (within scope) 100% of the time
Auditable/Source Driven
Dualistic approach for central EDW
• DWH source driven or
demand driven?
• Source driven
• Goal oriented
• Neither may dominate!
Dualistic approach = realistic approach
• No problematic assumptions
• Detailed approach
• Clear principles
• User visible
Modeling a Data Vault
Legenda
Based on pictures by Dan Linstedt
Data Vault Modelling
• Primary Entity types
- HUB
- Unique list of business keys (customer number, order
number, part number)
- LINK
- Unique list of business keys combinations
- SATELLITE
- Tracks associated attributes through time
• Secondary Entity Types
- Hierarchical LINK
- Transactional LINK
• Helper Tables
- PIT
- Bridge
Loading a Data Vault
• Metadata
• Load Templates
- Hub
- Link
- Satellite
• Loading Phases
Common Minimal Metadata
• Load Sequence Data Vault ID dv_id , DV_SQN
• Load Date Time Stamp load_dts
• Load End Date Time Stamp load_dts_end
(optional)
• Record Source – record_src
Loading a HUB
INSERT INTO
customer_hub (cust#,load_dts,record_src)
SELECT source.customer#, @load_dts, @record_src
FROM source_customer AS source
WHERE
NOT EXISTS
(SELECT * FROM customer_hub AS hub WHERE
hub.customer#=source.customer#)
Pictures: Dan Linstedt ©
Loading a Link
Pictures: Dan Linstedt ©
Link Load query
INSERT INTO
custcontact_link(cust_id,contact_id,load_dts, record_src)
SELECT source.customer#, @load_dts, @record_src
FROM source_table AS source
INNER JOIN contact_hub AS contact ON
contact. contact#= source.contact#
INNER JOIN customer_hub AS cust ON
cust. customer#= source.customer#
WHERE
NOT EXISTS
(SELECT * FROM custcontact_link AS link WHERE
link. contact_id= contact.id and link.cust_id= cust.id)
Loading a Satellite
Pictures: Dan Linstedt ©
Satellite Load query
INSERT INTO
customer_sat (hub_id,load_dts, name,record_src)
SELECT
hub.id, @load_dts, source.cust_name, ,@record_src
FROM source_customer AS source
INNER JOIN customer_hub AS hub ON
cust.customer#= source.customer# #
INNER JOIN customer_sat AS sat ON
sat.id= hub.id# AND sat “Is most recent” AND
sat.name <> source.name
Data Vault Loading Phases
Where possible !
Pictures: Dan Linstedt ©
Parallel Loading
Synchronization Points/ Dependencies
• Staging
• Hubs
- Hub Satellites
• Links
- Link
• Link on Link
- Link on Link Satellites
• Data Mart Feed
- Full/Partial Refresh
- Incremental loads
Data Vault Considerations & Comparisons
• Pro’s
• Con’s
• Versus 3NF
• Versus. Dimensional Modelling
Data Vault Pro’s
• Scalability
- Provides for Multi-Terabyte
storage
- Delta Driven Information
- Loading
• Auditability
- Easier Detection of “Dead
Data”
- Generation of Audit Trails
- Quality Feedback loops
- Truth vs. Facts
• Standardization
- Standard Implementation
Architecture
- Restartable, Consistent
Loading Patterns.
- Generate ETL & Data model
(be careful)
• Flexible
- Rapid Build of Data Marts
- Handle combinations of
different arrival speeds
- Flexible and incremental
implementation & Deployment
(Agile BI).
• Robustness
- Isolated Development
- Restartable Loading
Data Vault Cons
• End-user Access & aggregation performance
- Not friendly for direct exploration and user access
- Not conducive to today’s BI tools.
- Not conducive to OLAP processing.
• Requires firm Architect
- Business Keys
- Truth vs. Facts
- DV Standards
• Additional Layer
- Might require additional processing
But…
• End-user Access & aggregation performance
- Semantical layers & Helper tables/views
- Segregation of storage & access
• Requires firm Architect
- Ignore at your own peril
- Business Keys
- Auditability
- Standardization
• Additional Layer
- Adds flexibility & robustness
Data Vault vs. 3NF
•
•
•
•
•
•
•
•
Many to Many Linkages •
Handle lots of
•
information
•
Tightly integrated
•
information
Highly structured
Reasonably conducive •
to near-real time loads
•
Relatively easy to
extend
Time Driven PK issues
Parent-Child Complexities
Cascading Change
Impacts
Difficult to load
Not conducive to BI tools
Not conducive to Drilldown
Difficult to architect for an
Enterprise
Not conducive to
Spiral/scope
Data Vault vs. Star Schema
• Good for Multi-Dimensional
Analysis
• Subject Oriented Answers
• Excellent for Aggregation
Points
• Less landing zones
• Great for Some Historical
Storage
• Great for BI Tools
• Minimize data landing
zones
•
•
•
•
•
•
•
•
•
•
•
•
No Data mining.
No Real-time loading.
No ODS/Exploration
Expensive updates (type 1,2 and
3)
Inflexible modelling of basic
elements like history, structure
and key distribution
Grain issues difficult to resolve
High impact changes
Latency Issues with late or early
arriving facts
Complex loading and changing
of history
Fails under very heavy loads
Difficult to automate
...
Data Vault: Conclusion
• Go !
-
Flexible/Agile approach
Auditable/Historic
Scalable
Standardized/Automatable/Repeatable
Robust/Stable/Dependable
• No Go?
-
Experience/Familiarity
No Direct Access
Extra layer
Data Modelling
EXAMPLE
University Research Publications Information System (METIS)
Picture: Paul Kidby ©
Transforming a data model to a Data Vault in 5 easy steps
1. Create a working and complete source/business
model(s) (“Technical-Functional” Model)
2. Analyze and classify Keys & Columns
3. Classify Entities and Relationships
4. Combine information of step 3 & 4
5. Transform to a DV
Werkverband
Onderzoekernummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie Code C
Functie code
Startdatum
Einddatum
Aanstellingscode
Kamernummer werkadres
Werkadres medewerker
Postcode van het werkadres
Plaats van het werkadres
TELEFOON
E_MAIL_ADRES
Leeropdracht
FTE Onderwijs
FTE Onderzoek
FTE Overig
FTE Totaal
Volgnummer individueel arbeidscontract
Personeelsnummer
Arts
MUTATIEDATUM
CODE_WERKVERBAND
Onderzoekbijdrage
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
Organisatiedeel
<M>
<M>
PK_WERKVERBAND
AK_WERKVERBAND
...
Persoon
Onderzoekernummer
<M>
Geboortedatum
Personeelsnummer
Geslacht
Telefoon
Extern Nummer
Nationaliteit
Nationale Thesaurus voor Auteurs nummer
EXTERNE_INFO
PK_PERSOON
...
Organisatie code
<M>
Niveau
<M>
Soort orgainsatie code
Naam
<M>
Capaciteit
Adres
Postcode van adres
Postbus
Postcode van postbus
Plaats
Land
Achternaam contactpersoon
Voorvoegsel contactpersoon
Voorletters contactpersoon
Titelatuur contactpersoon
Telefoonnummer contactpersoon
Faxnummer contactpersoon
E-mail contactpersoon
URL website
Groep
Aangemaakt door
Opload URL
Helpfile URL
Consult
Ontstaan dd
Terziele dd
Gebruik_Dai
PK_ORGANISATIEDEEL
...
Onderzoek code
Onderzoeknummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie code C
Functie code
Onderzoekleider
Uitvoerder
Contactpersoon
(co-)Promotor
Begeleider
Volgnummer
Status
Nummer
Jaar vanaf
Jaar t/m
Pub
Jaar vanaf bijdrage
Jaar t/m bijdrage
Promovendus
Referent
Initiator
Lid_Onderzoeksinstituut
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
PK_ONDERZOEKBIJDRAGE
AK_ONDERZOEKSBIJDRAGE
...
Onderzoek
Onderzoek code
Onderzoek classificatie code
Soort onderzoek
Korte native titel
Korte engelse titel
Native titel
Engelse titel
Startdatum
Einddatum
Mutatiedatum
Contractnummer
Jaar beoordeling
Beoordeling
Beoordelende instantie
Status
Organisatie code
Org organisatie code
Opmerking
Native omschrijving
Onderzoek ID
Website van onderzoek
Voortgangsrapportage
Website?
Soort financiële instelling
Subsidient
Externe classificerende code
Dosiernummer
Verzonden naar NWO?
PK_ONDERZOEK
AK_ONDERZOEK
...
<M>
<M>
<M>
<M>
<M>
<M>
Onderzoekbijdrage
Werkverband
Onderzoekernummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie Code C
Functie code
Startdatum
Einddatum
Aanstellingscode
Kamernummer werkadres
Werkadres medewerker
Postcode van het werkadres
Plaats van het werkadres
TELEFOON
E_MAIL_ADRES
Leeropdracht
FTE Onderwijs
FTE Onderzoek
FTE Overig
FTE Totaal
Volgnummer individueel arbeidscontract
Personeelsnummer
Arts
MUTATIEDATUM
CODE_WERKVERBAND
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
Organisatiedeel
<M>
<M>
PK_WERKVERBAND
AK_WERKVERBAND
AK_SAT
AK_UOW
...
Persoon
Onderzoekernummer
<M>
Geboortedatum
Personeelsnummer
Geslacht
Telefoon
Extern Nummer
Nationaliteit
Nationale Thesaurus voor Auteurs nummer
EXTERNE_INFO
PK_PERSOON
AK_SAT
...
Organisatie code
<M>
Niveau
<M>
Soort orgainsatie code
Naam
<M>
Capaciteit
Adres
Postcode van adres
Postbus
Postcode van postbus
Plaats
Land
Achternaam contactpersoon
Voorvoegsel contactpersoon
Voorletters contactpersoon
Titelatuur contactpersoon
Telefoonnummer contactpersoon
Faxnummer contactpersoon
E-mail contactpersoon
URL website
Groep
Aangemaakt door
Opload URL
Helpfile URL
Consult
Ontstaan dd
Terziele dd
Gebruik_Dai
PK_ORGANISATIEDEEL
AK_SAT
...
Onderzoek code
Onderzoeknummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie code C
Functie code
Onderzoekleider
Uitvoerder
Contactpersoon
(co-)Promotor
Begeleider
Volgnummer
Status
Nummer
Jaar vanaf
Jaar t/m
Pub
Jaar vanaf bijdrage
Jaar t/m bijdrage
Promovendus
Referent
Initiator
Lid_Onderzoeksinstituut
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
PK_ONDERZOEKBIJDRAGE
AK_ONDERZOEKSBIJDRAGE
AK_SAT
AK_UOW
...
Onderzoek
Onderzoek code
Onderzoek classificatie code
Soort onderzoek
Korte native titel
Korte engelse titel
Native titel
Engelse titel
Startdatum
Einddatum
Mutatiedatum
Contractnummer
Jaar beoordeling
Beoordeling
Beoordelende instantie
Status
Organisatie code
Org organisatie code
Opmerking
Native omschrijving
Onderzoek ID
Website van onderzoek
Voortgangsrapportage
Website?
Soort financiële instelling
Subsidient
Externe classificerende code
Dosiernummer
Verzonden naar NWO?
PK_ONDERZOEK
AK_ONDERZOEK
AK_SAT
<M>
<M>
<M>
<M>
<M>
<M>
Werkverband
Onderzoekernummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie Code C
Functie code
Startdatum
Einddatum
Aanstellingscode
Kamernummer werkadres
Werkadres medewerker
Postcode van het werkadres
Plaats van het werkadres
TELEFOON
E_MAIL_ADRES
Leeropdracht
FTE Onderwijs
FTE Onderzoek
FTE Overig
FTE Totaal
Volgnummer individueel arbeidscontract
Personeelsnummer
Arts
MUTATIEDATUM
CODE_WERKVERBAND
Onderzoekbijdrage
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
Organisatiedeel
<M>
<M>
PK_WERKVERBAND
AK_WERKVERBAND
...
Persoon
Onderzoekernummer
<M>
Geboortedatum
Personeelsnummer
Geslacht
Telefoon
Extern Nummer
Nationaliteit
Nationale Thesaurus voor Auteurs nummer
EXTERNE_INFO
PK_PERSOON
...
Organisatie code
<M>
Niveau
<M>
Soort orgainsatie code
Naam
<M>
Capaciteit
Adres
Postcode van adres
Postbus
Postcode van postbus
Plaats
Land
Achternaam contactpersoon
Voorvoegsel contactpersoon
Voorletters contactpersoon
Titelatuur contactpersoon
Telefoonnummer contactpersoon
Faxnummer contactpersoon
E-mail contactpersoon
URL website
Groep
Aangemaakt door
Opload URL
Helpfile URL
Consult
Ontstaan dd
Terziele dd
Gebruik_Dai
PK_ORGANISATIEDEEL
...
Onderzoek code
Onderzoeknummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie code C
Functie code
Onderzoekleider
Uitvoerder
Contactpersoon
(co-)Promotor
Begeleider
Volgnummer
Status
Nummer
Jaar vanaf
Jaar t/m
Pub
Jaar vanaf bijdrage
Jaar t/m bijdrage
Promovendus
Referent
Initiator
Lid_Onderzoeksinstituut
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
PK_ONDERZOEKBIJDRAGE
AK_ONDERZOEKSBIJDRAGE
...
Onderzoek
Onderzoek code
Onderzoek classificatie code
Soort onderzoek
Korte native titel
Korte engelse titel
Native titel
Engelse titel
Startdatum
Einddatum
Mutatiedatum
Contractnummer
Jaar beoordeling
Beoordeling
Beoordelende instantie
Status
Organisatie code
Org organisatie code
Opmerking
Native omschrijving
Onderzoek ID
Website van onderzoek
Voortgangsrapportage
Website?
Soort financiële instelling
Subsidient
Externe classificerende code
Dosiernummer
Verzonden naar NWO?
PK_ONDERZOEK
AK_ONDERZOEK
...
<M>
<M>
<M>
<M>
<M>
<M>
Onderzoekbijdrage
Werkverband
Onderzoekernummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie Code C
Functie code
Startdatum
Einddatum
Aanstellingscode
Kamernummer werkadres
Werkadres medewerker
Postcode van het werkadres
Plaats van het werkadres
TELEFOON
E_MAIL_ADRES
Leeropdracht
FTE Onderwijs
FTE Onderzoek
FTE Overig
FTE Totaal
Volgnummer individueel arbeidscontract
Personeelsnummer
Arts
MUTATIEDATUM
CODE_WERKVERBAND
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
Organisatiedeel
<M>
<M>
PK_WERKVERBAND
AK_WERKVERBAND
AK_SAT
AK_UOW
...
Persoon
Onderzoekernummer
<M>
Geboortedatum
Personeelsnummer
Geslacht
Telefoon
Extern Nummer
Nationaliteit
Nationale Thesaurus voor Auteurs nummer
EXTERNE_INFO
PK_PERSOON
AK_SAT
Organisatie code
<M>
Niveau
<M>
Soort orgainsatie code
Naam
<M>
Capaciteit
Adres
Postcode van adres
Postbus
Postcode van postbus
Plaats
Land
Achternaam contactpersoon
Voorvoegsel contactpersoon
Voorletters contactpersoon
Titelatuur contactpersoon
Telefoonnummer contactpersoon
Faxnummer contactpersoon
E-mail contactpersoon
URL website
Groep
Aangemaakt door
Opload URL
Helpfile URL
Consult
Ontstaan dd
Terziele dd
Gebruik_Dai
PK_ORGANISATIEDEEL
AK_SAT
Onderzoek code
Onderzoeknummer
Medewerker categorie code
Organisatie code A
Organisatie code B
Organisatie code C
Functie code
Onderzoekleider
Uitvoerder
Contactpersoon
(co-)Promotor
Begeleider
Volgnummer
Status
Nummer
Jaar vanaf
Jaar t/m
Pub
Jaar vanaf bijdrage
Jaar t/m bijdrage
Promovendus
Referent
Initiator
Lid_Onderzoeksinstituut
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
<M>
PK_ONDERZOEKBIJDRAGE
AK_ONDERZOEKSBIJDRAGE
AK_SAT
AK_UOW
Onderzoek
Onderzoek code
Onderzoek classificatie code
Soort onderzoek
Korte native titel
Korte engelse titel
Native titel
Engelse titel
Startdatum
Einddatum
Mutatiedatum
Contractnummer
Jaar beoordeling
Beoordeling
Beoordelende instantie
Status
Organisatie code
Org organisatie code
Opmerking
Native omschrijving
Onderzoek ID
Website van onderzoek
Voortgangsrapportage
Website?
Soort financiële instelling
Subsidient
Externe classificerende code
Dosiernummer
Verzonden naar NWO?
PK_ONDERZOEK
AK_ONDERZOEK
AK_SAT
<M>
<M>
<M>
<M>
<M>
<M>
<<LINK>>
LINK Research Contribution
<<SAT>>
SAT Employment
<<dvskcol>>
dv id
DV SEQ <pk,fk> <i1,i2>
<<dvtimecol>> load date DATE <pk> <i1>
<<ck>> PK_SAT_EMPLOYMENT <pk>
...
<<SAT>>
<<dvskcol>> dv id
DV SEQNR <pk>
<i1>
identity
<<dvskcol>> Research dv id
DV SEQ
<i2,i8>
not null
<ak,fk1>
<<dvskcol>> Organization dv id DV SEQ
<ak,fk2,fk3> <i3,i6,i8> not null
<<dvskcol>> Person dv id
<ak,fk2,fk4> <i3,i7,i8> not null
DV SEQ
SAT Research Contribution
<<dvskcol>>
dv id
DV SEQ <pk,fk> <i1,i2>
<<dvtimecol>> load date DATE <pk> <i1>
<<ck>> PK_SAT_RESERACH_CONTR <pk>
<<uow >> LNK_RESEARCH_CONTR <ak>
<<sk>>
PK_RESEARCH_CONTR <pk>
<<REFLINK>>
LINK Organisation Research
<<LINK>>
LINK Employment
<<dvskcol>> dv id
DV SEQNR <pk>
<i1>
identity
<<dvskcol>> Organization dv id DV SEQ
<ak,fk1> <i2,i6> not null
<<dvskcol>> Person dv id
<ak,fk2> <i5,i6> not null
DV SEQ
<<dvskcol>> dv id
DV SEQNR <pk>
<<dvskcol>> Research dv id
DV SEQ
<ak,fk2> <i1,i3>
<<dvskcol>> Organization dv id DV SEQ
<ak,fk1> <i1,i2>
<<uow >> LNK_ORG_RESEARCH <ak>
<<sk>>
PK_ORG_RESEARCH <pk>
<<uow >> LNK_EMPLOYMENT <ak>
<<sk>>
PK_EMPLOYMENT <pk>
<<HUB>>
HUB Organization
<<HUB>>
HUB Person
<<dvskcol>> dv id
<<dvhubcol>> Organization code
<<dvskcol>>
dv id
DV SEQNR <pk> <i1> identity
<<bk>> BK_ORGANIZATION
<<dvhubkeycol>> Employee number <None>
<ak> <i2> not null <<sk>> PK_ORGANIZATION
<<bk>> BK_PERSON <ak>
<<sk>> PK_PERSON <pk>
DV SEQNR
<pk> <i1> identity
Organisatie code <ak> <i2> not null
<<HUB>>
HUB Research
<<dvskcol>>
dv id
DV SEQNR <pk> <i1> identity
<<dvhubkeycol>> Research code Code V6
<ak> <i2> not null
<ak>
<pk>
...
<<bk>> BK_RESEARCH <ak>
<<sk>> PK_RESEARCH <pk>
...
<<SAT>>
SAT Organization
<<SAT>>
SAT Person
<<dvskcol>>
dv id
DV SEQ <pk,fk> <i1,i2>
<<dvtimecol>> load date DATE
<pk> <i1>
<<ck>> PK_PERSON_SAT <pk>
<<dvskcol>>
dv id
DV SEQ <pk> <i1> not null
<<dvtimecol>> load date DATE
<pk> <i1> not null
<<ck>> PK_SAT_ORGANIZATION <pk>
<<SAT>>
SAT Research
<<dvskcol>>
dv id
DV SEQ <pk,fk> <i1,i2>
<<dvtimecol>> load date DATE <pk> <i1>
<<ck>> PK_SAT_RESEARCH <pk>
EXAMPLE
A Data Vault oriented Datawarehouse Architecture
• Staging & CDC/Replication/Real Time/SOA feeds
• Central EDW Data Vault Core
• Business Rule Layer
• Non Source oriented & DV structured
• Business Rule results & calculations/aggregations
• Virtualized Data Mart Layer
• Star Schema’s encoded in semantical layers
(UDM/BISM/views/Universes)
• None/Partial Physical star schema’s
Advanced Concept: Business Data Vault
• Data Vault structured layer • Centralization
• System Driven instead of
• Performance
Source Driven
Picture: Dan Linstedt ©
Datawarehouse Architecture
Central DWH
Dimensional views
Business
(Rule)
Vault
( Temporal )
3NF views
Staging
(Optional)
Data
Vault
BI Apps: SAP-BO
Universe
(Virtual)
Data
Marts
OLAP
Data
Marts
Reports
Voyager
MS Fast Track 2.0/3.0
• SQL Server 2008 R2 Enterprise Edition
• Microsoft Fast –Track 2.0/3.0 DWH Architecture
met Data Vault
• Virtual Data marts
• Challenges
• Benefits
Questions?
Change Data Capture?
Metadata?
Fast Track?
Theorie?
Anchor Oriented Modeling?
Information over Data Vault
• Data Vault Book: www.learndatavault.com
• Website creator: www.danlinsted.com
Additional Information
• Data Vault Generators
- BIReady: www.biready.com
- Quipu: http://www.datawarehousemanagement.org
- Several others
• Blogs & Resources
- www.prudenza.nl
- Facebook: datavaultdirectory
• Linkedin groups
- Data Vault Discussions, Temporal Data Modeling
- Dutch Data Vault Subgroup
Contact
•
•
•
•
•
•
MSN/Email: [email protected]
LinkedIn: http://www.linkedin.com/in/dmunseen
Twitter: DM_Unseen
Blog: http://dm-unseen.blogspot.com/
LinkedIn Group: Temporal Data Modeling
Facebook: datavaultdirectory
Dutch Data Vault User group
• Twitter: @NLDVGG
- HASTAGS: #NLDVGG #DDVGG
• Email: [email protected]
• Website: Http://dvusergroup.com
• Windows Live: http://datavault.groups.live.com/
• Facebook:
- datavaultdirectory
- Dutch Data Vault User group:
([email protected])
• Belgium
- Contact person: Yves Mulkes / BI-community.org
- Email: [email protected]
Recap & Checklist
1.Understand selling points
- Check out (online) Data Vault Resources
- Training/Coaching/Seminars
2.Evaluate
- Understand architecture requirements
- Prototyping
- Consultancy
3.Implement
- Small increments