Multidimenzionális Adatbázisok Alapjai

Download Report

Transcript Multidimenzionális Adatbázisok Alapjai

Multidimenzionális Adatbázisok Alapjai Ny írcsák Zoltán – F4CSMV [email protected]

www.sch.bme.hu/~alien/olap

Mi a multidimenzionális adatbázis ?

• A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását.

• az adatok egymással valamilyen módon összefüggenek • különböző nézetek – perspektívák, dimenziók - alapján tároljuk és vizsgáljuk őket

Az információ felhasználása • • • A kapott információkból a menedzserek: Stratégiákat állítanak fel Trendeket ismernek fel Üzleti döntéseket hoznak

Az alapvető cél • Vezetők által feltett kérdések, amik az üzleti életre vonatkoznak • Adatainkat különféle perspektívákból szemléljük • Nagy mennyiségű adatot érint • Gyors válaszidő szükséges • Átlátható formátumú eredményt akarunk

Relációs Adatbázis (miért nem jó ?) • Komplex lekérdezések • Több táblás join-ok • Indexelések • Lassú válaszidő • Nehezen átlátható eredmény

Egy relációs tábla

ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL

MIKROBUSZ MIKROBUSZ MIKROBUSZ SPORT KUPÉ SPORT KUPÉ SPORT KUPÉ SEDAN SEDAN SEDAN

SZÍN

KÉK PIROS FEHÉR KÉK PIROS FEHÉR KÉK PIROS FEHÉR

ELADOTT MENNYISÉG

4 3 2 6 5 4 3 5 5

“Cross-Tab” nézetek - Tömbök

ELADOTT MENNYISÉG – GLEASON KERESKEDÉS

6 3 4 5 5 3 4 5 2 MIKROBUSZ KUPÉ SEDAN

M O D E LL

KÉK PIROS

SZÍN

FEHÉR • 2 dimenzió (perspektíva) : szín, modell – 3-3 elemmel • Egyszerűbb kinézet • Több információ nyerhető belőle ránézésre

Egy nagyobb tábla Nézzük az előbbi táblát, kiegészítve még egy dimenzióval!

• Dimenzió : KERESKEDÉS • 3 db értékkel • Táblaméret : 3x3x3 = 27 • Probléma : áttekinthetetlen

Megjelenítés többdimenzióban

ELADOTT MENNYISÉG – GLEASON KERESKEDÉS M O D E LL

MIKROBUSZ KUPÉ SEDAN 6 3 4 5 5 3 4 5 2 KÉK PIROS

SZÍN

FEHÉR GLEASON CARR CLYDE

KERESKEDÉS

Teljesítménybeli előnyök • Relációs esetben az egy rekord kikeresésének átlagos költsége 1000 rekord esetén : 500 • Multidimenzionális esetben 3 dimenziót feltételezve ez 5+5+5=15 • Költségcsökkenés 3300 %-os

Mikor használjuk, mikor ne ?

IGEN • Az mezők értéke ismétlődést mutat • Eredendően összefüggő adatok, amikből fontos üzleti információt nyerhetünk • • NEM Különféle, nem ismétlődő értékek Tipikus relációs táblák, korrelálatlan adatok, kevés (rejtett) összefüggés

Műveletek multidimenzionális adathalmazon • Forgatás – új nézet egyszerű műveletel • Szűkítés (átméretezés) – a fontos elemekre fókuszálunk (redukált tömb) • Multidimenzionális lekérdezések • Hierarchikus felépítésnél – roll-up, drill down

Szervezeti hierarchia

SZERVEZETI DIMENZIÓ

RÉGIÓ KERÜLET KERESKEDÉS MIDWEST CHICAGO ST.LOUIS

GARY CLYDE GLEASON CARR LEVI

Multidimenzionális lekérdezések • Egyszerűbb nyelvezet • Átlátható eredmény • Gyors válaszidő • MDX (MultiDimensional eXpression)

Architektúra • Kliens-szerver • Multi user • OLTP és OLAP rendszerek külön Miért ?

– OLTP – egyenletes terhelés, folyamatos, kis intenzitású query-k – OLAP – ritka, nagy intenzitású kérések, nagy adatmennyiséget érint – Szétválasztás nélkül a tranzakciós rendszer teljesítménye romlik

További jellemzők • Idő dimenzió – legtöbb rendszerben beépített támogatás van rá • Ritka adatok (sparse data) kezelése • Hierarchikus dimenziók • Partíciók • Kockák, virtuális kockák • Aggregátumok

Kereskedelmi szoftverek • TM1 • Oracle Express • MS OLAP Services (Analysis Services)