Transcript Multidimenzionális Adatbázisok Alapjai
Multidimenzionális Adatbázisok Alapjai Ny írcsák Zoltán – F4CSMV [email protected]
www.sch.bme.hu/~alien/olap
Mi a multidimenzionális adatbázis ?
• A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását.
• az adatok egymással valamilyen módon összefüggenek • különböző nézetek – perspektívák, dimenziók - alapján tároljuk és vizsgáljuk őket
Az információ felhasználása • • • A kapott információkból a menedzserek: Stratégiákat állítanak fel Trendeket ismernek fel Üzleti döntéseket hoznak
Az alapvető cél • Vezetők által feltett kérdések, amik az üzleti életre vonatkoznak • Adatainkat különféle perspektívákból szemléljük • Nagy mennyiségű adatot érint • Gyors válaszidő szükséges • Átlátható formátumú eredményt akarunk
Relációs Adatbázis (miért nem jó ?) • Komplex lekérdezések • Több táblás join-ok • Indexelések • Lassú válaszidő • Nehezen átlátható eredmény
Egy relációs tábla
ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL
MIKROBUSZ MIKROBUSZ MIKROBUSZ SPORT KUPÉ SPORT KUPÉ SPORT KUPÉ SEDAN SEDAN SEDAN
SZÍN
KÉK PIROS FEHÉR KÉK PIROS FEHÉR KÉK PIROS FEHÉR
ELADOTT MENNYISÉG
4 3 2 6 5 4 3 5 5
“Cross-Tab” nézetek - Tömbök
ELADOTT MENNYISÉG – GLEASON KERESKEDÉS
6 3 4 5 5 3 4 5 2 MIKROBUSZ KUPÉ SEDAN
M O D E LL
KÉK PIROS
SZÍN
FEHÉR • 2 dimenzió (perspektíva) : szín, modell – 3-3 elemmel • Egyszerűbb kinézet • Több információ nyerhető belőle ránézésre
Egy nagyobb tábla Nézzük az előbbi táblát, kiegészítve még egy dimenzióval!
• Dimenzió : KERESKEDÉS • 3 db értékkel • Táblaméret : 3x3x3 = 27 • Probléma : áttekinthetetlen
Megjelenítés többdimenzióban
ELADOTT MENNYISÉG – GLEASON KERESKEDÉS M O D E LL
MIKROBUSZ KUPÉ SEDAN 6 3 4 5 5 3 4 5 2 KÉK PIROS
SZÍN
FEHÉR GLEASON CARR CLYDE
KERESKEDÉS
Teljesítménybeli előnyök • Relációs esetben az egy rekord kikeresésének átlagos költsége 1000 rekord esetén : 500 • Multidimenzionális esetben 3 dimenziót feltételezve ez 5+5+5=15 • Költségcsökkenés 3300 %-os
Mikor használjuk, mikor ne ?
IGEN • Az mezők értéke ismétlődést mutat • Eredendően összefüggő adatok, amikből fontos üzleti információt nyerhetünk • • NEM Különféle, nem ismétlődő értékek Tipikus relációs táblák, korrelálatlan adatok, kevés (rejtett) összefüggés
Műveletek multidimenzionális adathalmazon • Forgatás – új nézet egyszerű műveletel • Szűkítés (átméretezés) – a fontos elemekre fókuszálunk (redukált tömb) • Multidimenzionális lekérdezések • Hierarchikus felépítésnél – roll-up, drill down
Szervezeti hierarchia
SZERVEZETI DIMENZIÓ
RÉGIÓ KERÜLET KERESKEDÉS MIDWEST CHICAGO ST.LOUIS
GARY CLYDE GLEASON CARR LEVI
Multidimenzionális lekérdezések • Egyszerűbb nyelvezet • Átlátható eredmény • Gyors válaszidő • MDX (MultiDimensional eXpression)
Architektúra • Kliens-szerver • Multi user • OLTP és OLAP rendszerek külön Miért ?
– OLTP – egyenletes terhelés, folyamatos, kis intenzitású query-k – OLAP – ritka, nagy intenzitású kérések, nagy adatmennyiséget érint – Szétválasztás nélkül a tranzakciós rendszer teljesítménye romlik
További jellemzők • Idő dimenzió – legtöbb rendszerben beépített támogatás van rá • Ritka adatok (sparse data) kezelése • Hierarchikus dimenziók • Partíciók • Kockák, virtuális kockák • Aggregátumok
Kereskedelmi szoftverek • TM1 • Oracle Express • MS OLAP Services (Analysis Services)