پردازش تحلیلی برخط برای پشتیبانی تصمیم OLAP for Decision Support سمینار درس سیستم های تصمیم یار هوشمند مسعود منصوری دی 1390
Download
Report
Transcript پردازش تحلیلی برخط برای پشتیبانی تصمیم OLAP for Decision Support سمینار درس سیستم های تصمیم یار هوشمند مسعود منصوری دی 1390
پردازش تحلیلی برخط برای
پشتیبانی تصمیم
OLAP for Decision
Support
سمینار درس سیستم های تصمیم یار
هوشمند
مسعود منصوری
دی 1390
2/34
فهرست مطالب
مقدمه
پایگاه داده تحلیلی
قابلیت های OLAP
بررسی مدل داده ای چند بعدی و رابطه ای
دسته بندی های OLAP
جمع بندی
3/34
مقدمه
هدف :بررسی پردازش تحلیلی برخط ( )OLAPو چگونگی استفاده از آن
برای پشتیبانی تصمیم.
،OLAPاز توسعه ی مفهوم پایگاه داده استاندارد برگرفته شده است
(.)OLTP
OLTPبه عملیات بروزرسانی ،پرس و جو و نمایش داده های متنی و عددی
از پایگاه داده عملیاتی اشاره دارد.
OLAPبه عملیات پرس و جو و ارائه داده های متنی و عددی از پایگاه داده
تحلیلی اشاره دارد.
4/34
تفاوت OLAPو OLTP
پارامترهای ارزیابی
OLAP
OLTP
کارکرد
پشتیبانی تصمیم
عملیات روزانه
طراحی پایگاه داده
موضوع – گرا
کاربرد – گرا
داده
سابقه،خالصه شده،چند بعدی،سر
جمع،یکپارچه
جاری،به روز،با جزئیات،رابطه
ای،منفرد
کاربرد
خاص منظوره
عملیات تکرار شونده
واحد کاری
پرس و جوهای پیچیده
تراکنش های ساده و کوتاه
تعداد رکوردهای مورد دسترس ی
میلیون ها رکورد
دهها رکورد
تعداد کاربران
هزاران کاربر
صدها کاربر
اندازه پایگاه داده
گیگابایت -ترابایت
مگابایت – گیگابایت
5/34
پایگاه داده تحلیلی
سازمان ها برای انجام عملیات روزانه از تعدادی منابع اطالعاتی عملیاتی
استفاده می کنند.
یک پایگاه داده تحلیلی به عنوان یک منبع داده ای مجزا در سازمان ایجاد می
شود که هدف اصلی آن تحلیل داده برای پشتیبانی از فرآیندهای تصمیم گیری
مدیران می باشد.
چرا پایگاه داده تحلیلی باید مجزا ایجاد شود؟
کارایی (سرعت) پرس و جوها
ایجاد یک پایگاه داده که بتواند بطور مستقیم برای اهداف عملیاتی و تحلیلی استفاده
شود ،غیر ممکن است.
6/34
پایگاه داده تحلیلی ETL -
( ETL استخراج ،تبدیل و بارگذاری)
زیر ساختی برای تسهیل در بازیابی داده ها از پایگاه داده عملیاتی به
پایگاه داده تحلیلی
7/34
پایگاه داده تحلیلی – Data Mart
یک منبع داده ای است با اصولی مشابه با پایگاه داده تحلیلی اما در یک حوزه
ی محدودتر
معموالً کوچکتر از پایگاه داده تحلیلی است و روی موضوع یا بخش خاصی
تمرکز دارد.
مدلسازی ابعادی یک تکنیک مدلسازی در data martها می باشد (همچنین
می تواند در پایگاه داده تحلیلی نیز استفاده شود)
8/34
پایگاه داده تحلیلی -ادامه
انواع جداول در مدلسازی ابعادی:
جدول :fact
شامل حداقل یک معیار (معموالً عددی) از یک موضوع می باشد که برای
تحلیل ،مدل شده است.
جدول :dimension
Fact
Dimension
شامل ویژگی های توصیفی متنوع (معموالً متنی) که مرتبط با موضوع نشان داده
شده توسط جدول factمی باشد.
هدف از مدلسازی ابعادی ارائه دادن سواالتی است که پاسخ آنها تصمیم گیری
مناسب در یک حوزه تجاری خاص را میسر می سازد
9/34
پایگاه داده عملیاتی -
مثال
10/34
پایگاه داده عملیاتی -
مثال
11/34
پایگاه داده عملیاتی -
مثال
12/34
پایگاه داده عملیاتی -
مثال
13/34
پایگاه داده تحلیلی -
مثال
14/34
پایگاه داده تحلیلی -
مثال
15/34
یک پرس و جوی نمونه
“Find the ten products sold in stores of 20,000 sq ft. or higher, to the
customer with ‘Excellent’ credit rating the month of January for the
”past four years
پاسخ چنین سوالی با استفاده از یک پرس و جوی ساده در data mart C
بدست می آید ،در صورتی که بدون استفاده از data martباید از پرس و
جوهای بسیار پیچیده ای استفاده کرد و نیاز به جستجو در پایگاه ها داده های
Aو Bمی باشد.
16/34
قابلیت های OLAP
سه ویژگی پایه که توسط تحلیلگران استفاده می شود:
Slice and dice
افزودن ،جایگزین کردن و حذف ویژگی یک بعد مشخص
)Pivot (rotate
سازماندهی مجدد ()reorganization
Drill down and drill up
کاهش یا افزایش میزان granularityداده
17/34
یک نمونه از پرس و جو
“For each individual store, show separately the number of product
units sold for each product category during workdays and during
holiday/weekend days.”
18/34
Slice-and-Dice
“For each individual store show the number of product units sold
for the camping product category during workdays.”
19/34
Slice-and-Dice
“For each individual store show separately the number of product
units sold to customers with different credit rating values during
workdays and during holiday/weekend days.”
20/34
Pivot
“For each individual store show separately the number of product
units sold for each product category during workdays and during
holiday/weekend days.”
21/34
Drilldown
“For each individual store, show separately the number of product
units sold for each product category, and within each product
category for each individual product name, during workdays and
during holiday/weekend days.”
22/34
مدل داده چند بعدی در مقابل رابطه ای
مدل داده رابطه ای یک مدل پایه برای سیستم های مدیریت
پایگاه داده رابطه ای ( )RDBMSمی باشد که برای پیاده
سازی اکثر پایگاه داده های عملیاتی بکار می روند.
Oracle, IBM DB2, MS SQL server
23/34
Data Mart
24/34
fact پیاده سازی رابطه ای جدول
CalendarKey
ProductKey
StoreKey
Sale Amount
1
1
1
$100
1
2
1
$120
1
3
1
$200
0
0
0
0
25/34
پیاده سازی چندبعدی جدول fact
(1,1,1) → $100
26/34
دسته بندی OLAP
پردازش تحلیلی برخط چند بعدی ()MOLAP
پردازش تحلیلی برخط رابطه ای ()ROLAP
پردازش تحلیلی برخط ترکیبی ()HOLAP
27/34
پردازش تحلیلی برخط چند بعدی
MOLAPداده را از پایگاه داده تحلیلی یا منابع عملیاتی می گیرد.
MOLAPداده را در مکعب های چند بعدی ذخیره می کند.
پیچیدگی انجام این فرآیند از دید کاربر پنهان است.
کاربر تنها عملیات OLAPاستاندارد را اجرا می کند بدون دانستن اینکه
چگونه مکعب ها ساخته می شوند و چه تفاوتی با جداول رابطه ای دارند.
28/34
پردازش تحلیلی برخط چند بعدی -ادامه
یکی از خصوصیات اصلی ،MOLAPفراهم کردن تحلیل های خیلی
سریع می باشد.
قبل از ذخیره داده در مکعب تحلیلی ،محاسبات را انجام می دهد (pre-
)calculate
MOLAPمحل مناسبی برای نگهداری داده های همراه با جزئیات
سطح تراکنشی نمی باشد.
“sleeping bag ‘ZZZ Bag’ was sold to the customer Tina in the store S1
”on January1, 2006
“in Q1 of 2006, 200 units of products from the camping category were
sold to the customers with ‘excellent’ credit rating in Chicagoland
”stores
سریع در بازیابی داده ،کند در بروزرسانی مکعب
29/34
پردازش تحلیلی برخط رابطه ای
ابزارهای ،ROLAPقابلیت های مشابه OLAPرا فراهم می کنند.
سرور ROLAPپرس و جو ها را به زبان SQLترجمه می کند.
پرس و جوی SQLبرای پایگاه داده تحلیلی که بر روی زیر ساخت
RDBMSقرار دارد فرستاده می شود.
RDBMSپرس و جو را ترجمه و نتیجه را برای سرور ROLAPمی
فرستد و پس از آن برای کاربر فرستاده می شود.
30/34
پردازش تحلیلی برخط رابطه ای -ادامه
ROLAPمحدودیتی از لحاظ اندازه پایگاه داده و نوع تحلیلی که
ممکن است اجرا شود ندارد ،اما بدلیل نداشتن پیش پردازش ،به
اندازه ی MOLAPسریع نیست.
MOLAP در مقابل :ROLAP
Tradeoff بین کارایی و حافظه
31/34
پردازش تحلیلی برخط ترکیبی
ROLAP + MOLAP = HOLAP
در رویکرد ترکیبی ،می توان از پایگاه داده رابطه ای برای ذخیره
سازی حجم زیادی از داده ها استفاده کرد و از پایگاه داده چندبعدی
برای ذخیره سازی داده های تجمیع شده استفاده کرد.
32/34
Desktop OLAP
DOLAPمانند MOLAPاز مکعب های چند بعدی استفاده می کند ،با
این تفاوت که در DOLAPمکعب ها توسط کاربر نهایی قابل دانلود می
باشد.
مکعب های استفاده شده در DOLAPکوچکتر از مکعب های
MOLAPمی باشد.
استفاده از این مکب ها ساده ولی دارای قابلیت های محدودی می باشند.
ساده به دلیل حجم کم داده و محدود به دلیل وجود داده های ایستا
33/34
جمع بندی
کارکردهای :OLAPارائه روشی مناسب برای دسترسی کاربران به داده
ها و پشتیبانی از تصمیمات مدیران
انواع :OLAP
HOLAP ،ROLAP ،MOLAPو DOLAP
قابلیت های OLAPامکان تحلیل را روی داده های تجمیع شده فراهم
می کند
تفاوت MOLAPو :ROLAP
Tradeoffبین حافظه و کارائی
34/34
مرجع
N. Jukic, B. Jukic, and M. Malliaris, “Online Analytical
Processing (OLAP) for Decision Support,” Handbook on
Decision Support Systems 1, pp. 259–276, 2008.