دانشکده مهندس ی کامپیوتر دانشگاه صنعتی امیرکبیر ارائه درس هوش تجاری فصل 10 طراحی انباره فراداده ناهید قصاب زاده ( )88131064 استاد درس : دکتر عبدهللا زاده ناهید قصاب زاده.
Download
Report
Transcript دانشکده مهندس ی کامپیوتر دانشگاه صنعتی امیرکبیر ارائه درس هوش تجاری فصل 10 طراحی انباره فراداده ناهید قصاب زاده ( )88131064 استاد درس : دکتر عبدهللا زاده ناهید قصاب زاده.
1
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
ارائه درس هوش تجاری
فصل 10
طراحی انباره فراداده
ناهید قصاب زاده ()88131064
استاد درس:
دک تر عبدهللا زاده
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
3
موارد موردنظر در طراحی یک انباره فراداده یا ارزیابی ان
مزایا و معایب انواع مختلف استراتژی های پیاده سازی
مزایا و معایب انواع مختلف طراحی برای انباره فراداده
خرید یک انباره فراداده
توصیف فعالیت ها در طراحی انباره فراداده
ریسک های انجام ندادن این مرحله
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
انباره فراداده موجود
4
ایا در حال حاضر یک انباره فراداده داریم؟
ایا باید ان را توسعه دهیم؟ باید به اجزای ان اضافه کنیم یا functionalityان را توسعه دهیم؟
چه کسی ان را به روز رسانی می کند؟
چه کسی از ان استفاده می کند؟ چگونه و از چه بخش های ی از ان استفاده می کنند؟
اگر یک انباره فراداده نداریم ،چگونه از عهده ان برمی اییم؟
چرا فراداده نداریم؟ کمبود بودجه؟ کمبود منابع؟ یا عدم فهم کافی؟
دانشگاه صنعتی امیرکبیر
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
محصوالت انباره فراداده
5
ایا محصول انباره فراداده ای وجود دارد که نیازهای ما را براورده سازد؟
چقدر از نیازمندی های فراداده ما با محصوالت انباره فراداده موجود در بازار براورده نمی شوند؟ ان
نیازمندی ها تا چه اندازه مهم هستند؟
کدام یک از محصوالت انباره فراداده قابلیت های importو exportرا دارند؟
دانشگاه صنعتی امیرکبیر
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
واسط ها
6
چگونه واسط ها را از انباره فراداده به سایر ابزارها که خود فراداده دارند (به طور مثال ،CASE
ETLو )OLAPبه صورت اتوماتیک خواهیم کرد؟ ایا باید میان افزار دیگری بخریم؟
چگونه فراداده را به افراد کسب و کار تحویل خواهیم داد؟ از طریق گزارش ها؟ از طریق یک تابع
کمکی؟ از طریق یک واسط وب؟
ایا برای افراد کسب و کار سخت خواهد بود تا نحوه استفاده از واسط های انباره فراداده را یاد بگیرند؟
چه اموزش های ی را باید به ان ها بدهیم؟
دانشگاه صنعتی امیرکبیر
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
پرسنل
7
ایا به پرسنل بیشتری برای نصب ،بهبود و نگه داری یک محصول انباره فراداده خریداری شده نیاز
داریم؟
به پرسنل بیشتری برای طراحی ،ساخت و نگه داری انباره فراداده ای که خودمان می خواهیم بسازیم،
نیاز داریم؟
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
8
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
معایب:
دیکشنری های داده (که نام امروزی ان ها انباره فراداده است) در گذشته به پردازش های دستی نیاز
داشتند که زمانبر و کسل کننده بودند.
فقدان مهارت های تکنیکی در ان ها
قابلیت های گزارش دهی در ان ها مطلوب نبود.
عدم استفاده از فناوری های مناسب در ان ها به منظور داشتن واسط های اتوماتیک ،واسط های کاربر
گرافیکی با استفاده اسان یا توابع کمکی حساس به زمینه
فقدان استاندارها
9
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
10
دانشکده مهندسی کامپیوتر
اجزای فراداده مختلف در ابزارهای مختلفی ذخیره می شوند و هیچ یک از ان ها (به جز انباره فراداده)
طوری طراحی نشده اند تا تمام اجزای فراداده از سایر ابزارها را در خود ذخیره سازند .برای مثال:
ابزارهای ،CASEفراداده کسب و کار را برای اجزای مدل داده منطقی و فراداده تکنیکی را برای
اجزای مدل داده فیزیکی ذخیره می کنند.
دیکشنری های ،DBMSفراداده تکنیکی را برای ساختار پایگاه داده ذخیره می کنند؛ مانند پایگاه
داده ها ،جداول ،ستون ها ،ایندکس ها و . ...
ابزارهای ،ETLفراداده تکنیکی برای نگاشت های داده از مبدا به مقصد و مشخصات انتقال ان ها را
ذخیره می کنند.
ابزارهای Data-cleansing
ابزارهای OLAP
ابزارهای داده کاوی
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
11
دانشکده مهندسی کامپیوتر
به سه طریق انجام می گیرد:
انباره فراداده متمرکز؛ که به دو صورت زیر انجام می شود:
Custom-build Repository
Licensed Repository
فراداده غیرمتمرکز؛ که از یک فرامدل تجمیع شده استفاده می کند اما به صورت فیزیکی فراداده را در
پایگاه داده های مختلفی توزیع می کند.
یک راه حل توزیع شده با قابلیت XML؛ که در ان فراداده با XMLبر چسب گذاری و ذخیره می
شود.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
12
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
13
دانشکده مهندسی کامپیوتر
Custom-build Repository
مزایا
معایب
این طراحی تمام نیازمندی های فراداده را ترکیب می
کند.
پرسنل تمام وقت برای نگه داری پایگاه داده انباره
فراداده و گزارش های فراداده نیاز است.
نرم افزار نهای ی برای دسترسی و واسط ها به ابزارهای
مختلف بر حسب نیاز مشتری طراحی شده اند تا تمام
نیازمندی ها را براورده سازند.
نرم افزار نهای ی برای دسترسی و واسط ها به ابزارهای
مختلف باید برنامه نویسی و نگه داری شوند که هر دو
فرایندهای زمانبری هستند.
ٌ
گزارش ها و توابع کمکی دقیقا ان طور که مطلوب
هستند طراحی شده اند.
انباره فراداد باید به صورت دوره ای بهبود یابد (گهگاه
طراحی دوباره) برای ان که از ابتدا نمی توان ان را به
طور کامل ساخت.
کارشناسان فنی کنترل کامل بر روی طراحی دارند.
محتواها ممکن است منطبق نباشند.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
14
دانشکده مهندسی کامپیوتر
Licensed Repository
مزایا
معایب
در وقت صرفه جوی ی می شود زیرا نیاز به طراحی و
ساخت پایگاه داده ،واسط ها و گزارش های انباره
فراداده نیست.
در صورت براورده نشدن تمام نیازمندی ها ،یک متولی
تمام وقت نیاز است تا محصول خریداری شده را نگه
داری کند و بهبود دهد.
اک ثر ان ها واسط دارند و بیشتر ان ها شامل مجموعه
کاملی از APIها هستند.
به یک منحنی یادگیری نیاز است تا با معماری ،واسط
ها و APIمحصول اشنا شویم.
وقتی فراداده مستقر می شود ،اگر محصول برای
ابزارها تضمین شود ،واسط های ابزار فراهم خواهند
شد.
هر چقدر محصول پیچیده تر باشد ،گران تر است و
کارشناسان فنی مهارت بیشتری نیاز خواهند داشت تا
ان را نگه داری کنند.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
15
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
16
دانشکده مهندسی کامپیوتر
مزایا
معایب
مالکان مختلف می توانند مجموعه فراداده خود را به
صورت جداگانه نگه داری و مدیریت کنند.
کنترل کردن افزونگی در بین چندین انباره داده دشوار
است.
پایگاه داده های انباره فراداده کوچک تر و برای
استفاده راحت تر هستند.
نگه داری و مدیریت پایگاه داده های مختلف بر روی
پلت فرم های گوناگون زمان بیشتری می گیرد.
هر انباره فراداده می تواند فرامدل خود را داشته باشد.
ارتباطات بین متولیان انباره های فراداده گوناگون
افزایش خواهد یافت.
گزارش ها برای هر انباره فراداده می تواند شخصی
سازی شود.
مرتبط ساختن فراداده در بین پایگاه داده های
مختلف دشوار می شود.
وجود گذرگاه ،نام و مکان انباره فراداده را از فردی که
به ان دسترسی پیدا می کند ،شفاف می نماید.
معماری این راه حل پیچیده است و منحنی یادگیری
برای پایگاه داده های مختلف با طراحی های گوناگون
باال می رود.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
17
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
18
دانشکده مهندسی کامپیوتر
مزایا
معایب
برچسب های XMLدسترسی به فراداده را از طریق
هر دستگاه ذخیره سازی داده ،ممکن می سازد.
برچسب گذاری اولیه تمام فراداده با XMLفرایندی
دستی و پرزحمت است.
فراداده هیچ وقت کپ ی نمی شود.
برچسب های XMLبه نیازمندی های ذخیره سازی
اضافه می شوند.
وجود گذرگاه ،مکان فراداده را از فردی که به ان
دسترسی پیدا می کند ،شفاف می نماید.
یک فرا فرامدل باید ایجاد شود.
موتورهای جستجوی استاندارد وب می توانند هر
فراداده ای را در هر کجا قرار دهند.
DBMSو فروشندگان ابزار باید استانداردهای
صنعت را دنبال کنند.
فراداده و داده های کسب و کار می توانند به هم
بپیوندند و با هم منتقل شوند.
تمام DBMSها و ابزارها قابلیت XMLرا ندارند.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
19
اگر بخواهید خود یک انباره فراداده طراحی کنید ،دو انتخاب وجود دارد:
)1طراحی روابط موجودیت ها
)2طراحی شیءگرا
دانشکده مهندسی کامپیوتر
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
طراحی روابط موجودیت ها
20
مزایا
معایب
تغییرات و بهبود ها در ان ممکن است نیاز به
طراحی دوباره پایگاه داده داشته ؛ باشد؛ به
خواندن و فهم ان اسان است.
عالوه تخلیه کردن و بارگذاری دوباره انباره
فراداده
به دلیل طبیعت شهودی و .صریح طراحی ،پرس فرامدل فیزیکی ان ً
نسبتا بزرگ است؛ با شی ها و
و جوها می توانند با جمالت ً
نسبتا ساده SQLروابط بسیار که معماری را تاحدی پیچیده می
کند.
نوشته شوند.
شی های فراداده و روابط ان ها باید برای ان که
پیاده سازی ان ها به صورت ساختارهای پایگاه
فرامدل فیزیکی دقیق باشد ،بسیار خوب تعریف
داده رابطه ای اسان است.
شوند.
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
طراحی شیءگرا
21
مزایا
معایب
از ان جا که در ان شی ای که Objectنام گذاری
به شدت انعطاف پذیر است .وقتی اعمال تغییرات الزم شده است ،شامل تمام نمونه ها (ردیف ها)ی فراداده
است ،این جدول بسیار بزرگ خواهد شد .ممکن
است ،نیازی به طراحی دوباره پایگاه داده نیست.
است بر روی کارای ی دسترسی تاثیر بگذارد.
ساده است و بنابراین نگه داری و بهبود ان اسان
است.
نوشتن پرس و جوها بسیار سخت است و به
«الحاق»های بازگشتی بسیاری نیاز دارد .دانش
SQLپیشرفته نیاز است.
پیاده سازی ان ها به صورت ساختارهای پایگاه داده
شیءگرا اسان است.
به منحنی یادگیری باالی ی نیاز دارد .فهم فرامدل
فیزیکی بسیار تجریدی دشوار است و درک قوانین
ِ
گسترده زمانبر است.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
با این سؤال شروع نکنید!
بهترین محصول در بازار کدام است؟
سؤال های قابل بررسی:
نیازمندی های ما چیست؟
کدام نیازمندی ها:
• الزامی هستند؟
• مهم هستند؟
• اختیاری هستند؟
22
کدام محصوالت متناسب با نیازمندی های الزامی ما هستند؟
کدام محصوالت متناسب با نیازمندی های مهم ما هستند؟
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
23
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
24
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
25
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
26
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
27
دانشکده مهندسی کامپیوتر
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
28
دانشکده مهندسی کامپیوتر
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
29
دانشکده مهندسی کامپیوتر
نیازی نیست این فعالیت ها به صورت خطی انجام شوند.
در مرحله ،1اگر به جای خرید یک انباره فراداده می خواهید ان را خود طراحی کنید ،از طراحی روابط
موجودیت ها یا شیء گرا استفاده کنید .یک فرامدل فیزیکی ایجاد کنید و روال های نگه داری پایگاه
داده را در نظر بگیرید.
در مرحله ،2اگر تصمیم بر ان است که یک انباره فراداده بخرید ،محصوالت موجود و فروشندگان ان
را ارزیابی کنید .بهترین ان ها را انتخاب نمایید و ان را نصب و تست کنید.
در مرحله ،3تمام ابزارها و DBMSهای ی که فراداده های فنی و تجاری از ان ها استخراج خواهند شد،
تعیین کنید.
در مرحله ،4در هر صورت ،کاربردهای فراداده را شامل واسط های دسترسی ،ویژگی های وب ،گزارش
ها و توابع کمکی انالین طراحی کنید.
ناهید قصاب زاده – هوش تجاری -پاییز 88
دانشگاه صنعتی امیرکبیر
30
دانشکده مهندسی کامپیوتر
اگر یک محصول انباره فراداده می خرید ،نتایج قابل تحویل شما یک محصول نصب و تست شده
است.
اگر انباره فراداده را خود طراحی می کنید ،باید موارد طراحی زیر را تولید کنید:
)1فرا مدل فیزیکی
)2زبان تعریف داده برای انباره فراداده
)3زبان کنترل داده برای انباره فراداده
)4مشخصات برنامه نویسی انباره فراداده
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
31
دانشکده مهندسی کامپیوتر
معمار زیرساخت هوش تجاری :باید تمام فعالیت های طراحی را مرور کند .اگر انباره فراداده خریداری
شود ،در اماده کردن معیارهای ارزیابی و تصمیم گیری روی فاک تورهای وزن دهی برای معیارها شرکت
می کند .هم چنین در انتخاب محصول نهای ی درگیر خواهد شد.
متولی داده :بر روی نیازمندی های فراداده با متولی داده همکاری خواهد کرد و با فعالیت های مدل
کردن داده به متولی فراداده کمک خواهد کرد.
متولی فراداده :مسئول اولیه برای فراداده و انباره فراداده است .مسئول طراحی و ایجاد فراداده است
یا در صورت خرید مسئول نصب ،تست ،بهبود و نگه داری است.
دانشگاه صنعتی امیرکبیر
ناهید قصاب زاده – هوش تجاری -پاییز 88
32
دانشکده مهندسی کامپیوتر
مشابه هر سیستم دیگر ،نیاز به یک فراداده با سطح قابل قبولی از کارای ی ،مقیاس پذیری و قابلیت
نگه داری در طول زمان است.
اگر تصمیم به خرید یک محصول انباره فراداده دارید ،باید فرایند ارزیابی را به دقت طی کنید.
اگر زمان کافی برای طراحی یک راه حل انباره فراداده مستحکم نگذارید ،باید مراحل راه حل خود را
دوباره طی کنید یا کار را با یک محیط پشتیبانی تصمیم نامناسب برای هوش تجاری تمام کنید.
«االن بپرداز یا ً
بعدا ،اما باید بپردازی!»
33