کنفرانس داده کاوی

Download Report

Transcript کنفرانس داده کاوی

‫موضوع ‪:‬‬
‫داده کاوی‬
‫استاد مربوطه‪ :‬خانم زرین قلمی‬
‫تهیه کننده‪ :‬وحیده پیرهادی‬
‫پاییز ‪93‬‬
‫‪Slide 2‬‬
‫مقدمه‬
‫از سال ‪ 1950‬به بعد که رایانه‪ ،‬در تحلیل و ذخیره سازی داده ها به کار رفت‪ .‬حجم داده ها در پایگاه داده هر دو سال یکبار دو برابر شد‪.‬‬
‫با وجود شبکه جهانی وب‪ ،‬سیستم های یکپارچه اطالعاتی‪ ،‬سیستم های یکپارچه بانکی‪ ،‬تجارت الکترونیکی و ‪ ...‬لحظه به لحظه به‬
‫حجم داده ها در پایگاه داده ها اظافه شده و باعث بوجود آمدن انبارهای (توده های) عظیمی از داده ها شده است‪ ،‬به طوری که ضرورت‬
‫کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است‪.‬‬
‫‪‬‬
‫اصطالح ‪Data Mining‬همان طور که از ترجمه آن به معنی داده کاوی مشخص میشود به مفهوم استخراج اطالعات نهان و یا‬
‫الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطالعاتی بزرگ است‪.‬‬
‫•‬
‫داده کاوی‪ ،‬پایگاه ها و مجموعه های حجیم داده ها را در پی کشف واستخراج دانش‪ ،‬مورد تحلیل و کند و کاوهای ماشینی (و‬
‫نیمهماشینی) قرار میدهد‪ .‬این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا‬
‫گیر آمار دانست‪.‬‬
‫•‬
‫بسیاری از شرکتها و موسسات دارای حجم انبوهی از اطالعات هستند‪ .‬تکنیکهای دادهکاوی به طور تاریخی به گونهای گسترش‬
‫یافتهاند که به سادگی میتوان آنها را بر ابزارهای نرمافزاری و ‪ ...‬امروزی تطبیق داده و از اطالعات جمع آوری شده بهترین بهره را‬
‫برد‪.‬‬
‫•‬
‫در صورتی که سیستمهای ‪ Data Mining‬بر روی سکوهای ‪ Client/Server‬قوی نصب شده باشد و دسترسی به بانک های‬
‫اطالعاتی بزرگ فراهم باشد‪ ،‬میتوان به سواالتی از قبیل ‪:‬کدامیک از مشتریان ممکن است خریدار کدامیک از محصوالت آینده‬
‫شرکت باشند‪ ،‬چرا‪ ،‬در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد‪.‬‬
‫‪Slide 2‬‬
‫نگاهی به ترجمه لغوی داده کاوی‬
‫•‬
‫•‬
‫واژه ‪ MIN‬به معنای استخراج از منابع نهفته و با ارزش زمین اطالق می شود‪.‬‬
‫ادغام این کلمه با ‪ Data‬به معنی داده بر جستجویی عمیق از داده های قابل‬
‫دسترس با حجم زیاد برای یافتن اطالعات مفید که قبال ً نهفته بودند‪ ،‬تأکید دارد‬
‫‪Slide 3‬‬
‫موضوع داده کاوی چیست؟‬
‫موضوع داده کاوی شناخت چیزهای جدید و با ارزش و بالقوه مفید‪ ،‬رابطه های منطقی و الگوهای موجود در داده هاست‪.‬‬
‫عبارت «داده کاوی» توسط آمارشناسان‪ ،‬محققان پایگاه های داده و سیستم های اطالعات مدیریتی و جوامع بازرگانی به کار برده می شود‪.‬‬
‫عبارت کشف دانش در پایگاه داده ها عموماً برای اشاره به فرایند کلی کشف دانش مفید از داده هایی که داده کاوی گام مهمی در این‬
‫فرایند است‪ ،‬مورد استفاده قرار می گیرد‪.‬‬
‫دو رویکرد برای داده کاوی وجود دارد که از لحاظ ایجاد و طراحی مدل و یافتن الگوها با هم فرق دارند‪.‬‬
‫اولین رویکرد ‪ :‬ساخت مدل که مشابه روش های آماری مرسوم است‪(.‬مثل تحلیل داده ها برای پیشگویی)‬
‫رویکرد‬
‫دومین رویکرد ‪ :‬تشخیص الگو که انحراف هایی هرچند کوچک را تشخیص دهد و الگو ها و روندهای غیر‬
‫معمول ( مثل ‪ :‬کالهبرداری) در استفاده از کارت های اعتباری که نایان شود‪.‬‬
‫‪Slide 4‬‬
‫ویژگی های داده کاوی‬
‫• ابتکارات مربوط به تأمین امنیت ملی داده کاوی است‪.‬‬
‫• شناسایی افراد خرابکار شامل جابه جایی پول و ارتباطات بین آن‬
‫ها و همچنین شناسایی و رد گیری خود آنها باا بررسای ساواب‬
‫مربوط به مهاجرت و مسافرت هاست‪.‬‬
‫ویژگی کلیدی‬
‫ابزاری برای‬
‫‪Slide 5‬‬
‫محدودیت های داده کاوی‬
‫‪(1‬‬
‫یکی از این محدودیتها این است که با وجود اینکه به آشکارسازی الگوها و‬
‫روابط کمک میکند اما اطالعاتی را در باره ارزش یا میزان اهمیت آنها به‬
‫دست نمیدهد‪.‬‬
‫‪(2‬‬
‫دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین‬
‫رفتارها و یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست‪.‬‬
‫موفقیت داده کاوی در گرو بهره گیری از‬
‫کارشناسان فنی و تحلیل گران کار آزمودهای‬
‫است که از توانایی کافی برای طبقه بندی‬
‫تحلیلها و تغییر آنها برخوردار هستند‪.‬‬
‫‪Slide 6‬‬
‫ابزارهای داده کاوی‬
‫‪Clementine‬‬
‫ابزارهای‬
‫داده کاوی‬
‫رپیدماینر‬
‫که نسخه ‪ 13‬آن‬
‫با نام‬
‫‪SPSS Modeler‬‬
‫نامیده می شود‪.‬‬
‫‪Slide 7‬‬
‫نرم افزارهای داده کاوی‬
‫• نرم افزارهای آماری عمومی‬
OLAP‫• برای کاربردهای‬
• SPSS
• SAS
• STATISTICA
• DB2 OLAP Server
• Oracle OLAP
• Clever Path OLAP
‫بسته های نرم افزاری‬
‫اختصاصی داده کاوی‬
Weka poly Analyst 4.6
insightful
Miner 3
Text mining software
Enterprise Data Minig
Slide 8
‫عناصر داده کاوی‬
‫‪Slide 9‬‬
‫صنعت‬
‫حمل و‬
‫نقل(انتقال)‬
‫پزشکی‬
‫بازاریابی‪ /‬خرده فروشی‬
‫شبکه کاوی‬
‫بیمه و مرقبت های بهداشتی‬
‫متن کاوی‬
‫بانکداری‬
‫صوت کاوی‬
‫‪Slide 10‬‬
‫گزارش‬
‫داده کاوی در تولید چهار نوع دانش ذیل مفید است‪:‬‬
‫‪(1‬‬
‫‪ (2‬دانش چند وجهی‪ -‬کاربردهای ‪OLAP‬‬
‫‪ (3‬دانش نهان(تشخیص الگو و کاربردهای الگوریتم یادگیری ماشینی)‬
‫‪ (4‬دانش عمیق( کاربردهای الگوریتم بهینه سازی داخلی)‬
‫دانش سطحی‪ -‬کاربردهای ‪SQL‬‬
‫گام نهایی در داده کاوی‬
‫گزارش دادن است‪.‬‬
‫‪Slide 11‬‬
1‫شکل‬
Slide 12
‫منابع‬
1) Civilica.com
2) wikipedia.org
Slide 13
‫پایان‬
Slide 14