کنفرانس داده کاوی
Download
Report
Transcript کنفرانس داده کاوی
موضوع :
داده کاوی
استاد مربوطه :خانم زرین قلمی
تهیه کننده :وحیده پیرهادی
پاییز 93
Slide 2
مقدمه
از سال 1950به بعد که رایانه ،در تحلیل و ذخیره سازی داده ها به کار رفت .حجم داده ها در پایگاه داده هر دو سال یکبار دو برابر شد.
با وجود شبکه جهانی وب ،سیستم های یکپارچه اطالعاتی ،سیستم های یکپارچه بانکی ،تجارت الکترونیکی و ...لحظه به لحظه به
حجم داده ها در پایگاه داده ها اظافه شده و باعث بوجود آمدن انبارهای (توده های) عظیمی از داده ها شده است ،به طوری که ضرورت
کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است.
اصطالح Data Miningهمان طور که از ترجمه آن به معنی داده کاوی مشخص میشود به مفهوم استخراج اطالعات نهان و یا
الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطالعاتی بزرگ است.
•
داده کاوی ،پایگاه ها و مجموعه های حجیم داده ها را در پی کشف واستخراج دانش ،مورد تحلیل و کند و کاوهای ماشینی (و
نیمهماشینی) قرار میدهد .این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا
گیر آمار دانست.
•
بسیاری از شرکتها و موسسات دارای حجم انبوهی از اطالعات هستند .تکنیکهای دادهکاوی به طور تاریخی به گونهای گسترش
یافتهاند که به سادگی میتوان آنها را بر ابزارهای نرمافزاری و ...امروزی تطبیق داده و از اطالعات جمع آوری شده بهترین بهره را
برد.
•
در صورتی که سیستمهای Data Miningبر روی سکوهای Client/Serverقوی نصب شده باشد و دسترسی به بانک های
اطالعاتی بزرگ فراهم باشد ،میتوان به سواالتی از قبیل :کدامیک از مشتریان ممکن است خریدار کدامیک از محصوالت آینده
شرکت باشند ،چرا ،در کدام مقطع زمانی و بسیاری از موارد مشابه پاسخ داد.
Slide 2
نگاهی به ترجمه لغوی داده کاوی
•
•
واژه MINبه معنای استخراج از منابع نهفته و با ارزش زمین اطالق می شود.
ادغام این کلمه با Dataبه معنی داده بر جستجویی عمیق از داده های قابل
دسترس با حجم زیاد برای یافتن اطالعات مفید که قبال ً نهفته بودند ،تأکید دارد
Slide 3
موضوع داده کاوی چیست؟
موضوع داده کاوی شناخت چیزهای جدید و با ارزش و بالقوه مفید ،رابطه های منطقی و الگوهای موجود در داده هاست.
عبارت «داده کاوی» توسط آمارشناسان ،محققان پایگاه های داده و سیستم های اطالعات مدیریتی و جوامع بازرگانی به کار برده می شود.
عبارت کشف دانش در پایگاه داده ها عموماً برای اشاره به فرایند کلی کشف دانش مفید از داده هایی که داده کاوی گام مهمی در این
فرایند است ،مورد استفاده قرار می گیرد.
دو رویکرد برای داده کاوی وجود دارد که از لحاظ ایجاد و طراحی مدل و یافتن الگوها با هم فرق دارند.
اولین رویکرد :ساخت مدل که مشابه روش های آماری مرسوم است(.مثل تحلیل داده ها برای پیشگویی)
رویکرد
دومین رویکرد :تشخیص الگو که انحراف هایی هرچند کوچک را تشخیص دهد و الگو ها و روندهای غیر
معمول ( مثل :کالهبرداری) در استفاده از کارت های اعتباری که نایان شود.
Slide 4
ویژگی های داده کاوی
• ابتکارات مربوط به تأمین امنیت ملی داده کاوی است.
• شناسایی افراد خرابکار شامل جابه جایی پول و ارتباطات بین آن
ها و همچنین شناسایی و رد گیری خود آنها باا بررسای ساواب
مربوط به مهاجرت و مسافرت هاست.
ویژگی کلیدی
ابزاری برای
Slide 5
محدودیت های داده کاوی
(1
یکی از این محدودیتها این است که با وجود اینکه به آشکارسازی الگوها و
روابط کمک میکند اما اطالعاتی را در باره ارزش یا میزان اهمیت آنها به
دست نمیدهد.
(2
دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین
رفتارها و یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست.
موفقیت داده کاوی در گرو بهره گیری از
کارشناسان فنی و تحلیل گران کار آزمودهای
است که از توانایی کافی برای طبقه بندی
تحلیلها و تغییر آنها برخوردار هستند.
Slide 6
ابزارهای داده کاوی
Clementine
ابزارهای
داده کاوی
رپیدماینر
که نسخه 13آن
با نام
SPSS Modeler
نامیده می شود.
Slide 7
نرم افزارهای داده کاوی
• نرم افزارهای آماری عمومی
OLAP• برای کاربردهای
• SPSS
• SAS
• STATISTICA
• DB2 OLAP Server
• Oracle OLAP
• Clever Path OLAP
بسته های نرم افزاری
اختصاصی داده کاوی
Weka poly Analyst 4.6
insightful
Miner 3
Text mining software
Enterprise Data Minig
Slide 8
عناصر داده کاوی
Slide 9
صنعت
حمل و
نقل(انتقال)
پزشکی
بازاریابی /خرده فروشی
شبکه کاوی
بیمه و مرقبت های بهداشتی
متن کاوی
بانکداری
صوت کاوی
Slide 10
گزارش
داده کاوی در تولید چهار نوع دانش ذیل مفید است:
(1
(2دانش چند وجهی -کاربردهای OLAP
(3دانش نهان(تشخیص الگو و کاربردهای الگوریتم یادگیری ماشینی)
(4دانش عمیق( کاربردهای الگوریتم بهینه سازی داخلی)
دانش سطحی -کاربردهای SQL
گام نهایی در داده کاوی
گزارش دادن است.
Slide 11
1شکل
Slide 12
منابع
1) Civilica.com
2) wikipedia.org
Slide 13
پایان
Slide 14