การขุดค้นข้อมูล (Data Mining)

Download Report

Transcript การขุดค้นข้อมูล (Data Mining)

การขุดค้นข้อมูล (Data Mining)
ผูส้ อน: พิชญา แก้วกสิ
[email protected]
หัวข้อการบรรยาย
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
 กระบวนการทาง Data Mining
 การค้นหาความรู ้จากฐานข้อมูล
 ประเภทของข้อมูลที่นามาขุดค้น
 ประเภทของรู ปแบบข้อมูลที่ขดุ ค้นมาได้
 การนา Data Mining ไปประยุกต์ใช้

วิวฒั นาการของเทคโนโลยีฐานข้อมูล
การเก็บรวบรวมข้อมูล (Data Collection) และการสร้าง
ฐานข้อมูล (Database Creation) - (ยุค 1960)
– การประมวลผล File แบบดั้งเดิม
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบการจัดการฐานข้อมูล (Database Management
Systems) - (1970 - ช่วงต้นของยุค 1980)
– ระบบฐานข้อมูลแบบลาดับขั้น (Hierarchical Database System)
และระบบฐานข้อมูลแบบเครื อข่าย (Network Database System)
– ระบบฐานข้อมูลแบบสัมพันธ์ (Relational Database System)
– เครื่ องมือสร้างแบบจาลองข้อมูล (Data Modeling Tool)
– เทคนิคการทาดัชนี (Indexing)
– Query Language
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
– ส่ วนติดต่อกับผูใ้ ช้ (User Interface) และรายงาน (Report)
– การประมวลผล Query (Query Processing) และการ
ปรับปรุ งประสิ ทธิภาพของ Query ให้สูงสุ ด (Query
Optimization)
– การจัดการ Transaction (Transaction
Management)
– การประมวลผล Transaction แบบ On-line (On-line
transaction processing - OLTP)
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลขั้นสูง
 ระบบฐานข้อมูลเชิง Web
 Data Warehousing และ Data Mining

วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลขั้นสูง - (ช่วงกลางของยุค 1980 - ปัจจุบนั )
– แบบจาลองข้อมูลขั้นสู ง (Advanced Data Model)
– ฐานข้อมูลเชิงการประยุกต์ (Application-oriented)
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลเชิง Web (Web-based
Database System) - (ยุค 1990 - ปัจจุบนั )
– ระบบฐานข้อมูลเชิง XML (XML-based Database
System)
– Web Mining
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
Data Warehousing และ Data Mining - (ช่วง
ปลายยุค 1980 - ปัจจุบนั )
– Data Warehouse และเทคโนโลยี OLAP
– Data Mining และ Knowledge Discovery
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบสารสนเทศแบบบูรณาการยุคใหม่ (Integrated
Information System) - ( 2000 - … )
Data Mining
ข้อมูลตั้งเยอะแยะ
จะทายังไงดี
Data Mining
ดึงเอาความรู ้ออกมาใช้ดีกว่า
Knowledge
Data Pyramid
Knowledge
Information
Data
Data Mining

Data Mining = การนาเอาความรู ้ (Knowledge) ที่
น่าสนใจ เช่น กฎ (rule), รู ปแบบ (pattern), ข้อกาหนด
(constraint) ออกมาจากข้อมูลที่อยูใ่ นฐานข้อมูล

Data Analysis, Data Archaeology, Data
Dredging ...
Data Mining
Statistics
Database
Data Mining
Data Warehouse
Machine Learning
Pattern Recognition
Database Query VS Data Mining
ลูกค้าทั้งหมดที่ซ้ื อสิ นค้าเกิน 1000
บาทในเดือนที่แล้ว
 ลูกค้าทั้งหมดที่ซ้ื อขนมปั ง


มีลกู หนี้กี่คนที่มีเงินเดือนสู งกว่า
10000 บาท
รู ปแบบพฤติกรรมการซื้ อสิ นค้า
ของลูกค้า
 ถ้าลูกค้าซื้ อขนมปั งแล้วจะซื้ อ
สิ นค้าใดด้วยบ้าง
 ลูกหนี้ ที่เป็ นลูกหนี้ ช้ น
ั ดีมี
คุณสมบัติอย่างไรบ้าง

การค้นหาความรู้จากฐานข้อมูล
Knowledge Discovery in Databases
(KDD)
 การประยุกต์ใช้ความรู ้ (Knowledge) ที่เก็บอยูใ่ นฐานข้อมูล
ให้ได้ประโยชน์สูงสุ ด

กระบวนการค้นหาความรู้จากฐานข้อมูล
Data Mining
Selection and
Transformation
Cleaning and
Integration
Evaluation and
Presentation
Knowledge
กระบวนการค้นหาความรู้จากฐานข้อมูล
Data Cleaning
 Data Integration
 Data Selection
 Data Transformation
 Data Mining
 Pattern Evaluation
 Knowledge Presentation

Data Cleaning

การกาจัดข้อมูลที่ผดิ ปกติ (Noise) หรื อไม่ถูกต้องออกไป
Data Integration

การรวมเอาข้อมูลจากหลายๆแหล่งมาไว้เข้าด้วยกัน
Data Selection

การเลือกเอาเฉพาะข้อมูลที่เกี่ยวข้องกับสิ่ งที่ตอ้ งการวิเคราะห์ออกมา
Data Transformation

การแปลงข้อมูลให้อยูใ่ นรู ปแบบที่สามารถจะนาไปใช้ในการทา
Data Mining
-2, 32, 100, 59, 48
-0.02, 0.32, 1.00, 0.59, 0.48
Data Mining

วิธีการดึงเอารู ปแบบ (Pattern) ของข้อมูลออกมา
Pattern Evaluation

การประเมินความถูกต้องของรู ปแบบที่ได้มา
Knowledge Representation

การนาเสนอความรู ้ (Knowledge) ที่ได้มาให้ User
ประเภทของข้อมูลที่นามาขุดค้น
Relational Database
 Data Warehouse
 Transaction Database
 Object-Oriented Database
 Object-Relational Database
 Spatial Database

ประเภทของข้อมูลที่นามาขุดค้น
Temporal Database
 Time-Series Database
 Text Database
 Multimedia Database
 WWW

ประเภทของรู ปแบบข้อมูลที่ขดุ ค้นมาได้
Predictive
 Descriptive

Predictive
Classification
 Regression
 Prediction

Regression
วงเงิน
รายได้
Descriptive
Clustering
 Summarization
 Association

Clustering
วงเงิน
รายได้
การนา Data Mining ไปประยุกต์ใช้
การช่วยในการตัดสิ นใจอนุมตั ิเงินสิ นเชื่อ
 การพยากรณ์ปริ มาณการใช้ไฟฟ้ า
 การวิเคราะห์ยอดขายสิ นค้า
 การวิเคราะห์รูปแบบพฤติกรรมการซื้ อของผูบ
้ ริ โภค
