การขุดค้นข้อมูล (Data Mining)
Download
Report
Transcript การขุดค้นข้อมูล (Data Mining)
การขุดค้นข้อมูล (Data Mining)
ผูส้ อน: พิชญา แก้วกสิ
[email protected]
หัวข้อการบรรยาย
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
กระบวนการทาง Data Mining
การค้นหาความรู ้จากฐานข้อมูล
ประเภทของข้อมูลที่นามาขุดค้น
ประเภทของรู ปแบบข้อมูลที่ขดุ ค้นมาได้
การนา Data Mining ไปประยุกต์ใช้
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
การเก็บรวบรวมข้อมูล (Data Collection) และการสร้าง
ฐานข้อมูล (Database Creation) - (ยุค 1960)
– การประมวลผล File แบบดั้งเดิม
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบการจัดการฐานข้อมูล (Database Management
Systems) - (1970 - ช่วงต้นของยุค 1980)
– ระบบฐานข้อมูลแบบลาดับขั้น (Hierarchical Database System)
และระบบฐานข้อมูลแบบเครื อข่าย (Network Database System)
– ระบบฐานข้อมูลแบบสัมพันธ์ (Relational Database System)
– เครื่ องมือสร้างแบบจาลองข้อมูล (Data Modeling Tool)
– เทคนิคการทาดัชนี (Indexing)
– Query Language
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
– ส่ วนติดต่อกับผูใ้ ช้ (User Interface) และรายงาน (Report)
– การประมวลผล Query (Query Processing) และการ
ปรับปรุ งประสิ ทธิภาพของ Query ให้สูงสุ ด (Query
Optimization)
– การจัดการ Transaction (Transaction
Management)
– การประมวลผล Transaction แบบ On-line (On-line
transaction processing - OLTP)
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลขั้นสูง
ระบบฐานข้อมูลเชิง Web
Data Warehousing และ Data Mining
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลขั้นสูง - (ช่วงกลางของยุค 1980 - ปัจจุบนั )
– แบบจาลองข้อมูลขั้นสู ง (Advanced Data Model)
– ฐานข้อมูลเชิงการประยุกต์ (Application-oriented)
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบฐานข้อมูลเชิง Web (Web-based
Database System) - (ยุค 1990 - ปัจจุบนั )
– ระบบฐานข้อมูลเชิง XML (XML-based Database
System)
– Web Mining
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
Data Warehousing และ Data Mining - (ช่วง
ปลายยุค 1980 - ปัจจุบนั )
– Data Warehouse และเทคโนโลยี OLAP
– Data Mining และ Knowledge Discovery
วิวฒั นาการของเทคโนโลยีฐานข้อมูล
ระบบสารสนเทศแบบบูรณาการยุคใหม่ (Integrated
Information System) - ( 2000 - … )
Data Mining
ข้อมูลตั้งเยอะแยะ
จะทายังไงดี
Data Mining
ดึงเอาความรู ้ออกมาใช้ดีกว่า
Knowledge
Data Pyramid
Knowledge
Information
Data
Data Mining
Data Mining = การนาเอาความรู ้ (Knowledge) ที่
น่าสนใจ เช่น กฎ (rule), รู ปแบบ (pattern), ข้อกาหนด
(constraint) ออกมาจากข้อมูลที่อยูใ่ นฐานข้อมูล
Data Analysis, Data Archaeology, Data
Dredging ...
Data Mining
Statistics
Database
Data Mining
Data Warehouse
Machine Learning
Pattern Recognition
Database Query VS Data Mining
ลูกค้าทั้งหมดที่ซ้ื อสิ นค้าเกิน 1000
บาทในเดือนที่แล้ว
ลูกค้าทั้งหมดที่ซ้ื อขนมปั ง
มีลกู หนี้กี่คนที่มีเงินเดือนสู งกว่า
10000 บาท
รู ปแบบพฤติกรรมการซื้ อสิ นค้า
ของลูกค้า
ถ้าลูกค้าซื้ อขนมปั งแล้วจะซื้ อ
สิ นค้าใดด้วยบ้าง
ลูกหนี้ ที่เป็ นลูกหนี้ ช้ น
ั ดีมี
คุณสมบัติอย่างไรบ้าง
การค้นหาความรู้จากฐานข้อมูล
Knowledge Discovery in Databases
(KDD)
การประยุกต์ใช้ความรู ้ (Knowledge) ที่เก็บอยูใ่ นฐานข้อมูล
ให้ได้ประโยชน์สูงสุ ด
กระบวนการค้นหาความรู้จากฐานข้อมูล
Data Mining
Selection and
Transformation
Cleaning and
Integration
Evaluation and
Presentation
Knowledge
กระบวนการค้นหาความรู้จากฐานข้อมูล
Data Cleaning
Data Integration
Data Selection
Data Transformation
Data Mining
Pattern Evaluation
Knowledge Presentation
Data Cleaning
การกาจัดข้อมูลที่ผดิ ปกติ (Noise) หรื อไม่ถูกต้องออกไป
Data Integration
การรวมเอาข้อมูลจากหลายๆแหล่งมาไว้เข้าด้วยกัน
Data Selection
การเลือกเอาเฉพาะข้อมูลที่เกี่ยวข้องกับสิ่ งที่ตอ้ งการวิเคราะห์ออกมา
Data Transformation
การแปลงข้อมูลให้อยูใ่ นรู ปแบบที่สามารถจะนาไปใช้ในการทา
Data Mining
-2, 32, 100, 59, 48
-0.02, 0.32, 1.00, 0.59, 0.48
Data Mining
วิธีการดึงเอารู ปแบบ (Pattern) ของข้อมูลออกมา
Pattern Evaluation
การประเมินความถูกต้องของรู ปแบบที่ได้มา
Knowledge Representation
การนาเสนอความรู ้ (Knowledge) ที่ได้มาให้ User
ประเภทของข้อมูลที่นามาขุดค้น
Relational Database
Data Warehouse
Transaction Database
Object-Oriented Database
Object-Relational Database
Spatial Database
ประเภทของข้อมูลที่นามาขุดค้น
Temporal Database
Time-Series Database
Text Database
Multimedia Database
WWW
ประเภทของรู ปแบบข้อมูลที่ขดุ ค้นมาได้
Predictive
Descriptive
Predictive
Classification
Regression
Prediction
Regression
วงเงิน
รายได้
Descriptive
Clustering
Summarization
Association
Clustering
วงเงิน
รายได้
การนา Data Mining ไปประยุกต์ใช้
การช่วยในการตัดสิ นใจอนุมตั ิเงินสิ นเชื่อ
การพยากรณ์ปริ มาณการใช้ไฟฟ้ า
การวิเคราะห์ยอดขายสิ นค้า
การวิเคราะห์รูปแบบพฤติกรรมการซื้ อของผูบ
้ ริ โภค