What is Data Warehouse? - ผศ.วิวัฒน์ ชินนาทศิริกุล

Download Report

Transcript What is Data Warehouse? - ผศ.วิวัฒน์ ชินนาทศิริกุล

คลังข้อมู ล(Data
Warehouse)
อ.วิว ัฒน์ ชินนาทศิรก
ิ ล
ุ
้
เนื อหา
 What
is Data Warehouse?
 Characteristics of Data
Warehouse
 Data Warehouse Architecture
 Operational System VS Data
Warehouse
ทาไมต้องมี Data
Warehouse

พิจารณาการดาเนิ นการขององค ์กรในปัจจุบน
ั
- มีการแข่งขันกันสูง
- มีความต ้องการใช ้ข ้อมูล ในการตัดสินใจมาก
ขึน้
- ข ้อมูลขององค ์กรมีมาก แต่ไม่ได ้ใช ้ให ้เกิด
ประโยชน์
- ข ้อมูลกระจาย ไม่ได ้อยูใ่ นรูปแบบเดียวกัน
What is data
warehouse?
Data Warehouse is a collection
of decision Support
technology, aimed at enabling the
knowledge worker
(executive , manager , analyst) to
make better and faster
decision.
(S.Prabhu , N.Venatesan : Data
What is Data Warehouse?
A data warehouse is subjectoriented,integrated,
time-variant , nonvolatile collection of
data in support of
management’s decision making
process.
(W.Inmon : Building the Data
What is Data
Warehousing ?
The process of constructing
and using
data
warehouses.
ความหมายของคลังข้อมู ล


่ บข ้อมูลขนาดใหญ่ขององค ์กร ทีออกแบบมาเพื
่
่
ทีเก็
อ
ช่วยในการ
ตัดสินใจของผูบ้ ริหารในองค ์กร
่ ้มาจากข ้อมูลภายในองค ์กร จากฐานข ้อมูล
ข ้อมูลทีได
การใช ้งานประจาวันหรือฐานข ้อมูลปฏิบต
ั ก
ิ าร
(Operational Database) หรือมาจากฐานข ้อมูลภาย
นอกองค ์กร (External Database)
ข ้อมูลในคลังข ้อมูลจะถูกนามาใช ้เพือ่
สนับสนุ นการตัดสินใจบริหารงานของผูบ้ ริหาร
่ ้อมูลพืนฐานให
้
่
เพือข
้กับระบบงาน เพือการ
่ เช่น
บริหารงานอืน
ระบบสนับสนุ นการตัดสินใจ
(Decision Support System) หรือ ระบบ
การจัดการสารสนเทศ (Management
Information
System)
่ ่ใน
ลักษณะของข้อมู ลทีอยู
Data Warehouse

จากคานิ ยามของ W.Inmon มี 4 ลักษณะคือ
1. Subject-Oriented
2. Integrated
3. Time-Variant
4. Non-Volatile
Subject-Oriented
ข ้อมูลในคลังข ้อมูล มีการแบ่งโครงสร ้างตาม
่
หัวข ้อทีสนใจ
คลังข ้อมูลจะถูกออกแบบตาม
้
่
เนื อหาที
สนใจ
และจาเป็ นต่อกระบวนการตัดสินใจ
Integrated (การรวมเป็ น
หนึ่ง)
เป็ นการรวบรวมข ้อมูลจากแหล่งต่างๆทัง้
ภายในและภายนอกองค ์กร จากหลาย
่ ยวกัน ทาให ้
ระบบปฏิบต
ั ก
ิ าร ให ้มาอยู่ในทีเดี
ข ้อมูลมีความสอดคล ้องกัน
Time-Varient
(ความสัมพันธ ์กับเวลา)

การเก็บข ้อมูลในคลังข ้อมูล จะเป็ นข ้อมูลลักษณะ
Historical Data (เก็บข ้อมูลย ้อนหลังไปหลายๆ
่ าไปวิเคราะห ์ เปรียบเทียบหาแนวโน้ม
ปี ) เพือน
ของข ้อมูล
Non-Volatile (ความ
เสถียรของข้อมู ล)
ข ้อมูลในคลังข ้อมูลจะไม่มก
ี ารแก ้ไข
่
่
เปลียนแปลง
หลังจากทีโหลดเข
้าสูค
่ ลังข ้อมูลแล ้ว
ผูใ้ ช ้ทาได ้เพียงการเข ้าถึงข ้อมูลเท่านั้น
ฐานข้อมู ลปฏิบต
ั ก
ิ าร(Operatinal
Database)
ข ้อมูลในฐานข ้อมูล OLTP เป็ นลักษณะ
Relational
 มีการเข ้าถึงข ้อมูลบ่อย และปร ับปรุงข ้อมูลให ้เป็ น
ปัจจุบน
ั เสมอ
 สนับสนุ นการปฏิบต
ั งิ านประจาวัน (Day to day
operation)

Differences Between Operation Databases and
Data Warehouses
การนาข้อมู ลเข้าสู ่
คลังข้อมู ล
1. การดึงข ้อมูล (Extraction)
2.
การแปลงข ้อมูล(Transformation)
3. การโหลดข ้อมูลเก็บไว ้ในคลัง (Loading)
เรียกขัน
้ ตอนทัง้ สามแบบย่อว่า ETL
There are a number of ETL tools available in the market to do
ETL process.Following are some of this.
สถาปั ตยกรรมคลังข้อมู ล
(Data warehouse Architecture)

สถาปัตยกรรมหรือโครงสร ้างของคลังข ้อมูล จะ
่ อทีใช
่ ้
รวมเครืองมื
ในการสกัดหรือดึง(Extract) ข ้อมูลจาก
่ ้งานประจาวัน
ฐานข ้อมูลทีใช
้
รวมทังฐานข
้อมูลจากภายนอกองค ์กร เพือ่ ทา
ความสะอาดข ้อมูล
(Cleaning) แปลงรูป(Transforming) และ นา
Data Warehouse Architecture
่ Data mining and warehousing
ทีมา
สถาปั ตยกรรมคลังข้อมู ล
่
โดยทัวไป
มีองค ์ประกอบหลัก 3 ส่วน
1.
2.
3.
Data Acquisition
Data Warehouse
Design/Storage
Data Access
Data Acquisition (การได้มา
่ อมู ล)
ซึงข้

่ อในการดึงข ้อมูล ทังจาก
้
จาเป็ นต ้องอาศัยเครืองมื
ฐานข ้อมูลปฏิบต
ั ก
ิ ารประจาวัน และจาก
่ ในการทาความสะอาด
แหล่งข ้อมูลภายนอกอืนๆ
ข ้อมูลแปลงข ้อมูล รวมข ้อมูล โหลดข ้อมูลเข ้าสู่
คลังข ้อมูล
Data Warehouse
Design / Storage

การออกแบบและโครงสร ้างการจัดเก็บข ้อมูลใน
่
น RDBMS หรือ
คลังข ้อมูล ซึงอาจเป็
Multidimensional
นอกจากข ้อมูลในคลังหลักแล ้ว ยังมีข ้อมูลใน
่
ระบบงานย่อยอืนๆ
่ ยกว่า Data Marts
ทีเรี
Data Access (การเข้าถึง
ข้อมู ล)

่ าข ้อมูลมาใช ้งาน โดยเครืองมื
่ อต่างๆเช่น
เพือน
่ อสอบถาม เครืองมื
่ อวิเคราะห ์ข ้อมูล
เครืองมื
่ อทาเหมืองข ้อมูล
เครืองมื

นอกจากองค ์ประกอบหลักๆ 3 ส่วนแล ้ว ยังมีส่วน
สาคัญอีก 2 ส่วน
ได ้แก่
- แหล่งจัดเก็บและจัดการเมตาดาต ้า
่ อในการควบคุมและบริการระบบ
- เครืองมื
คลังข ้อมูล
Metadata
่
่
จัดเก็บข ้อเท็จจริงเพืออธิ
บายข ้อมูล เพือ
1. อธิบายความหมายหรือคาจากัดความของข ้อมูล
2. ใช ้เป็ นข ้อมูลสาหร ับการดาเนิ นการต่างๆกับขอ้ มูล
ตามกระบวนการ
ฐานข ้อมูล เช่น ข ้อมูลแต่ละตัวมาจากแหล่งใด ถูก
นาเข ้าด ้วยวิธก
ี ารใด
แบบฝึ กหัด
บริษท
ั แห่งหนึ่ งได ้มีการพัฒนาระบบสารสนเทศของบริษท
ั
ในแต่ละช่วงเวลาดังนี ้
• ปี พ.ศ. 2534 พัฒนาระบบสารสนเทศคลังสินค้า
่ บข ้อมูล
ใช ้ Text File เป็ นทีเก็
ใช ้ระบบ DOS
ระบบและข ้อมูลดูแลโดย........ฝ่ายคลังสินค้า
่
• ปี พ.ศ. 2535 พัฒนาระบบสารสนเทศเกียวกั
บการขาย
สินค้า
่ บข ้อมูล
ใช ้ ระบบฐานข ้อมูล Access เป็ นทีเก็
ใช ้ระบบ DOS ร่วมกับ Window 3.1
ระบบและข ้อมูลดูแลโดย.........ฝ่ายขาย
่
• ปี พ.ศ. 2539 พัฒนาระบบสารสนเทศเกียวกั
บการ
บริหารงานบุคลากร
่ บข ้อมูล
ใช ้ ระบบฐานข ้อมูล Oracle เป็ นทีเก็
ใช ้ระบบ Window 95 OS
คาถาม
่ ดขึนกั
้ บบริษท
้ อะไร จง
1. ปัญหาทีเกิ
ั แห่งนี มี
เขียนมาให ้ละเอียด
่ ดขึน้ นักศึกษาคิด
2. ถ ้าต ้องการแก ้ปัญหาทีเกิ
ว่าจะต ้องทาอย่างไร