บทที่ 6 คลังข้อมูล

Download Report

Transcript บทที่ 6 คลังข้อมูล

… บทที่ 6…
คลังข้ อมูล
ระบบสารสนเทศเพื่อการบริ หาร
Management Information Systems for Administration
2552007 Management Information Systems for Administration
การเข้ าถึงดาต้ าแวร์ เฮาส์ Data Warehouse
ดาต้าแวร์เฮาส์ หรื อ คลังข้อมูล
•สารสนเทศจากภายใน
•สารสนเทศจากภายนอก
สามารถเข้าถึงสารสนเทศ
ได้ทุกประเภท
EIS
•วิเคราะห์/ตัดสิ นใจ
•เจาะลึกข้อมูล
•ซอฟต์แวร์สาเร็ จรู ป
•ใช้ DSS และ AI
สนับสนุนการทารายงาน
ช่วยผูบ้ ริ หารระบุปัญหา
ในลักษณะยืดหยุน่ และ
และสร้างโอกาส
เป็ นเครื่ องมือวิเคราะห์สารสนเทศ
ที่มา:ปรั บจาก Haag et al.(2000:68).
คลังข้ อมูล
• คลังข้อมูล เกิดจากแนวคิด ความต้ องการโครงสร้ างการจัดเก็บที่
มีประสิ ทธิภาพ
• เพือ่ นาข้ อมูลทีม่ ีคุณภาพเหล่ านั้นมาช่ วยในการตัดสิ นใจ
• เพือ่ ให้ ผู้บริหารสามารถเรียกใช้ ข้อมูลได้ อย่ างรวดเร็ว
ความหมายคลังข้ อมูล
คลังข้ อมูล คือ
ระบบจัดเก็บ รวบรวมข้อมูลที่มีอยูใ่ นระบบปฏิบตั ิการต่าง ๆ ขององค์กร
ขนาดกลางถึงขนาดใหญ่ที่มีอยูอ่ ย่างกระจัดกระจายเข้าไว้เป็ นศูนย์กลาง
 สามารถเก็บข้อมูลย้อนหลังได้หลาย ๆ ปี เพื่อช่วยในการสนับสนุนการ
ตัดสิ นใจ
 สามารถวิเคราะห์ได้ท้ งั แบบหลายมิติ วิเคราะห์ทางธุรกิจ (พยากรณ์)
วิเคราะห์แบบ “ถ้าเป็ นอย่างนี้ แล้วอะไรจะเกิดขึ้น” และวิเคราะห์แบบเหมือง
ข้อมูล
Client
Information Source
ETL process
โหลดและ
แปลงข้ อมูล
OLAP
Server
User
OLAP
Data Warehouse
ข้อมูลที่เกิดขึ้นรายวัน
Data Warehouse
Server
ข้อมูลที่ใช้ช่วยในการ
วิเคราะห์และการตัดสิ นใจ
Group
ขั้นตอนในการทาคลังข้ อมูล
เก็บข้อมูล
ตรวจสอบ
จัดเก็บ
วิเคราะห์
แสดงรายงาน
คุณสมบัตขิ องคลังข้ อมูล
1.
2.
3.
4.
ตามหัวข้ อเรื่ องที่ต้องการ (Subject Oriented)
หลอมรวมข้ อมูล (Integrated)
ความสัมพันธ์แกนเวลา (Time-variant)
คุณสมบัติไม่เปลี่ยนแปลงบ่อย ๆ (Non-volatile)
ความแตกต่ างระหว่ างฐานข้ อมูลปฏิบัตกิ ารและคลังข้ อมูล
การใช้ งาน
ลักษณะการจัดการ
ข้อมูล
โครงสร้างข้อมูล
เนื้อหาและช่วงเวลา
การปรับปรุ งข้อมูล
ฐานข้ อมูลปฏิบัติการ
คลังข้ อมูล
ตามโปรแกรมที่ตอ้ งการ
ตามหัวข้อที่ตอ้ งการ
ซับซ้อน แล้วแต่เครื่ องมือ
และการคานวณ แต่เป็ น
รู ปแบบที่ชดั เจน
ปั จจุบนั
อาจจะมีการปรับปรุ งย่อย
และเพิ่มข้อมูลจานวนมาก
ในแต่ละวัน และทาเป็ น
ประจา
มีโครงสร้างไม่แน่นอน ประมวลผล
แบบวิเคราะห์แต่ง่ายและเหมาะกับ
องค์กร
อดีตและปั จจุบนั
แล้วแต่สถานการณ์และความ
ต้องการ ไม่มีการปรับปรุ งข้อมูล
โดยตรง
ความแตกต่ างระหว่ างฐานข้ อมูลปฏิบัตกิ ารและคลังข้ อมูล
การใช้ งาน
ฐานข้ อมูลปฏิบัติการ
คลังข้ อมูล
การเคลื่อนไหวของข้อมูล ตลอดเวลา
เวลาในการทางาน
เร็ ว
คงที่จนกว่าจะปรับปรุ งใหม่
ช้ากว่า หรื อแล้วแต่ขนาดข้อมูล
ความแน่นอนในการใช้
ข้อมูล
แหล่งข้อมูล
ขนาดของข้อมูล
แน่นอน
ไม่แน่นอน
ภายในองค์กร
กิกะไบต์
ทั้งภายในและภายนอกองค์กร
กิกะไบต์ถึงเทราไบต์ (ใหญ่กว่า)
องค์ ประกอบภายในคลังข้ อมูล
1) ส่ วนของการใส่ ขอ้ มูล ได้แก่ การพัฒนาข้อมูล วางแผนในการดึง
ข้อมูล วิธีการจัดเก็บ
2) ส่ วนของการจัดเก็บข้อมูล ประกอบด้วย ส่ วนของการบันทึกสถิติของ
ข้อมูล รายละเอียดของข้อมูล(ชื่อแฟ้ ม โปรแกรมที่เขียน ที่มาของ
ข้อมูล)
3) ส่ วนที่ได้รับจากการใช้คลังข้อมูล เช่น การสอบถามข้อมูลและการ
เข้าถึงข้อมูล
การเตรียมข้ อมูลเข้ าสู่ คลังข้ อมูล
1. การเก็บข้อมูลประจาวัน เก็บอยูใ่ นรู ปแบบฐานข้อมูล เช่น
ข้อมูลด้านการเงิน การสัง่ ของ รายการสิ นค้าคงคลัง
2. การรวบรวมข้อมูล เพื่อปรับแต่งข้อมูลให้อยูใ่ นรู ปแบบเดียวกัน
อาจต้องใช้วธิ ีการ ดังนี้
1. การตรวจสอบความผิดปกติและแก้ไข
2. การแปลงรู ปแบบข้อมูล
การนาข้ อมูลเข้ าส่ ู คลังข้ อมูล
การนาเข้า
โดยผ่านโปรแกรม
ที่มีประสิ ทธิภาพ
Data Warehouse
การปรับปรุ งข้อมูล
ในคลังข้อมูล
มีการกาหนดว่าจะ
ปรับปรุ งเมื่อไหร่ อย่างไร
ตามระยะเวลาที่กาหนด
รู ปแบบการวิเคราะห์ ข้อมูลในคลังข้ อมูล
• ข้อมูลทางธุรกิจมีลกั ษณะเป็ นหลายมิติ เช่น ข้อมูลยอดขาย
มองในด้ านยอดขายต่ อเวลา
มองในด้ านยอดขายต่ อสิ นค้ า
ปี พ.ศ.
2551
2552
2553
ชนิดสิ นค้ า รวมเงิน
แป้ ง
800,000
สบู่
700,000
ยาสี ฟัน
750,000
สาขา
มองในด้ านสถานที่จาหน่ าย
แป้ง
200,000
350,000
250,000
สบู่
150,000
150,000
400,000
ยาสี ฟัน
250,000
150,000
350,000
แป้ง
สบู่
150,000
250,000
100,000
สุ ราษฎร์ธานี 350,000
250,000
150,000
หาดใหญ่
400,000
350,000
ชุมพร
250,000
ยาสี ฟัน
การวิเคราะห์ ข้อมูลหลายมิติ
ประกอบด้ วย
1. การเจาะลึก (Drill Down)
2. การรวมขึ ้น (Roll Up)
3. การเฉือนบาง (Slice)
4. การตัดบางส่วน (Dice)
5. การหมุน (Pivot or Rotate)
6. การเจาะข้ าม (Drill Across)
7. การเจาะทะลุ (Drill Through)
การเจาะลึก (Drill down)
 เป็ นการวิเคราะห์ขอ้ มูลโดยดูขอ้ มูลเป็ นลาดับชั้น ดูขอ้ มูลจากระดับบน
แล้วค่อย ๆ ซอยย่อยเจาะลึกลงไปในระดับล่าง
เช่น เมื่อดูสรุปยอดขาย หากสงสั ยว่ าทาไมยอดขายในภาค
นั้นมีปัญหา ก็ต้องเข้ าไปดูรายละเอียดเพิม่ เติม ในส่ วน
ของสิ นค้ า พนักงาน ข้ อมูลต่ าง ๆ ทีเ่ กีย่ วข้ อง
ดูยอดขายประจาปี แล้วเจาะลึกลงไปดูรายเดือน รายสั ปดาห์
การรวมขึน้ (Roll Up)
การรวมขึ้น ตรงกันข้ามกับการเจาะลึก
 เป็ นการดูข้อมูลจากส่ วนรายละเอียดแล้ วค่ อยดูสรุ ปรวม

การเฉือนบาง (Slice) และ
การตัดบางส่ วน (Dice)
เป็ นการมองข้อมูลจากหลายมุม เช่น การดูยอดขายสิ นค้าทั้งหมดต่อเดือน
แล้วเปลี่ยนมาดูยอดขายต่อจังหวัด
ยอดขายสิ นค้าประจาเดือนตุลาคม
ของบริ ษทั (รวมทุกสาขา)
ยอดขายสิ นค้าประจาเดือนตุลาคม
ของสาขาชุมพร
ชนิดสิ นค้ า
ชนิดสิ นค้ า
แป้ ง
สบู่
ยาสี ฟัน
จานวนชิ้น
25,000
20,000
35,000
รวมเงิน
500000
450,000
350,000
แป้ ง
สบู่
ยาสี ฟัน
จานวนชิ้น
1,000
2,000
3,000
รวมเงิน
50,000
75,000
85,000
การหมุน (Pivot or Rotate)
มองในมุมของเวลา (ปี พ.ศ.)
ปี พ.ศ.
แป้ง
สบู่
ยาสี ฟัน
2551
200,000 150,000 250,000
2552
2553
350,000 250,000 150,000
250,000 400,000 350,000
มองในมุมของชนิดสิ นค้ า
รายการสิ นค้ า 2551
แป้ ง
200,000
สบู่
150,000
2552
350,000
250,000
2553
250,000
400,000
ยาสี ฟัน
150,000
350,000
250,000
การเจาะข้ าม (Drill Across)
• เจาะข้อมูลลงในตารางข้อมูลจริ งมากกว่าหนึ่งตาราง
การเจาะทะลุ (Drill Through)
• เป็ นการเจาะข้อมูลลงไปในระดับฐานข้อมูล
ตลาดข้ อมูล (Data Mart)
• เป็ นข้อมูลในเรื่ องใดเรื่ องหนึ่ง
• มุ่งเน้นตามลักษณะเฉพาะตามหน้าที่งาน เช่น งานขาย งาน
การเงิน และการตลาด
• ตลาดข้อมูลสร้างขึ้นโดยแผนกในองค์กรนั้น ๆ
• โดยดึงข้อมูลเพียงบางส่ วนในคลังข้อมูล
• ต่างกับคลังข้อมูลที่มีขอ้ มูลหลากหลาย
• ตลาดข้อมูลมีขนาดเล็กและความซับซ้อนน้อยกว่าคลังข้อมูล
• บารุ งรักษาได้ง่ายกว่าคลังข้อมูล
คลังข้ อมูล และ ตลาดข้ อมูล
การใช้ งาน
คลังข้ อมูล
ตลาดข้ อมูล
ขอบเขต
หัวข้ อที่สนใจ
ทังองค์
้ กร
เฉพาะส่วนงานหรื อแผนก
หลากหลายกว่าตลาดข้ อมูล เฉพาะส่วนงานที่ต้องการ
แหล่งข้ อมูลต้ น
กาเนิด
ขนาดของระบบ
ระยะเวลาในการวาง
ระบบ
มาจากทังภายในภายนอก
้
หลากหลาย
ตังแต่
้ 100 GB-TB+
ใช้ เวลาหลายปี
แหล่งกาเนิดน้ อยกว่า
คลังข้ อมูล
น้ อยกว่า 100 GB
ระยะสัน้ แค่หลักเดือน