Lesson # 6 Response of IC when ESD zapped.

Download Report

Transcript Lesson # 6 Response of IC when ESD zapped.

Chapter 3
Data Management:
Data, Databases, and Warehousing
1
Learning Objectives (1)
ทำควำมเข้ำใจถึงควำมสำคัญของข้อมูล, แนวทำงกำรบริ หำร และlife cycle .
อธิ บำยถึงแหล่งต่ำง ๆ ของข้อมูลและกำรรวบรวมข้อมูล
อธิบำยถึงระบบกำรบริ หำรจัดกำรเอกสำร
อธิบำยถึงกำรทำงำนของคลังข้อมูล (data warehousing) และแนวทำงกำรใช้
ระบบสนับสนุน
 อธิ บำยถึงกำรค้นพบสำรสนเทศและองค์ควำมรู ้และเชำว์ปัญญำทำงธุรกิจ
(business intelligence)
 ทำควำมเข้ำใจกับอำนำจและผลประโยชน์ของ data mining.
 อธิบำยวิธีกำรนำเสนอข้อมูลและ geographical information systems, visual
simulations และ virtual reality ในเชิงเครื่ องมือต่ำง ๆ ที่ใช้สนับสนุนกำรทำงำน




Learning Objectives (2)
 กล่ำวถึงบทบำทของฐำนข้อมูลทำงกำรตลำดและตัวอย่ำง
 ทำควำมเข้ำใจแนวทำงกำรบริ หำรจัดกำรข้อมูลโดยใช้ Web
Finding Diamonds by Data Mining at Harrah’s
 Business Problem:
 Harrah’s Entertainment เป็ น casino chain มีท้ งั หมด 26 แห่งใน 13 มลรัฐของ
สหรัฐอเมริ กำ ยอดขำยปี 2002 ประมำณ 4B$ มีผลกำไร 235 M$ ปั ญหำทำงด้ำนธุรกิจ
ของเขำก็คือ ทำ อย่ำงไรที่จะชักชวนให้คนเข้ำมำที่บ่อนคำซิ โนมำกขึ้น(เพื่อใช้เงินใน
บ่อน)และกลับ มำอีกบ่อย ๆ
 โดยทัว่ ไป พนักงำนในคำซิ โนจะอำศัยควำมรู ้สึกส่ วนตัวในกำรวำงแผนเพื่อชักจูงลูกค้ำ
ทั้งหมดได้ เช่น ให้ loyalty card กับลูกค้ำ เพื่อให้ลกู ค้ำมีหอ้ งพักฟรี เพื่อให้ลกู ค้ำเข้ำมำ
บ่อยขึ้น ดูกำรแสดงฟรี และ อื่น ๆ อีกมำก เป็ นต้น กำรทำดังนี้ คู่แข่งอื่นๆ ก็ทำเช่นกัน
ทำ ให้ไม่มีขอ้ แตกต่ำงกับคู่แข่งทั้งหลำย
 IT Solution:
 Harrah ได้ใช้กลยุทธ์ที่อำศัย IT มำเป็ นตัวผลักดันกลยุทธ์ “กำรบริ หำรควำมสัมพันธ์
กับลูกค้ำ (Customer Relationship Management, CRM)” และอำศัยฐำนข้อมูลของ
ลูกค้ำในด้ำน กำรตลำดมำทำกำรทดสอบกำรโปรโมตต่ำง ๆ ซึ่ งทำให้บริ ษทั สำมำรถ
fine tune กลยุทธ์ทำงด้ำนกำรตลำดที่นำเสนอออกไป และกลยุทธ์ทำงด้ำนกำรให้
บริ กำรแก่ลกู ค้ำ เมื่อดูขอ้ มูลย้อนหลังพบว่ำ 82.7% ของรำยได้ท้ งั หมดมำจำกเครื่ อง
Slot machine ที่ต้ งั อยูใ่ น 26 สำขำ
 Harrah ได้แจก loyalty smart card ให้กบั ทุกคน แล้วติดเครื่ องอ่ำน(smart card reader)
ไว้ที่เครื่ อง Slot machine ทุก ๆ เครื่ องทั้ง 26 สำขำ เพื่อบันทึกกำรกิจกรรมของลูกค้ำ
นอกจำกนั้น เขำยังติดตั้งเครื่ องอ่ำนไว้ทุกๆ ที่ เช่น ในภัตรำคำร ร้ำนขำยของชำร่ วย
ฯลฯ เพื่อบันทึกกำรใช้จ่ำยของลูกค้ำทั้งหมด ข้อมูลเหล่ำนี้จะถูกเก็บลงคลังข้อมูล
ขนำด 300GB เพื่อนำมำวิเครำะห์ต่อไป
 แต่ละสำขำได้ทำกำรวิเครำะห์ขอ้ มูลหลำยล้ำนรำยกำรที่ได้ โดยแยกออกเป็ นส่ วน ๆ
เช่น อุปนิสัยของลูกค้ำและควำมชอบต่ำง ๆ เป็ นต้น ข้อมูลเหล่ำนี้จะถูกส่ งไปยังคลัง
ข้อมูลรวมขององค์กร (enterprise data warehouse) ซึ่ งมีรำยละเอียดของลูกค้ำเก็บอยู่
เช่น ชื่อ ที่อยู่ อำยุ เพศ รวมทั้งเกมที่ชอบเล่น ลักษณะกำรใช้จ่ำยเงิน และ ควำมชื่น
ชอบในด้ำนต่ำง ๆ เป็ นต้น ข้อมูลเหล่ำนี้จะถูก นำมำวิเครำะห์ เพื่อแยกเอำสำรสนเทศ
ออกมำ เช่น Harrah พบว่ำ ลูกค้ำชั้นดีของเขำจะอยูใ่ นวัยกลำงคน และ ผูส้ ู งวัยที่จดั
กำรเรื่ องเวลำและรำยได้ได้ดว้ ยตนเอง คนกลุ่มนี้จะชอบเล่น Slot machine นอกจำก
นั้น คนเหล่ำนี้ยงั เป็ นกลุ่มที่ไม่ชอบพักในโรงแรมของสถำน คำซิ โน แต่จะแวะเข้ำมำ
เพรำะเป็ นทำงผ่ำนเมื่อกลับจำกกำรทำงำน และเป็ นคืนของวันหยุดสุ ดสัปดำห์ คน
กลุ่มนี้จะเลือกเอำชิพ 60$ เพื่อเล่นเกมมำกว่ำที่จะเลือกห้องพักฟรี พร้อมสเต็ก 2 มื้อ
และชิพ 30$ แสดงว่ำ คนกลุ่มนี้เข้ำมำเพื่อหำควำมสนุกสนำนกำรเล่นเกม มำกกว่ำมำ
ท่องเที่ยว
 จำกข้อมูลเหล่ำนี้ ทำให้สำมำรถทำกำรวำงกลยุทธ์ทำงกำรตลำดได้ดีข้ ึน เขำมองไปที่
กำรใช้ จ่ำยของผูท้ ี่มำพักเป็ นระยะเวลำนำนก่อน จำกนั้นก็ดูลึกลงไปในข้อมูลถึง ควำม
ชอบ ควำมสนใจ ของลูกค้ำ แล้วจัดวำงสิ่ งต่ำง ๆ (เกม) ให้ตรงกับลูกค้ำต้องกำร เพื่อ
ดึง ดูดให้ลกู ค้ำใช้จ่ำยมำกขึ้น
 โดยกำรใช้ Data mining technique (กำรทำเหมืองข้อมูล) เขำยังพบอีกว่ำ ลูกค้ำต่ำง ๆ
มักชอบเครื่ องจักรเครื่ องใดเครื่ องหนึ่งเป็ นพิเศษ ทำให้เขำสำมำรถจัดวำงเครื่ อง Slot
machine ได้อย่ำงเหมำะสม นอกจำกนั้น Data mining ยังช่วยให้บริ ษทั สำมำรถสร้ำง
ควำมพึงพอใจให้ลกู ค้ำได้มำกขึ้น (ซึ่ งลูกค้ำก็จะใช้จ่ำยมำกขึ้นด้วย) โดยบริ ษทั ได้มี
แผนกำรให้โบนัสกับพนักงำนที่ได้คะแนนควำมพึงพอใจจำกลูกค้ำสู งถึงค่ำที่กำหนด
 The results:
 จำกประสบกำรณ์ของ Harrah แสดงให้เห็นว่ำ ยิง่ สร้ำงประสบกำรณ์ที่ดีให้กบั ลูกค้ำ
มำกขึ้นเพียงใด มันก็จะเป็ นตัวดึงดูดใจให้ลกู ค้ำกลับมำใช้บริ กำรอีก นัน่ หมำยถึงบริ ษทั
ก็จะได้เงินจำกลูกค้ำมำกขึ้น
 สิ่ งที่ควรศึกษำเพิม่ เติมคือ กำรบริ หำรควำมสัมพันธ์กบั ลูกค้ำ กำรทำคลังข้อมูล และ
กำรทำเหมืองข้อมูล
3.1) กำรบริ หำรจัดกำรกับข้อมูล (Data Management): A Critical Success
Factors
 Data Management Concerns:
 กำรประยุกต์ใช้ IT ในด้ำนต่ำง ๆ จะไม่สำเร็ จได้เลย ถ้ำปรำศจำกข้อมูล นัน่ คือข้อมูล
จะต้องมีคุณภำพสู ง (หมำยถึง ข้อมูลต้องมีควำมถูกต้อง สมบูรณ์ เหมำะสมกับเวลำ ไม่
แปลเปลี่ยนไปมำ เข้ำถึงได้ ตรงประเด็น และรัดกุม) พื้นฐำนของกำรบริ หำรข้อมูล
ประกอบไปด้วย 4 ส่ วน คือ:
 1) Data profiling – กำรทำควำมเข้ำใจกับข้อมูล
 2) Data quality management- กำรปรับปรุ งคุรภำพของข้อมูล
 3) Data integration- รวมข้อมูลจำกหลำยแหล่วที่มีลกั ษณะคล้ำยกันเข้ำด้วยกัน
 4) Data augmentation-กำรปรับปรุ งคุณค่ำของข้อมูล
 Data Management:
 ควำมยุง่ ยำกในกำรจัดกำรกับข้อมูล:
 ขนำดของข้อมูลจะเพิ่มขึ้นในเชิง exponential เมื่อเทียบกับเวลำ
 ข้อมูลจะกระจำยอยูท่ วั่ ทั้งองค์กร มันถูกรวบรวมเอำไว้หลำยแบบ โดยใช้หลำยๆ
วิธีกำรในกำรรวบรวมข้อมูล และใช้เครื่ องมือที่แตกต่ำงกันออกไป
 กำรเพิ่มขึ้นของข้อมูลจำกภำยนอกองค์กร จะขึ้นอยูก่ บั แนวทำงที่ได้ตดั สิ นใจของ
องค์กรนั้น ๆ
 ควำมปลอดภัยของข้อมูล คุณภำพ และ ควำมสมบูรณ์ (integrity) เป็ นตัววิกฤต
และเกิดอันตรำยได้ง่ำย
 กำรเลือกเครื่ องมือที่นำมำใช้บริ หำรข้อมูลจะเป็ นปั ญหำใหญ่ เพรำะมีให้เลือก
จำนวนมำก
 ข้อมูลที่ถกู สร้ำงขึ้นและถูกนำมำใช้ในเชิง offline โดยไม่มีกำรตรวจสอบกำร
ควบคุมคุณภำพ จะทำให้เกิดคำถำมเกี่ยวกับควำมถุกต้องของข้อมูล
 ข้อมูลที่อยูท่ วั่ องค์กรมักมีกำรเก็บไว้ซ้ ำซ้อนและล้ำสมัย ทำให้เกิดปั ญหำ
ตำมมำในกำรดูแลรักษำ
แฟกเตอร์ ที่วกิ ฤตต่อควำมสำเร็ จ (Critical Success Factors; CSF)
 กำรดำเนินงำนในองค์กรหนึ่ ง ๆ จะมีแฟกเตอร์ มำกมำยหลำยตัวที่เข้ำมำเกีย่ วข้อง
และต้องควบคุมให้เป็ นไปตำมควำมต้องกำร
 แต่จะมีแฟกเตอร์ ไม่กี่ตวั ที่ตอ้ งควบคุมให้เป็ นไปอย่ำงถูกต้องตำมต้องกำร เพื่อมัน่
ใจได้วำ่ องค์กรจะดำเนินงำนต่อไปได้และประสบควำมสำเร็ จ เรี ยกแฟกเตอร์ กลุ่ม
นี้วำ่ แฟกเตอร์ ที่วกิ ฤตต่อควำมสำเร็ จ (Critical Success Factors; CSF)
วงจรของข้อมูล (Data Life Cycle) (1)
 ธุรกิจวิง่ อยูบ่ นข้อมูล หรื อ ก็คือกำรเปลี่ยนจำกข้อมูลเป็ นสำรสนเทศและองค์ควำมรู้
ซึ่ งผูบ้ ริ หำรสำมำรถนำไปใช้แก้ปัญหำเชิงธุรกิจหรื อสร้ำงโอกำสใหม่ ๆ ให้กบั ธุรกิจ
 จำกกรณี ศึกษำของ Harrah จะเห็นได้วำ่ องค์ควำมรู ้คือแรงขับเคลื่อนของคำตอบต่ำง
ๆ และจะเห็นว่ำ กำรบริ หำรข้อมูลนั้นเป็ นเรื่ องยุง่ ยำก
 กำรเก็บและกำรนำเสนอข้อมูลเป็ นเรื่ องง่ำย แต่กำรดึงเอำองค์ควำมรู ้ออกมำจำก
ข้อมูลที่เก็บสะสมเอำไว้ออกมำใช้งำน เป็ นเรื่ องที่ไม่ง่ำยเลย
 รู ปหน้ำถัดไปแสดงถึง กระบวนกำรข้ำงต้น ข้อมูลต่ำง ๆ จะถูกเก็บไว้ในฐำนข้อมูล
ต่ำงๆ ข้อมูลข้ำงต้นจะถูกจัดกำรให้เหมำะกับรู ปแบบที่ตอ้ งเก็บไว้ในคลังข้อมูล
(data warehouse) หรื อ ตลำดข้อมูล (data mart) ผูใ้ ช้สำมำรถเข้ำถึงข้อมูลที่ตอ้ งกำร
ในคลัง ข้อมูล หรื อ ตลำดข้อมูล เพื่อนำมำวิเครำะห์
วงจรของข้อมูล (Data Life Cycle) (2)
 กำรวิเครำะห์จะทำโดย:
 ใช้เครื่ องมือในกำรวิเครำะห์ขอ้ มูล (data analysis) และ mining tool ต่ำง ๆ เพื่อ
ค้นหำรู ปแบบต่ำงๆ (patterns) ที่ตอ้ งกำร
 ใช้ระบบอัจฉริ ยะ (Intelligent system)ต่ำงๆ เพื่อสนับสนุนกำรแปลควำมหมำย
ของข้อมูล(data interpretations)
 ผลที่ได้จำกกำรกระทำข้ำงต้น จะได้ขอ้ มูลที่ใช้ในกำรสนับสนุนกำรตัดสิ นใจ และ
องค์ควำมรู ้ออกมำ ซึ่ งมันจะถูกส่ งไปยังผูใ้ ช้โดยนำเสนอผ่ำนทำง visualization tools
 นอกจำกนั้นองค์ควำมรู ้ที่ได้มำจะถูกเก็บไว้ฐำนควำมรู ้ขององค์กรและนำมำใช้ร่วม
กับเครื่ องมือสนับสนุนต่ำง ๆ ทั้งนี้เพื่อแก้ปัญหำที่เกิดขึ้นกับองค์กร
วงจรของข้อมูล (Data Life Cycle)
กำลังจะกล่ำวถึงเรื่ องนี้
หัวข้อที่จะกล่ำวถึงต่อไป จะอ้ำงอิงตำม Flow ของรู ปนี้
แหล่งข้อมูลต่ำง ๆ (Data Sources)
 แหล่งต่ำงๆของข้อมูลภำยใน (Internal Data Sources): เป็ นข้อมูลที่เกี่ยวกับผูค้ น ผลิต
ภัณฑ์ กำรให้บริ กำร และ กระบวนกำรต่ำงๆ จะเป็ นข้อมูลที่อยูภ่ ำยในองค์กร ผูใ้ ช้
สำมำรถเข้ำใช้ผำ่ นทำง Intranet
 ข้อมูลส่ วนบุคคล (Personal Data): ระบบสำรสนเทศของผูใ้ ช้ หรื อ เอกสำรของ
พนักงำน ในองค์กรที่เก็บเอำไว้ เช่น ประวัติพนักงำน ประสบกำรณ์กำรทำงำน เป็ นต้น
อำจรวมถึง ควำมคิดเห็น ประสบกำรณ์ต่ำง ๆ ด้วย ข้อมูลเหล่ำนี้อำจเก็บอยูภ่ ำยนอก
เครื่ องคอมพิว เตอร์ ของเขำก็ได้ เช่นเก็บไว้ในฐำนข้อมูลกลำงขององค์กร
 แหล่งข้อมูลต่ำงๆจำกภำยนอก(External Data Sources): ข้อมูลต่ำงๆ ที่ได้มำจำกภำย
นอกองค์กร เช่น จำกฐำนข้อมูลทำง กำรค้ำที่ตอ้ งกำรตรวจสอบ หรื อ เผยแพร่ จำก
หน่วยงำนรัฐบำล เป็ นต้น
 ข้อมูลที่ได้มำจะต้องทำกำรตรวจสอบว่ำ มันมีประโยชน์ใช้งำนได้ตรงตำมควำมต้องกำร
ไม่มีประโยชน์ใด ๆ ที่จะเก็บข้อมูลที่ไม่มีประโยชน์เอำไว้
วิธีกำรต่ำง ๆ ในกำรเก็บรวบรวมข้อมูลดิบ
 งำนในกำรเก็บรวบรวมข้อมูลจะมีควำมซับซ้อนพอควร เพื่อหลบเลี่ยงปญหำเรื่ อง
คุณภำพของข้อมูล ท่ำนจะต้องตรวจสอบควำมถูกต้องของข้อมูลและขจัดส่วนที่
ไม่ตอ้ งกำรออกไป
 สถำนที่ที่ตอ้ งเก็บข้อมูลได้แก่
 ใน field
 จำกแต่ละคน (แหล่งข้อมูล)
 ผ่ำนทำงกำรเก็บด้วยมือในรู ปแบบต่ำง ๆ เช่น time studies, Surveys, Observations เป็ น
ต้น
 ใช้เครื่ องมือและตัวตรวจจับต่ำง ๆ
 Transaction processing systems (TPS)
 ผ่ำนทำงกำรส่ งผ่ำข้อมูลแบบอิเลคทรอนิคส์ (electronic transfer)
 จำก web site (Clickstream)
Methods for managing data collection
 ทำงหนึ่งที่จะปรับปรุ งกำรรวบรวมข้อมูลจำกแหล่งภำยนอกหลำย ๆ แหล่ง คือ กำร
ใช้ data flow manager (DFM) ซึ่ งเป็ นกำรนำเอำสำรสนเทศมำจำกแหล่งภำยนอกไป
วำงไว้ในที่ที่ตอ้ งกำรใช้มนั ในรู ปแบบที่สำมำรถใช้ประโยชน์ได้ทนั ที
 DFM ประกอบด้วย
 ระบบกำรสนับสนุนในกำรตัดสิ นใจ (decision support system)
 กำรประมวลผลข้อมูลจำกส่ วนกลำง (central data request processor)
 กำรรวบรวมข้อมูลเข้ำด้วยกัน
 กำรเชื่อมต่อกับแหล่งข้อมูลภำยนอก
 กำรประมวลผลจำกแหล่งข้อมูลภำยนอก
คุณภำพและควำมสมบูรณ์ของข้อมูล (Data Quality and Integrity)
 คุณภำพของข้อมูล (Data quality (DQ)) คือ ส่ วนที่สำคัญมำกที่สุดส่ วนหนึ่ ง เพรำะว่ำ
คุณภำพหมำยถึง กำรถูกใช้ให้เป็ นประโยชน์ของข้อมูล ทั้งนี้รวมไปถึง คุณภำพในกำร
ตัดสิ นใจต่ำง ๆ โดยใช้ขอ้ มูลข้ำงต้น
 ควำมสมบูรณ์ของข้อมูล (Data integrity) หมำยถึง ข้อมูลต้องมีควำมถูกต้อง เข้ำถึงได้
ง่ำยและทันสมัย
1) Intrinsic DQ: หมำยถึง ควำมถูกต้อง ตรงตำมวัตถุประสงค์ เชื่อถือได้ เปิ ดเผยเป็ นจริ ง
2) DQในแง่กำรเข้ำถึง: ควำมสำมำรถในกำรเข้ำถึงและควำมปลอดภัยในกำรเข้ำถึง
3) DQในแง่คำอธิบำย: ตรงประเด็น มีมูลค่ำเพิม่ ถูกเวลำ มีควำมสมบูรณ์ มีปริ มำณเพียง พอ
4) DQในแง่กำรนำเสนอ: แยกแยะได้ง่ำย ง่ำยต่อกำรทำควำมเข้ำใจ นำเสนออย่ำงรัดกุม ไม่
เปลี่ยนแปลงเมื่อนำเสนอ
 อ่ำนเพิ่มเติมในตำรำงที่ 10.1 Data Problems and Possible Solutions




Data Privacy, Cost and Ethics
 กำรรวบรวมข้อมูลของพนักงำน ลูกค้ำ หรื อ ประชำชนอื่น ๆ ทำให้เกิดเรื่ องต่ำง ๆ
ที่เกี่ยวข้องกับกำรปกป้ องควำมเป็ นส่ วนตัว ดังนั้น ข้อมูลต้องสำมำรถเข้ำถึงได้
เฉพำะผูท้ ี่มีอำนำจเท่ำนั้น (authorized people)
 กำรปกป้ องข้อมูลข้ำงต้นทำให้เกิดต้นทุน (cost) ในกำรรวบรวม กำรจัดเก็บ และ
กำรนำมำใช้งำน
 อ่ำนเพิ่มเติมใน A Close Look 3.1 “National Security Depends on Intelligence
and Data Mining” page 86
กำรจัดกำรกับงำนเอกสำร (Document Management) (1)
 ข้อมูลที่อยูใ่ นรู ปเอกสำรจะมีมำกมำยที่ตอ้ งเก็บเอำไว้ ทำให้เปลืองเนื้อที่และบริ หำร
จัดกำรลำบำก ถ้ำเรำสำมำรถเปลี่ยนให้อยูใ่ นรู ปอิเลคทรอนิคส์(electronic document)
แล้ว จะสำมำรถทำกำรควบคุมโดยใช้คอมพิวเตอร์ ได้ นัน่ หมำยควำมว่ำ เรำสำมำรถ
ทำให้เป็ นระบบอัตโนมัติได้ตลอดช่วงอำยุกำรใช้งำนของ electronic documents,
page images, spreadsheets, word processing documents, และ complex documents
แบบอื่น ๆ ภำยในองค์กร
 เครื่ องมือหลัก ๆ ของกำรจัดกำรกับงำนเอกสำรคือ ซอฟท์แวร์ ที่จดั กำรกับกำรไหล
ของงำน (workflow software), เครื่ องมือต่ำง ๆ สำหรับกำรอนุมตั ิ (authoring tools)
สแกนเนอร์ (scanner) ระบบต่ำง ๆ เกี่ยวกับรู ปภำพ (imaging systems) และ
ฐำนข้อมูล
กำรจัดกำรกับงำนเอกสำร (2)
 ระบบบริ หำรจัดกำรเอกสำร (Document Management Systems, DMSs): ระบบ
คอมพิวเตอร์ ต่ำง ๆ ที่สำมำรถบ่งชี้ เกี่ยวกับ กำรจัดเก็บ กำรนำกลับคืน กำรติดตำม และ
สำรสนเทศในปัจจุบนั ในรู ปแบบ อิเลคทรอนิคส์เพื่อให้ผทู้ ี่ตอ้ งตัดสิ นใจนำไปใช้งำน
 ระบบบริ หำรจัดกำรเอกสำรโดยอำศัยเวบ (Web-Based DMS): คือกำรใช้ Web เพื่อช่วย
ทำงด้ำนกำรเข้ำถึงข้อมูล หรื อ เอกสำรต่ำงๆ
 อ่ำนเพิ่มเติม A Close Look3.2 “How Companies use document management
systems”, page 416
3.2) File Management
 ระบบคอมพิวเตอร์ จดั ข้อมูลเป็ นลำดับขั้น จำกบิต ไบต์ ฟี ลด์ เรกคอร์ด ไฟล์ และ
ฐำนข้อมูล
 อีกทำงหนึ่งในกำรทำควำมเข้ำใจเกี่ยวกับ database component โดยถือว่ำ เรกคอร์ด
หนึ่ง ๆ รู ปแบบทำงกำยภำพที่ใช้อธิบำยถึง entity หนึ่ง ๆ
 เอนทิต(ี entity) หมำยถึง สิ่ งต่ำงๆ ที่เรำสนใจต้องกำรเก็บข้อมูลเกี่ยวข้องด้วย ซึ่ ง entity
อำจเป็ นรู ปธรรมหรื อนำมธรรมก็ได้ ดังนั้น entity หนึ่ง ๆ อำจเป็ นคน สถำนที่ สิ่ งของ
หรื อ เหตุกำรณ์หนึ่ ง ๆ ก็ได้ คุณลัษณะเฉพำะที่ใช้อธิ บำย entity หนึ่ง ๆ เรี ยกว่ำ
attribute (ซึ่ งสอดคล้องกับ field หรื อ record หนึ่ง ๆ)
 แอตทริบิวต์ (attribute) หมำยถึง ข้อมูลที่แสดงคุณลักษณะหรื อคุณสมบัติต่ำงๆ ของ
entity หนึ่งๆ เช่น entity นักศึกษำ ประกอบด้วย attribute รหัสนักศึกษำ, ชื่อ, เพศ และ
รหัสคณะ เป็ นต้น
 ทุก ๆ เรกคอร์ ดในไฟล์หนึ่ง ๆ ควรมีอย่ำงน้อย 1 ฟี ลด์ที่ใช้เป็ นตัวบ่งชี้ที่ไม่เหมือน
ใคร (uniquely identify) ซึ่ งใช้ระบุถึงเรกคอร์ ดนั้น ๆ เมื่อเป็ นเช่นนี้ เรกคอร์ดข้ำงต้น
จึงสำมำรถ นำกลับมำ (retrieve) ปรับให้ทนั สมัย (update) หรื อ จัดเรี ยงได้ (sort)
ฟี ลด์ที่ใช้เป็ นตัวบ่งชี้น้ ี เรี ยกว่ำ primary key เช่น ใช้รหัสประจำตัวนักศึกษำเป็ น
primary key เป็ นต้น นอกจำกนั้น ยังอำจใช้ secondary key เพื่อช่วยกำหนดเรกคอร์ด
ให้จำเพำะเจำะจงมำกขึ้น เช่น ชื่อนักศึกษำ เป็ นต้น เมื่อเปรี ยบเทียบระหว่ำง primary
กับ secondary key แล้ว ควำมแม่นยำในกำรระบุเรกคอร์ ดของ primary key จะดีกว่ำ
 Foreign keys ใช้เป็ น key แสดงควำมสัมพันธ์ระหว่ำงตำรำง (Table) สองตำรำง
 Accessing Records from Computer files
 Sequential file organization แบบนี้ data record จะถูกเรี ยกกลับในรู ปแบบเดียวกับ
กำรจัดเรี ยงทำงกำยภำพที่มนั เก็บไว้ (กำรทำงำนเหมือนกำรบันทึกเทป จะต้องอ่ำนหำ
จำกต้นม้วนไปยังท้ำยม้วน)
 Direct or Random file organization แบบนี้ผใู ้ ช้สำมำรถเรี ยกข้อมูลกลับมำตำมลำดับ
ใด ๆ ก็ได้ โดยไม่ตอ้ งสนใจกำรกำรจัดเรี ยงทำงกำยภำพในสื่ อ (กำรทำงำนเหมือนกำร
อ่ำนแผ่น CD)
 Indexed sequential access method (ISAM) จะใช้กำรบ่งชี้ของ key field เพื่อระบุ
ตำแหน่งของแต่ละเรกคอร์ ด ให้ดูจำกรู ปใน slide ถัดไป มีกำรชี้ไปยัง file ที่แสดง key
field ของแต่ละเรกคอร์ ดว่ำมีกำรเก็บไว้ทำงกำยภำพที่ใด
Indexed sequential access method
Problems arising from the file environment
 1) Data redundancy ไฟล์แอพพลิเคชัน และ ข้อมูล อำจถูกสร้ำงมำจำกโปรแกรมเมอร์
หลำยคนเป็ นเวลำนำนแล้ว ดังนั้น ข้อมูลเดียวกันอำจถูกทำซ้ ำ (duplicate) เป็ นหลำย ๆ
ไฟล์ ทำให้เกิดควำมสิ้ นเปลืองในหลำย ๆ ด้ำน
 2) Data inconsistency โดยผลของข้อ 1 จะทำให้เกิด ข้อ 2 คือ ข้อมูลที่มีอยูน่ ้ นั แตกต่ำง
กันออกไป ทั้งนี้เนื่องจำกคนๆหนึ่ งอำจแก้แค่ไฟล์เดียว ทำให้ไฟล์อื่น ๆ ที่มีกำร
duplicate ออกไป ไม่ถกู แก้
 3) Data isolation โดยโครงสร้ำงของไฟล์ที่สร้ำงขึ้นในที่หนึ่ งอำจทำให้แอพพลิเคชันอื่น
ๆ เข้ำถึงข้อมูลนั้น ๆ ได้ยำก เพรำะโครงสร้ำงของไฟล์แตกต่ำงกัน
 4) Data integrity จะเป็ นเรื่ องยำกในกำรกำหนดข้อจำกัดในด้ำน data integrity ได้ตลอด
ทัว่ ทั้ง (across) multiple files
3.3 Database and Database Management Systems
 ผมจะข้ำมเรื่ องนี้ไป เพรำะอย่ำงไรท่ำนก็ตอ้ งเรี ยนเรื่ อง Database ที่ละเอียดกว่ำนี้
อยูแ่ ล้ว
3.4 Creating Database
 ผมจะข้ำมเรื่ องนี้ไป เพรำะอย่ำงไรท่ำนก็ตอ้ งเรี ยนเรื่ อง Database ที่ละเอียดกว่ำนี้
อยูแ่ ล้ว
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Data Warehouse
6
3.5 คลังข้อมูล (Data Warehousing)
 Transactional vs. Analytical Data Processing (1)
 กำรประมวลผลเกี่ยวกับกำรทำธุรกรรม (Transactional processing) ถูกนำมำใช้
ในระบบ ปฏิบตั ิงำนต่ำง ๆ (operational systems) (TPS) ซึ่ งทำให้องค์กรมี
ควำมสำมำรถที่จะดำเนินกำรทำธุรกรรมต่ำง ๆ รวมทั้งกำรทำรำยงำนที่เกี่ยวข้อง
ในธุรกิจนั้น ๆ ได้ ข้อมูลต่ำง ๆ จะแบ่งออกเป็ นกลุ่มหลัก ๆ มีโครงสร้ำงเป็ นแบบ
ตำมลำดับขั้น (hierarchical structure)และถูกดำเนินกำรผ่ำนศูนย์กลำง
 งำนหลักของ TPS จะถูกนำมำใช้ได้ดีกบั งำนประจำซึ่ งมีขอ้ มูลที่ซ้ ำๆ มันจะทำได้
อย่ำงรวดเร็ วและมีประสิ ทธิ ผล
Transactional vs. Analytical Data Processing (2)
 ส่ วนดำเนินงำนสนับสนุนให้กบั transaction processing เรี ยกว่ำ กำรประมวลผลใน
เชิงวิเครำะห์ (analytical processing) เพื่อทำกำรวิเครำะห์ขอ้ มูลที่รวบรวมเอำไว้
แล้ว
 Analytical processing บำงทีเรี ยกเป็ น business intelligence ซึ่ งรวมถึง กำรทำ
เหมืองข้อมูล (data mining), ระบบสนับสนุนในกำรตัดสิ นใจ (decision support
systems, DSS), querying และ กำรวิเครำะห์อื่น ๆ เอำไว้ดว้ ยกัน
 ผลที่ได้จำกกำรวิเครำะห์ขำ้ งต้น จะเป็ นสำรสนเทศเชิงกลยุทธ์ป้อนให้กบั ผูท้ ี่ทำหน้ำ
ที่ในกำรตัดสิ นใจ อันทำให้ผลิตผลและกำรตัดสิ นใจทำได้ดีข้ ึน ส่งผลให้มีควำมได้
เปรี ยบในกำรเปรี ยบในกำรแข่งขันมำกขึ้น
คลังข้อมูลคือ……
 คลังข้อมูลคือ ทีเ่ ก็บข้อมูลในอดีตในเชิง subject-oriented ที่ถกู จัดกลุ่มเพื่อให้
สำมำรถ เข้ำถึงในรู ปที่ง่ำยต่อกำรนำไปใช้ในกำรประมวลผลเชิงวิเครำะห์ (เช่น data
mining, decision support, querying, และ other applications)
 ประโยชน์ของคลังข้อมูล (ในเชิงปรับปรุ ง Analytical Process) คือ:
 นำเสนอข้อมูลทำงธุรกิจไปให้ผใู ้ ช้ปลำยทำง (end user)
 ควำมสำมำรถในกำรเข้ำใช้ขอ้ มูลได้อย่ำงรวดเร็ ว เพรำะข้อมูลทั้งหมดวำงอยูท่ ี่เดียว
กัน
 ควำมสำมำรถในกำรเข้ำใช้ขอ้ มูลของผุใ้ ช้ทำได้อย่ำงรวดเร็ วและบ่อย ๆ ผ่ำนทำง
Web browsers.
9
The Data Warehouse & Data Management
Organization
Data
คุณลักษณะของคลังข้อมูล (1)
 1) Organization ข้อมูลถูกจัดแบ่งเป็ นหัวข้อและมีสำรสนเทศที่สำมำรถนำมำใช้
สนับสนุนในกำรตัดสิ นใจเท่ำนั้น
 2) Consistency ข้อมูลใน different operational databases อำจถูกรวบรวม (code)
แตกต่ำงกัน แต่สำหรับใน data warehouse แล้ว มันจะต้องถูกรวบรวมใน
ลักษณะ หรื อ ในรู ปแบบเดียวกัน ตลอดเวลำ
 3) Time variant ข้อมูลจะถูกเก็บรวมไว้หลำย ๆ ปี ดังนั้นมันจึงสำมำรถนำมำใช้ใน
กำรทำนำยแนวโน้ม กำรพยำกรณ์ และ กำรเปรี ยบเทียบต่ำง ๆ ตลอดระยะเวลำ ที่
จัดเก็บ
 4) Non-volatile ข้อมูลจะต้องไม่ถกู update (ไม่ทำกำรเปลี่ยนแปลงแก้ไข)
หลังจำก เก็บเข้ำไปใน warehouse แล้ว
10
คุณลักษณะของคลังข้อมูล (2)
 5) Relational ในทำงปฏิบตั ิแล้ว data warehouse จะใช้โครงสร้ำงแบบ Relational
Structure
 6) Client/server ใช้สถำปัตยกรรมแบบ Client/server
 7) Web-based ข้อมูลของ data warehouse ในปั จจุบนั ้ ี จะถูกออกแบบให้มี efficient
computing environment เพื่อใช้ใน web-based application ต่ำง ๆ
 8) Integration ข้อมูลมำจำกหลำยแหล่งต้องรวมเข้ำด้วยกันได้
 9) Real Time ควรทำให้เป็ นแบบ Real Time
 อ่ำนเพิม่ เติม
 “Table 3.3 Summary of Strategic Using of Data Warehousing”, page 104
 “Table 3.4 Reasons Data Warehouse Fail”, page 105
Building a Data Warehouse
 Cost: ต้นทุนและกำรดูแลรักษำ data warehouse สู งมำก เกิดควำมยุง่ ยำกและมีตน้ ทุนใน
กำร Convert data จำกระบบเดิม และ อำจเกิดกำรเลื่อมเวลำในกำร share ข้อมูล ดังนั้น
พึงระมัดระวังในกำรจะลงมือทำ data warehouse
 Architecture and Tools: สถำปัตยกรรมของ data warehouse มีหลำยแบบ กำรเลือกใช้
งำนควรพิจำรณำให้เหมำะสมกับสิ่ งที่องค์กรต้องกำร
 ควำมเหมำะสม (Suitability): กำรจะทำ data warehouse ควรพิจำรณำว่ำ







มีขอ้ มูลจำนวนมำกที่ถูก access จำกผูใ้ ช้
ข้อมูลที่ใช้งำนถูกจัดเก็บอยูใ่ นระบบที่แตกต่ำงกัน
มีกำรบริ หำรจัดกำรแบบ information-based
มีฐำนลูกค้ำขนำดใหญ่และหลำกหลำย
ข้อมูลเดียวกันที่ใช้ในระบบที่แตกต่ำงกัน
ข้อมูลถูกเก็บในเชิง Highly Technical Format ทำให้ยงุ่ ยำกในกำรคลี่ออกมำใช้งำน
มีประโยชน์ต่อผูใ้ ช้มำกขึ้นในเชิงกำรคำนวณ
Building a Data Warehouse
11
Web-based Data Management Systems – content and information
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Metadata
6
Metadata คืออะไร (มองอย่ำงง่ำย ๆ)
 Metadata จะให้คำอธิบำย(context) กับ “user” ในด้ำน “วัตถุประสงค์(object)”
เพื่อทำให้เกิดกำรกระทำที่มีประสิ ทธิ ภำพมำกขึ้น เป็ นรู ปแบบทีช่ ดั เจนมำกขึ้น
 Classic example: กำรจัดทำเอกสำรข้อมูล (data documentation)
 User – นักวิเครำะห์ (analyst)
 Object – ฐำนข้อมูลจำกกำรสำรวจ (survey database)
 Metadata – variable definitions, code lists, …
 คำอธิ บำยเพื่อเสริ มให้เกิดกำรดำเนิ นกำรต่ำง ๆ – information to obtain
appropriate summary statistics for a given objective
Data Collection (DC) Examples
User
Object
Metadata
Interviewer
Question
Definition of a term
Data quality
evaluator
CAI program
Data flagged as
erroneous
Data record
Edit rule metadata, notes from field
Mediator in
computing
infrastructure
Field computing
environment
Visualization capabilities, processing
capacity, geospatial data needs
Format to read data
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Data Mart
6
ตลำดข้อมูล (Data Mart) (1)
 ตลำดข้อมูล (Data Mart): คือ คลังข้อมูลที่มีขนำดเล็กถูกออกแบบมำเพื่อใช้ใน
หน่วย ธุรกิจเชิงกลยุทธ์ (strategic business unit, SBU) หรื อในแผนกหนึ่ง ๆ
 ข้อดีของตลำดข้อมูลประกอบด้วย:
 ต้นทุนต่ำ (รำคำต่ำกว่ำ 100,000$ ในขณะที่คลังข้อมูลจะประมำณ 1M$ หรื อ มำก
กว่ำ)
 เมื่อนำมำติดตั้งใช้งำนจะใช้เวลำน้อยกว่ำมำก (มักจะน้อยกว่ำ 90 วัน) เป็ นแบบ local
แทนที่จะเป็ นแบบควบคุมจำกศูนย์กลำง (central control) (เมื่อเปรี ยบเทียบในเชิง
ควำมสำมำรถกำรใช้งำนของกลุ่ม)
 ตอบสนองได้เร็ ว ง่ำยต่อกำรทำควำมเข้ำใจ และเรี ยนรู ้ได้ง่ำยกว่ำคลังข้อมูลที่ใช้ทวั่
ทั้งองค์กร (enterprise wide data warehouse )
13
ตลำดข้อมูล (2)
 Data mart มีสองประเภทใหญ่ ๆ คือ:
 Replicated (dependent) data marts คือกลุ่มย่อยขนำดเล็ก(small subset)หลำย ๆ
กลุ่มของคลังข้อมูล ซึ่ งก็คือกำรคัดลอกกลุ่มย่อยบำงกลุ่มในคลังข้อมูล มำไว้ใน
ตลำดข้อมูลเล็กๆ หลำยๆ อัน แต่ละอันจะใช้เฉพำะ functional area ที่แน่นอน
หนึ่ง ๆ เท่ำนั้น
 Stand-alone data marts. บริ ษทั สำมำรถมีตลำดข้อมูลเพียงหนึ่ งหรื อมำกกว่ำก็ได้
และเป็ นอิสระจำกกันโดยไม่จำเป็ นต้องมีคลังข้อมูล กำรใช้ data mart
ส่ วนมำก ได้แก่ ฝ่ ำยกำรตลำด ฝ่ ำยบัญชี ฝ่ ำยที่ประยุกต์ใช้ในงำนวิศวกรรม
Operational Data Stores
 Operational data store คือ ฐำนข้อมูลที่ใช้ใน transaction processing system ซึ่ งใช้
แนวควำมคิดของ data warehouse ทำให้ขอ้ มูล clean
Relational and Multidimensional Database
 ฐำนข้อมูลเชิงสัมพัทธ์ (Relational database) เป็ นกำรเก็บข้อมูลในรู ปแบบตำรำงแบบ
สองมิติ (two–dimension- al tables)
 ฐำนข้อมูลแบบหลำยมิติ (Multidimensional database) โดยปกติแล้ว มันจะเก็บข้อมูล
ในลักษณะเป็ นอำร์เรย์ หลำย ๆ อำร์เรย์ (arrays) ซึ่ งแต่ละอำร์ เรย์ประกอบด้วยอย่ำง
น้อย มิติทำงธุรกิจสำมมิติ (three business dimension)
 มิติทำงธุรกิจ (Business dimension) หมำยถึง กำรมองและวิเครำะห์ขอ้ มูลในมุมมอง ที่
แตกต่ำงกันออกไป มิติเหล่ำนี้จะก่อรู ปเป็ น Data cube เมื่อเป็ นเช่นนี้ มิติทำงธุรกิจ คือ
บริ เวณขอบของ data cube ซึ่ งแสดงถึงมุมมองหลักๆ ของข้อมูลเชิงธุรกิจ
 ฐำนข้อมูลแบบหลำยมิติ มักถูกนำมำใช้ในคลังข้อมูล
12
สมมุติวำ่ …….
 สมมติวำ่ บริ ษทั ของเรำขำยของสี่ ชนิ ดคือ nuts, screws, bolts และ Washers
 กระจำยสิ นค้ำขำยออกไปทั้งสำมภำค คือ ภำคตะวันออก (East), ภำคตะวันตก
(West) และ ภำคกลำง (Central)
 กำรเก็บข้อมูลทั้งสำมปี คือ 2001, 2002 และ 2003
 ถ้ำเป็ นฐำนข้อมูลเชิงสัมพัทธ์ (Relational database) จะมองเห็นข้อมูลดังหน้ำถัดไป
เป็ นกำรมองข้อมูลแยกออกเป็ นสำมส่ วนตำมปี แต่ละส่ วนมีโครงสร้ำงของข้อมูล
เหมือนกัน (Product, Region และ Sales) และมีกำรจัดกลุ่มผลิตภัณฑ์เหมือนกัน
ตัวอย่ำงของ Relational databases
ตัวอย่ำงของ Multidimensional database
มิติของกำรขำยแบ่งเป็ น Regions, Products และ Years
ควำมทัดเทียมกันของ Relational & Multidimensional Databases
ควำมทัดเทียมกันของ Relational & Multidimensional Databases
ควำมทัดเทียมกันของ Relational & Multidimensional Databases
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Data Analysis
10.3 Information & Knowledge Discovery with Business Intelligence
 Business Intelligence (น่ำจะแปลว่ำ “เชำว์ปัญญำเชิงธุรกิจ” มัง๊ ครับ): แนวทำง
กว้ำง ๆ ของกำรประยุกต์ใช้และเทคนิคต่ำง ๆ ในกำรรวบรวมข้อมูล กำรเก็บ กำร
วิเครำะห์ และ กำรเข้ำถึง เพื่อช่วยให้ผใู ้ ช้ในองค์กรตัดสิ นใจทำงธุรกิจและกลยุทธ์ได้
ดีข้ ึน
 ตัวอย่ำงกำรทำงำนเป็ นดังรู ปในหน้ำถัดไป ข้อมูลดิบที่ได้จำกกำรทำงำนจะถูกเก็บอยู่
ในฐำนข้อมูลต่ำง ๆ คลังข้อมูลจะดึงเอำข้อมูลเหล่ำนั้นมำรวมกัน เมื่อใช้ Business
Intelligence Software ผูใ้ ช้สำมำรถส่ งคำถำม (query) ร้องขอรำยงำนตำมที่ตอ้ งกำร
(ad-hoc report) หรื อ ทำกำรวิเครำะห์อื่น ๆ ผลที่ได้จำกกำรร้องขอข้ำงต้นสำมำรถนำ
มำทำรำยงำน ทำกำรทำนำย แจ้งเตือน และ/หรื อ นำเสนอในเชิงรู ปภำพต่ำง ๆ ได้
How Business Intelligence works?
15
The Tools and techniques of business intelligence
 กำรประยุกต์ใช้หลัก ๆ ประกอบด้วย กำรดำเนินงำนทำงด้ำน query และ reporting,
online analytical processing (OLAP), DSS, data mining, forecasting และ
statistical analysis.
 Business intelligence ประกอบด้วย:
1) outputs such as financial modeling and budgeting 2) resource allocation
3) coupons and sales promotions
3) Seasonality trends
4) Benchmarking (business performance)
5) competitive intelligence.
 เครื่ องมือที่ใช้ใน BI มักแยกออกเป็ นสองส่ วนหลัก ๆ คือ:
 (1) กำรค้นพบสำรสนเทศและองค์ควำมรู้
 (2) สนับสนุนในกำรตัดสิ นใจและintelligent analysis.
16
Categories of business intelligence
1
2
BPI = Business Process Integration, BPM = Business Process Management
17
The Tools and Techniques of Information and Knowledge Discovery
 กำรค้นพบองค์ควำมรู้และสำรสนเทศ (Information and Knowledge Discovery) จะ
แตกต่ำงจำกกำรสนับสนุนกำรตัดสิ นใจ ในมุมมอง ของ “กำรค้นพบ (discovery)”
หมำยควำมว่ำ ต้องค้นพบแล้ว จึงนำผลนั้นไปใช้ สำหรับสนับสนุนในกำรตัดสิ นใจ
 วิวฒั นำกำรของ Information and Knowledge Discovery
 Information discovery เริ่ มมำตั้งแต่ปลำยปี 1960 พร้อมกับเทคนิคต่ำง ๆ ที่ใช้รวบ
รวมข้อมูล ซึ่ งมันก็คือ กำรรวบรวมข้อมูลแบบพื้นฐำน ง่ำย ๆ และ มันตอบคำถำม
ต่ำงๆได้โดยใช้ขอ้ มูลกลุ่มหนึ่ งที่เก็บไว้ในอดีต กำรวิเครำะห์แบบนี้ต่อมำได้ขยำย
ออกเป็ นเครื่ องมือหลำยตัว เช่น SQL Relational database management systems
 อ่ำนเพิ่มเติมใน ตำรำงที่ 10.3 Stages in the Evolution of Knowledge Discovery
Knowledge Discovery (KD)
 กระบวนกำรคัดแยกเอำองค์ควำมรู้ออกมำจำกข้อมูลที่มีจำนวนมำก รวม data
mining เอำไว้ดว้ ย
18
Ad-Hoc Queries and Reporting
 Ad-hoc queries หมำยถึงกำรยินยอมให้ผใู้ ช้
ต่ำง ๆ ร้องขอสำรสนเทศจำกคอมพิวเตอร์ ใน
เวลำจริ ง (real time) ซึ่ งไม่เคยมีในรำยงำน ที่
ทำเป็ นปกติ คำตอบที่ได้มำข้ำงต้น (Report)
จะถูกนำใช้ในกำรตัดสิ นใจอย่ำงเร่ งด่วน
 ระบบ Ad-hoc queries ง่ำย ๆ ทำโดยกำรใช้
เมนู ที่ซบั ซ้อนขึ้นไปจะใช้ SQL (Structured
query language) และที่ซบั ซ้อนขึ้นไปอีก จะ
อยูบ่ น natural language processing บำงรู ป
แบบสำมำรถติดต่อกับผูใ้ ช้โดยใช้กำรจดจำ
เสี ยง (voice recognition)
OLAP (Online Analytical Processing)
 ย่อมำจำก “Online Analytical Processing” ถือเป็ นเครื่ องมือทำงซอฟท์แวร์ประเภทหนึ่ ง ที่
ใช้จดั กำรกับข้อมูลที่เก็บไว้ในฐำนข้อมูล
 OLAP tools จะช่วยให้ผใู ้ ช้ทำกำรวิเครำะห์ควำมแตกต่ำงของมิติหลำยๆมิติของ
multidimensional data ตัวอย่ำงเช่น มันช่วยทำกำรวิเครำะห์มุมมองทำงด้ำน time series
และ trend analysis ดังนั้น OLAP มักถูกนำมำใช้ในงำน data mining
 องค์ประกอบหลักของ OLAP ก็คือ OLAP server ซึ่ งวำงอยูร่ ะหว่ำง client กับ database
management systems (DBMS) โดยที่ OLAP server จะเข้ำใจว่ำ ข้อมูลควรจัดรู ปแบบ
อย่ำงไรในฐำนข้อมูลและมีฟังก์ชนั พิเศษต่ำง ๆ สำหรับใช้ในกำรวิเครำะหื ขอ้ มูล
 โดยทัว่ ไป มักจะมี OLAP server วำงอยูใ่ กล้กบั ระบบฐำนข้อมูลหลักเป็ นส่ วนมำก
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Data Mining
แนวควำมคิดของ Data Mining
 Data mining: คือ กระบวนกำรค้นหำ สำรสนเทศทำงธุรกิจที่มีมูลค่ำต่อองค์กร ในฐำน
ข้อมูลขนำดใหญ่ คลังข้อมูล หรื อ ตลำดข้อมูล
 ควำมสำมำรถของ Data mining ประกอบด้วย:
 1) สำมำรถทำนำยแนวโน้มและพฤติกรรมต่ำง ๆ โดยอัตโนมัติ
 2) ค้นพบรู ปแบบต่ำง ๆ (unknown patterns) ที่ผำ่ นมำแล้วโดยอัตโนมัติ
ตัวอย่ำงของ Data Mining Process
อ่ำนเพิ่มเติมใน A Closer Look “10.3 Data Mining Techniques and Information Types”
กำรประยุตใ์ ช้ Data Mining
กำรประยุตใ์ ช้ Data Mining








ตัวอย่ำงกำรประยุกต์ใช้ Data Mining ได้แก่
กำรขำยปลีกและขำยส่ ง
กำรธนำคำร
กำรประดิษฐ์และกำรผลิต
กำรประกันภัย
กำรทำงำนของตำรวจ
กำรดูแลสุ ขภำพ
กำรตลำด
Text Mining
 กำรประยุกต์ใช้ data mining กับแฟ้ มข้อมูลแบบตัวอักษรและเป็ นแบบไม่มีโครง
สร้ำง (non- structured) หรื อ มีโครงสร้ำงน้อย (less-structured)
 Text mining จะช่วยให้องค์กรทำสิ่ งต่อไปนี้
 (1) ค้นหำเนื้อหำที่แฝงเร้น (“hidden” content) ของเอกสำรต่ำงๆ รวมทั้งแสดงควำม
สัมพันธ์กนั ที่มีประโยชน์เพิม่ เติมเข้ำมำด้วย
 (2) จัดกลุ่มเอกสำรให้อยูใ่ นเรื่ องเดียวกัน (common themes) (เช่น แยกแยะลูกค้ำ
ทั้งหมดที่ทำประกันออกดูวำ่ ใครบ้ำงที่ร้องเรี ยนเข้ำมำในเรื่ องเหมือน ๆ กัน)
Web Mining
 กำรประยุกต์ใช้เทคนิคของ data mining เพื่อค้นหำรู ปแบบที่มีควำมหมำย สมควร
นำมำใช้ หรื อ รู ปร่ ำง (profiles) และ แนวโน้มที่จะเกิดขึ้น (trends) จำก web
resources.
 Web mining มักจะนำมำใช้ในพื้นที่ต่อไปนี้: ทำกำรคัดกรองสำรสนเทศ, surveillance,
mining of web- access logs สำหรับทำกำรวิเครำห์ผใู้ ช้, assisted browsing, และ กำร
บริ กำรต่ำง ๆ ที่ต่อสู ้กบั อำชญำกรรมบนอินเตอร์ เน็ต
 Web mining สำมำรถรองรับฟังก์ชนั ต่อไปนี้:
 Resource discovery ระบุเอกสำรหรื อกำรบริ กำรบน Web ที่ไม่คุน้ เคย
 Information extraction แยกสำรสนเทศตำมที่กำหนดจำก Web โดยอัตโนมัติ
 Generalization เปิ ดเผยรู ปแบบทัว่ ๆ ไปในแต่ละ Web site ส่ วนตัว หรื อ ข้ำม Web site
 อ่ำนเพิ่มเติมในตำรำงที่ 10.4 The reasons Data Warehouse and Mining fail
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ต่อไปจะกล่ำวถึงส่ วนนี้ คือ Data Visualization
Data Visualization Technologies
 Data Visualization: เป็ นกำรนำเสนอข้อมูลด้วยรู ปภำพดดยใช้เทคโนโลยีต่ำง ๆ
เช่น รู ปภำพแบบต่ำง ๆ ตำรำง กรำฟ videos และภำพเคลื่อนไหว และ multimedia
ในรู ปแบบต่ำง ๆ
 อ่ำนเพิ่มใน IT at Work 10.2 “Danskin’s Virtual Showroom”, page 433
 Multidimentionality Visualization คือกำรมองภำพ (จำกข้อมูล) ได้หลำยมิติใน
เวลำเดียวกัน
 สำมตัวแปรที่พิจำรณำถึงควำมเป็ น multidimensionality คือ มิติ กำรวัด และ เวลำ
เช่น
 ด้ำนมิติ: สิ นค้ำ พนักงำนขำย ส่ วนแบ่งกำรตลำด หน่วยธุรกิจ ช่องทำงกำรจัด
จำหน่ำย ประเทศ อุตสำหกรรม เป็ นต้น
 ด้ำนกำรวัด: เงิน ยอดขำย จำนวนคน ผลตอบแทนด้ำนสิ นค้ำคงคลัง เป็ นต้น
 ด้ำนเวลำ: รำยวัน รำยสัปดำห์ รำยเดือน รำยปี เป็ นต้น
Geographical Information System (GIS)
 ระบบที่อำศัยคอมพิวเตอร์ ในกำรจับภำพ เก็บ รวบรวม จัดกำร และ แสดงข้อมูล
โดยกำรใช้แผนที่แบบดิจิตอล (digitized map)
 อ่ำนเพิ่มเติมในหน้ำ 436-437
Visual Interactive Model and Simulation
 Visual Interactive Modeling (VIM): กำรใช้ computer graphic displays
นำเสนอ ผลกระทบของกำรตัดสิ นใจเกี่ยวกับกำรบริ หำรหรื อกำรปฏิบตั ิงำนที่
แตกต่ำงออก ไปจำกเป้ ำหมำยของบริ ษทั ที่ต้ งั ไว้ เช่น กำไร ส่ วนแบ่งกำรตลำด เป็ น
ต้น
 Visual Interactive Simulation (VIS): วิธีกำรของ visual interactive modeling
method ที่ใช้โดย end user เพื่อดูควำมก้ำวหน้ำของ simulation model ในเชิงรู ป
ภำพที่เคลื่อนไหวได้ โดยใช้ graphics terminals
 อ่ำนเพิ่มเติมใน IT at Work 10.3 “Computer training in complex logging
machines at Partek forest”
Virtual Reality (VR)
 ภำพสำมมิติที่สร้ำงโดยคอมพิวเตอร์ และ
มีกำรสนองตอบต่อผูใ้ ช้ ภำพจะส่ งผ่ำน
ไป ยังผูใ้ ช้โดยส่ วนแสดงผลที่สวมอยูท่ ี่
ศรี ษะ
 Virtual reality and the web: A platformindependent standard สำหรับ VR
เรี ยกว่ำ virtual reality mark up language
(VRML) ใช้ช่วยนำทำงเข้ำไปยัง online
supermarkets, museums, และ stores มี
กำรตอบโต้กบั ผูใ้ ช้ผำ่ นทำง textual
information.
อ่ำนเพิม่ เติมจำกตำรำงที่ 3.3 หน้ำ 82
3.6 Marketing Databases in Action
 Data warehouses and data marts รองรับผูใ้ ช้ท้ งั หมดในทุก ๆ functional areas โดย
ฐำนข้อมูลปั จจุบนั ทั้งหมดเป็ นแบบ static คือ รวบรวมและจัดเก็บ แต่ธุรกิจในปัจจุบนั
เริ่ มต้องกำร specialized databases เช่น
 Marketing transaction database (MTD)
 เป็ นกำรรวมคุณลักษณะที่หลำกหลำยของฐำนข้อมูลปั จจุบนั และแหล่งข้อมูล
กำรตลำดปั จจุบนั เข้ำเป็ นฐำนข้อมูลเดียวกัน ทำให้นกั กำรตลำดมีปฎิสัมพันธ์กบั
ลูกค้ำได้เจำะจงมำกขึ้น
 Interactive capability
 interactive transaction เกิดขึ้นเมื่อลูกค้ำแลกเปลี่ยนสำรสนเทศและทำกำร update
ฐำนข้อมูลแบบ real time ซึ่ งจะตรงข้ำมแบบเดิมที่ทำเป็ นช่วง ๆ (weekly, monthly,
or quarterly) ตัวอย่ำงเช่น classical warehouses and marts.
3.7 Web-based Data Management System
 กำรดำเนินกำรเกี่ยวกับกำรบริ หำรจัดกำรข้อมูล และ Business Intelligence ตั้งแต่กำร
รวบรวมข้อมูล ไปจนถึงกำรจัดทำ warehouse และ data mining มักจะกระทำโดยอำศัย
เครื่ องมือของ Web หรื อ เกี่ยวข้องกับ Web Technology ต่ำง ๆ ผูใ้ ช้สำมำรถใช้ เบรำส์
เซอร์ log เข้ำระบบและดำเนินกิจกรรมที่เกี่ยวข้องได้โดยสะดวก ดังนั้นจะ เห็นได้วำ่
เทคโนโลยีที่เกี่ยวกับ Web จะเข้ำมำมีบทบำทอย่ำงมำกมำยในปั จจุบนั
 Enterprise BI suites and Corporate Portals: รวบรวม query, reporting, OLAP, และ
เครื่ องมืออื่น ๆ
 Intelligent Data Warehouse Web-based Systems: ให้ search engine เพื่อค้นหำ specific
applications ซึ่ งสำมำรถปรับปรุ งกำรทำงำนของ data warehouse ให้ดีข้ ึน
ตัวอย่ำงของ Web-based Data Management System
BI = Business Intelligence
Clickstream Data Warehouse
 Clickstream Data Warehouse คือกำรรวบรวมข้อมูลเกี่ยวกับพฤติกรรมของผูใ้ ช้
และรู ปแบบในกำรเลือกอ่ำน(ค้นหำ)ข้อมูลที่ตอ้ งกำร เป็ นกำร monitor กำรกระทำ
ของผูใ้ ช้เมื่อเขำแวะเข้ำไปในเวบไซท์หนึ่ง ๆ
 อ่ำนเพิ่มเติม “Victoria’s Secret’s Data Warehouse”, page 84
Web-based Data Management Systems (Enterprise information portal)
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
ในส่ วนของ Knowledge Management จะกล่ำวภำยหลัง
วงจรของข้อมูล (Data Life Cycle)
ท่ำนเรี ยนรู ้เรื่ องนี้แล้ว
IT Solution ซึ่ งเรำเรี ยนผ่ำนมำบ้ำงแล้ว
MANAGERIAL ISSUES
 Cost-benefit issues and justification.
 data management solutions บำงตัวที่กล่ำวผ่ำนมำแล้วนั้นมีรำคำแพงมำก มักซื้ อใช้
กันในเองค์กรขนำดใหญ่ องค์กรขนำดเล็กควรมองหำรคำตอบที่มี cost ต่ำ ในเชิง
leverage existing databases แทนที่จะสร้ำงขึ้นใหม่
 Where to store data physically.
 ข้อมูลควรถูกกระจำยไปอยูใ่ กล้ผใู ้ ช้มำที่สุดหรื อไม่? คำตอบก็คือ ควรจะเป็ นเช่นนั้น
เพื่อป้ อนและ update ข้อมูลได้เร็ ว แต่จะเพิม่ replication และ security risks หรื อ
 ข้อมูลควรอยูท่ ี่ศนู ย์กลำงเพื่อง่ำยต่อกำรควบคุม กำรดูแลควำมปลอดภัย และ disaster
recovery? มันก็จะมีปัญหำเรื่ องกำรสื่ อสำรและ single point of failure risks.
MANAGERIAL ISSUES Continued
 Legal issues.
 Data mining อำจแนะนำให้บริ ษทั ส่ ง catalogs หรื อ promotions ไปยัง one age group หรื อ
one gender
 A man sued Victoria’s Secret Corp. because his female neighbor received a mail order
catalog with deeply discounted items and he received only the regular catalog (the
discount was actually given for volume purchasing).
 Internal or external?
 องค์กรควรลงทุนภำยในองค์กรด้ำน collecting, storing, maintaining, และ purging ข้อมูลใน
ฐำนข้อมูลของตนเอง? หรื อ ควรเป็ นสมำชิก external databases ที่ผใู้ ห้บริ กำรจัดกำรให้
ทั้งหมดในเชิง data management และ data access?
MANAGERIAL ISSUES Continued
 Disaster recovery.
 กระบวนกำรทำงธุรกิจขององค์กร (ซึ่งมีฐำนข้อมูลอิสระจำกกัน) สำมำรถกูก้ ลับคืนและยังคงทำงำนได้
หลังจำกเกิดภัยธรรมชำติหรื อ information system disaster บำงประเภท? Data warehouse จะถูกปกป้ อง
อย่ำงไร? และที่รำคำเท่ำใด?
 Data security and ethics.
 ข้อมูลที่ทำให้องค์กรเกิดควำมได้เปรี ยบในกำรแข่งขันได้รับกำรปกป้ องจำกกำรขโมยหรื อกำรก่อวินำศกรรม
อย่ำงไร? Confidential data เช่น personnel details ปลอดภัยจำกกำร access อย่ำงไม่ถูกต้อง หรื อ ผิด
กฎหมำย? ใครเป็ นเจ้ำของและต้องรับผิดชอบ?
 Privacy
 กำรรวบรวมข้อมูลใน warehouse และกำรทำ data mining อำจส่ งผลให้เกิดกำรก้ำวล่วงควำมเป็ นส่ วนตัว
บริ ษทั มีกำรป้ องกันอย่ำงไร? และแต่ละคนปกป้ องควำมเป็ นส่ วนตัวได้อย่ำงไร?
MANAGERIAL ISSUES Continued
 Legacy data.
 One very real issue, often known as the legacy data acquisition problem, is what to do with the mass of
information already stored in a variety of systems and formats,. Data in older, perhaps obsolete, databases
still need to be available to newer database management systems. Many of the legacy application
programs used to access the older data simply cannot be converted into new computing environments
without considerable expense. Basically, there are three approaches to solving this problem. One is to
create a database front end that can act as a translator from the old system to the new. The second is to
cause applications to be integrated with the new system, so that data can be seamlessly accessed in the
original format. The third is to cause the data to migrate into the new system by reformatting it.
 Data delivery.
 กำรเคลื่อนย้ำยข้อมูลไปรอบ ๆองค์กรมักเป็ นปัญหำหลัก เนื่องจำกประสิ ทธิภำพ ของกำรสื่ อสำรและ
ประสิ ทธิภำพระหว่ำงกลุ่มต่ำง ๆ รวมทั้งควำมแตกต่ำงด้ำนภูมิศำสตร์
จบหัวข้อที่ 3
 มีคำถำมมัย๊ ครับ…….