Transcript Slide 1
CHARPTER 6 การจัดเก็บข้อมูลลงไฟล์ และฐานข้อมูล (Storage Data In File and Database) สาระการเรียนร ้ ู • • • • • • • ข้อมูลและโครงสร้างข้อมูล แฟ้ มข้อมูลและชนิดของแฟ้ มข้อมูล การประมวลผลข้อมูล การจัดข้อมูลในแฟ้ มข้อมูล ระบบแฟ้ มข้อมูลและปัญหาที่พบ ฐานข้อมูลและระบบฐานข้อมูล ชนิดของฐานข้อมูล ข้อมูลและโครงสร้างข้อมูล ข้ อมูล ข้อมูล (Data) ข้อเท็จจริ งหรื อเหตุการณ์ต่าง ๆ ที่เกิดขึ้นในชีวติ ประจาวัน ซึ่ งอาจเป็ นข้อเท็จจริ งที่ เกี่ยวกับสถานที่ คน สัตว์ สิ่ งของ และอื่น ๆ ซึ่ งคอมพิวเตอร์สามารถจัดเตรี ยม และจัดเก็บข้อมูล ได้แก่ ข้อมูลที่เป็ น ข้อความ , ตัวเลข , รู ปภาพ , เสี ยง , วีดีโอ และอื่น ๆ ข้ อมูลในคอมพิวเตอร์ แบ่ งออกเป็ น 2 กลุ่ม คือ ข้ อมูลทีค่ ำนวณได้ (Numeric) ได้แก่ ข้อมูลที่เป็ นตัวเลข และจะนาไปใช้ในการคานวณ ข้ อมูลทีไ่ ม่ นำมำคำนวณ (Character) ได้แก่ ข้อมูลที่เป็ นตัวอักษรหรื อตัวเลข แต่ตวั เลข นั้นไม่สามารถคานวณได้ เช่น บ้านเลขที่ , รหัสประจาตัว , เลขที่บตั รประจาตัวหมายเลข ประชาชน , หมายเลขโทรศัพท์ ข้อมูล ทั้ง 2 ประเภทจะถูกเก็บในเครื่ องคอมพิวเตอร์จะอยูใ่ นรู ปแบบของภาษาเครื่ อง หรื อเลข ฐาน 2 ที่ประกอบด้วยด้วยตัวเลข 2 ตัว คือ 0 กับ 1 บิต (BIT) จำนวน 8 บิต =>> 001 =>> 01001010 ก็จะมีจำนวนทั้งหมด ก็จะมีจำนวนทั้งหมด 3 บิต 1 ไบต์ โครงสร้างข้อมูล • • • • • อักขระ ฟิ ลด์ เรคคอร์ด ไฟล์ ฐานข้อมูล โครงสร้างข้อมูล • ตัวอักขระ (Character) คือ ข้อมูลชนิดใด ๆ ที่มีแค่เพียง 1 อักขระเท่านั้น ได้แก่ขอ้ มูลประเภทอักษร ก-ฮ หรือ A-Z ข้อมูลประเภทตัวเลข 0-9 สัญลักษณ์พิเศษ Special Symbol หรื อถ้าเป็ นทางตรรกะ คณิ ตศาสตร์ < , # , $ , @ , % , > , + , - , * , / เป็ นต้น • ฟิ ลด์ (Field) คือ เป็ นหน่วยข้อมูลที่ประกอบด้วยอักขระตั้งแต่ 1 อักขระขึ้นไป เพื่อแสดงลักษณะหรื อสื่ อ ความหมายของข้อเท็จจริ งบางอย่างเช่น วันเกิด,สถานที่ทางานบ้านเลขที่ เป็ นต้น 1.ฟิ ลด์ ตัวเลข (Numeric Field) ประกอบด้วยฟิ ลด์ท้งั จานวนเต็มบวก ลบ และทศนิยม ฟิ ลด์ที่สามารถคานวณได้เช่น ฟิ ลด์ราคาสิ นค้า , จานวนสิ นค้า เป็ นต้น 2.ฟิ ลด์ อกั ขระ (Character Filed/Alphanumeric Field) ประกอบด้วย ตัวอักษร,ตัวเลข เช่น ฟิ ลด์ “ชื่อพนักงาน” , “นามสกุล” เป็ นต้น 2.ฟิ ลด์ ตัวอักษร (Alphabetic Field) จะประกอบไปด้วย ตัวอักษร ตัวเลข สัญลักษณ์ พิเศษ ตัวเลขปนตัวอักษรเช่น ฟิ ลด์ ”บ้านเลขที่” , “ที่อยู”่ , “รหัสสิ นค้า” เป็ นต้น • เรคคอร์ด (Record) คือ กลุ่มของ Field ที่มีความสัมพันธ์กนั ภายใน คือ 1 เรคคอร์ดจะประกอบด้วย 1 ฟิ ลด์ที่มี ประเภทเหมือนหรื อแตกต่างกันแต่มีความสัมพันธ์กนั จึงได้นามารวมเป็ น Record เช่น รหัสพนักงาน ชื่อพนักงาน นามสก ุล อาย ุ ที่อยู่ 1001 1002 AAA BBB AAAA BBBB 23 24 กรุ งเทพ ชลบุรี • ไฟล์ (File) แฟ้ มข้อมูล คือ กลุ่มของ เรคคอร์ด ที่มีความสัมพันธ์กนั มารวมกัน เช่น แฟ้ มข้อมูลของพนักงาน จะประกอบด้วย Record พนักงานหลาย ๆ คน โครงสร้ ำงของแฟ้ มข้ อมูลจะประกอบด้ วย แฟ้มข้อมูล (File) เรคคอร์ด (Record) ฟิลด์ (Field) ไบต์ (Byte) บิต (Bit) ฟิลด์ (Field) ไบต์ (Byte) บิต (Bit) เรคคอร์ด (Record) • ไฟล์ (File) กลุ่มของแฟ้ มข้อมูลที่มีความสัมพันธ์กนั และถูกนามารวมกัน เช่น ฐานข้อมูลบริ ษทั แห่งหนึ่ง อาจประกอบไปด้วยหลายแฟ้ มข้อมูลหลายแฟ้ ม ได้แก่ แฟ้ มข้อมูลพนักงาน , แฟ้ มข้อมูลแผนก , และ แฟ้ มข้อมูลขายสิ นค้า Character A D Field “First Name” , “Last Name” Record รหัสพนักงาน ชื่อพนักงาน นามสก ุล อาย ุ ที่อยู่ 1001 AAA AAAA 23 กรุ งเทพ File รหัสพนักงาน ชื่อพนักงาน นามสก ุล อาย ุ ที่อยู่ 1001 AAA AAAA 23 กรุ งเทพ 1002 BBB BBBB 24 ชลบุรี DATABASE “Employee” ID.NO Name Phone Age Address 1001 AAA AAAA 23 กรุ งเทพ 1002 BBB BBBB 24 ชลบุรี Name Position AAA Marketing BBB Accounting Name History AAA 1/04/1998 BBB 1/05/1997 แฟ้มข้อมูลและชนิดของข้อมูล แฟ้ มข้อมูลสามารถจาแนกได้หลายประเภท แต่หากจาแนกตามกลุ่มใหญ่ จะมีอยูด่ ว้ ยกันทั้งหมด 2 ประเภท คือ 1.Program File เป็ นชุดคาสัง่ ที่อยูใ่ นซอฟต์แวร์ภายใน Microsoft Office ที่สาคัญจะมีชื่อว่า Setup.exe 2.Data File เป็ น “แฟ้ มข้อมูล” ภายในแฟ้ มจะเก็บข้อมูลบรรจุไว้ภายใน ซึ่งอาจสร้างด้วยโปรแกรมสาเร็จ รู ปชนิดใด ๆ ก็ได้ ได้แก่ Ms.Word ได้ File นามสกุลเป็ น .DOC แฟ้ มข้อมูลที่สามารถนามาใช้ในการปรับปรุ งระบบงานทัว่ ไปแบ่งออกเป็ น 2 ประเภท คือ แฟ้มข้ อมูลหลัก (Master File) แฟ้มข้ อมูลรำยกำรเปลีย่ นแปลง (Transaction File) การประมวลผลข้อมูล เมื่อนาข้อมูลเข้าสู่ระบบคอมพิวเตอร์แล้ว ข้อมูลจะถูกจัดการด้วยวีธีการต่าง ๆ เพื่อให้ได้ผลลัพธ์ ตามที่ตอ้ งการเรี ยกว่า “สารสนเทศ” :ซึ่ งเป็ นประโยชน์ต่อการตัดสิ นใจ ข้อมูล (Data ) การประมวลผล (Processing) สารสนเทศ (Information ) การประมวลผลด้วยคอมพิวเตอร์แบ่งออกเป็ น 2 ประเภท ได้แก่ กำรประมวลผลแบบทันที (Online Processing) เป็ นแบบ Real-time Processing กำรประมวลผลแบบสุ่ ม (Batch Processing) การประมวลผลแบบกลมุ่ VS การประมวลผลแบบทันที • กำรประมวลผลแบบกลุ่ม (batch processing) -- เก็บข้อมูลไว้ระยะเวลาหนึ่งแล้วจึง ประมวลผลให้เสร็จในคราวเดียวกัน เช่น กรณี การใช้บตั รเครดิต Page 350 การประมวลผลแบบกลมุ่ VS การประมวลผลแบบทันที • กำรประมวลผลแบบทันที (real-time processing) -- เมื่อมีรายการเกิดขึ้นจะทาการ ประมวลผลทันที ตัวอย่างเช่น การใช้ระบบเอทีเอ็ม Page 350 การจัดข้อมูลในแฟ้มข้อมูล การจัดข้อมูลลงในแฟ้ มข้อมูล (File Organization) คือ วิธีการจัดการข้อมูลเพื่อจัดเก็บลงในสื่ อ ปันทึกข้อมูล โดยทัว่ ไปแบ่งออกเป็ น 3 วิธีได้แก่ กำรจัดข้ อมูลแบบเรียงลำดับ (Sequential File Organization) กำรจัดข้ อมูลแบบโดยตรง (Direct File Organization) กำรจัดข้ อมูลแบบเรียงลำดับดัชนี (Index-sequential File Organization) กำรจัดข้ อมูลแบบเรียงลำดับ (Sequential File Organization) Record Number 1 2 3 4 5 6 7 8 9 10 11 980 981 ID 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 --980 981 STOCK สิ นค้า A สิ นค้า B สิ นค้า C สิ นค้า D สิ นค้า E สิ นค้า F สิ นค้า G สิ นค้า H สิ นค้า I สิ นค้า J --สิ นค้า K สิ นค้า L Quility 10 5 5 3 12 11 12 40 60 25 --15 10 Price 100 120 115 102 99 90 45 50 60 35 --75 100 กำรจัดข้ อมูลแบบโดยตรง (Direct File Organization) Record Number 1 2 3 4 ID 1001 1002 1003 STOCK สิ นค้า A สิ นค้า B สิ นค้า C Quility 10 5 5 Price 100 120 115 1005 สิ นค้า E 12 99 1207 สิ นค้า A12 22 125 1009 สิ นค้า I 60 60 --1280 --สิ นค้า M22 --10 --69 5 6 7 8 9 10 11 980 981 กำรจัดข้ อมูลแบบเรียงลำดับดัชนี (Index- Sequential File Organization) Index File Record Key Field Number 1001 1 1 1002 2 2 1003 3 3 1004 4 4 1005 5 5 1006 6 6 1007 7 7 1008 8 8 1009 9 9 1010 10 10 --- --- --- 980 980 980 981 981 981 Number ID 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 --980 981 STOCK สิ นค้า A สิ นค้า B สิ นค้า C สิ นค้า D สิ นค้า E สิ นค้า F สิ นค้า G สิ นค้า H สิ นค้า I สิ นค้า J --สิ นค้า K สิ นค้า L Quility 10 5 2 3 12 11 12 40 60 25 --15 10 Price 100 120 115 102 99 90 45 50 60 35 --75 100 ระบบแฟ้มข้อมูลและปัญหาที่พบบ่อย ระบบแฟ้ มข้อมูล เกิดขึ้นเนื่องจากในแต่หน่วยงานหรื อองค์กรเก็บข้อมูลจานวนมาก จึงทาให้ มีการจัดทาให้เป็ น “ระบบแฟ้ มข้อมูล” ที่จาแนกเป็ นหน่วยงานได้แก่ จัดซื้อ , หรื อบุคคล เป็ นต้น ซึ่งแต่ละ แผนกก็จะใช้โปรแกรมเพื่อจัดการข้อมูลที่แตกต่างกัน ดังรู ป ฝ่ ำยกำรตลำด โปรแกรม A แฟ้มข้ อมูลพนักงำนขำย แฟ้มข้ อมูลลูกค้ำ ฝ่ ำยกำรตลำด ฝ่ ำยคลังสินค้ำ โปรแกรม B โปรแกรม C แฟ้มข้ อมูลพนักงำน แฟ้มข้ อมูลคลังสินค้ำ ปัญหำของระบบแฟ้มข้ อมูล เกิดควำมซ้ำซ้ อนกันของข้ อมูล (Data Redundancy) ควำมไม่ สอดคล้ องกันของข้ อมูล (Data Inconsistency) ควำมไม่ สัมพันธ์ กนั ของข้ อมูล (Data Anomaly) จากปัญหาของระบบแฟ้ มข้อมูลข้างต้น จึงทาให้มีการจัดการข้อมูลในระบบคอมพิวเตอร์ใหม่ เรี ยกกันว่า “ฐานข้อมูล (Database)” เพื่อแก้ปัญหาที่เกิดขึ้นทั้งหมด ฐานข้อมูลและระบบฐานข้อมูล ฐานข้อมูล (Database) หมายถึง กลุ่มของแฟ้ มข้อมูลที่มีความสัมพันธ์กนั และถูกนามารวมกัน โดยมีโครงสร้างเดียวกัน ถูกควบคุม และจัดการโดยซอฟต์แวร์ DBMS เช่น ฝ่ายบ ุคคล ฝ่ายคลังสินค้า ฝ่ายการตลาด ระบบจัดกำรฐำนข้ อมูล (DBMS) ฐานข้อมูล (Database) แฟ้มข้อมูลพนักงาน แฟ้มข้อมูลคลังสินค้า แฟ้มข้อมูลพนักงานขาย แฟ้มข้อมูลล ูกค้า องค์ประกอบของระบบฐานข้อมูล องค์ ประกอบฐำนข้ อมูลแบ่ งออกเป็ น 4 ส่ วนได้ แก่ ข้ อมูล (Data) ได้แก่ ข้อมูลทั้งหมดของระบบเก็บไว้ฐานข้อมูลและต้องมีความสัมพันธ์กนั ฮำร์ ดแวร์ (Hardware) ได้แก่ เครื่ องคอมพิวเตอร์และอุปกรณ์อื่น ๆ ที่สนับสนุนการทางาน ของระบบฐานข้อมูล ซอฟต์ แวร์ (Software) ได้แก่ ซอฟต์แวร์ระบบจัดการฐานข้อมูล (Database Management System) ผู้ใช้ (User) แบ่งออกเป็ น 3 กลุ่มได้แก่ 1. โปรแกรมเมอร์ 2. End User 3. Database Administrator (DBA) ข้อดีของการใช้ฐานข้อมูล การนาระบบฐานข้อมูลเข้ามาใช้งานในองค์กร ส่ วนใหญ่จะเกิดข้อดีมากว่าข้อเสี ย อย่างไร ก็ตาม ในที่น้ ีจะบอกให้เห็นทั้ง 2 ด้านดังนี้ ข้ อดี 1. ลดควำมซ้ำซ้ อนของข้ อมูลลงได้ 2. หลีกเลีย่ งควำมไม่ สอดคล้ องกันของข้ อมูล 3. กำหนดให้ มีข้อมูลมีรูปแบบเดียวกันได้ เช่ น ข้ อมูลวันที่ สำมำรถกำหนดให้ มีรูปแบบ DD/MM/YY ได้ 4. กำหนดระบบควำมปลอดภัยให้ กบั ข้ อมูลได้ ง่ำย 5. รักษำควำมถูกต้ องและควำมน่ ำเชื่อถือให้ กบั ข้ อมูล 6. ควบคุมกำรเข้ ำถึงข้ อมูลจำกผู้ใช้ หลำยคนได้ 7. ข้ อมูลเป็ นอิสระจำกโปรแกรมที่ใช้ จัดกำรข้ อมูลนั้น 8. ตอบสนองควำมต้ องกำรใช้ ข้อมูลได้ หลำยรู ปแบบ 9. ลดเวลำพัฒนำโปรแกรมสำหรับเรียกใช้ ข้อมูลจำกฐำนข้ อมูลได้ เนื่องจำกมีซอฟต์ แวร์ DBMS 10. ข้ อมูลที่อยู่ในฐำนข้ อมูล สำมำรถนำมำจัดทำ Report ได้ ง่ำย ข้ อเสี ย 1. หำกต้ องกำรระบบฐำนข้ อมูลที่มีประสิ ทธิภำพ จะต้ องอำศัยผู้ออกแบบที่มีควำมชำนวญ 2. ผู้ใช้ งำนจำเป็ นต้ องได้ รับกำรฝึ กอบรมกำรใช้ งำนก่ อน ทำให้ เกิดค่ ำใช้ จ่ำยในส่ วนนี้ 3. หำกฐำนข้ อมูลมีปัญหำเกิดขึน้ อำจทำให้ สูญเสี ยข้ อมูลบำงส่ วนไปได้ ระบบจัดการฐานข้อมูล • ระบบจัดการฐานข้อมูล (database management system – DBMS) เป็ นซอฟต์แวร์ เฉพาะสาหรับสร้าง ปรับปรุ ง และเข้าถึงข้อมูล ประกอบด้วย 5 ส่ วน ดังนี้ – เครื่ องมือสร้างระบบจัดการฐานข้อมูล – การนิยามข้อมูล – การจัดการข้อมูล • Query-by-example (QBE) • ภาษาเชิงสอบถาม (SQL) – การสร้างโปรแกรมประยุกต์ – การบริ หารฐานข้อมูล Page 353 ประเภทของฐานข้อมูล บำงครั้งเรียกว่ ำ แบบจำลองข้ อมูล (data model) นิยำมกฎและ มำตรฐำนสำหรับข้ อมูลใน ฐำนข้ อมูล แบ่ งออกเป็ น 5 แบบ ดังนี้ – ฐานข้อมูลแบบลาดับชั้น – ฐานข้อมูลแบบเครื อข่าย – ฐานข้อมูลแบบเชิงสัมพันธ์ – ฐานข้อมูลแบบหลายมิติ – ฐานข้อมูลแบบเชิงวัตถุ Page 354 ชนิดของฐานข้อมูล • ฐานข้อมูลส่ วนบุคคล • ฐานข้อมูลขององค์กรหรื อฐานข้อมูลใช้ร่วมกัน • ฐานข้อมูลชนิดกระจาย • ฐานข้อมูลชนิดมีเจ้าของเฉพาะ • ฐานข้อมูลบนเว็บ Page 360 1.บราวเซอร์จาก Client ร้องข้อเว็บ เพจ ` Server Client ์ เวอร์สง่ Html ที่ได้จาก 2. เว็บเซิรฟ ์ เวอร์คน้ หาตาแหน่งของเว็บเพจที่รอ้ งขอ 4. เว็บเซิรฟ การ 3. เว็บเซิรฟ ์ เวอร์ประมวลผลโค้ด ASP และแปลง ประมวลผลไปยังไคลเอนท์ ผลลัพธ์เป็ นเอกสารในรูป Html สาหรับซอฟต์แวร์ ระบบจัดการฐานข้อมูลชนิดนี้ จะเรี ยกว่า “OODBMS” แต่ฐานข้อมูล ดังกล่าวยังไม่เป็ นที่แพร่ หลายกันมากนักเท่าฐานข้อมูลเชิงสัมพันธ์มีการผสมผสานแนวคิดเชิง วัตถุเท่านั้นกับฐานข้อมูลเชิงสัมพันธ์ เรี ยกว่า Object-relational-Database โปรแกรมที่ช่วย จัดการได้แก่ Oracle , DB2, Sybase การนาฐานข้อมูลไปใช้ • ใช้ สำหรับกลยุทธ์ – จัดเก็บลงในฐานข้อมูลชนิ ดพิเศษที่เรี ยกว่า คลังข้อมูล (data warehouse) – ใช้เทคนิคเหมืองข้อมูล (data mining) เพื่อค้นหาสารสนเทศที่มี ความสัมพันธ์กนั • ควำมปลอดภัยของสำรสนเทศ – – Page 362 ฐานข้อมูลมีคุณค่า ฐานข้อมูลมีความสาคัญมาก ป้ องกันไว้ก่อน เพื่อความปลอดภัย • คลังข้ อมูล (Data Warehouse) & เหมืองข้ อมูล (Data Mining) คลังข้ อมูล (Data Warehouse) ฐานข้อมูลที่จดั เก็บข้อมูลที่ได้มาจากการสกัดข้อมูล (Extract) จากฐานข้อมูลอื่นๆ ซึ่ งอาจมีโครงสร้างแตกต่างกันหรื ออยูบ่ นระบบปฏิบตั ิการที่ แตกต่างกันก็ได้ ทั้งนี้เพื่อประโยชน์ในการวิเคราะห์และตัดสิ นใจทางธุรกิจ เหมืองข้ อมูล (Data Mining) บางครั้งเรี ยกว่า “การค้นพบองค์ความรู้” (Knowledge Discovery) เป็ นเทคนิคที่ใช้ในการค้นหาข้อมูลเชิงวิเคราะห์ช้ นั สู ง สาหรับใช้จดั การกับข้อมูล ที่มีอยูใ่ นฐานข้อมูลที่มีอยูเ่ ป็ นจานวนมาก ซึ่ งประกอบไปด้วยการค้นหา แยกแยะกลุ่มข้อมูล และเลือกแฟ้ มข้อมูลที่มีคุณค่า เป็ นต้น โดยมีวตั ถุประสงค์หลัก เพื่อใช้อธิบายข้อมูลในอดีต และคาดการณ์ขอ้ มูลในอนาคต การบริหารจัดการ ผูใ้ ช้ การบัญชี การเงิน คลังข้อมูล ผูใ้ ช้ การผลิต การตลาด ผูใ้ ช้ การขาย สร ุป • ข้ อมูลหมายถึง ข้อเท็จจริ งหรื อเหตุการณ์ต่าง ๆ ได้แก่ สถานที่ คน สัตว์ สิ่ งของ อื่นๆ • ข้ อมูลทีถ่ ูกจัดกำรโดยคอมพิวเตอร์ จะได้ ข้อความ รู ปภาพ เสี ยง วีดีโอ • ข้ อมูลแบ่ งเป็ น 2 กลุ่มได้แก่ Numeric และ Character • โครงสร้ ำงข้ อมูลประกอบด้ วย Character, Field, Record, File, Database • แฟ้มข้ อมูลแบ่ งเป็ น 2 ประเภทได้แก่ Data File, MasterFile • แฟ้มข้ อมูลแบ่ งออกเป็ น Transaction File,BatchFile • กำรจัดเก็บมูลแบ่งได้ Sequential File , Direct File,Indexed-Sequential File