Transcript Slide 1

CHARPTER 6
การจัดเก็บข้อมูลลงไฟล์ และฐานข้อมูล
(Storage Data In File and Database)
สาระการเรียนร ้ ู
•
•
•
•
•
•
•
ข้อมูลและโครงสร้างข้อมูล
แฟ้ มข้อมูลและชนิดของแฟ้ มข้อมูล
การประมวลผลข้อมูล
การจัดข้อมูลในแฟ้ มข้อมูล
ระบบแฟ้ มข้อมูลและปัญหาที่พบ
ฐานข้อมูลและระบบฐานข้อมูล
ชนิดของฐานข้อมูล
ข้อมูลและโครงสร้างข้อมูล
ข้ อมูล
ข้อมูล (Data) ข้อเท็จจริ งหรื อเหตุการณ์ต่าง ๆ ที่เกิดขึ้นในชีวติ ประจาวัน ซึ่ งอาจเป็ นข้อเท็จจริ งที่
เกี่ยวกับสถานที่ คน สัตว์ สิ่ งของ และอื่น ๆ ซึ่ งคอมพิวเตอร์สามารถจัดเตรี ยม และจัดเก็บข้อมูล ได้แก่
ข้อมูลที่เป็ น ข้อความ , ตัวเลข , รู ปภาพ , เสี ยง , วีดีโอ และอื่น ๆ
ข้ อมูลในคอมพิวเตอร์ แบ่ งออกเป็ น 2 กลุ่ม คือ
 ข้ อมูลทีค่ ำนวณได้ (Numeric) ได้แก่ ข้อมูลที่เป็ นตัวเลข และจะนาไปใช้ในการคานวณ
 ข้ อมูลทีไ่ ม่ นำมำคำนวณ (Character) ได้แก่ ข้อมูลที่เป็ นตัวอักษรหรื อตัวเลข แต่ตวั เลข
นั้นไม่สามารถคานวณได้ เช่น บ้านเลขที่ , รหัสประจาตัว , เลขที่บตั รประจาตัวหมายเลข
ประชาชน , หมายเลขโทรศัพท์
ข้อมูล ทั้ง 2 ประเภทจะถูกเก็บในเครื่ องคอมพิวเตอร์จะอยูใ่ นรู ปแบบของภาษาเครื่ อง หรื อเลข
ฐาน 2 ที่ประกอบด้วยด้วยตัวเลข 2 ตัว คือ 0 กับ 1
บิต (BIT)
จำนวน 8 บิต
=>> 001
=>> 01001010
ก็จะมีจำนวนทั้งหมด
ก็จะมีจำนวนทั้งหมด
3 บิต
1 ไบต์
โครงสร้างข้อมูล
•
•
•
•
•
อักขระ
ฟิ ลด์
เรคคอร์ด
ไฟล์
ฐานข้อมูล
โครงสร้างข้อมูล
• ตัวอักขระ (Character)
คือ ข้อมูลชนิดใด ๆ ที่มีแค่เพียง 1 อักขระเท่านั้น ได้แก่ขอ้ มูลประเภทอักษร ก-ฮ หรือ A-Z
ข้อมูลประเภทตัวเลข 0-9 สัญลักษณ์พิเศษ Special Symbol  หรื อถ้าเป็ นทางตรรกะ
คณิ ตศาสตร์ < , # , $ , @ , % , > , + , - , * , / เป็ นต้น
• ฟิ ลด์ (Field)
คือ เป็ นหน่วยข้อมูลที่ประกอบด้วยอักขระตั้งแต่ 1 อักขระขึ้นไป เพื่อแสดงลักษณะหรื อสื่ อ
ความหมายของข้อเท็จจริ งบางอย่างเช่น วันเกิด,สถานที่ทางานบ้านเลขที่ เป็ นต้น
1.ฟิ ลด์ ตัวเลข (Numeric Field) ประกอบด้วยฟิ ลด์ท้งั จานวนเต็มบวก ลบ และทศนิยม
ฟิ ลด์ที่สามารถคานวณได้เช่น ฟิ ลด์ราคาสิ นค้า , จานวนสิ นค้า เป็ นต้น
2.ฟิ ลด์ อกั ขระ (Character Filed/Alphanumeric Field) ประกอบด้วย ตัวอักษร,ตัวเลข
เช่น ฟิ ลด์ “ชื่อพนักงาน” , “นามสกุล” เป็ นต้น
2.ฟิ ลด์ ตัวอักษร (Alphabetic Field) จะประกอบไปด้วย ตัวอักษร ตัวเลข สัญลักษณ์
พิเศษ ตัวเลขปนตัวอักษรเช่น ฟิ ลด์ ”บ้านเลขที่” , “ที่อยู”่ , “รหัสสิ นค้า” เป็ นต้น
• เรคคอร์ด (Record)
คือ กลุ่มของ Field ที่มีความสัมพันธ์กนั ภายใน คือ 1 เรคคอร์ดจะประกอบด้วย 1 ฟิ ลด์ที่มี
ประเภทเหมือนหรื อแตกต่างกันแต่มีความสัมพันธ์กนั จึงได้นามารวมเป็ น Record เช่น
รหัสพนักงาน
ชื่อพนักงาน
นามสก ุล
อาย ุ
ที่อยู่
1001
1002
AAA
BBB
AAAA
BBBB
23
24
กรุ งเทพ
ชลบุรี
• ไฟล์ (File)
แฟ้ มข้อมูล คือ กลุ่มของ เรคคอร์ด ที่มีความสัมพันธ์กนั มารวมกัน เช่น แฟ้ มข้อมูลของพนักงาน
จะประกอบด้วย Record พนักงานหลาย ๆ คน
โครงสร้ ำงของแฟ้ มข้ อมูลจะประกอบด้ วย
แฟ้มข้อมูล (File)
เรคคอร์ด (Record)
ฟิลด์ (Field)
ไบต์ (Byte)
บิต (Bit)
ฟิลด์ (Field)
ไบต์ (Byte)
บิต (Bit)
เรคคอร์ด (Record)
• ไฟล์ (File)
กลุ่มของแฟ้ มข้อมูลที่มีความสัมพันธ์กนั และถูกนามารวมกัน เช่น ฐานข้อมูลบริ ษทั แห่งหนึ่ง
อาจประกอบไปด้วยหลายแฟ้ มข้อมูลหลายแฟ้ ม ได้แก่ แฟ้ มข้อมูลพนักงาน , แฟ้ มข้อมูลแผนก , และ
แฟ้ มข้อมูลขายสิ นค้า
Character
A D
Field
“First Name” , “Last Name”
Record
รหัสพนักงาน
ชื่อพนักงาน
นามสก ุล
อาย ุ
ที่อยู่
1001
AAA
AAAA
23
กรุ งเทพ
File
รหัสพนักงาน
ชื่อพนักงาน
นามสก ุล
อาย ุ
ที่อยู่
1001
AAA
AAAA
23
กรุ งเทพ
1002
BBB
BBBB
24
ชลบุรี
DATABASE “Employee”
ID.NO
Name
Phone
Age
Address
1001
AAA
AAAA
23
กรุ งเทพ
1002
BBB
BBBB
24
ชลบุรี
Name
Position
AAA
Marketing
BBB
Accounting
Name
History
AAA
1/04/1998
BBB
1/05/1997
แฟ้มข้อมูลและชนิดของข้อมูล
แฟ้ มข้อมูลสามารถจาแนกได้หลายประเภท แต่หากจาแนกตามกลุ่มใหญ่ จะมีอยูด่ ว้ ยกันทั้งหมด
2 ประเภท คือ
1.Program File เป็ นชุดคาสัง่ ที่อยูใ่ นซอฟต์แวร์ภายใน Microsoft Office ที่สาคัญจะมีชื่อว่า Setup.exe
2.Data File เป็ น “แฟ้ มข้อมูล” ภายในแฟ้ มจะเก็บข้อมูลบรรจุไว้ภายใน ซึ่งอาจสร้างด้วยโปรแกรมสาเร็จ
รู ปชนิดใด ๆ ก็ได้ ได้แก่ Ms.Word ได้ File นามสกุลเป็ น .DOC
แฟ้ มข้อมูลที่สามารถนามาใช้ในการปรับปรุ งระบบงานทัว่ ไปแบ่งออกเป็ น 2 ประเภท คือ
 แฟ้มข้ อมูลหลัก (Master File)
 แฟ้มข้ อมูลรำยกำรเปลีย่ นแปลง (Transaction File)
การประมวลผลข้อมูล
เมื่อนาข้อมูลเข้าสู่ระบบคอมพิวเตอร์แล้ว ข้อมูลจะถูกจัดการด้วยวีธีการต่าง ๆ เพื่อให้ได้ผลลัพธ์
ตามที่ตอ้ งการเรี ยกว่า “สารสนเทศ” :ซึ่ งเป็ นประโยชน์ต่อการตัดสิ นใจ
ข้อมูล
(Data )
การประมวลผล
(Processing)
สารสนเทศ
(Information )
การประมวลผลด้วยคอมพิวเตอร์แบ่งออกเป็ น 2 ประเภท ได้แก่
 กำรประมวลผลแบบทันที (Online Processing) เป็ นแบบ Real-time Processing
 กำรประมวลผลแบบสุ่ ม (Batch Processing)
การประมวลผลแบบกลมุ่ VS การประมวลผลแบบทันที
• กำรประมวลผลแบบกลุ่ม (batch processing) -- เก็บข้อมูลไว้ระยะเวลาหนึ่งแล้วจึง
ประมวลผลให้เสร็จในคราวเดียวกัน เช่น กรณี การใช้บตั รเครดิต
Page 350
การประมวลผลแบบกลมุ่ VS การประมวลผลแบบทันที
• กำรประมวลผลแบบทันที (real-time processing) -- เมื่อมีรายการเกิดขึ้นจะทาการ
ประมวลผลทันที ตัวอย่างเช่น การใช้ระบบเอทีเอ็ม
Page 350
การจัดข้อมูลในแฟ้มข้อมูล
การจัดข้อมูลลงในแฟ้ มข้อมูล (File Organization) คือ วิธีการจัดการข้อมูลเพื่อจัดเก็บลงในสื่ อ
ปันทึกข้อมูล โดยทัว่ ไปแบ่งออกเป็ น 3 วิธีได้แก่
 กำรจัดข้ อมูลแบบเรียงลำดับ (Sequential File Organization)
 กำรจัดข้ อมูลแบบโดยตรง (Direct File Organization)
 กำรจัดข้ อมูลแบบเรียงลำดับดัชนี (Index-sequential File Organization)
 กำรจัดข้ อมูลแบบเรียงลำดับ (Sequential File Organization)
Record
Number
1
2
3
4
5
6
7
8
9
10
11
980
981
ID
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
--980
981
STOCK
สิ นค้า A
สิ นค้า B
สิ นค้า C
สิ นค้า D
สิ นค้า E
สิ นค้า F
สิ นค้า G
สิ นค้า H
สิ นค้า I
สิ นค้า J
--สิ นค้า K
สิ นค้า L
Quility
10
5
5
3
12
11
12
40
60
25
--15
10
Price
100
120
115
102
99
90
45
50
60
35
--75
100
 กำรจัดข้ อมูลแบบโดยตรง (Direct File Organization)
Record
Number
1
2
3
4
ID
1001
1002
1003
STOCK
สิ นค้า A
สิ นค้า B
สิ นค้า C
Quility
10
5
5
Price
100
120
115
1005
สิ นค้า E
12
99
1207
สิ นค้า A12
22
125
1009
สิ นค้า I
60
60
--1280
--สิ นค้า M22
--10
--69
5
6
7
8
9
10
11
980
981
 กำรจัดข้ อมูลแบบเรียงลำดับดัชนี (Index- Sequential File Organization)
Index File
Record
Key Field
Number
1001
1
1
1002
2
2
1003
3
3
1004
4
4
1005
5
5
1006
6
6
1007
7
7
1008
8
8
1009
9
9
1010
10
10
---
---
---
980
980
980
981
981
981
Number
ID
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
--980
981
STOCK
สิ นค้า A
สิ นค้า B
สิ นค้า C
สิ นค้า D
สิ นค้า E
สิ นค้า F
สิ นค้า G
สิ นค้า H
สิ นค้า I
สิ นค้า J
--สิ นค้า K
สิ นค้า L
Quility
10
5
2
3
12
11
12
40
60
25
--15
10
Price
100
120
115
102
99
90
45
50
60
35
--75
100
ระบบแฟ้มข้อมูลและปัญหาที่พบบ่อย
ระบบแฟ้ มข้อมูล เกิดขึ้นเนื่องจากในแต่หน่วยงานหรื อองค์กรเก็บข้อมูลจานวนมาก จึงทาให้
มีการจัดทาให้เป็ น “ระบบแฟ้ มข้อมูล” ที่จาแนกเป็ นหน่วยงานได้แก่ จัดซื้อ , หรื อบุคคล เป็ นต้น ซึ่งแต่ละ
แผนกก็จะใช้โปรแกรมเพื่อจัดการข้อมูลที่แตกต่างกัน ดังรู ป
ฝ่ ำยกำรตลำด
โปรแกรม A
แฟ้มข้ อมูลพนักงำนขำย
แฟ้มข้ อมูลลูกค้ำ
ฝ่ ำยกำรตลำด
ฝ่ ำยคลังสินค้ำ
โปรแกรม B
โปรแกรม C
แฟ้มข้ อมูลพนักงำน
แฟ้มข้ อมูลคลังสินค้ำ
 ปัญหำของระบบแฟ้มข้ อมูล
 เกิดควำมซ้ำซ้ อนกันของข้ อมูล (Data Redundancy)
 ควำมไม่ สอดคล้ องกันของข้ อมูล (Data Inconsistency)
 ควำมไม่ สัมพันธ์ กนั ของข้ อมูล (Data Anomaly)
จากปัญหาของระบบแฟ้ มข้อมูลข้างต้น จึงทาให้มีการจัดการข้อมูลในระบบคอมพิวเตอร์ใหม่
เรี ยกกันว่า “ฐานข้อมูล (Database)” เพื่อแก้ปัญหาที่เกิดขึ้นทั้งหมด
ฐานข้อมูลและระบบฐานข้อมูล
ฐานข้อมูล (Database) หมายถึง กลุ่มของแฟ้ มข้อมูลที่มีความสัมพันธ์กนั และถูกนามารวมกัน
โดยมีโครงสร้างเดียวกัน ถูกควบคุม และจัดการโดยซอฟต์แวร์ DBMS เช่น
ฝ่ายบ ุคคล
ฝ่ายคลังสินค้า
ฝ่ายการตลาด
ระบบจัดกำรฐำนข้ อมูล
(DBMS)
ฐานข้อมูล
(Database)
แฟ้มข้อมูลพนักงาน
แฟ้มข้อมูลคลังสินค้า
แฟ้มข้อมูลพนักงานขาย
แฟ้มข้อมูลล ูกค้า
องค์ประกอบของระบบฐานข้อมูล
องค์ ประกอบฐำนข้ อมูลแบ่ งออกเป็ น 4 ส่ วนได้ แก่
 ข้ อมูล (Data) ได้แก่ ข้อมูลทั้งหมดของระบบเก็บไว้ฐานข้อมูลและต้องมีความสัมพันธ์กนั
 ฮำร์ ดแวร์ (Hardware) ได้แก่ เครื่ องคอมพิวเตอร์และอุปกรณ์อื่น ๆ ที่สนับสนุนการทางาน
ของระบบฐานข้อมูล
 ซอฟต์ แวร์ (Software) ได้แก่ ซอฟต์แวร์ระบบจัดการฐานข้อมูล (Database Management System)
 ผู้ใช้ (User) แบ่งออกเป็ น 3 กลุ่มได้แก่
1. โปรแกรมเมอร์
2. End User
3. Database Administrator (DBA)
ข้อดีของการใช้ฐานข้อมูล
การนาระบบฐานข้อมูลเข้ามาใช้งานในองค์กร ส่ วนใหญ่จะเกิดข้อดีมากว่าข้อเสี ย อย่างไร
ก็ตาม ในที่น้ ีจะบอกให้เห็นทั้ง 2 ด้านดังนี้
 ข้ อดี
1. ลดควำมซ้ำซ้ อนของข้ อมูลลงได้
2. หลีกเลีย่ งควำมไม่ สอดคล้ องกันของข้ อมูล
3. กำหนดให้ มีข้อมูลมีรูปแบบเดียวกันได้ เช่ น ข้ อมูลวันที่ สำมำรถกำหนดให้ มีรูปแบบ DD/MM/YY ได้
4. กำหนดระบบควำมปลอดภัยให้ กบั ข้ อมูลได้ ง่ำย
5. รักษำควำมถูกต้ องและควำมน่ ำเชื่อถือให้ กบั ข้ อมูล
6. ควบคุมกำรเข้ ำถึงข้ อมูลจำกผู้ใช้ หลำยคนได้
7. ข้ อมูลเป็ นอิสระจำกโปรแกรมที่ใช้ จัดกำรข้ อมูลนั้น
8. ตอบสนองควำมต้ องกำรใช้ ข้อมูลได้ หลำยรู ปแบบ
9. ลดเวลำพัฒนำโปรแกรมสำหรับเรียกใช้ ข้อมูลจำกฐำนข้ อมูลได้ เนื่องจำกมีซอฟต์ แวร์ DBMS
10. ข้ อมูลที่อยู่ในฐำนข้ อมูล สำมำรถนำมำจัดทำ Report ได้ ง่ำย
 ข้ อเสี ย
1. หำกต้ องกำรระบบฐำนข้ อมูลที่มีประสิ ทธิภำพ จะต้ องอำศัยผู้ออกแบบที่มีควำมชำนวญ
2. ผู้ใช้ งำนจำเป็ นต้ องได้ รับกำรฝึ กอบรมกำรใช้ งำนก่ อน ทำให้ เกิดค่ ำใช้ จ่ำยในส่ วนนี้
3. หำกฐำนข้ อมูลมีปัญหำเกิดขึน้ อำจทำให้ สูญเสี ยข้ อมูลบำงส่ วนไปได้
ระบบจัดการฐานข้อมูล
• ระบบจัดการฐานข้อมูล (database management system –
DBMS) เป็ นซอฟต์แวร์ เฉพาะสาหรับสร้าง ปรับปรุ ง และเข้าถึงข้อมูล
ประกอบด้วย 5 ส่ วน ดังนี้
– เครื่ องมือสร้างระบบจัดการฐานข้อมูล
– การนิยามข้อมูล
– การจัดการข้อมูล
• Query-by-example (QBE)
• ภาษาเชิงสอบถาม (SQL)
– การสร้างโปรแกรมประยุกต์
– การบริ หารฐานข้อมูล
Page 353
ประเภทของฐานข้อมูล
บำงครั้งเรียกว่ ำ แบบจำลองข้ อมูล
(data model) นิยำมกฎและ
มำตรฐำนสำหรับข้ อมูลใน
ฐำนข้ อมูล แบ่ งออกเป็ น 5 แบบ
ดังนี้
– ฐานข้อมูลแบบลาดับชั้น
– ฐานข้อมูลแบบเครื อข่าย
– ฐานข้อมูลแบบเชิงสัมพันธ์
– ฐานข้อมูลแบบหลายมิติ
– ฐานข้อมูลแบบเชิงวัตถุ
Page 354
ชนิดของฐานข้อมูล
• ฐานข้อมูลส่ วนบุคคล
• ฐานข้อมูลขององค์กรหรื อฐานข้อมูลใช้ร่วมกัน
• ฐานข้อมูลชนิดกระจาย
• ฐานข้อมูลชนิดมีเจ้าของเฉพาะ
• ฐานข้อมูลบนเว็บ
Page 360
1.บราวเซอร์จาก Client ร้องข้อเว็บ
เพจ
`
Server
Client
์ เวอร์สง่ Html ที่ได้จาก
2. เว็บเซิรฟ
์ เวอร์คน้ หาตาแหน่งของเว็บเพจที่รอ้ งขอ 4. เว็บเซิรฟ
การ
3. เว็บเซิรฟ
์ เวอร์ประมวลผลโค้ด ASP และแปลง
ประมวลผลไปยังไคลเอนท์
ผลลัพธ์เป็ นเอกสารในรูป Html
สาหรับซอฟต์แวร์ ระบบจัดการฐานข้อมูลชนิดนี้ จะเรี ยกว่า “OODBMS” แต่ฐานข้อมูล
ดังกล่าวยังไม่เป็ นที่แพร่ หลายกันมากนักเท่าฐานข้อมูลเชิงสัมพันธ์มีการผสมผสานแนวคิดเชิง
วัตถุเท่านั้นกับฐานข้อมูลเชิงสัมพันธ์ เรี ยกว่า Object-relational-Database โปรแกรมที่ช่วย
จัดการได้แก่ Oracle , DB2, Sybase
การนาฐานข้อมูลไปใช้
•
ใช้ สำหรับกลยุทธ์
– จัดเก็บลงในฐานข้อมูลชนิ ดพิเศษที่เรี ยกว่า คลังข้อมูล (data
warehouse)
– ใช้เทคนิคเหมืองข้อมูล (data mining) เพื่อค้นหาสารสนเทศที่มี
ความสัมพันธ์กนั
•
ควำมปลอดภัยของสำรสนเทศ
–
–
Page 362
ฐานข้อมูลมีคุณค่า ฐานข้อมูลมีความสาคัญมาก
ป้ องกันไว้ก่อน เพื่อความปลอดภัย
• คลังข้ อมูล (Data Warehouse) & เหมืองข้ อมูล (Data Mining)
คลังข้ อมูล (Data Warehouse) ฐานข้อมูลที่จดั เก็บข้อมูลที่ได้มาจากการสกัดข้อมูล
(Extract) จากฐานข้อมูลอื่นๆ ซึ่ งอาจมีโครงสร้างแตกต่างกันหรื ออยูบ่ นระบบปฏิบตั ิการที่
แตกต่างกันก็ได้ ทั้งนี้เพื่อประโยชน์ในการวิเคราะห์และตัดสิ นใจทางธุรกิจ
เหมืองข้ อมูล (Data Mining) บางครั้งเรี ยกว่า “การค้นพบองค์ความรู้” (Knowledge
Discovery) เป็ นเทคนิคที่ใช้ในการค้นหาข้อมูลเชิงวิเคราะห์ช้ นั สู ง สาหรับใช้จดั การกับข้อมูล
ที่มีอยูใ่ นฐานข้อมูลที่มีอยูเ่ ป็ นจานวนมาก ซึ่ งประกอบไปด้วยการค้นหา แยกแยะกลุ่มข้อมูล
และเลือกแฟ้ มข้อมูลที่มีคุณค่า เป็ นต้น โดยมีวตั ถุประสงค์หลัก เพื่อใช้อธิบายข้อมูลในอดีต
และคาดการณ์ขอ้ มูลในอนาคต
การบริหารจัดการ
ผูใ้ ช้
การบัญชี
การเงิน
คลังข้อมูล
ผูใ้ ช้
การผลิต
การตลาด
ผูใ้ ช้
การขาย
สร ุป
• ข้ อมูลหมายถึง ข้อเท็จจริ งหรื อเหตุการณ์ต่าง ๆ ได้แก่ สถานที่ คน สัตว์ สิ่ งของ อื่นๆ
• ข้ อมูลทีถ่ ูกจัดกำรโดยคอมพิวเตอร์ จะได้ ข้อความ รู ปภาพ เสี ยง วีดีโอ
• ข้ อมูลแบ่ งเป็ น 2 กลุ่มได้แก่ Numeric และ Character
• โครงสร้ ำงข้ อมูลประกอบด้ วย Character, Field, Record, File, Database
• แฟ้มข้ อมูลแบ่ งเป็ น 2 ประเภทได้แก่ Data File, MasterFile
• แฟ้มข้ อมูลแบ่ งออกเป็ น Transaction File,BatchFile
• กำรจัดเก็บมูลแบ่งได้ Sequential File , Direct File,Indexed-Sequential File