Database System--บทที่ 1 ความรู้เบื้องต้นเกี่ยวกับระบบฐานข้อมูล

Download Report

Transcript Database System--บทที่ 1 ความรู้เบื้องต้นเกี่ยวกับระบบฐานข้อมูล

ความรู้เบื ้องต้ นเกี่ยวกับระบบฐานข้ อมูล
Introduction to Database System
1
เนื้อหาบรรยาย
 ความรู้ พื ้นฐานเรื่ องเขตข้ อมูล ระเบียน และแฟ้มข้ อมูล
 ชนิดและคุณสมบัติของหน่วยเก็บข้ อมูลสารองและหน่วยความจาหลัก
 ความจาเป็ นที่ทาให้ เกิดการใช้ งานโดยระบบฐานข้ อมูล
 ฐานข้ อมูลและระบบจัดการฐานข้ อมูล
 ระบบการจัดการฐานข้ อมูล
 ประโยชน์ของระบบจัดการฐานข้ อมูล
 สถาปั ตยกรรมของระบบฐานข้ อมูล
 ภาษาที่ใช้ ในระบบฐานข้ อมูล
 แนวคิดฐานข้ อมูลแบบต่างๆ
2
ความรู้พื ้นฐานเรื่ องเขตข้ อมูล ระเบียนและแฟ้มข้ อมูล
 ความหมายของข้ อมูล / บิต / ไบต์
 เขตข้ อมูล คือ การนาเอาอักขระหลายๆ ตัวรวมกัน โดยมีความหมายอย่างใด
อย่างหนึง่ หรื ออาจเรี ยกอีกอย่างว่า ฟิ ลด์ (Field) แบ่งได้ เป็ น 3 ประเภท



ตัวเลข : จานวนเต็ม ทศนิยม บวก ลบ
ตัวอักษร : อักขระที่เป็ นตัวอักษร หรื อ ช่องว่าง
อักขระ : อักขระที่เป็ นตัวอักษร หรื อ ตัวเลข
 ระเบียน คือ กลุม
่ ของฟิ ลด์ที่สมั พันธ์กนั หรื ออาจเรี ยก อีกอย่างหนึง่ ว่า
เรคอร์ ด (Record) ในแต่ละระเบียนจะมีคีย์ที่อ้างอิงถึงเรี ยกว่า (Key Field)
3
ความรู้พ้นื ฐานเรื่ องเขตข้อมูล ระเบียนและแฟ้ มข้อมูล
 ลาดับโครงสร้างของแฟ้ มข้อมูล
4
ความรู้พ้นื ฐานเรื่ องเขตข้อมูล ระเบียนและแฟ้ มข้อมูล
 ชนิดของข้ อมูล มีหลายรู ปแบบดังนี ้ คือ
1. ข้ อมูลแบบรู ปแบบ (formatted data) เป็ นข้ อมูลที่รวมอักขระเป็ นรูปแบบที่แน่นอน
อาจอยูใ่ นรูปของรหัส ซึง่ ต้ องตีความหมายอีกครัง้
2. ข้ อมูลแบบข้ อความ (Text) เป็ นข้ อมูลที่เป็ นอักขระในแบบข้ อความ โดยไม่มีรูปแบบที่
แน่นอน ความหมายจะอยูใ่ นข้ อความ
3. ข้ อมูลแบบภาพลักษณ์ (Images) เป็ นข้ อมูลที่เป็ นภาพหรื อเป็ นกราฟ
4. ข้ อมูลแบบเสียง (audio) เป็ นข้ อมูลที่เป็ นเสียง ลักษณะของการจัดเก็บก็จะเหมือนกับ
การจัดเก็บข้ อมูลแบบภาพ
5. ข้ อมูลแบบภาพและเสียง (video) เป็ นการจัดเก็บภาพและเสียงไว้ รวมกัน
5
ความรู้พ้นื ฐานเรื่ องเขตข้อมูล ระเบียนและแฟ้ มข้อมูล
 ลักษณะของระบบแฟ้มข้ อมูล


ระเบียนขนาดคงที่ (fixed length record) : โครงสร้ างแบบเดียวกัน ขนาดตัว
อักขระเท่ากันทุกระเบียน
ระเบียนที่มีความยาวแปรได้ (variable length record) : ฟิ ลด์ตา่ งกัน ความ
ยาวต่างกัน
 การจัดการแฟ้มข้ อมูล


การสร้ างแฟ้มข้ อมูล (file creating)
การปรับปรุง รักษาแฟ้มข้ อมูล ( file updating)
6
ความรู้พ้นื ฐานเรื่ องเขตข้อมูล ระเบียนและแฟ้ มข้อมูล
 ประเภทของแฟ้มข้ อมูล
1. แฟ้มข้ อมูลหลัก (Master file)
2. แฟ้มข้ อมูลรายการเปลี่ยนแปลง (Transaction file)
3. แฟ้มข้ อมูลตาราง (Table file)
4. แฟ้มข้ อมูลเรี ยงลาดับ (Sort file)
5. แฟ้มข้ อมูลรายงาน (Report file)
7
ความรู้พ้นื ฐานเรื่ องเขตข้อมูล ระเบียนและแฟ้ มข้อมูล
 การจัดโครงสร้ างแฟ้มข้ อมูล



แบบลาดับ (Sequential file) ข้ อมูลถูกบันทึกอยูใ่ นลาดับที่ติดกัน
จะเรี ยงกันหรื อไม่ก็ได้
แบบลาดับตามดัชนี (Index sequential file) ข้ อมูลถูกบันทึกใน
ลักษณะการเรี ยงลาดับและมีคีย์ฟิลด์เป็ นตัวเข้ าถึงข้ อมูล
แบบสัมพัทธ์ (Relative file) ค่าของข้ อมูลจะมีความสัมพันธ์ กบั
ตาแหน่งของข้ อมูลในหน่วยความจา
8
ชนิดและคุณสมบัตขิ องหน่ วยเก็บข้ อมูลสำรองและหน่ วยควำมจำหลัก
 ชนิดของหน่วยความจาหลัก
 ชนิดของหน่วยความจาสารอง
9
ชนิดและคุณสมบัตขิ องหน่ วยเก็บข้ อมูลสำรองและหน่ วยควำมจำหลัก
 ชนิดของหน่ วยความจาหลัก

แรม RAM
• ไดนามิกแรม (dynamic RAM)
• สแตติกแรม (static RAM)

รอม ROM
• พรอม (Programmable ROM, PROM)
• อีพรอม (Erasable PROM,EPROM)
• อีอีพรอม (Electrically Erasable PROM, EEPROM)
10
ชนิดและคุณสมบัตขิ องหน่ วยเก็บข้ อมูลสำรองและหน่ วยควำมจำหลัก
 ชนิดของหน่ วยความจาสารอง


เข้ าถึงข้ อมูลได้ โดยตรง (direct access หรือ random access)
เช่น จานบันทึกแม่เหล็ก (magnetic disk) , ออพติคลั ดิสก์ (optical
disk) , พีซีเอ็มซีไอเอ (Personal Computer Memory Card
International Association, PCMCIA)
เข้ าถึงข้ อมูลแบบเรียงลาดับ (sequential access) เช่น เทป
แม่เหล็ก (magnetic tape )
11
ความจาเป็ นที่ทาให้เกิดการใช้งานโดยระบบฐานข้อมูล
การประมวลผลกับระบบแฟ้มข้ อมูลยุง่ ยาก
 แฟ้มข้ อมูลไม่มีความเป็ นอิสระของข้ อมูล
 แฟ้มข้ อมูลมีความซ ้าซ้ อนมาก
 แฟ้มข้ อมูลมีความถูกต้ องของข้ อมูลน้ อย
 แฟ้มข้ อมูลมีความปลอดภัยน้ อย
 ไม่มีการควบคุมจากศูนย์กลาง

12
ฐานข้อมูล และระบบจัดการฐานข้อมูล



ความหมายของ ฐานข้ อมูล (database) หมายถึง กลุม่ ของข้ อมูลที่มีการ
เก็บรวบรวมไว้ โดยมีความสัมพันธ์ซงึ่ กันและกัน
การบริหารฐานข้ อมูล DBA (Data Base Administrator) คือ ผู้มีหน้ าที่
ควบคุมการบริหารงานของฐานข้ อมูลทังหมด
้
หน้ าที่ของผู้บริหารฐานข้ อมูล
• กาหนดโครงสร้ างหรื อรูปแบบของฐานข้ อมูล
• กาหนดโครงสร้ างของอุปกรณ์เก็บข้ อมูลละวิธีการเข้ าถึงข้ อมูล
• กาหนดขอบเขตการเข้ าถึงข้ อมูลของผู้ใช้
13
ฐานข้อมูล และระบบจัดการฐานข้อมูล

ความสาคัญของระบบฐานข้ อมูล
• ลดการเก็บข้ อมูลที่ซ ้าซ้ อน
• รักษาความถูกต้ องของข้ อมูล
• การป้องกันและการรักษาความปลอดภัยให้ กบั ข้ อมูล ทาได้ สะดวก
• สามารถใช้ ข้อมูลร่วมกันได้
• มีความเป็ นอิสระของข้ อมูล
• สามารถขยายงานได้ ง่าย
• ทาให้ ข้อมูลบูรณะกลับสูส่ ภาพปกติได้ อย่างรวดเร็ วและมีมาตรฐาน
14
ฐานข้อมูล และระบบจัดการฐานข้อมูล

ระบบการจัดการฐานข้ อมูล (DBMS) เป็ นซอฟต์แวร์ ที่ใช้ จดั การ
ฐานข้ อมูล มีหน้ าที่ดงั นี ้ คือ
• ดูแลการใช้ งานให้ กบั ผู้ใช้ งาน
• ควบคุมระบบความปลอดภัยของข้ อมูล
• ควบคุมการใช้ ข้อมูลในสภาพที่มีผ้ ใู ช้ งานพร้ อมกันหลายคน
15
ประโยชน์ของระบบจัดการฐานข้อมูล





ลดความซ ้าซ้ อนของข้ อมูล
รักษาความถูกต้ องของข้ อมูล
มีความเป็ นอิสระของข้ อมูล
มีความปลอดภัยของข้ อมูลสูง
ใช้ ข้อมูลร่วมกันโดยมีการควบคุมจากศูนย์กลาง
16
สถาปัตยกรรมของระบบฐานข้อมูล
 ระดับของข้ อมูล
 ความเป็ นอิสระของข้ อมูล
 ภาษาที่ใช้ ในระบบของฐานข้ อมูล
17
สถาปัตยกรรมของระบบฐานข้อมูล
 ระดับของข้ อมูล

ระดับชันของระบบจั
้
ดการฐานข้ อมูล มี 4 ระดับ
• ระดับภายนอก (external level) เป็ นระดับสูงสุดผู้ใช้ สามารถมองเห็นได้ ในแต่ละคน
• ระดับหลักการ (conceptual level) เป็ นโครงสร้ างระดับแฟ้มข้ อมูล มองเห็นได้ ตามสิทธิ์
• ระดับภายใน (internal level) เป็ นระดับของความสัมพันธ์ระหว่างแฟ้มข้ อมูล มองเห็นได้ ตาม
สิทธิ์
• ระดับโครงสร้ างที่แท้ จริง (physical organization level) เป็ นระดับที่จดั เก็บข้ อมูลที่แท้ จริ ง
18
สถาปัตยกรรมของระบบฐานข้อมูล
19
สถาปัตยกรรมของระบบฐานข้อมูล
 ความเป็ นอิสระของข้ อมูล



แนวคิดเชิงกายภาพและตรรกะ คือการแก้ ไขโครงสร้ างของแฟ้มโดย
ไม่กระทบกับการเขียนโปรแกรม
การออกแบบฐานข้ อมูล คือการออกแบบเชิงตรรกะ (ออกแบบ
แฟ้มข้ อมูล) และกายภาพ (เก็บข้ อมูลในสื่ออย่างไร)
วิวกับการแปลงรูป คือการออกแบบระดับแนวคิดกับภายในให้ ผ้ ใู ช้
ใช้ งานได้ สะดวกโดยไม่จาเป็ นต้ องทราบว่าข้ อมูลเก็บไว้ อย่างไร
20
สถาปัตยกรรมของระบบฐานข้อมูล
 ภาษาที่ใช้ ในระบบของฐานข้ อมูล



ภาษานิยามข้ อมูล (Data Definition Language : DDL) เป็ นภาษาที่ใช้ ในการ
กาหนด Schema เช่น Create เป็ นต้ น
ภาษาจัดการข้ อมูล (Data Manipulation Language : DML) เป็ นภาษาที่ใช้
ในการจัดการข้ อมูลภายในระบบฐานข้ อมูล เช่น Select เป็ นต้ น
ภาษาที่ใช้ ในการควบคุมข้ อมูล (Data Control Language : DCL) เป็ น
ภาษาที่ใช้ ในการควบคุมความถูกต้ องและความปลอดภัยของข้ อมูล เช่น Grant
/ Revoke เป็ นต้ น
21
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบลาดับชัน้ (Hierarchical Data Model)
 ฐานข้ อมูลแบบเครื อข่าย (Network Data Model)
 ฐานข้ อมูลแบบสัมพันธ์ (Relational Data Model)
 ฐานข้ อมูลแบบกระจาย (Distributed Data Model)
22
แนวคิดฐานข้อมูลแบบต่างๆ

ฐานข้ อมูลแบบลาดับชัน้ (Hierarchical Data
Model)

โครงสร้ างของฐานข้ อมูลเป็ นความสัมพันธ์แบบพ่อลูก
• พ่อ (parent) 1 คน มีลกู (Child) ได้ หลายคน [1 ต่อ n ]


เรคอร์ ดพ่อมีเรคอร์ ดลูกได้ หลายเรคอร์ ด แต่เรคอร์ ดลูก
มีเรคอร์ ดพ่อได้ เรคอร์ ดเดียว
ตัวอย่างของภาษาปฏิบตั ิการ คือ IMS/VS
23
แนวคิดฐานข้อมูลแบบต่างๆ
William
John
รหัสสินค้ า
A1
A2
A3
A2
A3
B1
ชื่อสินค้ า
ตะปู
ปูน
สี
ปูน
สี
จอบ
ปริมาณ
250
15
150
100
50
10
24
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบลาดับชัน้ (Hierarchical Data Model)

ลักษณะเด่น
•
•
•
•
•
เป็ นระบบฐานข้ อมูลทีม่ ีโครงสร้ างซับซ้ อนน้ อยที่สดุ
มีคา่ ใช้ จ่ายในการจัดสร้ างฐานข้ อมูลน้ อย
ลักษณะโครงสร้ างเข้ าใจง่าย
เหมาะสาหรับงานที่ต้องการค้ นหาข้ อมูลแบบมีเงื่อนไขเป็ นลาดับ
ป้องกันระบบความลับของข้ อมูลได้ ดี เพราะต้ องอ่านแฟ้มที่เป็ นต้ น
กาเนิดก่อน
25
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบลาดับชัน้ (Hierarchical Data Model)

ข้ อจากัด
• มีโอกาสเกิดความซ ้าซ้ อนมากที่สดุ
• ขาดความสัมพันธ์ระหว่างแฟ้ มข้ อมูลในรูปของเครื อข่าย
• มีความคล่องตัวน้ อยกว่า เพราะต้ องอ่านแฟ้มที่เป็ นต้ นกาเนิดก่อน
26
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบเครื อข่าย (Network Data
Model)

โครงสร้ างของข้ อมูลมีความสัมพันธ์แบบร่ างแห
• ความสัมพันธ์ของลูกจ้ างกับงานที่ทา โดยงานชิ ้นหนึ่งอาจทา
โดยลูกจ้ างหลายคน [m ต่อ n ]

ตัวอย่างของภาษาปฏิบตั ิการ คือ IDMS
27
แนวคิดฐานข้อมูลแบบต่างๆ
William
John
รหัสสิ นค้ ำ
A1
A2
A3
B1
ชื่อสิ นค้ ำ
ตะปู
ปูน
สี
จอบ
ปริมำณ
250
115
200
10
28
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบเครื อข่าย (Network Data Model)

ลักษณะเด่น
• เหมาะสาหรับงานที่แฟ้ มข้ อมูลมีความสัมพันธ์แบบเครื อข่าย
• มีโอกาสเกิดความซ ้าซ้ อนของข้ อมูลน้ อยกว่าแบบลาดับชัน้
• การค้ นหาข้ อมูลมีเงื่อนไขได้ มากและกว้ างกว่าแบบลาดับชัน้

ข้ อจากัด
• ป้องกันความลับของข้ อมูลได้ ยาก
• มีคา่ ใช้ จ่ายและสิ ้นเปลืองมากกว่า
• ถ้ าความสัมพันธ์มีมากเกินไป จะทาให้ ออกแบบฐานข้ อมูลมีความยุ่งยาก
ซับซ้ อน
29
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบสัมพันธ์ (Relational
Data Model)


โครงสร้ างของฐานข้ อมูลอยู่ในรูปของรี เลชัน
หรื อ ตาราง ประกอบด้ วยแถว (Tuple) และ
สดมภ์ (Attribute)
การควบคุมความถูกต้ อง
•
•
•
•

Tuple มีข้อมูลไม่ซ ้ากัน
Tuple ไม่มีลาดับจากบนลงล่าง
Attribute ไม่มีลาดับจากซ้ ายไปขวา
ค่าของ Attribute ทุกค่าจะต้ องเป็ น
atomicity
ตัวอย่างของภาษาปฏิบตั ิการ คือ SQL
30
แนวคิดฐานข้อมูลแบบต่างๆ
Customer
Cust_ID Cust_Name
001 William
002 John
Product
Prod_ID
A1
A2
A3
B1
Prod_Name
ตะปู
ปูน
สี
จอบ
Order
Cust_ID Prod_ID Quantity
001
001
001
002
002
002
A1
A2
A3
A2
A3
B1
250
15
150
100
50
10
31
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบสัมพันธ์ (Relational Data Model)

ลักษณะเด่น
• เหมาะสาหรับงานเลือกดูข้อมูลแบบหลายฟิ ลด์ข้อมูล
• ป้องกันข้ อมูลถูกทาลายหรื อแก้ ไขได้ ดี
• การเลือกดูข้อมูลทาได้ ง่าย

ข้ อจากัด
• แก้ ไขปรับปรุงข้ อมูลทาได้ ยาก
• มีคา่ ใช้ จ่ายของระบบสูงมาก
32
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบกระจาย (Distributed Data Model)

องค์ประกอบของระบบฐานข้ อมูลแบบกระจาย
1. ความเหมือนและความแตกต่างกันของระบบฐานข้ อมูลที่ใช้ อยู่
ในเครื่ อง
2. ความเป็ นอิสระของการใช้ ข้อมูลในแต่ละแห่ง คือการใช้ ภายใน
และการใช้ ภายนอก
3. ระดับของมองผ่านการกระจาย ขึ ้นอยูก่ บั ความจาเป็ นของผู้ใช้
อยูใ่ นระดับใด
33
แนวคิดฐานข้อมูลแบบต่างๆ
34
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบกระจาย (Distributed Data Model)

ผลดี
1. ความสามารถในการควบคุมการใช้ ข้อมูลแบบภายใน การควบคุมการใช้
ทาได้ ง่าย
2. ความสะดวกในการขยายขนาดของระบบ สามารถขยายระบบได้ ง่าย
3. ความพร้ อมของระบบคอมพิวเตอร์ ปั ญหาที่เกิดจะเกิด ณ จุดเครื่ องของ
ผู้ใช้ ไม่กระทบส่วนกลาง
4. ประสิทธิภาพที่สงู ขึ ้น มีลกั ษณะการใช้ งานจริง เพิ่มความรวดเร็ว
35
แนวคิดฐานข้อมูลแบบต่างๆ
 ฐานข้ อมูลแบบกระจาย (Distributed Data Model)

ผลเสีย
1. การแก้ ไขข้ อมูลที่เก็บซ ้ากัน ต้ องคอยแก้ ไขตามจุดของเครื่ องต่าง ๆ
2. ความซับซ้ อนในการประมวลผลการเรี ยกใช้ ข้อมูล การใช้ คาสัง่
ยุง่ ยาก ล่าช้ า
3. ความซับซ้ อนในการควบคุมภาวะพร้ อมกัน การขอใช้ และแก้ ไขมี
ขันตอนมาก
้
ยุง่ ยาก เสียเวลา
4. ความซับซ้ อนในการฟื น้ สภาพ เมื่อมีการเปลี่ยนแปลงข้ อมูล
จาเป็ นต้ องแก้ ไขข้ อมูลตามจุดต่าง ๆ
5. ความยุง่ ยากในการดูแลจัดการพจนานุกรมข้ อมูล
36