ระบบการประมวลผลไฟล์แบบดั้งเดิม

Download Report

Transcript ระบบการประมวลผลไฟล์แบบดั้งเดิม

บทที่ 1
ความรู้ พนื้ ฐานเกีย่ วกับระบบฐานข้ อมูล
อ. ดร. ชุรี เตชะวุฒิ
CS (204)321
ระบบฐานข้อมูล 1 (Database System I)
เนือ้ หา
1)
2)
3)
4)
บทนา
นิยามคาศัพท์
ระบบการประมวลผลไฟล์แบบดั้งเดิม (Traditional file processing system)
ปัญหาของการประมวลผลไฟล์
บทนา
 ปั จจุบนั การประมวลผลข้อมูลทางธุรกิจได้ใช้คอมพิวเตอร์ ในการประมวลผล โดยพัฒนา
ระบบประมวลผลไฟล์มาเป็ นระบบฐานข้อมูล
บทนา
 ตัวอย่างระบบที่ประยุกต์ใช้งานฐานข้อมูล
ได้แก่ ระบบการถอนเงินจากธนาคาร
- ธนาคารจะบันทึกข้อมูลของลูกค้าและ
รายละเอียดเกี่ยวกับบัญชีประเภทต่างๆของ
ลูกค้าไว้ในฐานข้อมูล
- เมื่อลูกค้าถอนเงินผ่านเครื่ อง ATM
โปรแกรมประยุกต์จะเรี ยกดูขอ้ มูลลูกค้าจาก
ฐานข้อมูล เพื่อตรวจสอบว่าลูกค้ามีเงินใน
บัญชีเพียงพอต่อการถอนหรื อไม่
- หลังจากที่ลกู ค้ายืนยันการถอนเงิน
โปรแกรมประยุกต์จะบันทึกรายการถอน
เงินและปรับปรุ งข้อมูลของบัญชีลกู ค้าใน
ฐานข้อมูล
บทนา
ฐานข้อมูลส่ วนใหญ่
• ข้อความ (Text)
• ตัวเลข (Numeric)
• ได้แก่ ฐานข้อมูลประชากรไทย
และ ฐานข้อมูลกรมการขนส่ งที่เก็บ
การจดทะเบียนรถยนต์
ฐานข้อมูลสื่ อประสม
•
•
•
•
•
•
•
ข้อความ (Text)
ตัวเลข (Numeric)
รู ปภาพ (Image)
ภาพเคลื่อนไหว (Video)
เสี ยง (Sound)
ได้แก่ สารสนเทศภูมิศาสตร์ (GIS)
คลังข้อมูลเพื่อการบริ หาร (Data
warehouse)
บทนา
 การใช้ประโยชน์จากฐานข้อมูลจะต้องเข้าใจ
- หลักการของฐานข้อมูล
- วิธีการจัดระเบียบข้อมูล
- วิธีการออกแบบข้อมูล
- การใช้ภาษาสอบถามข้อมูล (Query language)
คาศัพท์ พนื้ ฐาน
ฐานข้ อมูล (Database)
การรวบรวมข้อมูลอย่างเป็ นระเบียบของข้อมูล ที่มีความสัมพันธ์เชิงตรรกะต่อกัน
เช่น ฐานข้อมูลของมหาวิทยาลัย ที่บนั ทึกข้อมูลนักศึกษา ข้อมูลอาจารย์ ข้อมูลกระบวน
วิชา ข้อมูลการลงทะเบียนเรี ยน ข้อมูลผลการเรี ยนของนักศึกษา เป็ นต้น
ข้ อมูล (Data)
ข้อเท็จจริ ง (Fact) ซึ่ งอาจอยูใ่ นรู ปของข้อความ รู ปภาพ กราฟิ ก เสี ยง หรื อ
ภาพเคลื่อนไหวที่แสดงถึงลักษณะ สถานภาพหรื อเหตุการณ์ต่างๆที่มีความหมายเฉพาะตัว
ยังไม่มีการนาไปวิเคราะห์หรื อประมวลผล สามารถบันทึกและเก็บลงสื่ อคอมพิวเตอร์ได้
สารสนเทศ (Information)
ข้อมูลที่ผา่ นกระบวนการจัดการ ประมวลผลหรื อวิเคราะห์ให้อยูใ่ นรู ปที่มีความหาย หรื อมี
คุณค่าเพิ่มต่อผูใ้ ช้
คาศัพท์ พนื้ ฐาน
ข้ อมูลของข้ อมูล (Metadata)
ข้อมูลที่อธิบายคุณสมบัติหรื อลักษณะของข้อมูล ช่วยให้ผใู ้ ช้รู้วา่ มีขอ้ มูลใดอยูใ่ นฐานข้อมูล
แบบชนิดข้อมูล (Data type) เงื่อนไข ข้อจากัด และความหมายของข้อมูลแต่ละตัว ข้อมูล
เกี่ยวกับผูม้ ีสิทธิ และเส้นทางการเข้าถึงข้อมูล
บางครั้งเรี ยกว่า พจนานุกรมข้อมูล (Data Dictionary) ในระบบฐานข้อมูล
ตัวอย่ าง ข้ อมูลของข้ อมูล
ชื่อข้ อมูล
code
name
mobile
แบบชนิดข้ อมูล
ความยาว
ตัวเลขจานวนเต็ม 9 หลัก
ตัวอักษร
ไม่เกิน 20 ตัว
ตัวอักษร
10 หลัก
ความหมาย
รหัสนักศึกษา
ชื่อนักศึกษา
เบอร์โทรศัพท์มือถือ
คาศัพท์ พนื้ ฐาน
ระบบจัดการฐานข้ อมูล (Database Management System : DBMS)
ชุดของโปรแกรมที่ช่วยในการสร้างและบารุ งรักษาฐานข้อมูล โดยโปรแกรมจะช่วยอานวย
ความสะดวกดังนี้
- การนิยามฐานข้อมูล (Define a database)
- การสร้างฐานข้อมูล (Construct database)
- การจัดดาเนินการฐานข้อมูล (Manipulate database)
ระบบการประมวลผลไฟล์ แบบดั้งเดิม
วัตถุประสงค์ ของการเรียนรู้ เรื่อง ระบบการประมวลผลไฟล์ แบบดั้งเดิม คือ
- เพื่อให้นกั ศึกษาเรี ยนรู ้เรื่ องการประมวลผลไฟล์เป็ นพื้นฐานก่อนเข้าสู่ เรื่ อง
ระบบฐานข้อมูล
- เพื่อให้นกั ศึกษาทราบถึงปั ญหาหรื อข้อจากัดที่เกิดขึ้นของการจัดการข้อมูลใน
อดีต
- เพื่อให้นกั ศึกษาระมัดระวังและหลีกเลี่ยงปัญหาเดิม เมื่อนักศึกษาออกแบบ
ฐานข้อมูล
- เพื่อให้นกั ศึกษาสามารถแปลงข้อมูลจากระบบไฟล์เดิมไปเป็ นระบบฐานข้อมูล
ระบบการประมวลผลไฟล์ แบบดั้งเดิม
 การออกแบบระบบเน้นที่กลุ่มผูใ้ ช้วา่ ต้องการกระบวนการ (Process) ประมวลผลอะไร
 เน้นการสร้างโปรแกรมสาหรับการประยุกต์เฉพาะด้าน สาหรับแผนกหรื อกลุ่มผูใ้ ช้
ระบบการประมวลผลไฟล์ แบบดั้งเดิม
ระบบการประมวลผลไฟล์ ประกอบด้วย
เขตข้อมูล (Field)
• กลุ่มของตัวอักขระตั้งแต่หนึ่งตัวขึ้นไปมาเขียนเรี ยงกัน เพื่อสื่ อความหมายอย่างใด
อย่างหนึ่ง เช่น รหัสและชื่อของนักศึกษา เป็ นต้น
ระเบียน (Record)
• กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กนั มารวมกันเพื่อแสดงถึงสิ่ งหนึ่งๆ เช่น
ระเบียนข้อมูลนักศึกษา 1 คนประกอบด้วย เขตข้อมูล รหัสนักศึกษา ชื่อ คณะ และ
GPA เป็ นต้น
ไฟล์ (File)
• การรวบรวมระเบียนที่สัมพันธ์กนั ตั้งแต่ 1 ระเบียนขึ้นไป เช่น ไฟล์นกั ศึกษาของสานัก
ทะเบียน จะประกอบด้วย ระเบียนนักศึกษาหลายระเบียน
ระบบการประมวลผลไฟล์ แบบดั้งเดิม
Traditional file processing
File
User 1
User 2
Grading Office
Accounting Office
Student grades
Print student transcript and enter
new grades into the file.
Student fees
File
Keep track of student fees and
payments.
 This redundancy in defining and storing data results in wasted storage
space and in redundant efforts to maintain common data up-to-date.
ระบบการประมวลผลไฟล์ แบบดั้งเดิม
 การพัฒนาโปรแกรมสามารถใช้ภาษาในการเขียนโปรแกรมได้หลายภาษา
 ยกตัวอย่าง ที่ฝ่ายทะเบียน (Grading office) และฝ่ ายบัญชีการเงิน (Accounting
office) มีการใช้ภาษาซี ซึ่ งไฟล์ขอ
้ มูลอาจถูกนิยามในโปรแกรมได้แตกต่างกัน เช่น
ฝ่ ายทะเบียน
struct student{
char
char
char
int
float
student_code[9];
student_name[30];
birthday[10];
faculty;
gpa; }
ฝ่ ายบัญชีการเงิน
struct std{
char
char
char
char
float
std_code[10];
std_name[40];
faculty[16];
datePaid[11];
amountPaid; }
ปัญหาของการประมวลผลไฟล์
 ความซ้าซ้ อนของข้ อมูล (Duplication of data)
ข้อมูลเดียวกันถูกบันทึกในทั้งฝ่ ายทะเบียนและฝ่ ายบัญชีการเงิน ซึ่ งก่อให้เกิด
- การเสี ยเนื้อที่ในหน่วยความจา
- เสี ยเวลาและต้นทุนสู ง เพราะต้องบันทึกข้อมูลเดียวกันหลายครั้งและหลายแห่ ง
- สูญเสี ยความคงสภาพของข้อมูล (Data integrity) และทาให้ขอ้ มูลเกิดการ
ขัดแย้งกัน (Data inconsistency)
 ข้ อจากัดของการใช้ งานร่ วมกัน (Limited data sharing)
ต่างฝ่ ายต่างนิยามไฟล์ในโปรแกรมของตัวเองและบันทึกข้อมูลแยกกัน ทาให้ใช้ขอ้ มูล
ร่ วมกันยาก หากนิยามไฟล์ดว้ ยภาษาโปรแกรมที่ต่างกันอาจต้องแปลงข้อมูลให้อยูใ่ น
รู ปแบบเดียวกันก่อน
ปัญหาของการประมวลผลไฟล์
 ความไม่ เป็ นอิสระของโปรแกรมและข้ อมูล (Program-data dependence)
ข้อมูลจะถูกนามาใช้งานได้กต็ ่อเมื่อโปรแกรมเรี ยกใช้ขอ้ มูลที่ถกู นิยามไว้แล้วในโปรแกรม
เท่านั้น เช่น หากมี 10 โปรแกรมเรี ยกใช้ขอ้ มูลนักศึกษาและต้องการเปลี่ยนแปลงขนาดของ
ข้อมูลชื่อนักศึกษา จะต้องตามไปแก้ไขจนครบทั้ง 10 โปรแกรมด้วย
 ความไม่ ยดื หยุ่นและผลิตภาพต่า (Inflexibility and low productivity)
เมื่อต้องการพัฒนาโปรแกรมประยุกต์ใหม่ โปรแกรมเมอร์ จะเริ่ มโดยออกแบบโครงสร้าง
ไฟล์ใหม่สาหรับโปรแกรม แม้วา่ จะมีขอ้ มูลนั้นแล้วอยูใ่ นหน่วยงาน ทาให้ขอ้ มูลซ้ าซ้อน
กับข้อมูลเดิมและต้องนาเข้าข้อมูลใหม่อีกครั้งหนึ่ ง
 การบารุ งรักษา (Maintenance)
เมื่อไฟล์ขอ้ มูลและโปรแกรมประยุกต์มีจานนวนมากขึ้น การบารุ งรักษาข้อมูลให้ถูกต้อง
ตรงกันทาได้ยากและใช้เวลา