ภาพนิ่ง 1

Download Report

Transcript ภาพนิ่ง 1

บทที่ 2
การประมวลผลข้ อมูล (Data Processing)
204101 Introduction to Computer
1
การประมวลผล (Processing)
 การดาเนินการกับข้ อมูลดิบ (Raw Data) เพือ่ ให้ ได้
ข้ อมูลสารสนเทศ (Information)
204101 Introduction to Computer
2
ข้ อมูลดิบ
 ข้ อมูลทีร่ วบรวมมาจากแหล่ งข้ อมูลต่ าง ๆ
 ตัวเลข ตัวอักษร รู ปภาพ เสี ยง อุณหภูมิ ความเร็ว
 คะแนนสอบของนักศึกษา 1 กลุ่ม
204101 Introduction to Computer
3
ข้ อมูลสารสนเทศ
 ข้ อมูลทีผ
่ ่ านการประมวลผลแล้ ว สามารถนาไปใช้
ประโยชน์ ได้
 ค่ าเฉลีย่ คะแนนสอบของนักศึกษา 1 กลุ่ม
204101 Introduction to Computer
4
ประเภทของการประมวลผล
 การประมวลผลด้ วยมือ (Manual Data Processing)
 การประมวลผลอัตโนมัติ (Automatic Data
Processing)
 Online Processing
 Batch Processing
204101 Introduction to Computer
5
Online Processing
 Real-time Processing คือการประมวลผลทีไ่ ด้ ผลลัพธ์ ทันที
เช่ น ระบบสารองทีน่ ั่งในเครื่องบิน ฝาก/ถอนATM
 เป็ นการประมวลผลแบบโดยตรงหรือสุ่ ม (Random) คือ เมื่อ
เกิด 1 ระเบียน(Transaction) ก็เข้ าสู่ การประมวลผลเลย
 มักเป็ นการประมวลผลแบบ Time Sharing คือมีผ้ ูใช้ เข้ าสู่
ระบบประมวลผลมากกว่ า 1 คนในขณะเดียวกัน
 ใช้ สื่อทีม
่ กี ารเข้ าถึงแบบโดยตรง เช่ น ฮาร์ ดดิสก์
204101 Introduction to Computer
6
Online Processing (ต่ อ)
 ข้ อมูลทีใ่ ช้ ประมวลผลทันต่ อเหตุการณ์ เป็ นปัจจุบัน
(Up to date)
 สามารถทารายงานได้ ทน
ั ที ได้ ผลลัพธ์ ทเี่ ป็ นปัจจุบัน
 จากการทางานทีก่ ล่ าวมา จึงต้ องมี I/O Device ทีต
่ ้ อง
เชื่อมต่ อกับ CPU ตลอดเวลา (Online)
204101 Introduction to Computer
7
Batch Processing
 ไฟล์ หลัก (Master Files)
 ไฟล์ รายการข้ อมูลสิ นค้ า
 ไฟล์ รายการเปลีย่ นแปลง (Transaction Files)
 รายการขายสิ นค้ า
 รายการซื้อสิ นค้ า
204101 Introduction to Computer
8
Batch Processing (ต่ อ)
 ประมวลผลตามรายการเปลีย่ นแปลงทีร่ วบรวมเป็ นชุ ด
(Batch) แล้ วประมวลผลตามคาบเวลาทีละรายการตั้งแต่
ระเบียนแรกจนหมด batch นั้นๆ
 ประมวลผลตามคาบเวลา(period of time) ทุกวัน/ทุกเดือน
 เป็ นการประมวลผลแบบลาดับ (Sequential)
 สามารถใช้ สื่อทีม
่ กี ารเข้ าถึงข้ อมูลเป็ นแบบลาดับได้ เช่ น
เทปแม่ เหล็ก จึงทาให้ มคี ่ าใช้ จ่ายต่า
204101 Introduction to Computer
9
Batch Processing (ต่ อ)
 มีการจัดเก็บระเบียนข้ อมูลเพือ่ รอการประมวลผลตามคาบ
เวลา จึงเกิดภาวะข้ อมูลไม่ ทนั ต่ อเหตุการณ์ (ไม่ Update)เช่ น
เก็บข้ อมูลขอ drop-add แล้ วประมวลผลพร้ อมกันภายหลัง
 รายงานหรือผลลัพธ์ ทไี่ ด้ ล่าช้ าไม่ ทน
ั ต่ อเหตุการณ์ (Past
information) เช่ นรายงานยอดขายสิ้นค้ าเมือ่ สิ้นเดือนที่แล้ ว
 จากการประมวลผลทีก่ ล่ าวมา I/O Device จึงไม่ จาเป็ นต้ อง
เชื่อมต่ อกับ CPU ตลอดเวลา
204101 Introduction to Computer
10
การประมวลผลด้ วยคอมพิวเตอร์
 การเก็บข้ อมูล (Data Collection)
 การประมวลผลข้ อมูล (Data Processing)
 ผลลัพธ์ (Output / Information)
204101 Introduction to Computer
11
การเก็บข้ อมูล
 วิธีการเก็บข้ อมูล
 ลักษณะของข้ อมูลทีด
่ ี
 การเข้ ารหัสข้ อมูล
 การตรวจสอบความถูกต้ องของข้ อมูล
 การเก็บข้ อมูลในสื่ อบันทึกข้ อมูล
204101 Introduction to Computer
12
วิธีการเก็บข้ อมูล
 สั งเกต (Observation)
 วัดค่ า (Measurement)
 เอกสาร (Document)
 สั มภาษณ์ (Interview)
204101 Introduction to Computer
13
วิธีการเก็บข้ อมูล
 แบบสอบถาม (Questionnaire)
 Manual
 Internet
204101 Introduction to Computer
14
แบบสอบถาม
204101 Introduction to Computer
15
ลักษณะของข้ อมูลทีด่ ี
 ถูกต้ อง (Accuracy)
 ปัจจุบัน (Updated)
 สมบูรณ์ (Completeness)
204101 Introduction to Computer
16
การเข้ ารหัสข้ อมูล
 ประหยัดเนือ้ ทีใ่ นการเก็บข้ อมูล เพราะเก็บรหัสแทนข้ อมูล
 มีความเร็วในการค้ นหาข้ อมูลชนิดรหัสสู งกว่ าข้ อมูลเดิม
 ใช้ ตวั เลข หรืออักขระ เป็ นรหัสแทนข้ อมูล
 ข้ อมูลทีจ่ ะเข้ ารหัสได้ ต้องถูกจัดในกลุ่มทีร่ ้ ู จานวน เช่ น
ข้ อมูลเพศมี 2 กลุ่ม คือ ญ/ช จะใช้ ตัวอักขระ 1 ตัวแทน
ข้ อมูล หรือข้ อมูลคณะของ ม.ช.ทีม่ มี ากกว่ า 10 คณะ จะ
ใช้ อกั ขระตัวเลข 2 หลักแทน (รหัส 00-99 มีถึง 100 รหัส)
204101 Introduction to Computer
17
การเข้ ารหัสข้ อมูล
นาย
สมชาย
คนไทย
เชียงใหม่
12,000 บาท
M
สมชาย
คนไทย
053
2
204101 Introduction to Computer
18
การตรวจสอบความถูกต้ องของข้ อมูล
 Edit/ Update
การแก้ ไข/ปรับปรุง:เพิม่ ลบ เปลีย่ นแปลง
 Verify
การทวนสอบขั้นตอนการนาเข้ าข้ อมูล
 Validation ความถูกต้ องอย่ างสมเหตุสมผลของข้ อมูล
 Range Check เป็ นการเช็ คที่เกีย
่ วข้ องกับข้ อมูล 1 field เช่ น field
คาตอบ มีข้อมูลคาตอบแบบสอบถาม 4 ตัวเลือก ข้ อมูล ที่เป็ น
คาตอบ ต้ องเป็ น ก-ง เท่ านั้น
 Relation Check เป็ นการเช็ คข้ อมูลที่สัมพันธ์ กน
ั 2 field เช่ น ข้ อมูล
เงินเดือนตาแหน่ ง programmer ของบริษทั ก ไม่ ต่ากว่ า 10,000.บาท หรือข้ อมูล คานาหน้ าชื่อ นาย ต้ องมีข้อมูล เพศเป็ น ชาย
204101 Introduction to Computer
19
การเก็บข้ อมูลในสื่ อบันทึกข้ อมูล
 ข้ อมูลจริง หมายถึงข้ อมูลทีเ่ กิดขึน
้ จริง จากการทางาน
 การเปลีย่ นสื่ อบันทึกข้ อมูล หมายถึงการนาข้ อมูลจริงบันทึก
ลงสื่ อคอมพิวเตอร์ ทเี่ หมาะสมเพือ่ การประมวลผลข้ อมูล
ต่ อไป หรือการนาข้ อมูลไปบันทึกยังสื่ ออืน่ เช่ น การสารอง
ข้ อมูล (Back up)
 ข้ อมูลในสื่ อบันทึกข้ อมูล หมายถึงการนาข้ อมูลจริงบันทึก
ลงในสื่ อคอมพิวเตอร์ ตามหลักการหรือวิธีการของ file หรือ
ฐานข้ อมูล (Database)
204101 Introduction to Computer
20
ข้ อมูลจริง
ชื่อ
นายสมชาย คนไทย
นางสาวแพร มีบุญ
นางศศิวมิ ล คนดี
...
204101 Introduction to Computer
แผนก
ชั่วโมง
คอมพิวเตอร์ 12
บัญชี
20
ประชาสั มพันธ์
5
...
...
อัตรา
60
50
80
...
21
ข้ อมูลในสื่ อบันทึกข้ อมูล
M สมชาย คนไทย
N แพร มีบุญ
O ศศิวมิ ล คนดี
...
1
2
3
...
ระเบียน (Record)
12
20
5
...
60
50
80
...
ค่ าแอททริบิวต์
(Attribute)
204101 Introduction to Computer
22
การประมวลผลข้ อมูล
 คานวณ (Calculating)
 ปรับปรุ ง (Updating)
 รายงาน
(Reporting) / เอกสาร (Document)
 สรุ ป (Summarizing)
204101 Introduction to Computer
23
การประมวลผลข้ อมูล
 เรียงลาดับ (Sorting)
 ค้ นหา (Searching)
 แบ่ งกลุ่ม (Grouping)
 แบ่ งประเภท (Classification)
204101 Introduction to Computer
24
คานวณ
 นากลุ่มของค่ าแอททริบิวต์ ทม
ี่ อี ยู่/จัดเก็บ มา
คานวณหาค่ าต่ างๆ ตามทีต่ ้ องการ
 หาค่ าเฉลีย่ (Mean)
 หาค่ ามัธยฐาน (Median)
 หาค่ าฐานนิยม (Mode)
204101 Introduction to Computer
25
ปรับปรุง(Update)
 นาค่ าแอททริบิวต์ ทม
ี่ อี ยู่มาคานวณ แล้ วแทนที่
 การปรับค่ าอัตราเงินเดือนของพนักงานขึน
้ จากเดิมอีก
20 %
 การปรับค่ าเงินสุ ทธิของบัญชีธนาคารของลูกค้ าแต่ ละ
บัญชี ด้ วยการนาค่ าสุ ทธิเดิม – จานวนเงินที่ถอนวันนี้
หรือ +จานวนเงินที่ฝากวันนี้
204101 Introduction to Computer
26
รายงาน
ชื่อ
นายสมชาย คนไทย
นางสาวแพร มีบุญ
นางศศิวมิ ล คนดี
...
204101 Introduction to Computer
แผนก
คอมพิวเตอร์
บัญชี
ประชาสั มพันธ์
...
อัตรา
60
50
80
...
ชั่วโมง ค่ าจ้ าง
12
720
20
1,000
5
400
...
...
27
สรุปผล
ชื่อ
นายสมชาย คนไทย
นางสาวแพร มีบุญ
นางศศิวมิ ล คนดี
...
204101 Introduction to Computer
แผนก
คอมพิวเตอร์
บัญชี
ประชาสั มพันธ์
...
อัตรา
60
50
80
...
ชั่วโมง ค่ าจ้ าง
12
720
20 1,000
5
400
...
...
72 5,140
28
สรุปผล (ต่ อ)
แผนก
คอมพิวเตอร์
บัญชี
ประชาสั มพันธ์
204101 Introduction to Computer
อัตรา
60
50
80
ชั่วโมง ค่ าจ้ าง
22 1,320
33 1,650
15 1,200
70 4,170
29
เรียงลาดับ
 ตัวเลข
เช่ น คะแนนสอบ
 ข้ อความ เช่ น ชื่อตามอักขระ ก ข ค
 รหัส
เช่ น รหัสสิ นค้ า
204101 Introduction to Computer
30
ค้ นหา
 ค้ นหาระเบียนที่ต้องการจากเงือ่ นไขที่กาหนด
 ค้ นหานักเรียนที่ GPA < 1.75
 ค้ นหาพนักงานที่ เงินเดือน  5,000 หรือ อยู่ฝ่ายบัญชี
 ค้ นหาสิ นค้ าที่ ราคา = 100 และ เป็ นอาหาร
204101 Introduction to Computer
31
แบ่ งกล่ มุ
 แบ่ งระเบียนทั้งหมดออกเป็ นกลุ่มจากเงือ่ นไขทีก่ าหนด
 แบ่ งแบบสุ่ ม เช่ น จับฉลากแบ่ งกลุ่มนักเรียน
 แบ่ งแบบนา้ หนักของแต่ ละกลุ่มมีค่าใกล้ เคียงกัน เช่ น
แบ่ งกลุ่มนักเรียนตาม GPA โดยทีแ่ ต่ ละกลุ่มมีคนเรียน
เก่ งและเรียนอ่ อนพอ ๆ กัน
204101 Introduction to Computer
32
ผลลัพธ์
 แสดงผล แล้ วนาผลลัพธ์ ไปใช้ เลย
 Feedback กลับไปแก้ ไขได้ ในกรณีทม
ี่ ขี ้ อผิดพลาด คือมี
การพิจารณา output เพือ่ การประมวลผลอีก
 กลับไปเก็บข้ อมูลใหม่
 กลับไปการประมวลผลข้ อมูลใหม่
204101 Introduction to Computer
33
องค์ ประกอบข้ อมูล (Data Organization)
 บิต (Bit)
 อักขระ (Character)
 ขอบเขตข้ อมูล (Field)
 ระเบียน (Record)
 แฟ้ มข้ อมูล (File)
 ฐานข้ อมูล (Database)
204101 Introduction to Computer
34
องค์ ประกอบข้ อมูล (ต่ อ)
204101 Introduction to Computer
35
บิต
 ตัวเลข 0 และ 1
 หน่ วยพืน
้ ฐานทีจ่ ัดเก็บในคอมพิวเตอร์
204101 Introduction to Computer
36
อักขระ
 กลุ่มของบิต เช่ น 011101011
 1 อักขระ นับเป็ น 1 ไบต์
 ในปัจจุบัน โดยทัว่ ไป 1 ไบต์ (อักขระ) มี 8 บิต
 เช่ น 01101011 แทน F เป็ นต้ น
204101 Introduction to Computer
37
อักขระ (ต่ อ)
 เวิร์ด (Word) :จานวนของ Byte (หลายบิท) ทีป
่ ระกอบ
กันขึน้ เพือ่ นาข้ อมูลเข้ าสู่ การประมวลผล ความเร็วใน
การประมวลผลขึน้ กับขนาดของ word ถ้ า 1 word มี
จานวนบิทมาก จะประมวลผลเร็ว
 แต่ ละระบบคอมพิวเตอร์ มข
ี นาดของเวิร์ดไม่ เท่ ากัน
 ขนาดของเวิร์ดคือขนาดของบัส หรือ บัสไลน์ (Bus
Lines)
204101 Introduction to Computer
38
ขอบเขตข้ อมูล
 กลุ่มของอักขระหรือข้ อความ (String) คือข้ อมูลที่
คานวณไม่ ได้ แต่ เปรียบเทียบค่ าได้ เช่ น Cat
 เลขจานวน (Number) คือข้ อมูลทีค
่ านวณได้ เช่ น เลข
จานวนเต็ม (Integer) เช่ น 1,004 หรือเลขจานวนจริง
(Real ) เช่ น 3.25
 อักขระเดีย่ ว (Character) หมายถึง อักขระ A-Z, 0-9 ,
สั ญลักษณ์ พเิ ศษ เช่ น *
204101 Introduction to Computer
39
ระเบียน
 กลุ่มของขอบเขตข้ อมูลทีเ่ กีย่ วข้ องกัน
นายพร มีบุญ
204101 Introduction to Computer
แผนกบัญชี
20 ชั่วโมง
50 บาท
40
แฟ้มข้ อมูล
 กลุ่มของระเบียนทีม
่ รี ู ปแบบเดียวกัน สี ฟ้า คือ field
name/ attribute name สี ดาคือ ข้ อมูล
ชื่อ
นายพร มีบุญ
นางสาวศศิวมิ ล คนดี
นาง ปนัดดา ดวงคา
...
204101 Introduction to Computer
แผนก
ชั่วโมง
คอมพิวเตอร์
20
บัญชี
5
ประชาสั มพันธ์ 17
...
...
อัตรา
150
80
90
...
41
ฐานข้ อมูล (ต่ อ)

กลุ่มของแฟ้มข้ อมูล/ตารางข้ อมูลทีส่ ั มพันธ์ กนั เช่ นฐานข้ อมูลพนักงาน
มี 2 ตารางข้ อมูล ดังนี้
ชื่อ
แผนก
ชั่วโมง
นายพร มีบุญ
คอมพิวเตอร์ 20
นางสาวศศิวมิ ล คนดี บัญชี
5
อัตรา
150
80
...
...
...
...
แผนก
เวลาเริ่มงาน จานวนพนักงาน
คอมพิวเตอร์ 12:00
52
บัญชี
9:00
23
...
204101 Introduction to Computer
...
...
42
แฟ้มข้ อมูล VS ฐานข้ อมูล
 ลักษณะของแฟ้ มข้ อมูล
 ลักษณะของฐานข้ อมูล
204101 Introduction to Computer
43
ลักษณะของแฟ้มข้ อมูล
 โปรแกรมต้ องรู้ โครงสร้ างของแฟ้ มข้ อมูล (Data
dependence) ใช้ กบั ภาษา 3 GL เช่ น ภาษา Pascal
 ค่ าใช้ จ่ายน้ อยเหมาะสาหรับการประมวลผลงานขนาดเล็ก
 ใช้ บันทึกข้ อมูลเรื่องใดเรื่องหนึ่งเท่ านั้น
 โดยปกติใช้ กบ
ั งานเพียงด้ านเดียวเท่ านั้น
 ถ้ าใช้ หลายทีใ่ นหน่ วยงานข้ อมูลจะมีความซ้าซ้ อน
204101 Introduction to Computer
44
ลักษณะฐานข้ อมูล
 ข้ อมูลเป็ นอิสระจากโปรแกรม(Data independence) ใช้
โปรแกรมภาษา 4 GL เช่ น Access, MySQL ซึ่งเรียกว่ า
เป็ นโปรแกรมจัดการฐานข้ อมูล
 ข้ อมูลมีโครงสร้ างทีแ่ น่ นอน เหมาะกับองค์ กรทีม
่ ขี ้ อมูล
มาก จึงทาให้ เกิดค่ าใช้ จ่ายสู ง
 มีชุดเดียวใช้ ได้ ท้งั หน่ วยงาน (Shared data)
 มีภาษาสอบถาม (Query Language) ใช้ ง่าย สะดวก
204101 Introduction to Computer
45