Transcript ภาพนิ่ง 1
บทที่ 2 การประมวลผลข้ อมูล (Data Processing) 204101 Introduction to Computer 1 การประมวลผล (Processing) การดาเนินการกับข้ อมูลดิบ (Raw Data) เพือ่ ให้ ได้ ข้ อมูลสารสนเทศ (Information) 204101 Introduction to Computer 2 ข้ อมูลดิบ ข้ อมูลทีร่ วบรวมมาจากแหล่ งข้ อมูลต่ าง ๆ ตัวเลข ตัวอักษร รู ปภาพ เสี ยง อุณหภูมิ ความเร็ว คะแนนสอบของนักศึกษา 1 กลุ่ม 204101 Introduction to Computer 3 ข้ อมูลสารสนเทศ ข้ อมูลทีผ ่ ่ านการประมวลผลแล้ ว สามารถนาไปใช้ ประโยชน์ ได้ ค่ าเฉลีย่ คะแนนสอบของนักศึกษา 1 กลุ่ม 204101 Introduction to Computer 4 ประเภทของการประมวลผล การประมวลผลด้ วยมือ (Manual Data Processing) การประมวลผลอัตโนมัติ (Automatic Data Processing) Online Processing Batch Processing 204101 Introduction to Computer 5 Online Processing Real-time Processing คือการประมวลผลทีไ่ ด้ ผลลัพธ์ ทันที เช่ น ระบบสารองทีน่ ั่งในเครื่องบิน ฝาก/ถอนATM เป็ นการประมวลผลแบบโดยตรงหรือสุ่ ม (Random) คือ เมื่อ เกิด 1 ระเบียน(Transaction) ก็เข้ าสู่ การประมวลผลเลย มักเป็ นการประมวลผลแบบ Time Sharing คือมีผ้ ูใช้ เข้ าสู่ ระบบประมวลผลมากกว่ า 1 คนในขณะเดียวกัน ใช้ สื่อทีม ่ กี ารเข้ าถึงแบบโดยตรง เช่ น ฮาร์ ดดิสก์ 204101 Introduction to Computer 6 Online Processing (ต่ อ) ข้ อมูลทีใ่ ช้ ประมวลผลทันต่ อเหตุการณ์ เป็ นปัจจุบัน (Up to date) สามารถทารายงานได้ ทน ั ที ได้ ผลลัพธ์ ทเี่ ป็ นปัจจุบัน จากการทางานทีก่ ล่ าวมา จึงต้ องมี I/O Device ทีต ่ ้ อง เชื่อมต่ อกับ CPU ตลอดเวลา (Online) 204101 Introduction to Computer 7 Batch Processing ไฟล์ หลัก (Master Files) ไฟล์ รายการข้ อมูลสิ นค้ า ไฟล์ รายการเปลีย่ นแปลง (Transaction Files) รายการขายสิ นค้ า รายการซื้อสิ นค้ า 204101 Introduction to Computer 8 Batch Processing (ต่ อ) ประมวลผลตามรายการเปลีย่ นแปลงทีร่ วบรวมเป็ นชุ ด (Batch) แล้ วประมวลผลตามคาบเวลาทีละรายการตั้งแต่ ระเบียนแรกจนหมด batch นั้นๆ ประมวลผลตามคาบเวลา(period of time) ทุกวัน/ทุกเดือน เป็ นการประมวลผลแบบลาดับ (Sequential) สามารถใช้ สื่อทีม ่ กี ารเข้ าถึงข้ อมูลเป็ นแบบลาดับได้ เช่ น เทปแม่ เหล็ก จึงทาให้ มคี ่ าใช้ จ่ายต่า 204101 Introduction to Computer 9 Batch Processing (ต่ อ) มีการจัดเก็บระเบียนข้ อมูลเพือ่ รอการประมวลผลตามคาบ เวลา จึงเกิดภาวะข้ อมูลไม่ ทนั ต่ อเหตุการณ์ (ไม่ Update)เช่ น เก็บข้ อมูลขอ drop-add แล้ วประมวลผลพร้ อมกันภายหลัง รายงานหรือผลลัพธ์ ทไี่ ด้ ล่าช้ าไม่ ทน ั ต่ อเหตุการณ์ (Past information) เช่ นรายงานยอดขายสิ้นค้ าเมือ่ สิ้นเดือนที่แล้ ว จากการประมวลผลทีก่ ล่ าวมา I/O Device จึงไม่ จาเป็ นต้ อง เชื่อมต่ อกับ CPU ตลอดเวลา 204101 Introduction to Computer 10 การประมวลผลด้ วยคอมพิวเตอร์ การเก็บข้ อมูล (Data Collection) การประมวลผลข้ อมูล (Data Processing) ผลลัพธ์ (Output / Information) 204101 Introduction to Computer 11 การเก็บข้ อมูล วิธีการเก็บข้ อมูล ลักษณะของข้ อมูลทีด ่ ี การเข้ ารหัสข้ อมูล การตรวจสอบความถูกต้ องของข้ อมูล การเก็บข้ อมูลในสื่ อบันทึกข้ อมูล 204101 Introduction to Computer 12 วิธีการเก็บข้ อมูล สั งเกต (Observation) วัดค่ า (Measurement) เอกสาร (Document) สั มภาษณ์ (Interview) 204101 Introduction to Computer 13 วิธีการเก็บข้ อมูล แบบสอบถาม (Questionnaire) Manual Internet 204101 Introduction to Computer 14 แบบสอบถาม 204101 Introduction to Computer 15 ลักษณะของข้ อมูลทีด่ ี ถูกต้ อง (Accuracy) ปัจจุบัน (Updated) สมบูรณ์ (Completeness) 204101 Introduction to Computer 16 การเข้ ารหัสข้ อมูล ประหยัดเนือ้ ทีใ่ นการเก็บข้ อมูล เพราะเก็บรหัสแทนข้ อมูล มีความเร็วในการค้ นหาข้ อมูลชนิดรหัสสู งกว่ าข้ อมูลเดิม ใช้ ตวั เลข หรืออักขระ เป็ นรหัสแทนข้ อมูล ข้ อมูลทีจ่ ะเข้ ารหัสได้ ต้องถูกจัดในกลุ่มทีร่ ้ ู จานวน เช่ น ข้ อมูลเพศมี 2 กลุ่ม คือ ญ/ช จะใช้ ตัวอักขระ 1 ตัวแทน ข้ อมูล หรือข้ อมูลคณะของ ม.ช.ทีม่ มี ากกว่ า 10 คณะ จะ ใช้ อกั ขระตัวเลข 2 หลักแทน (รหัส 00-99 มีถึง 100 รหัส) 204101 Introduction to Computer 17 การเข้ ารหัสข้ อมูล นาย สมชาย คนไทย เชียงใหม่ 12,000 บาท M สมชาย คนไทย 053 2 204101 Introduction to Computer 18 การตรวจสอบความถูกต้ องของข้ อมูล Edit/ Update การแก้ ไข/ปรับปรุง:เพิม่ ลบ เปลีย่ นแปลง Verify การทวนสอบขั้นตอนการนาเข้ าข้ อมูล Validation ความถูกต้ องอย่ างสมเหตุสมผลของข้ อมูล Range Check เป็ นการเช็ คที่เกีย ่ วข้ องกับข้ อมูล 1 field เช่ น field คาตอบ มีข้อมูลคาตอบแบบสอบถาม 4 ตัวเลือก ข้ อมูล ที่เป็ น คาตอบ ต้ องเป็ น ก-ง เท่ านั้น Relation Check เป็ นการเช็ คข้ อมูลที่สัมพันธ์ กน ั 2 field เช่ น ข้ อมูล เงินเดือนตาแหน่ ง programmer ของบริษทั ก ไม่ ต่ากว่ า 10,000.บาท หรือข้ อมูล คานาหน้ าชื่อ นาย ต้ องมีข้อมูล เพศเป็ น ชาย 204101 Introduction to Computer 19 การเก็บข้ อมูลในสื่ อบันทึกข้ อมูล ข้ อมูลจริง หมายถึงข้ อมูลทีเ่ กิดขึน ้ จริง จากการทางาน การเปลีย่ นสื่ อบันทึกข้ อมูล หมายถึงการนาข้ อมูลจริงบันทึก ลงสื่ อคอมพิวเตอร์ ทเี่ หมาะสมเพือ่ การประมวลผลข้ อมูล ต่ อไป หรือการนาข้ อมูลไปบันทึกยังสื่ ออืน่ เช่ น การสารอง ข้ อมูล (Back up) ข้ อมูลในสื่ อบันทึกข้ อมูล หมายถึงการนาข้ อมูลจริงบันทึก ลงในสื่ อคอมพิวเตอร์ ตามหลักการหรือวิธีการของ file หรือ ฐานข้ อมูล (Database) 204101 Introduction to Computer 20 ข้ อมูลจริง ชื่อ นายสมชาย คนไทย นางสาวแพร มีบุญ นางศศิวมิ ล คนดี ... 204101 Introduction to Computer แผนก ชั่วโมง คอมพิวเตอร์ 12 บัญชี 20 ประชาสั มพันธ์ 5 ... ... อัตรา 60 50 80 ... 21 ข้ อมูลในสื่ อบันทึกข้ อมูล M สมชาย คนไทย N แพร มีบุญ O ศศิวมิ ล คนดี ... 1 2 3 ... ระเบียน (Record) 12 20 5 ... 60 50 80 ... ค่ าแอททริบิวต์ (Attribute) 204101 Introduction to Computer 22 การประมวลผลข้ อมูล คานวณ (Calculating) ปรับปรุ ง (Updating) รายงาน (Reporting) / เอกสาร (Document) สรุ ป (Summarizing) 204101 Introduction to Computer 23 การประมวลผลข้ อมูล เรียงลาดับ (Sorting) ค้ นหา (Searching) แบ่ งกลุ่ม (Grouping) แบ่ งประเภท (Classification) 204101 Introduction to Computer 24 คานวณ นากลุ่มของค่ าแอททริบิวต์ ทม ี่ อี ยู่/จัดเก็บ มา คานวณหาค่ าต่ างๆ ตามทีต่ ้ องการ หาค่ าเฉลีย่ (Mean) หาค่ ามัธยฐาน (Median) หาค่ าฐานนิยม (Mode) 204101 Introduction to Computer 25 ปรับปรุง(Update) นาค่ าแอททริบิวต์ ทม ี่ อี ยู่มาคานวณ แล้ วแทนที่ การปรับค่ าอัตราเงินเดือนของพนักงานขึน ้ จากเดิมอีก 20 % การปรับค่ าเงินสุ ทธิของบัญชีธนาคารของลูกค้ าแต่ ละ บัญชี ด้ วยการนาค่ าสุ ทธิเดิม – จานวนเงินที่ถอนวันนี้ หรือ +จานวนเงินที่ฝากวันนี้ 204101 Introduction to Computer 26 รายงาน ชื่อ นายสมชาย คนไทย นางสาวแพร มีบุญ นางศศิวมิ ล คนดี ... 204101 Introduction to Computer แผนก คอมพิวเตอร์ บัญชี ประชาสั มพันธ์ ... อัตรา 60 50 80 ... ชั่วโมง ค่ าจ้ าง 12 720 20 1,000 5 400 ... ... 27 สรุปผล ชื่อ นายสมชาย คนไทย นางสาวแพร มีบุญ นางศศิวมิ ล คนดี ... 204101 Introduction to Computer แผนก คอมพิวเตอร์ บัญชี ประชาสั มพันธ์ ... อัตรา 60 50 80 ... ชั่วโมง ค่ าจ้ าง 12 720 20 1,000 5 400 ... ... 72 5,140 28 สรุปผล (ต่ อ) แผนก คอมพิวเตอร์ บัญชี ประชาสั มพันธ์ 204101 Introduction to Computer อัตรา 60 50 80 ชั่วโมง ค่ าจ้ าง 22 1,320 33 1,650 15 1,200 70 4,170 29 เรียงลาดับ ตัวเลข เช่ น คะแนนสอบ ข้ อความ เช่ น ชื่อตามอักขระ ก ข ค รหัส เช่ น รหัสสิ นค้ า 204101 Introduction to Computer 30 ค้ นหา ค้ นหาระเบียนที่ต้องการจากเงือ่ นไขที่กาหนด ค้ นหานักเรียนที่ GPA < 1.75 ค้ นหาพนักงานที่ เงินเดือน 5,000 หรือ อยู่ฝ่ายบัญชี ค้ นหาสิ นค้ าที่ ราคา = 100 และ เป็ นอาหาร 204101 Introduction to Computer 31 แบ่ งกล่ มุ แบ่ งระเบียนทั้งหมดออกเป็ นกลุ่มจากเงือ่ นไขทีก่ าหนด แบ่ งแบบสุ่ ม เช่ น จับฉลากแบ่ งกลุ่มนักเรียน แบ่ งแบบนา้ หนักของแต่ ละกลุ่มมีค่าใกล้ เคียงกัน เช่ น แบ่ งกลุ่มนักเรียนตาม GPA โดยทีแ่ ต่ ละกลุ่มมีคนเรียน เก่ งและเรียนอ่ อนพอ ๆ กัน 204101 Introduction to Computer 32 ผลลัพธ์ แสดงผล แล้ วนาผลลัพธ์ ไปใช้ เลย Feedback กลับไปแก้ ไขได้ ในกรณีทม ี่ ขี ้ อผิดพลาด คือมี การพิจารณา output เพือ่ การประมวลผลอีก กลับไปเก็บข้ อมูลใหม่ กลับไปการประมวลผลข้ อมูลใหม่ 204101 Introduction to Computer 33 องค์ ประกอบข้ อมูล (Data Organization) บิต (Bit) อักขระ (Character) ขอบเขตข้ อมูล (Field) ระเบียน (Record) แฟ้ มข้ อมูล (File) ฐานข้ อมูล (Database) 204101 Introduction to Computer 34 องค์ ประกอบข้ อมูล (ต่ อ) 204101 Introduction to Computer 35 บิต ตัวเลข 0 และ 1 หน่ วยพืน ้ ฐานทีจ่ ัดเก็บในคอมพิวเตอร์ 204101 Introduction to Computer 36 อักขระ กลุ่มของบิต เช่ น 011101011 1 อักขระ นับเป็ น 1 ไบต์ ในปัจจุบัน โดยทัว่ ไป 1 ไบต์ (อักขระ) มี 8 บิต เช่ น 01101011 แทน F เป็ นต้ น 204101 Introduction to Computer 37 อักขระ (ต่ อ) เวิร์ด (Word) :จานวนของ Byte (หลายบิท) ทีป ่ ระกอบ กันขึน้ เพือ่ นาข้ อมูลเข้ าสู่ การประมวลผล ความเร็วใน การประมวลผลขึน้ กับขนาดของ word ถ้ า 1 word มี จานวนบิทมาก จะประมวลผลเร็ว แต่ ละระบบคอมพิวเตอร์ มข ี นาดของเวิร์ดไม่ เท่ ากัน ขนาดของเวิร์ดคือขนาดของบัส หรือ บัสไลน์ (Bus Lines) 204101 Introduction to Computer 38 ขอบเขตข้ อมูล กลุ่มของอักขระหรือข้ อความ (String) คือข้ อมูลที่ คานวณไม่ ได้ แต่ เปรียบเทียบค่ าได้ เช่ น Cat เลขจานวน (Number) คือข้ อมูลทีค ่ านวณได้ เช่ น เลข จานวนเต็ม (Integer) เช่ น 1,004 หรือเลขจานวนจริง (Real ) เช่ น 3.25 อักขระเดีย่ ว (Character) หมายถึง อักขระ A-Z, 0-9 , สั ญลักษณ์ พเิ ศษ เช่ น * 204101 Introduction to Computer 39 ระเบียน กลุ่มของขอบเขตข้ อมูลทีเ่ กีย่ วข้ องกัน นายพร มีบุญ 204101 Introduction to Computer แผนกบัญชี 20 ชั่วโมง 50 บาท 40 แฟ้มข้ อมูล กลุ่มของระเบียนทีม ่ รี ู ปแบบเดียวกัน สี ฟ้า คือ field name/ attribute name สี ดาคือ ข้ อมูล ชื่อ นายพร มีบุญ นางสาวศศิวมิ ล คนดี นาง ปนัดดา ดวงคา ... 204101 Introduction to Computer แผนก ชั่วโมง คอมพิวเตอร์ 20 บัญชี 5 ประชาสั มพันธ์ 17 ... ... อัตรา 150 80 90 ... 41 ฐานข้ อมูล (ต่ อ) กลุ่มของแฟ้มข้ อมูล/ตารางข้ อมูลทีส่ ั มพันธ์ กนั เช่ นฐานข้ อมูลพนักงาน มี 2 ตารางข้ อมูล ดังนี้ ชื่อ แผนก ชั่วโมง นายพร มีบุญ คอมพิวเตอร์ 20 นางสาวศศิวมิ ล คนดี บัญชี 5 อัตรา 150 80 ... ... ... ... แผนก เวลาเริ่มงาน จานวนพนักงาน คอมพิวเตอร์ 12:00 52 บัญชี 9:00 23 ... 204101 Introduction to Computer ... ... 42 แฟ้มข้ อมูล VS ฐานข้ อมูล ลักษณะของแฟ้ มข้ อมูล ลักษณะของฐานข้ อมูล 204101 Introduction to Computer 43 ลักษณะของแฟ้มข้ อมูล โปรแกรมต้ องรู้ โครงสร้ างของแฟ้ มข้ อมูล (Data dependence) ใช้ กบั ภาษา 3 GL เช่ น ภาษา Pascal ค่ าใช้ จ่ายน้ อยเหมาะสาหรับการประมวลผลงานขนาดเล็ก ใช้ บันทึกข้ อมูลเรื่องใดเรื่องหนึ่งเท่ านั้น โดยปกติใช้ กบ ั งานเพียงด้ านเดียวเท่ านั้น ถ้ าใช้ หลายทีใ่ นหน่ วยงานข้ อมูลจะมีความซ้าซ้ อน 204101 Introduction to Computer 44 ลักษณะฐานข้ อมูล ข้ อมูลเป็ นอิสระจากโปรแกรม(Data independence) ใช้ โปรแกรมภาษา 4 GL เช่ น Access, MySQL ซึ่งเรียกว่ า เป็ นโปรแกรมจัดการฐานข้ อมูล ข้ อมูลมีโครงสร้ างทีแ่ น่ นอน เหมาะกับองค์ กรทีม ่ ขี ้ อมูล มาก จึงทาให้ เกิดค่ าใช้ จ่ายสู ง มีชุดเดียวใช้ ได้ ท้งั หน่ วยงาน (Shared data) มีภาษาสอบถาม (Query Language) ใช้ ง่าย สะดวก 204101 Introduction to Computer 45