อัตราการสุ่มเสียง - ภาควิชาคณิตศาสตร์และคอมพิวเตอร์

Download Report

Transcript อัตราการสุ่มเสียง - ภาควิชาคณิตศาสตร์และคอมพิวเตอร์

บทที่ 7
เสียง
Sound
อ.ชนิดา เรืองศิริวฒ
ั นกุล
สาขาวิชาเทคโนโลยีสารสนเทศ
คณะวิทยาศาสตร์ และเทคโนโลยี มหาวิทยาลัยราชภัฏอุตรดิตถ์
เสียง (Sound)
เสี ยง เป็ นองค์ ประกอบของมัลติมีเดีย ช่ วยให้ เกิดบรรยากาศที่
น่ าสนใจในการรับรู้ ทางหู โดยอาศัยการนาเสนอในรู ปของ เสี ยง
ประกอบ เพลงบรรเลง เสี ยงพูด เสี ยงบรรยาย หรือเสี ยงพากษ์
เป็ นต้ น
ความร้ ูเบื้องต้ นเกีย่ วกับเสียง
ออดิโอ (Audio) หรือ เสี ยง (Sound) อยูใ่ นรู ปแบบของพลังงานที่สามารถ
ถ่ายทอดจากที่หนึ่งไปยังอีกที่หนึ่งผ่านตัวกลางที่เกิดจากการสัน่ เสี ยงที่
มนุษย์ได้ยนิ เกิดจากการเดินทางผ่านตัวกลาง ทาให้เกิดการเปลี่ยนแปลง
ของคลื่นเสี ยง (Waveform) โดยจะเปลี่ยนแปลงไปตาม Amplitude และ
Frequency ของการสัน่ สะเทือน
หน่ วยวัดความดังของเสี ยง เรียกว่ า Decibel ซึ่งเป็ นหน่วยวัดความดังของ
เสี ยง และจานวนรอบการแกว่ งคลืน่ เสี ยงใน 1 วินาที เรียกว่ า Hertz : Hz
ความร้ ูเบื้องต้ นเกีย่ วกับเสียง
ความดังของเสี ยง (เดซิเบล)
0
30
60
85
90
115
140
ชนิดของเสี ยง
เสี ยงที่แผ่วเบาที่สุดที่มนุษย์ได้ยนิ
เสี ยงกระซิ บหรื อเสี ยงในห้องสมุด
เสี ยงพูดคุยตามปกติ
เสี ยงตะโกนข้ามเขา หรื อพื้นที่โล่งกว้าง
เสี ยงเครื่ องตัดหญ้า หรื อเครื่ องจักรในโรงงาน (ไม่
ควรได้ยนิ เกินวันละ 8 ชม.)
เสี ยงระเบิดหิ น หรื อแตรรถยนต์ (ไม่ควรได้ยนิ เกิน
วันละ 15 นาที)
เสี ยงยิงปื น เสี ยงเครื่ องบินเจ็ท
คณ
ุ สมบัติของเสียง
แอมพลิจูด(Amplitude) คือ ความสูงของคลื่นเสี ยงที่วดั จากแนวปกติข้ ึนไป
ยังสันคลื่นหรื อวัดจากแนวปกติลงไปท้องคลื่น โดยแอมพลิจูดมากแสดงว่า
มีคลื่นพลังงานมาก ซึ่งเป็ นตัวกาหนดความดังของเสี ยง ที่มีหน่วยเป็ นเดซิ
เบล ดังนั้นคลื่นเสี ยงที่มีแอมพลิจูดสูงจะให้เสี ยงที่ดงั กว่าคลื่นเสี ยงที่มีแอม
พลิจูดต่า
ความถี่ (Frequency) คือ จานวนคลื่นที่เคลื่อนที่ภายใน 1 หน่วยเวลา มี
หน่วยเป็ นรอบต่อวินาทีหรื อเฮิร์ต (Hz) โดยจะแสดงถึงระดับเสี ยง แบ่ง
ออกเป็ น เสี ยงสูง(ความถี่สูง) เช่น เสี ยงนกหวีด และเสี ยงต่า เช่น เสี ยงกลอง
เป็ นต้น
คณ
ุ สมบัติของเสียง
ส่ วนความถี่เสี ยงที่มนุษย์ไม่ได้ยนิ เรี ยกว่า “อัลตราโซนิก” หรื อ
“ซุปเปอร์ โซนิก” เป็ นเสี ยงที่มีความถี่สูงกว่าเสี ยงทัว่ ไป
ส่ วนเสี ยงที่มีความถี่ต่ากว่าเสี ยงทัว่ ไปจะเรี ยกว่า “อินฟราโซนิก” หรื อ
“สั บโซนิก”
รูปแบบคลืน่ (Waveform) เป็ นลักษณะการเคลื่อนที่ของเสี ยง เช่น คลื่น
ไซน์ สามเหลี่ยม และฟันเลื่อย เป็ นต้น
ความเร็ว (Speed) ความเร็ วของเสี ยงขึ้นอยูก่ บั การเดินทางเสี ยงผ่าน
ตัวกลาง โดยเสี ยงจะเดินทางผ่านตัวกลางที่มีความหนาแน่นมากได้ดีกว่า
ตัวกลางที่มีความหนาแน่นน้อย เช่น เสี ยงเดินทางผ่านน้ าได้ดีกว่าอากาศ
เพราะน้ ามีความหนาแน่นมากกว่าอากาศ
ประเภทของเสียง
มิดี้ (MIDI : Musical Instrument Digital Interface) คือ เสี ยงที่แทน
เครื่ องดนตรี ชนิดต่างๆ โดยเสี ยงดนตรี แบบมิด้ ีจะไม่เหมือนเครื่ องดนตรี
จริ งๆ จึงจาเป็ นต้องสร้างและปรับแต่งเสี ยงมิด้ ีให้มีความไพเราะมากยิง่ ขึ้น
โดยไมโครซอฟต์ได้กาหนดมาตรฐานของเสี ยงแบบมิด้ ี เรี ยกว่า GM
(General MIDI Standard) เพื่อกาหนดรู ปแบบของการสร้างข้อมูลเสี ยง
แบบ MIDI บนอุปกรณ์ต่างๆ เป็ นมาตรฐานเดียวกัน
ข้ อดีของมิด้ ี คือ ไฟล์ขนาดเล็ก เหมาะสาหรับงานบนเครื อข่าย ง่ายแต่
การแก้ไข ข้ อเสี ย คือ แสดงได้เฉพาะดนตรี บรรเลงและเสี ยงที่เกิดจากโน้ต
ดนตรี เท่านั้น
ประเภทของเสียง
เสี ยงแบบดิจิตอล (Digital Audio) คือ สัญญาณเสี ยงที่ส่งมาจาก
ไมโครโฟน เครื่ องเล่นเทป และแหล่งกาเนิดเสี ยงต่างๆ ทั้งจากธรรมชาติ ที่
สร้างขึ้นเอง แล้วนาข้อมูลที่ได้แปลงเป็ นสัญญาณดิจิตอล ข้อมูลจะถูกสุ่ ม
ให้อยูใ่ นรู ปแบบของบิต โดยอัตราการสุ่ มข้ อมูลทีไ่ ด้ มาว่ า “Sampling
rate” และจานวนของข้ อมูลทีไ่ ด้เรี ยกว่า “Sampling size”
เสี ยงแบบดิจิตอลจะมีขนาดข้อมูลใหญ่ ใช้หน่วยความจาและ
ประมวลผลมากกว่ามีด้ ี แต่จะแต่งเสี ยงได้หลากหลายและเป็ นธรรมชาติ
มากกว่า
ประเภทของเสียง
โดยทัว่ ไปเสี ยงแบบดิจิตอลจะอยูใ่ นช่วงความถี่ 44.1 Hz , 22.05 kHz
และ 11.025 kHz ซึ่งมีขนาดการสุ่ มสัญญาณ (Sampling size) เป็ น 8 บิต
และ 16 บิต โดยที่อตั ราการสุ่ ม และขนาดการสุ่ มที่สูงกว่าจะให้คุณภาพ
ของเสี ยงที่ดีกว่า
อัตราการสุ่ มเสี ยง (Sampling Rate) มีผลโดยตรงต่อคุณภาพของเสี ยง ถ้า
ใช้อตั ราการสุ่ ม 8 กิโลเฮิร์ต หมายถึง จะสุ่ มค่าแอมพลิจูดคลื่นเสี ยงจานวน
8,000 ครั้งต่อวินาที
มาตรฐาน Red Book
การเข้ ารหัสเสี ยงดิจิตอลแบบสเตริโอแล้วบันทึกลง CD Audio ทัว่ ไปให้ มี
คุณภาพสู งนั้นจะต้ องได้ มาตรฐาน ISO 10149 หรือเรียกว่ า Red Book
โดยกาหนด Sampling Rate 44.1 KHz Sampling Size 16 Bit
ประเภทของเสียง
บิตเรท (Bit Rate) และขนาดไฟล์ (File Size)
การเพิ่มอัตราการสุ่ มและความละเอียดในการสุ่ ม จะทาให้ไฟล์มีขนาดใหญ่
ขึ้นและต้องการพื้นที่สาหรับจัดเก็บข้อมูลมากขึ้น รวมทั้งหน่วย
ประมวลผลที่มีประสิ ทธิภาพสูงด้วย
การจัดเก็บแฟ้ มข้ อมูลเสียงแบบดิจิตอล
สู ตรการคานวณพื้นที่ในการจัดเก็บไฟล์เสี ยงคือ
Sampling Rate x เวลา x รู ปแบบเสี ยง
Ex1 ทาการบันทึกเสี ยงโมโนนาน 10 วินาที ที่ Sampling Rate 22.05
KHz Sampling Size 8 Bit จะคานวณพื้นที่ในการจัดเก็บได้ดงั นี้
22050 x 10 x (8/8) x 1 = 220500 Byte
= 220500/1024 = 215 Kb
Ex2 บันทึกเสี ยงสเตอริ โอ 30 วินาที ที่ Sampling Rate 22.05 KHz
Sampling Size 16 Bit จะคานวณพื้นที่ในการจัดเก็บได้ดงั นี้
22050 x 30 x (16/8) x 2 = 2646000 Byte
= 2646000/1024 = 2584 Kb
การประมวลผลไฟล์ เสียง
Processing Sound คือกระบวนการต่างๆ ตั้งแต่การนาไฟล์เสี ยงเข้าสู่
โปรแกรมสาหรับสร้างหรื อแก้ไขเสี ยงโดยเฉพาะ รวมถึงการปรับแต่ง
เสี ยง แก้ไข หรื อเพิ่มตัวโน้ต ตามความต้องการ จากนั้นก็ทาการทดสอบ
เสี ยง และนาเสนอไฟล์เสี ยงที่ได้
การประมวลผลไฟล์ เสียง
การบันทึกข้ อมูลเสี ยง (Recording Sound)
- Synthesize Sound
เป็ นเสี ยงทีเ่ กิดจากตัววิเคราะห์ เสี ยงทีเ่ รียกว่ า Midi โดยเมื่อตัวโน้ต
ทางาน คาสัง่ Midi จะถูกส่ งไปยัง Synthesize Chip เพื่อทาการแยกเสี ยง
ว่าเป็ นเสี ยงดนตรี ชนิดใด ไฟล์ Midi ที่ได้กจ็ ะมีขนาดเล็ก เนื่องจากเก็บ
คาสัง่ ในรู ปแบบง่ายๆ
- Sound Data
เป็ นเสี ยงที่ได้จากการแปลงสัญญาณอนาลอกเป็ นสัญญาณดิจิตอล โดยจะ
มีการบันทึกตัวอย่างคลื่นให้อยูท่ ี่ใดที่หนึ่งในช่วงของเสี ยงนั้นๆ
การประมวลผลไฟล์ เสียง
สิ่ งสาคัญก่อนการบันทึกเสี ยง คือ จะต้องทาการเลือก
Sampling Rate เพื่อให้ได้เสี ยงที่ตอ้ งการและใกล้เคียงกับเสี ยง
จริ ง โดยจะต้องพิจารณาถึงขนาดไฟล์ ถ้า Sampling Rate มาก
จะใช้พ้นื ที่ในการจัดเก็บข้อมูลมากขึ้นตามไปด้วย
อปุ กรณ์ สาหรั บควบคมุ และบันทึกเสียง
การ์ ดเสี ยง (Sound card) เป็ นอุปกรณ์ เสี ยงทีส่ ามารถเพิม่ ลงใน slot
PCI บนเมนบอร์ ด โดยทาหน้ าทีเ่ ชื่อมต่ อการทางานกับอุปกรณ์ ต่างๆ
เช่ น CPU ลาโพง เป็ นต้ น
อปุ กรณ์ สาหรั บควบคมุ และบันทึกเสียง
องค์ ประกอบพืน้ ฐานของการ์ ดเสี ยง (Sound card)
 หน่ วยความจา(Memory Bank) เป็ นบัฟเฟอร์ สาหรับจัดเก็บข้อมูล
ของการ์ดเสี ยง และกระบวนการเล่นไฟล์เสี ยง เมื่อเปิ ดไฟล์เสี ยง
ข้อมูลจะถูกโหลดมาเก็บในบัฟเฟอร์ และนามาประมวลผลด้วยตัว
แปลงสัญญาณดิจิตอลให้เป็ นอนาล็อก
 ตัวประมวลผลสั ญญาณดิจิตอล (DSP : Digital Signal Processor)
ทาหน้าที่ควบคุมสัญญาณเสี ยงดิจิตอล นอกจากนี้ยงั มีฟังก์ชนั ต่างๆ
ซึ่งช่วยให้เสี ยงมีคุณภาพดีข้ ึน
อปุ กรณ์ สาหรั บควบคมุ และบันทึกเสียง
องค์ ประกอบพืน้ ฐานของการ์ ดเสี ยง (Sound card)
 ตัวแปลงสั ญญาณดิจิตอลเป็ นอนาล็อก (DAC : Digital to Analog )
และตัวแปลสั ญญาณอนาล็อกเป็ นดิจิตอล (ADC : Analog to
Digital) โดยสัญญาณอนาล็อกที่ได้รับจากไมโครโฟนผ่านพอร์ต
อินพุตของการ์ดเสี ยง จะถูกแปลงให้อยูใ่ นสัญญาณดิจิตอล ด้วยตัว
แปลงสัญญาณ ADC ไฟล์เสี ยงดิจิตอลจะถูกเก็บในบัฟเฟอร์ก่อนที่
จะคัดลอกลงดิสก์ หากต้องการเล่นไฟล์เสี ยง DAC จะแปลงสัญญาณ
ดิจิตอลเป็ นอนาล็อก เพื่อส่ งไปยังลาโพงต่อไป
อปุ กรณ์ สาหรั บควบคมุ และบันทึกเสียง
องค์ ประกอบพืน้ ฐานของการ์ ดเสี ยง (Sound card)
 พอร์ ตอินพุตและเอาต์ พุตของเสี ยง (Input and Output Port)
 I/P Port พอร์ ตเชื่ อมต่อลาโพงกับการ์ ดเสี ยง และสาหรับรับ
ข้อมูลเสี ยงจากเครื่ องเล่นซีดีผา่ นนอก
 O/P Port เป็ นพอร์ ตสาหรับเชื่ อมต่อลาโพงเพื่อเล่นไฟล์เสี ยง
หรื อเชื่อมต่อไปยังอุปกรณ์จดั เก็บเสี ยงภายนอก
อปุ กรณ์ ถ่ายทอดสัญญาณเสียง (Audio Transmission)
Phone Audio Jack เป็ นคอนเนคเตอร์สาหรับการเชื่อมต่อทัว่ ไป เพื่อ
แลกเปลี่ยนข้อมูลเสี ยงทางโทรศัพท์ และใช้ถ่ายทอดเอาท์พตุ ของ
สัญญาณวิทยุแบบทรานซิสเตอร์
อปุ กรณ์ ถ่ายทอดสัญญาณเสียง (Audio Transmission)
RCA Jack เป็ นตัวเชื่อมต่อสาหรับถ่ายทอดสัญญาณเสี ยงและวีดีโอจาก
อุปกรณ์ภายในบ้าน ซึ่งมีสีเป็ นตัวกาหนดสัญญาณ เช่น สี เหลืองสาหรับ
วีดีโอ สี แดงสาหรับช่องสัญญาณเสี ยงด้านขวา และสี ขาวสาหรับช่อง
สัญญาณเสี ยงด้านซ้าย
อปุ กรณ์ ถ่ายทอดสัญญาณเสียง (Audio Transmission)
XLR Audio Connector ใช้สาหรับไมโครโฟนที่มีคุณภาพสูง
ประกอบด้วย 3 ขา ขาที่ 1 เป็ น ground ส่ วนขาที่ 2 และ 3 จะเป็ น
ขั้วไฟฟ้ า
การแปลงสัญญาณเสียงจากห้ องบันทึกเสียง
รูปแบบไฟล์ เสียง
WAV เป็ นการเก็บข้อมูลจากสัญญาณออดิโอในรู ปแบบคลื่นเสี ยง
ความถี่ โดยคุณภาพเสี ยงที่ได้จะใกล้เคียงกับต้นฉบับ สนับสนุนการใช้
งานบนแพล็ตฟอร์มของ Window , Mac รวมทั้งสามารถนาไปใช้งานบน
www โดยไฟล์ wav จะไม่มีการบีบอัดข้อมูล ทาให้เสี ยงมีคุณภาพสูง
ไฟล์มีขนาดใหญ่
 MID (MIDI) ไฟล์ที่ถูกสร้างจากชิปสังเคราะห์เสี ยงดิจิตอล โดยเสี ยงที่
ได้เหมือนเสี ยงดนตรี โดยไฟล์จะมีขนาดเล็ก เหมาะสาหรับใช้งานบน
เว็บ
รูปแบบไฟล์ เสียง
MP3 (MPEG Audio Layer 3) เป็ นไฟล์เสี ยงที่พฒั นามาจากมาตรฐาน
ของ MPEG เทคโนโลยีที่ใช้บีบอัดไฟล์เสี ยงให้มีขนาดเล็กลง โดย
สูญเสี ยคุณภาพเสี ยงเพียงเล็กน้อยเท่านั้น และมีอตั ราการบีบอัดได้หลาย
อัตราด้วย ยิง่ บีบอัดมากเท่าใด คุณภาพของเสี ยงก็ลดลงมากเท่านั้น แต่
ไฟล์มีคุณภาพเสี ยงที่ดี คุณภาพสูงแม้วา่ จะมีขนาดเล็ก
WMA มีลกั ษณะคล้ายกับไฟล์ MP3 แต่มีขนาดไฟล์เล็กกว่า โดยไฟล์มี
นามสกุลเป็ น “.wma” สามารถเปิ ดกับโปรแกรม window media player
หรื อ winamp
Ogg เป็ นรู ปแบบของไฟล์ที่ใช้งานได้ฟรี ซึ่งคล้ายกับไฟล์ mp3 แต่
คุณภาพเสี ยงดีกว่า
มาตรฐานการบีบอัดข้ อมูล
MPEG (Motion Picture Experts Group) เป็ นมาตรฐานการบีบ
อัดข้อมูลวีดีโอและออดิโอแบบดิจิตอลที่นิยมมากในปัจจุบนั รู ปแบบที่
นิยมใช้คือ MP3 (MPEG Audio Level 3) โดยจะมีอตั ราในการบีบอัด
ข้อมูลประมาณ 10:1 ถือว่าเป็ นการบีบอัดที่มีคุณภาพสูง ซึ่งได้รับความ
นิยมสูงสุ ดในปัจจุบนั แต่ยงั มีขอ้ เสี ยคือ คุณภาพในการแสดงผลยังไม่ดี
มากนัก
ั สัญญาณวีดีโอระดับ VHS เป็ นการบีบ
 MPEG-1 ออกแบบมาเพื่อใช้กบ
อัดเสี ยงให้มี 2 Channel ใช้กนั ทัว่ ไปสาหรับแผ่นซีดีเพลง หรื อ VCD
 MPEG-2 เป็ นการบีบอัดเสี ยงมีความละเอียดมากขึ้น เป็ นรู ปแบบของ
วีดีโอในแผ่น DVD-ROM โดยรู ปแบบ MPEG- 2 สามารถบีบอัดไฟล์
วีดีโอความยาว 2 ชัว่ โมงได้โดยใช้ขนาดไฟล์ในการบันทึกเพียง 2 – 3 Gb
เท่านั้น
มาตรฐานการบีบอัดข้ อมูล
MPEG-3 Audio Layer 3 หรื อที่รู้จกั กันดีในชื่อ MP3 สามารถย่อ
เพลงและยังสามารถรักษาคุณภาพไว้ได้ใกล้เคียงกับ CD จริ งๆ
 MPEG-4 รู ปแบบไฟล์ MPEG-4 ได้รับความนิ ยมและเป็ นมาตรฐาน
ในการแสดงผลภาพวีดีโอคุณภาพสูง ด้วยความก้าวหน้าทางเทคโนโลยี
ทาให้เราสามารถรับชมภาพวีดีโอ คลิป ตัวอย่างภาพยนตร์โฆษณาได้
จากเครื อข่ายอินเตอร์เน็ตโดยตรงในแบบสตรี มมิ่ง

มาตรฐานการบีบอัดข้ อมูล
MACE เป็ นเทคโนโลยีที่มีจุดเด่นคือสามารถบีบอัดและขยายข้อมูลให้มี
ขนาดเท่าเดิม ซึ่งใช้ได้เฉพาะเสี ยง 8 บิต อัตราบีบอัดประมาณ 3:1 และ
6:1 และทางานเฉพาะแมคอินทอชเท่านั้น
U-Law, A-Law เป็ นมาตรฐานที่บีบอัดข้อมูลเสี ยง 16 บิต อัตราบีบอัด
ประมาณ 2:1
ADPCM (Adaptive Differential Pulse Code Modulation) บีบอัดข้อมูล
เสี ยง 8 และ 16 บิต อัตราบีบอัดประมาณ 2:1 และ 4:1
ซอฟต์ แวร์ สาหรับเทคโนโลยีเสียง
- Winamp
- Sonique
- Jet Audio
- Cakewalk
- Windows Media Player
- Real Player
- Quicktime
- XingMPEG
- Cool Edit
- Etc.
ซอฟต์ แวร์ สาหรับเทคโนโลยีเสียง
เสียงบนระบบเครื อข่ าย
การใช้ งานเสี ยงบนระบบเครือข่ ายมีสองรูปแบบคือ
1. จัดเก็บข้อมูลเสี ยงจากระบบเครื อข่าย (Download) ลงบนเครื่ อง
คอมพิวเตอร์ของผูใ้ ช้ก่อนแล้วจึงแสดงผล
2. แสดงผลเสี ยงในขณะที่ใช้งานบนระบบเครื อข่าย (Streaming) วิธีน้ ี
คุณภาพของเสี ยงจะขึ้นอยูก่ บั ประสิ ทธิภาพของอุปกรณ์เชื่อมต่อ
แบบฝึ กหัดท้ ายบท
1. จงแสดงวิธีการหาขนาดไฟล์ที่บนั ทึกเสี ยงแบบสเตริ โอนาน 2 นาที ที่
Sampling Rate 44.1 KHz Sampling Size 16 Bit
2. การเพิ่มหรื อลดค่าอัตราการสุ่ ม (Sampling Rate) ของเสี ยง จะส่ งผล
กระทบด้านใดบ้าง
3. จงบอกข้อดีและข้อเสี ยของการใช้งานไฟล์ MP3