Transcript 多媒體

Chapter 4
多媒體
4-1
4-2
4-3
4-4
認識多媒體
多媒體的資料類型
多媒體的軟硬體設備
多媒體的應用
P.4-2
4-1 認識多媒體
多媒體 (multimedia)
指的是運用兩種以上
的媒體或資料類型所
呈現的資訊
4-2
多媒體的資料類型
P.4-3
4-2-1 文字
文字 (text) 是最基本的資料類型,而且任何文字在電腦
進行處理之前,必須先編碼成唯一的一組位元圖樣。
常見的文字檔格式
TXT
HTML
DOC/DOCX
PDF
P.4-4~4-5
4-2-2 圖形
點陣圖 (bitmap graphic)
是以矩陣的形式儲存圖形,矩陣內的每個點稱為一個像素
(pixel) 。
常見的色彩深度
有下列幾種:
黑白
灰階
16色
256色
高彩
全彩
P.4-6~4-10
常見的點陣圖檔格式
BMP
JPEG
GIF
PNG
TIFF
PSD
RAW
P.4-10~4-11
向量圖 (vector graphic)
是利用數學貝茲 (Bezier) 曲線來描述圖形的輪廓,然後透過解
譯演算法來解譯並轉換成點和線。
常見的向量圖檔格式
EPS
DXF、DWG
WMF
P.4-12
4-2-3 聲音
由於聲音 (audio) 屬於連續的類比訊號,而電腦只能接受0與
1的數位訊號,因此,聲音必須經過如圖下的轉換過程,才
能儲存於電腦。
P.4-13
常見的聲音檔格式
WAV
MP3
MIDI
Real Audio
WMA
CD-AUDIO
Dolby Digital
DTS
P.4-14~4-15
4-2-4 視訊
主要的電視系統視訊標準有下列幾種:
HDTV
NTSC
SECAM
PAL
常見的視訊檔格式
AVI
QuickTime
MPEG
Real Video
WMV
P.4-15
常見的視訊編輯軟體又分成兩派:
一派著重於視訊剪輯,例如Windows內建的Movie
Maker、Ulead會聲會影、Ulead MediaStudio Pro、訊
連科技威力導演、Adobe Premiere Pro、Vegas Video、
Apple Final Cut Pro、iMove…
另一派著重於視訊特效,例如After Effects、Apple
Motion、Shake…。
P.4-16
4-3
多媒體的軟硬體設備
麥克風、錄音設備、數位相機、數位攝影機 (DV)、Webcam、
掃描器、影像擷取卡、攝錄放影機、繪圖板等輸入裝置。
螢幕、顯示卡、喇叭、音效卡、電視外接盒、印表機、液晶
投影機/數位投影機、MP3隨身聽等輸出裝置。
儲存裝置
點陣圖編輯軟體;向量圖編輯軟體;音訊編輯軟體;視訊編
輯軟體;多媒體整合軟體;3D動畫軟體;光碟製作/燒錄軟體。
P.4-17
4-4 多媒體的應用
科技的突飛猛進在處理器及顯示互動設備的發展相當顯著,因
而多媒體的應用逐漸在我們的生活中出現,大幅增進人們生活
上的方便性。本節介紹多媒體技術實際應用的例子,讓我們可
以了解多媒體對一般人日常生活所產生的影響。早期的多媒體
處理功能都需要在電腦的控制下才能使用,例如影像處理軟體
或指紋處理器等都無法不以電腦來操作其性能。然而,電腦科
技的進步讓多媒體功能可藉由軟體與硬體的設計搭配來實現,
從而出現在諸如相機、PDA、手機等各式各樣的設備中。常見
的多媒體應用功能如下:
P.4-17
影像處理功能
當我們擁有品質不佳的影像,例如在拍照時光線不良或焦距設
定不對,就可使用影像處理的技術來改進影像的內容。一張模
糊的影像可藉由強化影像中物體邊界的資訊來獲得較清晰的影
像;而一張偏暗的影像可透過擴大顏色間的對比來調亮它的色
調。常見的影像處理功能包括:調整影像的清晰度、亮度、對
比、色調及飽和度等,當然也可以直接將文字或邊框等物件加
在影像中。目前這些功能已廣泛應用在數位相機上,能讓影像
有更好的拍攝效果。
P.4-17
圖4.14 模糊與清晰處理後的影像
圖4.15 亮度不足與亮度對比提昇後的影像
P.4-18
辨識系統
辨識系統的目的是為了讓電腦了解多媒體資訊的內容,並進一
步處理相對的應用。對電腦而言,多媒體資訊不過就是0和1的
組合,聲音、影像或動畫都須藉由相關的軟硬體才能瀏覽或播
放,但是也僅止於播放而已,電腦是完全不知道內容的意思,
更不用說可以進一步做後續的處理。因此,如果想要認知多媒
體的內容,辨識系統是不可或缺的。常見的辨識可分為語音及
影像兩大類,而影像辨識又可再依辨識的目的細分成人臉搜尋、
人臉辨識、指紋辨識、視網膜辨識、虹膜辨識及條碼辨識等多
種,以下分別為您介紹。
P.4-18
 語音辨識:語音交談是人類最方便的訊息交換方式,所以
讓電腦具備語音辨識的功能就成為自動化很重要的一環。
語音辨識的目的是將輸入的語音變成文字資訊,如此一來
就可以讓電腦聽懂人類的說話,進而讓電腦處理相對應的
工作,例如藉由語音下指令操控手機打電話或命令機器人
做家事等。語音辨識的困難在於每個人的發音都不相同,
甚至剛睡醒或感冒時語調也都會大不相同,同時還須考量
背景雜訊的影響。目前的技術能在上述問題上有相當的進
展,因而已有越來越多的應用提供語音辨識的功能,例如:
語音查詢、聲控家電等。
P.4-18
 人臉搜尋:人臉搜尋的目的是為了尋找影像中的人臉位置。
此功能在與人有關的互動系統中,扮演特別重要的角色。
舉凡門禁管制、保全監控、互動服務等系統都需要擁有一
套有效率的人臉搜尋系統。人臉搜尋系統須考慮到人臉的
膚色及五官特徵,一般可由統計或樣板方式來計算其特徵,
並決定是否為人臉。雖然目前人臉搜尋的技術仍難做到盡
善盡美,但此功能目前已廣泛見諸於數位相機的應用中,
並獲得不錯的效果。
圖4.16 數位相機多已具備人臉搜尋的功能
P.4-19
 人臉辨識:人臉辨識系統除了上述人臉搜尋功能外,更要
進一步辨識人臉的身份。目前已有諸多技術被提出,大多
是利用人臉五官的位置及相對距離來獲得足以辨識不同人
的特徵。此功能在影像隨處可得的現在,更凸顯其方便性。
但人臉影像拍攝時常因臉部表情、光線、髮型變化等因素
影響身份辨識的正確性。人臉辨識的應用非常廣泛,門禁
系統是目前最常見的應用,但舉凡須自動確認使用者身份
的系統皆可視為人臉辨識系統的應用。因此雖然目前人臉
辨識的誤判率仍高,但因其便利性讓眾多相關技術及產品
陸續被開發成產品。
圖4.17 目前已有部份數位相機具有人臉辨識功能
P.4-19
 指紋辨識:指紋辨識顧名思義是辨識指紋的擁有者為何人。早在
多年前人們就發現很難找到兩個具有相同指紋的人,因此指紋自
然地就被用來辨識人的身份。這些年來,由於指紋讀取設備的價
格普及,所以指紋辨識系統也廣為流行,在筆記型電腦或PDA中
常看到指紋辨識的蹤影。指紋辨識技術包括讀取指紋影像、特徵
抽取、保存特徵值和比對四個部份。一開始透過指紋讀取設備讀
取到指紋影像後,要對原始圖像進行初步的處理以獲得更清晰的
指紋影像。接下來依據每根手指特有的脊紋與溝紋找到節點,也
就是那些指紋紋路的分叉、終止或打圈處的坐標位置,然後計算
主要節點間的距離和角度(例如圖4.19藍色直線所繪),定義出
一個模板,再將模板的幾何關係轉換成一組獨特的數字,用來識
別此指紋。日後,當這個人再次將手指放到指紋讀取設備時,系
統只會再次計算他的模板幾何數字,然後與原先儲存的模板幾何
數字進行比對,判斷兩者是否相同以決定使用者的身分。
P.4-20
圖4.18 指紋讀取器
圖4.19 指紋模板分析
P.4-20
 視網膜辨識:視網膜辨識利用光線打在眼球以辨識身份。它利用
眼球後部血管的分佈作為特徵,這種技術具有準確度高且不易偽
造的特點,但設備成本昂貴且操作不易,同時在進行視網膜取樣
時,需將光線打在眼球上的讀取方式會造成使用者心理的恐懼,
這都是廣泛使用視網膜辨識所需面對的挑戰。
圖4.20 視網膜辨識
P.4-21
 虹膜辨識:虹膜辨識也是利用光線打在眼球以辨識身份,但是其
運作原理與視網膜辨識完全不同。虹膜辨識技術利用圍繞在兩眼
瞳孔旁不同的虹膜斑點資訊來進行辨識,此技術與視網膜辨識同
樣不受環境及時間的影響,所以有極佳的辨識效果。但是成本高
昂,而且與視網膜辨識一樣存在著讓使用者對於眼球取樣方式產
生抗拒的問題。
圖4.21 虹膜辨識
P.4-21
 條碼辨識:條碼是以特定規則的圖形來表示英文字、數字、或
一些控制字元。條碼可分為一維及二維兩種,一維條碼為線狀
黑白相間的條紋,同時將其代表意義顯示於條碼下方。目前世
界上有二百種以上的一維條碼,常見的有UPC、EAN、三九碼
與書籍使用之ISBN碼等多種,每一種條碼都有它自己的編碼規
格,有些可同時使用文字與數字,而大部份只可單純使用數字。
條碼掃瞄器的運作原理是由掃瞄器射出紅外線來掃瞄條碼,由
於空白會比線條反射得到更高的亮度,藉由這些明暗關係來獲
得條碼資料。鑒於一維條碼最多只能表示十五個文數字,近年
來眾多系統使用二維條碼以大幅提升儲存資訊量,目前常見的
二維條碼是一套由日本人發明的QR Code。QR Code運用在日
本已行之多年,其中所蘊含的資訊可以是網址,或是姓名、電
話等個人資訊。QR Code多半與手機結合,利用手機的照相功
能與其內建的辨識軟體來進行掃描及辨識。手機用戶只要輕輕
一拍,就能在一瞬間獲得大量訊息,而不需辛苦地鍵入各種資
料,非常地方便。
P.4-22
UPC碼
EAN碼
三九碼
ISBN碼
圖4.22 一維條碼
P.4-22
圖4.23 QR Code二維條碼
資訊化的目的是為了提供人們更便利的生活,由目前多媒體的
應用及對自動化的需求,我們可以預期未來將有各式各樣的辨
識系統出現在日常生活中,人們的生活將因資訊技術的進步而
更加的方便。然而,方便同時也會產生隱私權的問題,不過這
已是另一個課題,不屬於本章的範疇,我們將在第十五章第三
節中進一步討論。
本章摘要
P.4-23
多媒體 (multimedia) 指的是運用兩種以上的媒體或資料類
型所呈現的資訊。
多媒體的資料類型包括文字 (text)、圖形 (image)、聲音
(audio)、視訊 (video) 等四種。
常見的文字檔格式有TXT、HTML、DOC/DOCX、PDF等。
圖形 (image) 又分為點陣圖 (bitmap image) 與向量圖
(vector image) 兩種,前者是以矩陣的形式儲存圖形,後
者是利用數學貝茲 (Bezier) 曲線來描述圖形的輪廓,然後
透過解譯演算法來解譯並轉換成點和線。
常見的點陣圖檔格式有BMP、JPEG、GIF、PNG、TIFF、
RAW、PSD等。
P.4-23
常見的向量圖檔格式有DXF、DWG、WMF、EPS等。
聲音 (audio) 屬於連續的類比訊號,必須經過取樣、計量、
編碼的過程,才能轉換成數位訊號。
常見的聲音檔格式有WAV、MP3、MIDI、Real Audio、
WMA、CD-AUDIO、DolbyDigital、DTS等。
視訊 (video) 指的是同步播放連續畫面與聲音,主要的電
視系統視訊標準有NTSC、PAL、SECAM、HDTV,其中
HDTV目前正在推廣中。
常見的視訊檔格式有AVI、QuickTime、MPEG、Real
Video、WMV等。
學習評量
一、選擇題
1. 下列何者不是文字檔格式?
A. DOCX B. TXT
C. PDF
D. BMP
3. 下列關於點陣圖的描述何者錯誤?
A. 以矩陣的形式儲存圖形
B. 可以依照任意比例縮放
C. 可以精密展現圖形的色彩層次變化
D. 浪費儲存空間
5. 下列何者是以8位元儲存一個像素的色彩?(複選)
A. 高彩
B. 全彩
C. 256色 D. 灰階
P.4-24
P.4-24~25
7. 下列關於向量圖的描述何者正確?(複選)
A. 適合儲存線條清晰、形狀平滑的圖形
B. 以高倍率放大時容易產生鋸齒狀
C. 利用數學貝茲曲線來描述圖形的輪廓
D. 必須搭配JPEG、GIF等壓縮技術來減少檔案大小
9. 下列哪種聲音檔格式屬於合成音樂?
A. WAVE B. MIDI
C. WMA D. DTS