多媒體介紹

Transcript 多媒體介紹

第十一章多媒體概論
課前指引
現今資訊產業能夠蓬勃發展，深入各個角落與應用場合，全拜
網路與多媒體之賜，在接下來的三個章節中，我們將分別介紹
多媒體與網路的原理與應用。多媒體簡單來說，就是包含了多
種的媒體，包含文字、音訊、影像與視訊、動畫等，使得資訊
的呈現得以豐富化，並應用於各式各樣的場合。
第十一章多媒體概論
早在十年前，多媒體就成為資訊領域的一個分支，許多資訊科
系都有多媒體組，甚至將多媒體獨立為一個系所，可見多媒體
在資訊普及與推廣上扮演非常重要的關鍵角色。在本章中，我
們將從多媒體的定義與種類開始介紹，進而說明多媒體的基本
原理與常見應用。
章節大綱
11.1 什麼是多媒體
11.5 動畫媒體
11.2 文字
11.6 視訊媒體
11.3 音訊媒體
11.7 資料壓縮原理
11.4 影像及圖形媒體
11.8 多媒體的技術發展與整合應用
備註：可依進度點選小節
11.1 什麼是多媒體
多媒體就是多種媒體的意思，而什麼是媒體(Media)呢？
媒體是資訊傳播的內容、工具與載體
舉例來說，電視、廣播、電腦網路、報章雜誌、路邊大型廣告物等都屬
於媒體，這些媒體的工具與載體有些區別
• 無線電視與廣播牽涉到頻率與台內設備
• 網路則牽涉到網站伺服器與頻寬
並且因為工具與載體的區別也會影響內容的區別
• 例如廣播就不牽涉到影像，而報章雜誌不會牽涉到視訊，這是因為設
備的緣故。
• 早期電腦功能不發達之前，其內容也僅限於文字而與影音無關，甚至
在網路與錄製設備不發達之前，影音內容的發展也受到很大的侷限。
換句話說，工具與載體當然會影響媒體的表現方式。
• 雖然工具與載體會影響內容的傳播效率與結果，但當單獨提到多媒體
時，通常不會考慮工具與載體，只會強調資訊內容的多樣性。
• 只有在單獨提到某類媒體時，我們才會介紹其製作工具與載體的影響
4
11.1 什麼是多媒體
有了上述概念之後，我們可以
給多媒體一個定義如下：
多媒體(Multimedia)是：
• 在進行資訊的製作與傳播時，使
用並整合一個以上的媒體，這些
媒體的內容種類包含文字、音訊
、圖形、影像、視訊、動畫以及
未來隨著硬體設備增加而產生的
新種類（例如立體投影）。
舉例來說
• 早期的默劇電影只有影像，沒有
聲音，沒有文字。而後來加入了
聲音、音訊、文字，甚至是最新
流行的動畫之後，電影就成了多
媒體的一種展現。
圖11-1 多媒體內容包含各式各樣的
資訊呈現形式
5
11.1.1 多媒體的種類
目前電腦與網路的資訊呈現已經是多媒體的模式，首先，我
們先來認識常見媒體的種類有哪些。
文字(Text)
• 文字是電腦最早期與人類溝通的方式，文字除了本身的意涵之外
，也可以藉由一些特效來表達更多的語意，例如粗體、斜體、字
型的設定等。除此之外，文字也常被用來做為輔助說明其他媒體
之用，進而使得其他媒體得以被搜尋進而使得資訊得以流通。
音訊(Sound)
• 正如同人類科技的發展史一般，在文字之後，音訊成為了電腦提
供的第二種媒體形式。
• 音訊簡單來說，就是聲音的訊號，因為聲音本身原是類比訊號，
它是由於物體的震動而產生，具備能量特性，可透過空氣、液體
等介質，以波（聲波）的形式進行傳遞，達到資訊傳遞的目的。
• 要利用聲音作為一種媒體，就必須儲存聲音的訊號，也就是音訊
，由於電腦屬於數位機器，因此，需要透過一些方法將聲音進行
編碼為數位訊號，然後才能儲存、播放與傳遞在電腦與網路之間
。除非在播放時，否則只需要維持編碼後的數位訊號即可。
• 除了自然界的原始聲音之外，電腦也可以透過MIDI音效模擬樂器
的聲音。
6
11.1.1 多媒體的種類
圖形影像(Graph and Image)
• 圖形和影像的區別就如同圖畫與照片
– 圖形指的是從無到有創造出來的圖案
– 而影像則是將自然界呈現的景色擷取而成，當中可經過加工而進
行改造。
• 圖形
– 圖形是表達資訊的一種良好手段，很早就被使用於人類發展史之
中，例如統計表、架構圖等。
– 在不易透過文字進行簡單描述的情況下，利用圖形來表達資訊，
是一種非常好的方式。
– 隨著軟體的進步，現在透過電腦繪製圖形，不但能繪製2D圖形，
也能繪製3D圖形。
• 影像
– 自從人類發明照像的拍攝技術以來，影像就一直是人類保存與傳
達資訊的重要技術之一。
– 在電腦不普及的年代，影像就有加工的需求，現在隨著軟硬體的
進步，不論是影像的取得、影像的存放、影像的加工以及影像的
流通都更加得方便。
7
11.1.1 多媒體的種類
動畫(Animation)
• 如果將一張張連續的圖形快速播放就會變成動畫，早期的卡
通影片是利用人類眼睛的視覺暫留原理而製作，電腦的動畫
也是採用相同的原理。
• 傳統動畫的製作必須建立大量的圖形，會耗費大量時間與人
力，為了更快速製作動畫，現在有些軟體可以藉由插補技術
，由電腦自行計算完成所需要的中間圖形。
• 同樣地，動畫也可以區分為2D動畫與3D動畫。
圖11-2 Flash動畫常應用於網站首頁
8
11.1.1 多媒體的種類
視訊(Video)
• 影像只是靜態的拍攝，而動態的攝影就是視訊，錄影結果可以經
過編修等加工後，形成視訊。
• 早年製作電腦視訊內容是困難的，只有專業的工作室才能完成
• 拜錄影設備的普及、電腦硬體效能的提升、軟體的改良與網路頻
寬的加大，視訊儼然成為傳達資訊的最新潮流，使得視訊媒體不
再被電視台、電影所壟斷，這個變化，讓一般的素人與業餘愛好
者也能夠分享自己的影片給全世界的人們。
圖11-3 Youtube影音分享平台對於視訊媒體的發展具有極大的貢獻
9
11.1.2 多媒體的應用
多媒體已經應用在生活中的各種場合，並且提升了這些
應用的趣味性、效率性、推廣性等多項優點，以下是常
見的應用：
網路：
• 網頁本身就可以加入多媒體的資訊，除了文字以外，也可以加入音訊
、視訊、動畫等，這些多媒體效果使得大眾更願意瀏覽網頁，透過網
際網路進行資訊的傳達。
• 除了網頁之外，在點對點的網路溝通上（如MSN），也加入了即時視
訊效果或音訊的傳達，使得網路的應用不再侷限於文字的溝通，甚至
已經搶食到原有的電話市場。
教學：
• 多媒體教學在過去十年一直是電腦教學強調的重點，其實在過去未使
用電腦進行教學之前，教師們或書商就經常藉由畫圖或播放事先製作
好的影片來補強文字上的說明，將這些教材加入到電腦教學中是最自
然不過的事。
• 除此之外，互動也常是教學的一種手段，為此，多媒體也透過程式設
計或工具發展出具有互動效果的內容，稱之為互動式多媒體。
• 未來的電子書不再是單純的將書變成電子化而已，還會加入許多互動
式效果，使得讀者能夠更快地吸收與理解書中所要傳達的資訊。
10
11.1.2 多媒體的應用
【互動式多媒體】
互動式多媒體並不僅止應用於教學上，諸如遊戲、導覽等只要是希望與
使用者透過互動增加效果的應用場合都可以如此設計。
娛樂：
• 娛樂是多媒體的主要產業之一，例如3D電影、動畫電影、線上遊
戲等，許多都是依靠多媒體軟體的改善，使得原本難以製作的效
果越來越容易完成，這也使得這些產業所需的人才不再難以找尋
，進而擴大了產業的產能。
導覽：
• 不論是博物館或園區的導覽，通常影片或地圖會比單純的文字說
明來得容易傳達資訊，因此，多媒體特別適合用於導覽的應用。
• 除此之外，互動式多媒體，更是導覽的一大利器，可以讓遊客在
實際遊覽前先透過與電腦的互動，預覽即將瀏覽的目的地，並規
畫出遊覽路線。
11
11.1.3 多媒體產業
多媒體產業包含(1)硬體製造商(2)軟體供應
商(3)內容提供者。各產業須注意的重點略
有不同，說明如下：
多媒體硬體製造商
• 多媒體的發展是為了讓資訊透過電腦發布時，可以獲得使用
者更大的迴響。
• 換句話說，單純的電腦與電腦間的通訊，多媒體是沒有意義
的，而在電腦與人的溝通上，多媒體就變得重要很多。
• 硬體是多媒體的根本，不論軟體如何發展，最終都需要透過
多媒體硬體將其成果展現給使用者，或由使用者處取得資訊
• 在前面，我們知道，多媒體包含眾多種類，除了基本的文字
只需要使用到鍵盤與螢幕之外，其餘的媒體大多需要額外的
硬體設備以便(1)加強使用者的接受度或(2)提供更方便的內
容製作方式，而這也是多媒體硬體製造商的發展重點。
12
11.1.3 多媒體產業
• 這些硬體包含
– 影像媒體的硬體設備，如數位相機、影像擷取卡與掃描機等
– 視訊媒體的數位攝影機、網路攝影機、影像擷取卡、螢幕、投影
機等
– 音訊媒體的喇叭、耳機與麥克風等
– 圖形媒體的數位版/繪圖版
– 以及互動式多媒體的觸控螢幕、體感設備，如Wii的陀螺儀及
Kinect的深度感應器與陣列式麥克風等。
圖11-4 Kinect是一種微軟推出的體感
遊戲設備，目前可應用於Xbox360遊
戲，Kinect藉由彩色與紅外線共三組
攝影機所構成的深度感應器擷取使用
者的動作並進行判斷
13
11.1.3 多媒體產業
軟體供應商
• 多媒體的軟體供應商的主要發展方向，是提供更多製作工具
給製作多媒體內容的使用者使用。
– 例如，影像處理軟體、影片剪輯軟體、動畫製作軟體等。
• 這些軟體的發展方向不外乎兩點
– (1)讓使用者更方便地製作出某些特效。
– (2)減少媒體內容的所需容量。
• 舉例來說，傳統動畫必須一張一張的製作然後快速播放，而
動畫製作軟體則只需要製作第一張原始圖形與其內的物件，
而移動物件所需要的其餘圖形，則可以透過軟體計算方式進
行插補，省去了非常多的製作成本。
• 除此之外，空間是發展多媒體常會遇到的瓶頸，其主要原因
並不在於硬碟容量的大小，而是網路傳輸的頻寬。
• 因此，眾多軟體廠商或研究單位都專注於如何透過壓縮技術
降低多媒體的容量
– 例如JPEG格式就是將點陣圖進行破壞性壓縮，只保留人類視覺感
官能夠分辨的資訊，其餘資訊則可不需要完全保留。
14
11.1.3 多媒體產業
• 多媒體的軟體供應商最著名的是Adobe、Autodesk與
Corel
– Adobe發展的套裝軟體版本為Creative Suite，簡稱ÇS，包含
了Photoshop影像處理軟體、Illustrator繪圖軟體、InDesign
排版軟體、Flash動畫製作軟體、Dreamweaver網頁製作軟體、
Premiere剪輯軟體、After Effects後製效果軟體等等。
– Autodesk公司早期是發展AutoCAD工程軟體的廠商，這個軟體
在建築與機械設計的市占率獨居矛頭，奠定了大量的技術基礎
，爾後為了發展電影、遊戲與娛樂事業所需要的軟體，併購了
相關的企業，推出的Maya軟體主要是應用於3D動畫的製作，而
3ds Max則在3D繪圖具有龐大的市占率，同時也跨足3D動畫製
作。
– Corel公司早期的產品為WinZip和WordPerfect等辦公室軟體以
及CorelDRAW向量圖形製作軟體，爾後則併購了相關的企業，
推出的Painter可用於電腦繪圖、PaintShop Photo則是影像編
輯軟體，會聲會影是一套簡單的視訊編輯軟體，值得注意的是
，發展影像編輯軟體PhotoImpact的台灣本土企業：友立資訊
，也是被這家公司所併購。
15
11.1.3 多媒體產業
內容提供者
• 談及內容提供者時，一般都是以影音效果的製作為主
• 這些使用者主要是透過上述所介紹的各種軟硬體取得多
媒體的內容加以編修或製作
• 目前有許多科技大學都成立了多媒體應用系，其主要的
學習內容就在於熟悉上述各軟體的操作方式。
• 除此之外，傳統的電影、美術等科系為了迎接資訊時代
，也都必須學習上述的軟體。
16
11.2 文字
文字是電腦與人溝通最早出現的媒體，文字能清楚表達要傳
遞的訊息，是最常用的多媒體之一
尤其全球資訊網流行後，網頁的文字超鏈結和關鍵字搜尋更
是傳達訊息的利器
文字需儲存為文字檔案的格式，並具有儲存空間小、利於電
腦處理、可呈現的內容精確等特點
圖11-5 文字媒體可清處表達傳遞的訊息
17
11.2.1 文字的特性
一般手寫文字的特性可能只有語言上的區分，而電腦文字
的特性則包含眾多面向，例如輸入方式、編碼格式、顯示
格式、輸出對象、檔案類型等，分述如下：
文字可利用多種輸入方式，常見者如下：
• 直接使用鍵盤搭配各種輸入法進行輸入。常見的繁體中文輸入法有倉頡、
注音／新注音、大易、行列、嘸蝦米等。
• OCR光學字元辨識：先將文字文件掃描為圖檔，再使用OCR光學字元辨識技
術將其中的文字圖形辨識出來。
• 手寫辨識：可使用手寫板、觸控板、甚至是觸控螢幕進行手寫輸入，然後
透過手寫辨識軟體將圖形轉換為文字。
• 語音辨識：語音辨識最主要的目的是希望電腦聽懂人類說話的聲音，然後
轉換成文字，也可進一步命令電腦執行相對應的工作或只將文字進行儲存
與顯示。
編碼格式：
• 文字必須以特定的內碼格式儲存在各類文字檔案中，半形的英文與數字字
元以ASCII碼為主，而台灣慣用的繁體中文則以Big-5碼為主，簡體字是
GB2312碼。
• 而隨著Web的普及，目前許多文字已經不論是否為英文、中文或日文，都
採萬國字元UniCode進行編碼。
18
11.2.1 文字的特性
顯示格式：包含顯示的字型、顏色、特效（如粗體、斜體
）等，其中字型又分為點陣字型與向量字型兩種。
輸出對象：傳統文字的輸出對象為螢幕或印表機，而目前
也已經開發出語音輸出，可透過特定軟體，將文字用擴音
設備唸出來。
文字檔案的常見類型至少包含兩大類如下：
• 無描述之文字檔：此類文字檔只包含文字本身的資料，並無其他
描述用的資訊。TXT檔案為其最常見之檔案類型，使用記事本軟體
即可開啟、編輯與撰寫，其他如BAT檔也是如此，但BAT檔具有特
定用途（其內容為要批次執行的指令）。
圖11-6 使用記事本編輯純文字TXT檔
• 包含描述之文字檔：這類檔案包含一些描述資訊，用以描述字體
顏色、特效等，常見的有下列幾種：
19
11.2.1 文字的特性
HTML檔案：
• HTML是網頁檔，但本質為純文字檔（可使用純文字編輯
器編輯），當中除了代表資料的文字外，還包含一些描
述資訊，這些描述資訊以標籤（或屬性）型式出現，例
如<b>代表粗體。
XML檔案：
• XML檔的本質是純文字檔（可使用純文字編輯器編輯）
，而用途廣泛不受限制。在XML檔案中，可包含各項資
料的本身，以及描述資料的資料(MetaData)，這些描述
訊息也是使用標籤格式出現，但並未限制其用途，可由
使用者自定，故XML是一種標籤描述語言(Meta
Language)。例如W3C利用XML制定了XHTML，而XHTML中
的標籤如同HTML標籤的功能。
20
11.2.1 文字的特性
RTF檔案：
• RTF(Rich Text Format；豐富文字格式)是微軟制定的文字描述檔
格式，除了代表資料的文字外，還包含一些描述資訊，這些資訊
仍可使用純文字編輯器（如記事本）來觀察，用途是描述字型及
邊框等格式，使用WordPad即可製作RTF文件檔，並且在Word中也
可顯示其效果。
{\rtf1\ansi\ansicpg950\deff0\deflang1033\deflangfe1028{\fonttbl{\f0\froman\fprq2\fcharset136
\'b7\'73\'b2\'d3\'a9\'fa\'c5\'e9;}{\f1\fmodern\fprq6\fcharset136 \'b7\'73\'b2\'d3\'a9\'fa\'c5\'e9;}}
{\colortbl ;\red0\green0\blue255;\red255\green0\blue0;}
{\*\generator Msftedit 5.41.21.2506;}\viewkind4\uc1\pard\cf1\lang1028\f0\fs20 This is a\cf0\f1
\ul\b RTF\ulnone\b0 \cf2\f0 Document\cf0\f1\par
}
解讀為
圖11-7 RTF檔內容與WordPad解讀RTF檔
21
11.2.1 文字的特性
DOC檔案：
• 這是Microsoft Word的檔案格式，當中可記載文字，也包含
字型與邊框等格式訊息，除此之外，Word中也可以包含圖片
等其他非文字格式的資料。
• DOC檔的描述訊息是封閉的，故無法使用純文字編輯器觀察
。而DOCX檔是Word 2007版以後的特殊檔案格式，其最大的
變化在於將部份描述訊息使用Open XML格式來儲存。
PDF檔案：
• PDF（Portable Document Format；可攜式文件格式）是由
Adobe Systems公司在1993年所發展出的檔案格式，主要用
途為檔案交換。
• 它的優點在於可跨平臺、能保留檔案原有格式、開放標準，
能免版稅自由開發PDF相容軟體。PDF在2007年12月成為ISO
32000國際標準。
22
11.2.1 文字的特性
檔案格式檔案格式說明
無描述
 只記錄文字資料本身的內容。
*.TXT
 使用純文字編輯器，便可觀看與編輯檔案內容。
含描述
*.HTML
*.HTM
*.XML
*.RTF
*.DOC
*.DOCX
*.PDF
 本質為純文字檔，可使用純文字編輯器編輯檔案內容，但效果應由瀏覽
器讀取。
 除資料本身外，使用標籤儲存描述資料。
 作為網頁使用。
 本質為純文字檔，可使用純文字編輯器編輯檔案內容。
 除資料本身外，使用標籤儲存描述資料。
 用途不特定，可自行定義標籤。
 除資料本身外，使用「\」引導描述資料。
 可使用純文字編輯器觀看檔案內容，但不易了解其意涵。
 使用WordPad、Word皆可編輯與觀看文件效果。
 除資料本身外，也包含一些描述資料。
 除文字資料外，也可包含圖片等其他資料。
 無法使用純文字編輯器觀看檔案內容。
 需使用WORD等軟體編輯與觀看文件效果。
 Adobe Systems發展的可攜式文件格式，方便於檔案交換。具有跨平台與
開放的優點。
 可使用免費的Adobe Reader軟體觀看文件內容。但欲製作，則必須其他
相關軟體，例如付費的Adobe Acrobat或pdfFactory。
表11-1 文字檔案格式分類
23
11.3 音訊媒體
音訊媒體是利用聲音傳遞訊息，聲音是一種由能量
所產生的震動，通常以空氣為介質，用波動的形式
傳遞到我們的耳中
音訊媒體的製作，首先利用硬體工具進行波形音訊
的錄製，錄製好的聲音是類比訊號，然後利用電腦
進行後續的取樣、量化，轉成數位訊號後，即可進
行進一步的處理與編輯
24
11.3.1 音訊媒體的輸出入裝置
音訊媒體的輸出入裝置包含輸入
音源的麥克風、CD等電氣設備。
輸出音訊的裝置為耳機與喇叭，
並且又分為單音、立體聲、環場
音效等。
音訊輸出也經常搭配其他媒體（例如視訊
）一起展現，具有輔助強化的效果。
某些音訊的輸出入裝置被製作成
同一個硬體，例如耳機麥克風。
圖11-8 喇叭
麥克風可將外界的聲音訊號輸入到音效卡
中，透過音效卡的轉換輸入到電腦，然後
形成數位型態的訊號以方便錄音軟體進行
處理。耳機則可以將音效卡的訊號，轉換
為聲音後輸出。
由於使用麥克風的場合通常會搭配使用耳
機，因此，廠商通常將耳機和麥克風做在
一起，簡稱「耳麥」。
圖11-9 耳機麥克風
25
11.3.1 音訊媒體的輸出入裝置
音效卡
音效卡可說是音效媒體最重要的硬體，具有最基本的聲音輸
入輸出和合成功能。
音效卡主要功能是將電腦所產生的數位音訊轉換成類比訊號
，然後傳送給喇叭／耳機來輸出聲音。
通常音效卡也具備輸入插孔，可將麥克風線插入其中進行輸
入，它會將輸入的類比訊號轉換為數位訊號傳入電腦中。
目前市面上銷售的高階音效卡多已支援多聲道音效控制(杜
比音效、DTS等)，而音效卡的音質解析度與取樣率決定了音
效卡的品質，取樣頻率與解析度越大，則數位音訊的品質就
越細膩。
圖11-10 音效卡
26
11.3.2 音訊處理技術
音訊處理技術是多媒體處理技術的一大重點，許多以訊號
編碼為主的音訊壓縮方式紛紛被制定出來。
以MP3為例，它是利用移除人類聽覺系統中聽不到的聲音，來達到高
壓縮比、高音質的壓縮。
以下我們首先由聲音的物理原理開始說明，進而介紹聲音
如何被轉換儲存於電腦中，以及轉換輸出於耳機與喇叭。
聲音的基本原理
聲音是一種由能量所產生的震動，透過介質（例如空氣、水
）以波動形式傳遞至我們的耳中
更詳細來說，介質產生了震動，此震動對介質造成壓力，而
此壓力會以波的形式藉由介質向外擴散，當這些波傳到人的
耳朵，且頻率範圍在人耳可感應的範圍內(30Hz~30kHz)，耳
膜會因感應而聽見聲音，這就是聲音的產生原理
27
11.3.2 音訊處理技術
聲音的類比轉換數位(Analog to Digital)流程
聲音是類比訊號，要儲存在電腦中，必須先轉換為數
位訊號，以下是聲音輸入的流程：
• 首先，聲音經過麥克風進行輸入，這些聲音波動被轉換成一
連串高低變化的電壓波
• 將電壓波透過低通濾波器濾除其高頻雜訊。
• 透過類比數位轉換器(Analog Digital Converter;ADC)將聲
音波型取樣為數位化音訊。
– ADC為音效卡的主要功能之一，轉換工作一般交由音效卡上專屬
的ADC晶片來負責。
• 將數位化音訊存入記憶體或儲存設備（如硬碟等）。
圖11-11聲音的類比轉換數位流程
28
11.3.2 音訊處理技術
聲音的數位轉換類比(Digital to Analog)流程
相反地，要將數位音訊輸出為聲音也需要將之轉換為類比訊號
，以下是聲音輸出的流程：
• 將記憶體或儲存設備中的數位音訊輸出至音效卡。由音效卡的角度來看，
則為音效卡讀取數位音訊。
• 透過數位類比轉換器((Digital Analog Converter ; DAC)將數位訊號還
原為類比訊號。
– DAC也是音效卡的主要功能之一，轉換工作一般交由音效卡的DAC晶片來負責。
• 還原的類比波形再經過音效卡的低通濾波器將高次諧波濾除，使音訊較為
平滑。
• 最後，將聲音輸出至揚聲器（如喇叭或耳機）。
圖11-12 聲音的數位轉換類比流程
29
11.3.2 音訊處理技術
聲音品質的決定因素
影響聲音品質的要素包含(1)取樣頻率(2)解析度(3)
聲道數，分述如下：
聲音的取樣頻率
• 聲音數位化最重要的就是將類比訊號取樣，取樣頻率是以
Hz(赫茲)為單位，1 Hz代表每秒取樣一次，取樣頻率的倒數
為取樣週期。
• 取樣頻率越高，代表取樣間隔時間越短，所擷取後的數位音
訊資料也就越準確，但資料量較大。例如：CD音質取樣頻率
為44.1kHz
30
11.3.2 音訊處理技術
聲音的解析度(位元深度)
• 取樣在每一個上升邊緣時，
ADC會將當時的值紀錄下來，
量化此紀錄的値稱為樣本，
單位為位元(bit)或稱為解析度
。
• 取樣位元深度(解析度)越多則
越精確，
也會有越好的音質，
同樣地，資料量也會較大。
• 例如：CD音質的解析度為
16bits位元深度。
圖11-13 聲音的取樣和解析度流程
【聲音輸入品質的其他因素】
聲音輸入當然也會受到麥克風的影響，諸如動圈式麥克風、電容式麥克風等，
但已超越本書範圍，故在此不討論。
31
11.3.2 音訊處理技術
聲道數
• 聲道簡單來說就是聲音的通道，最早期的技術為單聲道技術，
而後來則發展出立體聲（DTS與杜比音效等）
• 真實世界人類能夠接受到的聲音是立體聲，例如在馬路旁閉上
眼睛仔細聆聽，我們可以分辨出通過的汽車是由左向右或由右
向左行駛。這是因為假設汽車由左向右行駛，則當汽車靠近時
，左耳聽到的聲音會比右耳聽到的聲音大，然後兩耳聽到的聲
音會相同，最後當汽車遠離時，則右耳聽到的聲音會比左耳聽
到的聲音大
• 如果使用單聲道技術搭配耳機時，我們將無法依照聲音來判斷
汽車的方向，因兩耳聽到的聲音是完全相同的（因為音訊來源
單一且相同，故耳機發出的聲音只有一種），只能判斷汽車靠
近又離開了
• 立體聲的發明，使得失明者得以完成「聽」電影的願望，因它
可輸出多種音訊來源給不同位置的喇叭，使得每個喇叭發出的
聲音是不同的
• 一個好的立體聲對於失明者而言非常重要，因他們可藉由不同的
聲音，運用其日常生活的經驗搭配想像力將電影影像還原在腦海
中。
32
11.3.2 音訊處理技術
• 立體聲目前大多以杜比音效及DTS為主。杜比音效使用杜比數位技術
輸出音效，它允許不同聲道的組合，最多且最常用的是5.1聲道，它
必須使用六個喇叭，其中五個為主要喇叭，分別稱為左前喇叭(Front
Left)、中前喇叭(Front Center)、右前喇叭(Front Right)、左後喇
叭(Rear Left)、右後喇叭(Rear Right)。另外還有一個負責重低音
的Subwoofer喇叭。喇叭連接法配置圖如圖11-14，即可構成環繞音效
。
圖11-14 杜比音效的5.1聲道配置示意圖
• DTS（Digital Theater Systems；數位影院系統）也是採用5.1聲道配置
，與杜比音效類似，但後來發展的DTS-ES則提供了6.1聲道。
33
11.3.3 音訊檔案格式
音訊數位資訊可經由音訊軟體進行播放，也可進行編修或更換格式，常見的音訊檔格式如表11-2整理。
音訊檔說明
案格式
*.wav  聲波形式，以波形(Waveform)儲存聲音。
 一分鐘長度的聲音所使用的記憶體約644K~ 27MB。
*.wma  Windows Media音訊
 wma代表Microsoft Windows Media音訊轉碼器，此類聲音檔案內容是聲音經由wma壓縮後的
結果。
 由於已壓縮，故通常使用於網際網路的傳播。
 UNIX 音訊
*.au
 一般使用於UNIX系統或網際網路的傳播。
*.mp3  使用MPEG-1 Audio Layer 3轉碼器，為目前網路上極為流行的聲音檔案格式。
 可將Wav檔壓縮成1/10的大小，壓縮後可能會導致失真，只是人類的耳朵很難感覺到差異。
*.mp4  mp3是MPEG-1 Layer 3的簡稱，但mp4不同於mp3，mp4是MPEG-4整個標準的簡稱。
 MPEG-4可做為視訊、音訊、視訊+音訊的格式，其中音訊編碼的模組沿用MPEG-2
AAC(Advanced Audio Coding)的標準並做些微改變，成為MPEG-4 AAC標準。
*.mid  MIDI (Musical Instrument Digital Interface；樂器數位介面)是一個工業標準的電子通訊協定，
為電子樂器等演奏裝置定義了各種音符或彈奏碼。
*.midi
 此類檔案內容記錄了樂器、音符、長度、音量等資料，為樂器、合成器及電腦的音樂資訊
交換標準格式。
【轉碼器】
表11-2 音訊檔案格式分類
轉碼器（Codec）代表壓縮與解壓縮程式的縮寫，
通常使用於音效檔或視訊檔。各類音效檔與視訊
檔使用不同的轉碼器，若播放軟體未內建該轉碼
器，則須另行安裝。
34
11.3.4 音訊軟體
音訊軟體分為音訊播放軟體與音訊處理軟體兩大類。
音訊播放軟體僅提供播放各類音訊檔案的功能，例如早期的
Winamp、Windows內建的Windows Media Player以及Apple的
iTunes等。
圖11-15 Windows Media Player音訊播放軟體
35
11.3.4 音訊軟體
音訊處理軟體可提供轉換音訊檔案格式的功能，例如RealOne
更專業的音訊處理軟體還會包含錄音、音軌編輯、混音等功
能，例如GoldWave、Adobe Audition
而頂級的專業音訊處理時常是在工作站上製作，因它需要更
高的硬體效能
圖11-16 Adobe Audition音訊處理軟體
36
11.4 影像及圖形媒體
影像(Image)媒體就是我們常講的圖檔，人的眼睛所
看到的自然景色、建築物等景象，可以透過數位照
相機來拍攝，若欲自行創作影像，亦可藉助繪圖軟
體產生影像。
除此之外，我們還可以對於現有的影像，透過影像
處理軟體進行加工，以產生各式各樣我們所需要的
影像。
37
11.4.1 影像媒體的輸出入裝置
影像媒體的輸出設備一般為螢幕／顯示卡、投影機或印表機
，當中若要求印表機輸出類似相片品質者，則可使用相片印
表機搭配特定用紙來完成
影像媒體的輸入設備則包含攝取平面文件的掃描機、自然景
象的數位相機，和手繪影像的數位板等
影像擷取卡則是影像媒體與視訊媒體共通的輸入介面卡
數位相機
數位相機是利用電子傳感器（CCD或CMOS），將光學影像轉換成電子
影像的照相機。
物體所反射的光被轉換為數位訊號，壓縮後儲存於內建的記憶體晶片
(RAM)或可攜式的記憶卡上，所以可以即時觀看成品，不須經過沖洗
過程，已取代用底片成像的傳統相機
圖11-17 數位相機
38
11.4.1 影像媒體的輸出入裝置
選購數位相機可參考數位相機的相關規格，整理如下：
解析度（ Resolution）
• 解析度是一定會標示的規格，例如1600x1200pixels，解析度越高，
照出來的相片畫面越清晰。
• 也有些會以畫素(pixel)來表示，畫素其實就是解析度的長寬值乘積
。
• 比較嚴格的規格還會將解析度分為感光元件CCD的解析度(Sensor
Resolution)與影像解析度(Image Resolution)。若未特別說明是哪
種解析度，則通常指的是影像解析度。
• 而且CCD的畫素會略等於影像畫素。雖然解析度越高越好，但也代表
著照片將佔用比較大的容量，因此您應該視需要選擇或調整解析度。
檔案格式（File Formats）
• 這裡的檔案格式指的是照片的圖檔格式，也就是相機可設定的圖檔格
式，通常至少會提供JPEG壓縮圖檔格式，有的也會提供TIFF未壓縮圖
檔格式。
• 若您希望將圖檔轉為其他未提供的格式，可以透過繪圖／看圖軟體來
轉換。
39
11.4.1 影像媒體的輸出入裝置
記憶卡(Image Storage)
• 數位相機是將照片存放在快閃記憶卡內，快閃記憶卡種類眾
多（如CF卡、SM卡、MMC卡等），您最好使用比較方便的記
憶卡（視您其他的電腦配備而定，例如讀卡機）。有時候，
記憶卡種類不會標示在此規格中，而會標示在介面
(interface)規格上。
• 除了記憶卡種類外，在此項目中，一定會註明記憶容量的大
小，有時候也會以各種解析度的照片張數來表示容量。
LCD預看螢幕(LCD Display)
• 數位相機有一個小小的LCD預看螢幕，可以讓我們不必單眼
靠在觀景窗拍攝，同時也可以做為各項設定時的顯示螢幕
• LCD預看螢幕通常不會提供太高的解析度與顏色，因為那無
關拍攝結果的品質
• 若無提供LCD螢幕，則使用時必須像以往使用傻瓜相機一樣
單眼靠在觀景窗拍攝
40
11.4.1 影像媒體的輸出入裝置
鏡頭(Lens)
• 鏡頭最好具有變焦功能，可以將拍攝物拉近或放遠，大多數
的數位相機都提供『普通』與『近距離』兩種拍攝方式，如
果仍舊不夠使用，有些數位相機也可以加裝外接鏡頭
• 變焦方式一般有數位變焦及光學變焦兩種，光學變焦(zoom
鏡頭)在使用上比較方便，也比較能夠獲得好效果
• 事實上，數位變焦只是透過數位計算的模擬變焦，因此採購
時，應以光學變焦為主
電池(battery)
• 數位相機非常耗電，一般採用三號電池
• 有些數位相機使用鋰電池或鎳氫電池，可以充電，請特別注
意，由於相機極有可能在戶外使用，因此最好出門前檢查電
量是否足夠
傳輸介面
• 傳輸介面必須視您的電腦提供了哪些介面來選擇相機，目前
數位相機的傳輸介面大多以新型態的USB/IEEE1394為主。
41
11.4.1 影像媒體的輸出入裝置
影像擷取卡
• 影像擷取卡是一塊連接於電腦上，專為擷取影像所設計的介面卡
。我們可以利用它來將錄影帶或攝影機所錄的影像（類比訊號）
轉換成數位訊號後傳送到電腦中，再由專門的視訊程式加以處理
。
• 影像擷取卡一般提供1組Composite及1組S-Video輸入端子，可連
接一般V8、Hi-8、錄放影機或影碟機，將您想要的影像擷取到電
腦內，儲存成動態影片檔（即視訊）或靜態圖檔（即影像）。
• 因此，它同時是影像與視訊媒體的輸入硬體裝置。目前大多數的
影像與視訊都是採用數位相機與數位攝影機取得，由於已經是數
位訊號，因此就不再需要影像擷取卡了。
圖11-18 影像擷取卡操作流程
42
11.4.1 影像媒體的輸出入裝置
數位板
• 數位板的板面一般採用4:3比例設計，主要用於手繪圖像，也可用
於影像編輯、照片編修時使用
掃描器
圖11-19 數位版
• 掃描器可將靜態影像文件掃瞄成數位影像，已經是相當普遍的大
眾化產品
• 掃描器是以DPI（Dot Per Inch；每英吋的點數）作為解析度的單
位
• 目前的「多功能事務機」通常已經具備了掃描器功能。（詳見第
六章內容）
圖11-20 掃描機
43
11.4.2 繪圖軟體
影像媒體的相關軟體包含繪圖軟體與影像處理軟體兩大類，
繪圖軟體是提供使用者「從無到有」產生影像的工作環境，
並且也提供影像再編修的能力
點陣圖與向量圖
電腦螢幕是由許多的小點所組成，這些小點稱為像素點(Pixel)，每
一個像素點若填上不同的顏色，就可以顯示出不同的圖形
其中點陣圖(Bitmap)的圖檔就是將圖片的每一個像素點儲存起來，
因此非常佔用空間，點陣圖的副檔名為BMP檔
由於點陣圖太過龐大，因此後來許多研究機構與軟體公司發展了許
多壓縮圖檔的方法，例如常見的GIF（副檔名為GIF）與JPEG（副檔
名為JPG）格式就是已壓縮過的圖檔
44
11.4.2 繪圖軟體
• 可以製作點陣圖及其壓縮格式的繪圖軟體，最著名的就是Windows
所附的小畫家
圖11-21 Windows的小畫家繪圖工具
除了少部分的基礎繪圖軟體之外，大多數的進階繪圖軟體都是以另一
種數學向量方式來儲存圖形檔案（稱之為向量圖），電腦記錄向量式
影像的方式是記錄圖像的座標及圖形種類與相關參數，由於使用向量
方式儲存繪圖元件不必記錄所有的像素點，因此可以製作比較複雜的
圖案，修改圖片或進行圖片變化時，也比較方便，進行縮放時也不至
於失真
• 這類進階的繪圖軟體有Corel公司的Corel Draw及Adobe公司的
Illustrator。
45
11.4.2 繪圖軟體
圖11-22 Corel Draw
圖11-23 Adobe Illustrator
46
11.4.2 繪圖軟體
2D與3D繪圖
上述的Corel Draw及Illustrator只能算是2D平面繪圖軟體，雖
然可以透過某些技巧讓圖片呈現立體感，但並非完全的3D繪圖
真正的3D立體繪圖能夠自由旋轉圖像，顯示不同的面向
• 例如3ds Max與TrueSpace都屬於3D立體繪圖軟體
• 此類軟體一般需要極高的硬體資源（如獨立顯示卡、多核心CPU、大量的
RAM），執行起來才會流暢
除了上述專為3D繪圖發展的軟體之外，有些2D的影像處理軟體
（下一小節介紹）也推出了Extended軟體，可讓原本的2D影像
加入3D效果，例如Adobe PhotoShop Extended
47
11.4.2 繪圖軟體
圖11-24 3ds Max
圖11-25 TrueSpace
48
11.4.3 影像處理軟體
影像處理軟體是對「既有」的影像或圖片進行各類型的加工
，例如調整影像某部分的顏色、色調及飽和度，對影像進行
切割、放大縮小等等
Windows提供的影像處理工具『Image』就是具有上述功能
的低階影像處理軟體
比較高階的影像處理除了提供上述功能外，還提供了合成、
霧化等濾鏡功能
例如Adobe公司發行的PhotoShop就是目前最流行的高階影像處
理軟體
而國內廠商友立(Ulead)也發行了PhotoImpact，雖然功能不如
PhotoShop來得齊全，但由於操作比較簡便，因此在國內外也有
一定的市場佔有率，非常適合初學者或業餘者使用
• （友立已被加拿大Corel公司併購，預計獲得更多資源後，會
逐漸追上PhotoShop的功能）
49
11.4.3 影像處理軟體
圖11-26 Adobe Photoshop
圖11-27 PhotoImpact
50
11.4.4 影像檔案格式
在進行繪圖儲存或影像處理時，常會遇到許多種不同的存
檔格式，我們將常見的影像檔格式的特色分述如下：
BMP檔
點陣圖的最基本格式
最早是由微軟提出並採用的規格，初期就已經使用在Windows作業系
統
支援黑白、灰階、索引色、RGB全彩等類型
由於未壓縮，因此檔案龐大
GIF檔
由點陣圖壓縮而得，壓縮技術為「非破壞性壓縮」
是網頁最常用的圖形格式之一（在非破壞性壓縮的網頁圖片中奪冠）
可儲存為透明圖、交錯圖、和小型動畫等等格式
檔案較小且圖片不失真
最多只能存放256色
51
11.4.4 影像檔案格式
JPG(JPEG) 檔
由點陣圖壓縮而得，採「破壞性壓縮」，壓縮率驚人，但可能
造成圖片失真
是網頁最常用的圖形格式之一（在破壞性壓縮的網頁圖片中奪
冠）
高壓縮的方式使得影像的品質可能會降低
支援黑白、灰階、索引色、RGB全彩等類型
PNG檔
由點陣圖壓縮而得，壓縮技術為「非破壞性壓縮」
是網頁常用的圖形格式之一，但普及度不如GIF檔與JPG檔
介於GIF與JPG之間，各取其特色，例如顏色可達全彩，但為非
破壞性壓縮不失真
可儲存為透明圖、交錯圖
支援黑白、灰階、索引色、RGB全彩等類型
52
11.4.4 影像檔案格式
TIF(TIFF) 檔
由點陣圖壓縮而得，壓縮技術為「非破壞性壓縮」
這是影像處理界最普遍使用的圖檔格式，因為所有的影
像處理或排版軟體都支援TIF圖檔，並且適合用於印刷
輸出
檔案較大，但若經ZIP壓縮傳送，則ZIP壓縮比非常高
UFO檔等特殊軟體檔
依照影像處理軟體的不同，各軟體會提供一些專屬的檔
案格式，用以保存所有使用到的物件，以便日後繼續編
輯，例如UFO檔是PhotoImpact專用的檔案格式，其他軟
體無法開啟
53
11.4.5 影像處理技術簡介
在進行影像處理時，常會遇到一些專有名詞，說明如下：
點陣式與向量式影像
從電腦儲存影像的角度來看，影像可分為點陣式影像
(Raster Image)與向量式影像(Vector Image)兩大類。
點陣式影像：
• 影像是由許多小點組合而成（這些小點稱為像素點），點陣
式影像會記錄每一個小點的資訊，例如該點的顏色，所以顯
示時不需要經過運算，只要直接顯示該點顏色即可。例如BMP
檔即採用此類格式。
【範例11-1】：
以三角形為例，若黑白圖形如右（黑為1，白為
0），則未壓縮的點陣式影像會儲存的資訊為
{0000000000000000, 0000000000100000,
0000000001100000, , 0000000010100000,
0000000100100000, ...... , 0010000000100000,
0011111111100000, 0000000000000000}。
圖11-28 點陣圖影像範例
54
11.4.5 影像處理技術簡介
向量式影像：
• 向量式影像是透過數學方式計算，將影像顯示出來，通
常用在美工插畫與工程繪圖。所以存放的只有關於該影
像的重要座標與必要參數，例如：{圖形種類，起點座
標，長度，寬度} 。
【範例11-2】：
以方形為例，要以向量方式儲存下列圖形，則儲存的資訊為{實心方形, (2, 1),
5,5}
圖11-29
向量圖影像範例
55
11.4.5 影像處理技術簡介
點陣式影像
向量式影像
優點 1.可製作各式的影像處理。 1.適合記錄幾何圖形。
2.效果逼真。
2.易於改變圖形屬性，處理
3.用途廣泛。
速度快。
3.儲存圖形所需的空間小。
缺點所佔記憶體龐大。
1.不適於記錄不規則內容的
影像。
2.進行影像處理特效困難。
應用 1.相片的保存與處理。
1.建築、機械製圖、流程圖
2.各種影像的製作與編輯。繪製等幾何繪圖。
2.虛擬實境、2D動畫、3D影
像繪圖。
表11-3 點陣式影像與向量式影像的特點
56
11.4.5 影像處理技術簡介
影像處理的專有名詞
像素
• 像素又稱為像素點，在點陣圖中，影像是由眾多小點組成，這些
小點稱之為像素(pixel)，因此，越大或解析度越高的點陣圖，所
需要使用的儲存空間也越大。以範例11-1為例，該圖片包含16x12
個像素。
影像大小（尺寸）
• 影像大小代表影像的寬與長，例如800x600，1024x768等。在點陣
圖中，影像大小代表的就是像素點的數量。
影像深度
• 影像深度代表一個像素點所佔用的位元數，例如8位元、16位元等
等，使用越多的位元數，可以表達的顏色越多種，以8位元的深度
為例，每一個像素點可以有256種變化，因此，影像格式為256色
。而若想要達到65536色，則深度必須為16，也就是每一個像素點
必須使用16位元，因為216=65536。
解析度
• 解析度是單位長度所包含的點數，一般單位為DPI(Dots Per
Inch)，代表一英吋內的點數。在數位影像中，點數代表像素點的
數量，因此也會以PPI(Pixels Per Inch)來表示單位。
57
11.4.5 影像處理技術簡介
• 例如一張6 x 4吋大小的照片影像圖檔，當以300 PPI的解析
度印刷輸出時，總共會輸出(6 x 300)x(4 x 300)＝
2,160,000個像素。
圖11-30 不同的影像解析度
• 事實上，解析度在不同場合中會常常出現，因而可區
分為影像解析度、輸出解析度、掃描解析度等等。
【鋸齒現象】
在範例11-1中所使用的16x12尺寸／解析度明顯不足，因此三角形的斜邊呈現
鋸齒狀，如果同樣的單位面積的像素點可以達到800x600，則鋸齒狀現象就會
改善。
58
11.4.5 影像處理技術簡介
顯像原理及色彩
不論是點陣圖或向量圖，對於顯示器而言，傳送到顯示器的資
料都是類似點陣圖的像素點資訊（如果是點陣圖，可直接傳送
，如果是向量圖，則需要經過軟體運算出像素資料後再傳送）
顯示像素點的方式很單純，如果是單色影像，則只有黑白兩色
，故使用一個位元來表示即可，而對於彩色影像而言，則需要
使用較多位元來表示，早期的為4位元、8位元；過渡期的為16
位元，現在較流行的則為24位元與32位元，其原理都是利用『
紅、綠、藍』三原色來調配眾多色彩（針對16位元、24位元與
32位元而言）
以下，我們就各種顏色加以介紹
單色 (Mono)
• 一個位元代表一個像素點，只需要表達黑白兩色
256 灰階 (256 Gray level)
• 256 灰階仍屬於黑白影像，但已經有明暗深淺之分，所謂256灰階，
代表共有256種層次的明暗度，因此，一個像素點需要使用8 個位元
(28=256)來表示
59
11.4.5 影像處理技術簡介
16 色
• 16色可以說是最陽春的彩色模式，一個像素點需要使用4個位元來
表示(24=16)，採用索引色彩技術（index-color），將各種顏色
對應固定的4位元圖樣(pattern)，其對應如下表：
0
0
0
0
0
0
0
0
圖樣
0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1
顏色
黑
藍
綠
灰藍
紅
紫紅（洋紅）
棕
灰（淺白）
1
1
1
1
1
1
1
1
圖樣
0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1
顏色
深灰
寶藍
淺綠
淺藍
淺紅
淺紫
黃
白（亮白）
表11-4 16色的4位元圖樣顏色對應表
60
11.4.5 影像處理技術簡介
256 色
• 一個像素點需要8個位元來儲存，同樣採用索引色彩技術（indexcolor），因此可以表達256 種不同顏色(28=256)。
65536色（64K）高彩模式(Hi-Color)
• 高彩採用『三原色調配』方式產生顏色，一共使用2個位元組（16
位元）來儲存像素點的顏色，早期分為555位元（第一個位元不使
用）與565位元兩種表示法
• 現今大多採565位元方式，也就是紅色佔 5 個位元、綠色佔 6 個
位元、藍色佔 5 個位元（格式為RRRRRGGGGGGBBBBB），因此一共
可產生25x26x25=32x64x32=65536種顏色。
全彩模式(True Color)
• 全彩模式是最接近自然界色彩的模式，一共提供一千多萬種顏色
（一般稱為16.7百萬色），它也是採用『三原色調配』方式產生
顏色，並且至少必須使用24位元（224=16,777,216），其中紅、綠
、藍色都各佔8位元，格式為（RRRRRRRR GGGGGGGG BBBBBBBB），
由於4個二進位數恰可對應1個16進位數，因此一般以(RR GG BB)
來表示，例如(FF FF 00)代表黃色。
61
11.4.5 影像處理技術簡介
圖像內容
圖像內容是影像處理或看圖軟體得以還原圖像的依據
以點陣圖為例，圖像本身所需空間為「圖像高 (像素點數) ×圖像寬
(像素點數) ×像素深度 (位元數)」
而除了圖像的每個像素內容外，也必須把圖像構成的基本要素加以記
錄，這些要素包含下列資訊，通常記錄於檔案開頭，故又稱為表頭資
訊：
• 1. 圖像的長寬所佔的像素點數
• 2. 圖像所採用的色彩模式
• 3. 若採用16色或256色模式時，則必須記錄所採用的調色盤
62
11.4.5 影像處理技術簡介
【RGB三原色調配】
利用光學原理，紅(Red)、綠(Green)、藍(Blue)RGB的3原色可以調配出各種顏色，
例如黃色就是全紅+全綠調配而成，如圖。目前常見的高彩與全彩都是採用3原色
調配方式產生各種顏色。
圖11-31 RGB三原色調配
【CMYK印刷四色模式】
我們常使用的RGB模式並不適用在印刷輸出上，印刷輸出時，通常使用四種顏料
來著色，也就是青色(Cyan)、紫紅色(洋紅；Magenta) 、黃色(Yellow) 及黑色
(blacK)。。RGB是直接採自光線的色彩組合，而CMYK則是利用照射在顏料上反射
回來的光線色彩來組合（也就是3原色的補色）。CMYK中的K，代表的是黑色，
由於CMY等量混合後，仍無法產生完美的黑色或灰色，因此印刷時會額外加上黑
色色彩，而又為了與藍色(Blue)有所區隔，因此黑色(blacK)，改採K作為代表字母。
通常RGB的檔案比CMYK檔案小一些，因此編輯時可以先用RGB模式來編輯，等到
需要進行實體印刷時，再轉為CMYK模式進行輸出即可。
63
11.4.5 影像處理技術簡介
【24位元全彩與32位元全彩的差別】：
全彩其實有兩種，分別使用24位元與32位元。一般人會認為使用越多位元記
錄像素點的顏色，可以使得影像的顏色產生更多種的變化，這句話在一般狀
況下是對的，不過由於32位元全彩實際上仍舊使用24個位元來記錄像素點的
顏色，因此32位元全彩並不會比24位元全彩表達更多種類的顏色。
既然如此，為何我們還要浪費8個位元呢？這是一種以空間換取時間的策略，
由於記憶體與磁碟機的硬體存取、組合語言指令、高階程式語言變數資料型
態等設計通常都只提供單位元組、雙位元組、四位元組（字組）等2的次方位
元組存取單位，因此，當您要讀取24位元時，通常需要分解為三次單位元組
的讀取，既然如此，為何我們不直接讀取四位元組的資料，然後針對其中的
前三位元組來作處理呢？也就是因為這樣，所以才有32位元全彩的設計。
64
11.4.6 BMP點陣圖檔
BMP檔包含表頭資訊與像素資訊兩部分，首先我們可透過檔案
總管觀察圖檔的大小如下
就該圖為例，PG30009.bmp是24位元色彩的BMP圖檔，檔案大小為102,774位元
組，由於寬與高為160×214=34,240，而每一個像素點的深度為3個位元組
(24bits)，故要存放所有像素點必須使用34,240×3=102,720個位元組
這和102,774仍相差了54個位元組，這54個位元組即為表頭資訊
按右鍵執行
【內容】指令
65
11.4.6 BMP點陣圖檔
BMP圖檔的表頭資訊分為兩大部分，第一段佔用14個位元組（
例如檔案大小記錄於此區間），第二段佔用40個位元組（例
如寬與高記錄於此區間），詳細資訊整理如表11-4。
位元組編號
（第一段）
#0-1
#2-5
#6-9
#10-13
（第二段）
#14-17
#18-21
#22-25
說明
代表點陣圖的標識
這兩個位元組固定為424DH，對應ASCII則為BM
代表檔案大小
保留（因此皆為0），可作為往後擴充使用
記錄圖形資料的起始位址
一個常數值，用來描述影像區塊的大小
在不同的系統中，常數值並不相同，在Windows中為28H
點陣圖的寬度（以像素點數量表示）
點陣圖的高度（以像素點數量表示）
66
11.4.6 BMP點陣圖檔
位元組編號
#26-27
#28-29
#30-33
#34-37
#38-41
#42-45
#46-49
#50-53
說明
彩色平面數，通常為 1 (十六色影像則為4)
每個像素的顏色位元數，亦即深度。常用值是1、4、8（灰階）和24（全彩）
記錄所使用的壓縮演算法，可能的值為0、1、2、3、4、5
若未壓縮則其值為0；JPEG壓縮則為4
實際圖形檔的字組大小
圖像水平解析度（單位為像素/英吋）
圖像垂直解析度（單位為像素/英吋）
所用顏色數目
保存所用重要顏色數目。若每個顏色都同等重要時，則與顏色數目相等
表11-4 BMP圖檔的表頭資訊（54個位元組）
想要觀察上述的PG30009.bmp點陣圖，可透過debug指令或UltraEdit等軟
體開啟它，通常會以16進制表示各位元組內容，如下圖：
67
11.4.6 BMP點陣圖檔
圖11-32 觀察點陣圖BMP檔內容
請注意，當以四個位元組代表一組資料時，必須反過來觀看，例如
圖檔之大小顯示為「76」「91」「01」「00」，實際上應該是「00
」「01」「91」「76」H個位元組 = 102,774個位元組。
【註】關於JPEG檔的說明，請見11.7節。
68
11.5 動畫媒體
動畫製作原理
由於人類的眼睛在分辨視覺訊號時，會產生「視覺暫留」的現
象，因此只要先製作多張連續性靜態圖片，每一張圖片只做一
些小小的改變（如位置或造型），然後以快速連續播放的方式
進行處理，就可以欺騙眼睛，造成動畫的效果
動畫中的每一張圖片稱為視框(Frame)，而播放視框的速度將會
決定動畫的流暢度
在電視上或電影上所看到的卡通動畫，都是利用人類視覺暫留
的原理，透過快速更換畫面的內容，逹到動態的目的
卡通動畫目前常見於卡通影片、電影或電腦遊戲等應用
電腦動畫又分成2D動畫和3D動畫，說明如下：
2D動畫：
• 2D(2 Dimension;二維)動畫是利用人類的視覺暫留，將一連串的
圖片在螢幕上快速連續地播放所產生的動畫效果
• 2D動畫一般分為兩種型式，一種是傳統的GIF圖片交換式動畫，另
一種則是由Flash軟體所製作的動畫
69
11.5 動畫媒體
• GIF動畫的原理是先製作一連串連續動作的圖片，然後透過動畫製
作軟體將之整合為GIF動畫檔，這類的軟體有Adobe Fireworks及
各家廠商（如友立、微軟）推出的GIF Animator等等。其中的
Fireworks還具備向量繪圖的功能
圖11-33 友立的GIF Animator
70
11.5 動畫媒體
• Flash是一種網頁動畫製作軟體，目前版本為Flash CS5.x，在Flash 4之
後，Flash就快速擄獲首頁動畫製作者的心，這是因為它結合了向量繪圖
工具以及流程控制，使得動畫產生了許多的特殊效果，除此之外，我們還
可以在Flash動畫中加入影音的媒體資料，也可以透過Action Script程式
進行流程控制，製作各式各樣的網頁遊戲。 Flash 提供了動畫插補的功
能，所以並非每一張圖都要使用者自行繪製，在製作動畫上節省了非常多
的時間。
圖11-34 Flash動畫軟體
71
11.5 動畫媒體
3D動畫：
• 3D(3 Dimension ; 三維)動畫的製作原理遠比2D動畫來得複雜，
3D動畫會記錄圖形物件的三度空間座標，具有十足的立體感與光
影效果。
• 3D的立體動畫，主要的代表軟體是Alias公司的Maya、Autodesk公
司的3ds Max等。
• 3ds Max是一套具有強大製作3D電腦動畫功能的軟體（也可用於3D
繪圖），被廣泛用於電影、電視、廣告、電腦遊戲和電視遊戲等
的數位特效創作。
【獨立顯示卡】
由於3D動畫需要使用大量的硬體資源，
故不但在製作時應使用含獨立顯示卡
的電腦來製作，以加速處理速度，在
瀏覽上也建議使用獨立顯示卡來加速
3D處理，這也是眾多遊戲軟體的特色。
圖11-35 3ds Max
72
11.6 視訊媒體
動畫媒體是將圖像快速連續播放，而視訊媒體的原
理則是將影像快速連續的播放
兩者的差別在於瞬間之單張圖片的來源，前者主要是設計
者自行繪製（如同繪圖軟體的繪圖之意）或電腦自行計算
插補，後者則通常使用攝影、錄影等設備來完成
73
11.6.1 視訊媒體的輸出入設備
視訊媒體的輸入設備包含DV數位攝影機、網路攝影
機、錄影機、VCD/DVD播放機、視訊擷取設備（如視
訊擷取卡）等，輸出設備則包含螢幕與投影機等
網路攝影機
網路攝影機(Webcam)是一個極小型的攝影機，一般不具備大量儲存功
能
網路攝影機搭配視訊軟體，可以透過網路寬頻直接將攝影取得的輸入
視訊傳遞給另一端，通常也搭配麥克風與耳機構成完整的視訊通話
視訊通話扮演著聯繫及增進親友關係的重要橋梁，讓相隔兩地的人彼
此面對面交談與溝通
圖11-36 網路攝影機
74
11.6.1 視訊媒體的輸出入設備
螢幕與電視
第六章所介紹的液晶螢幕是視訊媒體的輸出設備之一，由於視訊媒體
包含電影等較強調聲光效果的媒體，故也時常將液晶電視作為其輸出
設備
不論是液晶螢幕或液晶電視，其主要材質皆為LCD，統稱為LCD液晶顯
示器
LCD液晶顯示器的工作原理如下：
• 主要的核心結構類似一塊「三明治」，兩塊玻璃基板中間充斥著
運動的液晶分子，液晶本身不會發光（屬於背光型顯示器），經
由信號電壓直接控制薄膜晶體的開關狀態，再利用晶體管控制液
晶分子的導通或遮蔽，控制來自背光燈管發射的光線形成圖像的
顯示
• 通電後，如果螢幕上的液晶像素全部打開，則背光毫無遮掩，此
時螢幕一片全白。當要顯示圖像時，輸入信號經由AD轉換，計算
出各像素的通斷狀態後，直接透過信號驅動具體像素，控制該液
晶像素對光線的導通或遮蔽，就可以在螢幕上產生圖像
螢幕後側或旁側通常包含數種接孔，用以連接各類接頭與端子，常見
的有15針腳的D-sub、S端子、AV端子、DVI-D接頭等，整理如表11-5
75
11.6.1 視訊媒體的輸出入設備
圖11-38常見的端子或接頭
接頭與端子
D-sub接頭
S端子
AV端子
DVI-D接頭
說明
D-sub為標準VGA接頭，即電腦顯示器接頭。傳統15pin的D-sub傳輸的是類比訊
號(複合信號)，數位畫面訊號由顯示卡轉換成類比訊號經D-sub傳送到電腦螢幕。
S-端子（S-Video），S是「Separate」的簡稱。它是將視頻數據分成兩個單獨訊
號（光亮度和色度）進行傳送的模擬訊號。
AV端子是家用影音電器用來傳送類比視訊（如NTSC、PAL、SECAM）的常見
端子。在AV端子中傳送的是類比電視訊號的三個來源要素：Y、U、V，以及作
為同步化基準的脈衝信號。
DVI介面有兩種，分別是只能連接數位顯示設備的DVI-D與可以連接數位及類比
顯示設備的DVI-I。DVI介面全部的內容都採用數位格式傳輸，確保主機到顯示
器的傳輸過程中資料的完整性（無干擾信號介入），以便得到更清晰的影像。
表11-5 常見的顯示器端子或接頭
76
11.6.1 視訊媒體的輸出入設備
微型投影機與行動投影機
• 對於要求更大螢幕的電影媒體而言，數位投影機也是常
見的輸出設備之一（詳見第六章說明）
• 值得注意的是，目前投影機的技術已經能夠製作出大小
如同手機般的微型投影機，有些成為手機的功能之一，
稱之為「行動投影機」，方便取得的輸出將使得視訊媒
體更加蓬勃發展
圖11-39 三星的MBP200為投影手機（資料來源：三星網站）
77
11.6.2 視訊媒體的檔案格式
視訊媒體是由動態的影像畫面所構成，若不加以處理而直接儲
存，則容量會大到無法進行有效的傳播，因此，各家廠商與標
準組織推出了各種編碼與壓縮的技術，並且可透過副檔名加以
判斷其格式
常見視訊檔案格式包含MPEG系列（含MPEG-1、MPEG-2等）、AVI、WMV、
QuickTime等格式，說明如下：
MPEG-1（.mpg、.mpeg）
MPEG-1與MPEG-2編碼是常見的工具，它可製作成DVD、VCD或SVCD。MPEG-1與
MPEG-2的資料流都使用 .mpg 和 .mpeg 做為副檔名
MPEG-1檔的解析度只有352x240，NTSC訊號為每秒30影格(f/s)，亮度與色度
之間的比例格式只有4：2：0單一種。使用 200：1 的影像壓縮比例，所以失
真的情形在所難免，每小時資料量約600 MB
MPEG-2（.mpg、.mpeg）
MPEG-2 檔的解析度為 720x480，NTSC訊號每秒30影格(f/s)，亮度與色度之
間的比例格式有4：2：0(或4：0：2)、4：2：2、4：4：4等三種。使用 200
：1 的影像壓縮比例，每小時資料量約 600 MB
MPEG-2 的壓縮品質良好，加上DVD及各國極力推廣的數位電視/高畫質電視
(DTV/HDTV) 均採用 MPEG-2作為壓縮的標準，使得以 MPEG-2 壓縮的影片不
斷增加
78
11.6.2 視訊媒體的檔案格式
【NTSC傳輸訊號規格】
NTSC、PAL、SECAM是大多數國家所採用的電視播放系統規格，
NTSC主要用於北美、日本及台灣等地，而PAL和SECAM則是歐洲
國家使用的規格，大陸方面也採用PAL的規格。
三者的差別如下：
• NTSC 有525條水準線，每秒30個 Frame，因為交錯關係，故每秒共有
60個field，這是類比規格。而數位解析度則為720x480
• PAL的制定比較晚，被認為畫面品質比NTSC好，不過在技術條件差不
多的情況下，做了某些取捨。PAL有625條水準線，每秒降為25個
Frame，因為交錯，故每秒共有50 field。數位規格則為 720x576
• SECAM系統與PAL系統相似，都具有625條掃描線，以及每秒25個Frame
的播放速度。主要與PAL系統的差異，在於使用FM調變方式，來作顏
色的處理
79
11.6.2 視訊媒體的檔案格式
MPEG-4 (*.mp4)
MPEG-4 是目前普及的最新MPEG標準
在音訊方面沿用MPEG-2 AAC的模組，只做小部分修改。
但在視訊方面的編碼，則與MPEG-1、MPEG-2 有非常大的
區別。
• MPEG-1、MPEG-2 對於畫面的編碼是採用矩形為單位進行壓縮，而
MPEG-4 則是以物件為單位進行壓縮
• 這麼做的好處在於，物件除了可以是原本畫面中舊有的物件之外
，也可以是電腦軟體產生的物件，因此更適合用來儲存經由後製
加工的視訊。
• 通常，MPEG-4 的壓縮率可達MPEG-2的1.4 倍，並且品質更佳。
由於採用MPEG-4 壓縮的檔案較小，所以更適合網路下載
、隨身裝置的儲存與播放
• 例如iPad 的視訊播放軟體預設不支援MPEG-1、MPEG-2 的播放，
但支援MPEG-4 第十部分的H.264 之格式。
80
11.6.2 視訊媒體的檔案格式
AVI（.avi）
Audio Video Interleave (AVI) 是「資源交換檔案格式」(RIFF) 的特例，
AVI 是 Microsoft定義開發的格式
.avi 檔案格式是電腦上音訊與視訊資料的最常見格式，僅描述資料儲存方式
與結構，並未指定固定的編碼方式，故播放時必須取得正確的 codec方可進
行解碼，常見的code包含DivX 轉碼器、Cinepak 轉碼器、Indeo 轉碼器等種
類
由於是微軟定義的格式，故.avi檔可使用Windows Media Player加以播放
ASF（.asf、.wmv）
ASF(Advance Streaming Format；進階串流格式)是一種可延伸的檔案格式
ASF可儲存已同步處理的多媒體資料，除可本機播放外，也支援跨越各種網路
通訊協定的資料傳遞播放。Windows Media Player也可播放ASF檔
ASF可使用於音訊與視訊
當只使用Windows Media音訊 (WMA) 轉碼器壓縮的音訊內容，會以 .wma 做
為副檔名。而使用Windows Media音訊 (WMA)及 Windows Media視訊 (WMV)
轉碼器壓縮的音訊內容、視訊內容或影音內容，會以.wmv做為副檔名
81
11.6.2 視訊媒體的檔案格式
QuickTime（.mov）
QuickTime檔案格式為Apple公司所發展，以建立、編輯、發佈和檢視
多媒體檔案為主要功能，副檔名為*.mov。QuickTime 格式可包含視
訊、動畫、圖形、3D和虛擬實境(VR)等內容
只有 2.0或較舊版本的QuickTime檔案才能在 Windows Media Player
中播放。較新版本的 QuickTime檔案需要使用Apple QuickTime
Player來播放
RM（.ra、.rm、.ram）
.rm、.ram檔內容是
「RealPlayer」專屬的
儲存格式，由
RealNetworks公司所發展
檔案內容是以專用的
RealVideo與RealAudio轉碼器
加以壓縮儲存。
可使用RealOne進行播放
圖11-40 Realone player播放器
82
11.6.2 視訊媒體的檔案格式
FLV（.flv）
FLV是Flash Video的簡稱，是一種流行的Flash動畫網路視頻格
式，目前YouTube、Google Video、Yahoo! Video等大部分視頻
分享網站均採用這個格式
原先Flash的產出SWF檔案體積龐大，不能在網路上有效使用，
FLV的出現有效地解決了此一缺點
FLV要用類似FLV Player才能瀏覽視訊檔，網路上也有相關免費
軟體可將*.flv檔案轉換成*.mpg檔案
83
11.6.2 視訊媒體的檔案格式
視訊檔案格式說明
*.mpg與*.mp4 由Moving Picture Expert Group所制定的影像檔案，包含聲音和影像。
Microsoft所定義的檔案格式。可存放不同種類的資料流(data stream)
*.avi
如影像資料流、聲音資料流、文字資料流。
Quick Time專屬檔案，為APPLE公司規畫。可建立、編輯、發佈和
*.mov
檢視多媒體檔案。
ASF(Advance Streaming Format；進階串流格式)為可延伸的檔案格式，
*.asf
可以儲存已同步處理的多媒體資料。
*.wmv
可本機播放，也支援跨越各種網路通訊協定的資料傳遞播放。
Real player所制訂的檔案，內容為聲音、影像資料流的格式，目前有
*.rm
許多網路廣播使用此項技術。
*.ram
Flash Video的簡稱，是一種流行的Flash動畫網路視頻格式，目前
*.flv
YouTube、Google Video、Yahoo! Video等大部分視頻分享網站均採
用這個格式。FLV視頻檔要用 FLV Player才能進行瀏覽。
表11-6 視訊檔案常見的分類和說明
84
11.6.3 視訊軟體
視訊軟體可分為
(1)傳統視訊播放器
(2)網路視訊傳輸播放器
(3)視訊剪輯軟體等三大類
傳統視訊播放器
此類軟體可播放不同格式的視訊檔案，但通常只能播放其中某幾種格
式，而無法播放所有格式，這是因為某些格式的編碼器牽涉到權利金
等問題所致
常見的播放器包含
CyberLink的PowerDVD、
Apple的QuickTime Player
及Microsoft的
Windows Media Player等
圖11-41 Apple的QuickTime Player播放器
85
11.6.3 視訊軟體
網路視訊傳輸播放器
• 網路視訊播放器並非單一獨立的軟體，而是嵌於網路通訊之中，
例如MSN、Skype等，它提供了網路通訊時的視訊功能，使得對話
的兩方可看到對方透過網路攝影機所拍攝的視訊
圖11-42 視訊傳輸
86
11.6.3 視訊軟體
視訊剪輯軟體
• 視訊剪輯軟體是針對
已存在的視訊檔案影
片進行相關特效與後
製處理，包含剪輯、
合成、轉錄、快格、
慢動作等。
• 常見的視訊編輯軟體
有Adobe 的Premiere
及After Effects
Pro、Sony 的Vegas
Pro、蘋果的Final
Cut Express 等。
• 使用此類軟體時，通
常也需要較高的硬體
支援。
圖11-43 Adobe Premiere Pro
87
11.7 資料壓縮原理（以JPEG為例）
數位科技的進步與網際網路的蓬勃發展，各種影像、聲音與
視訊的多媒體應用技術不斷推陳出新，而由於多媒體資料量
的龐大，故資料壓縮(Data compression)就顯得重要且無法
避免
使用壓縮技術對多媒體資料進行壓縮，會造成儲存空間、播
放速度與網路傳輸等多方面的影響，分述如下：
可降低儲存多媒體資料所需的空間
可減少多媒體播放時從儲存體讀出之資料量
可降低網路的傳輸量
會增加CPU的工作負擔
88
11.7 資料壓縮原理（以JPEG為例）
【失真與非失真壓縮】
『壓縮』技術其實分為失真與非失真兩種，其目的都是為了使得檔案小一點
失真壓縮是將資料所佔用的空間減少一點，特色是有部份資料將會無法還原為本來
的面目，此類壓縮技術常使用於圖檔及影像檔，例如JPEG與MPEG
非失真壓縮的意思是壓縮後的資料仍舊可以透過解壓縮過程還原回原始檔案，此類
壓縮技術有ZIP、RAR等等，並且通常必須透過特殊的軟體進行壓縮與解壓縮
多媒體的資料壓縮又分為靜態或動態兩大類，分述
如下：
靜態壓縮：
• 指靜態媒體的壓縮，例如：影像(圖檔)檔案壓縮
動態壓縮：
• 指動態媒體的壓縮，包含：音訊資料壓縮、視訊資料壓縮
89
11.7.1 壓縮標準
國際標準化協會、國際電子學委員會、國際電信協
會等國際組織，於二十世紀90年代領導制定了三個
重要的視訊圖像壓縮編碼國際標準，包含影像的
JPEG標準
視訊的H.261標準和MPEG標準，分述如下：
JPEG：
• JPEG是彩色、灰度、靜止圖像的第一個國際標準，可適於靜態圖
像的壓縮，也是圖像壓縮編碼最常採用的標準
H.261：
• H.261是視訊圖像壓縮編碼的國際標準，主要用於視訊電話和電視
會議等場合，以H.261標準進行壓縮，可獲得較好的品質，以利傳
輸更複雜的圖像
MPEG：
• MPEG視訊壓縮技術是針對動態圖像的資料壓縮技術
• 目前又分為MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等格式
90
11.7.2 JPEG影像壓縮技術
由於壓縮技術屬於非常專業的技術，故在本節中，
我們將僅以JPEG為例，說明JPEG是如何對點陣圖檔
進行失真壓縮，其餘壓縮技術請見多媒體與壓縮技
術專書
JPEG簡介
JPEG是一種針對相片影像廣泛使用的失真壓縮標準方法，名稱
的由來是Joint Photographic Experts Group（聯合圖像專家
小組），此團隊創立於西元1986年，1992年發布了JPEG標準，
並在1994年獲得了ISO 109918-1的認定
JPEG本身只描述如何將一個影像轉換為位元組的數據串流
(streaming)，但並沒有說明這些位元組應該如何在任何特定的
儲存媒體上進行儲存
JPEG的壓縮方式通常是破壞性資料壓縮，意即在壓縮過程中，
圖像的品質會遭受到可見的破壞，故而只能使用於不完全要求
100%品質的場合
使用JPEG格式壓縮的圖片檔案一般也被稱為JPEG 檔案，最普遍
被使用的副檔名格式為.jpg與.jpeg
91
11.7.2 JPEG影像壓縮技術
JPEG編碼
壓縮的過程事實上也是編碼的一種，只不過此時編碼的目的是要讓原
本的資料大於編碼後的資料（如此就達成了壓縮的效果）。因此，在
多媒體的壓縮技術中，常見到所謂的「編碼器」即此原因
JPEG編碼可大幅度減少需要儲存或通訊的資訊量，而縮減後的資訊影
像也的確可以被人們的視覺感官所接受。下圖大略地說明了JPEG的整
個壓縮過程
圖11-44
JPEG圖檔轉換流程圖
92
11.7.2 JPEG影像壓縮技術
圖11-44的轉換步驟說明如下：
色彩空間轉換：
• 首先，影像由RGB(紅綠藍)轉換成為不同色彩空間，目前採用的色彩空間
變換包含YIQ、YUV和YCrCb等三種，與模擬PAL彩色電視傳輸所使用的色彩
空間相似
取樣(Sampling)：
• 若在YUV色彩空間中，減少U和V的成份稱為"縮減取樣"或"色度抽樣"。
JPEG採用的縮減取樣比例可以是4：4：4(無縮減取樣)，4：2：2(在水平
方向取一個2 的倍數)，以及最普遍的4：2：0(在水平和垂直方向各取一
個2 的倍數)。
離散餘弦轉換(DCT，Discrete Cosine Transform)：
• 將影像中的每個成份(Y,U,V)生成三個區域，每一個區域再劃分成如磁磚
般排列的8×8子區域，每一個子區域使用二維的離散餘弦轉換(DCT)轉換到
頻率空間。
量化(Quantization)：
• 人類眼睛對於一個相對大的範圍區域，可清楚辨別亮度上的細微差異；但
是對高頻率亮度變動之確切強度的分辨上，卻不是如此地準確。這個事實
讓我們能在高頻率成份上極佳地降低資訊的數量
• 簡單地把頻率領域上的每個成份，除以一個對於該成份的常數即可完成，
最後進行四捨五入取最接近的整數，這也是整個過程中的主要失真運算
93
11.7.2 JPEG影像壓縮技術
熵編碼技術(entropy coding)：
• 熵編碼是無失真資料壓縮的一個特別形式，它牽涉
到將影像成份以Z字型排列，把相似的頻率群組在
一起，插入長度編碼的零，接著對剩下的部分使用
霍夫曼編碼。
輸出JPEG檔：
• 最後依據特定格式輸出JPEG檔案
94
11.8 多媒體的技術發展與整合應用
電腦在多媒體的軟硬體發展上已經取得相當程度的
成果，並且多媒體技術隨著電腦的軟硬體發展也成
為了一門重要的學科
許多資訊科系皆已成立多媒體學程或學群，更有甚至，某些學校將多
媒體獨立為個別科系或研究所
接下來介紹多媒體重要的技術發展與整合相關應用
95
11.8.1 多媒體個人電腦
隨著多媒體的快速發展，因而衍生出
「多媒體個人電腦」一辭，多媒體個
人電腦（Multimedia Personal
Computer；簡稱MPC）是指使用特定的
硬體與軟體零組件進行輸入、輸出及
處理各種媒體資訊，這些媒體資訊包
括文字、圖形、聲音及影像等
多媒體個人電腦至少包括了DVD、網路
攝影機、麥克風、音效卡、喇叭、獨
立顯示卡及高解析度顯示器等組件，
目前大多數的個人電腦都能夠輕易升
級為多媒體個人電腦
除了上述的基本配備外，多媒體電
腦還可以透過USB/IEEE 1394擴充
更多的設備，例如想要新增照片或
圖像，則加插掃描器或數位相機後
，照片就可以直接傳送到電腦上
圖11-45
多媒體電腦
96
11.8.1 多媒體個人電腦
多媒體電腦除了硬體之外，也需要許多軟體來搭配，如果
要製作多媒體資料則需要透過多媒體編輯軟體來完成
多媒體編輯軟體可建立、編輯和整合多媒體文件，讓多媒
體文件則有一致性、一目了然、力求簡潔、保持生動、傳
遞訊息等特性，常見的多媒體編輯軟體，有些已在前面的
章節詳細介紹過，現將之整理如下：
繪圖編輯軟體：實際應用各種繪圖技巧進行圖形的製作，包含各種繪
製圖形的指令、精確繪圖、編輯圖形等。例如：AutoCAD、CorelDraw
等
影像編輯軟體：又稱為影像處理軟體，主要的功能包含瀏覽、編輯、
整批處理、分頁、影像結合等。例如：Paintbrush、PhotoShop、
Photo Impact等。
簡報編輯軟體：可用來協助製作演講、訓練課程、銷售展示和其它需
要視覺輔助進行展示的場合。例如：Power Point
動畫編輯軟體：透過動畫編輯軟體，動畫家不需要再一格一格的畫，
只需要建立物件和幾個關鍵影格，然後由軟體自動產生填補空檔的影
格即可，又分2D和3D二類軟體。例如：3ds Max、Maya、Flash等
97
11.8.1 多媒體個人電腦
視訊編輯軟體：透過視訊編輯軟體，可輕鬆完成影片的剪接、合成與
配樂同步等工作，也可以使得特效等進階工作變得更容易。例如：
Adobe Premiere、繪聲繪影、Ulead Media Studio Pro等
聲音編輯軟體：兼具錄音功能的聲波編輯軟體。例如：Sound
Recorder、Audacity等
螢幕錄影軟體：可將螢幕的展示過程和聲音一併錄製起來。例如：
PowerCam等
網頁編輯軟體：專為設計網頁的編輯軟體。例如：Dreamweaver、
FrontPage、Silverlight
圖11-46 PowerCam常見於多媒體教學應用
98
11.8.2 多媒體的技術發展
多媒體技術目前的主流發展為「利用電腦的互動式技術和
網路技術處理多種資訊媒體，含文字、影像、聲音、動畫
和視訊等，將多種訊息集合成一個互動式系統」。
相關的技術發展如下：
音訊處理技術：
• 聲音處理、語音識別、聲紋比對、音樂合成、文字語音相互轉換
影像處理技術：
• 影像壓縮、影像處理、影像識別、數位暗房
3D繪圖技術：
• 3D繪圖影像編輯、立體動畫編輯、虛擬實境
視訊處理技術：
• 視訊後製、動態偵測
99
11.8.2 多媒體的技術發展
應用軟體開發：
• 創作工具、編輯工具
多媒體搜尋：
• 擷取多媒體資料的內涵作為索引及設計各類多媒體查詢方法
，以便用於多媒體搜尋處理與多媒體資料庫等方面的應用
多媒體通訊：
• 視訊會議系統、隨選視訊(MOD)和通訊系統設計等
多媒體應用：
• 電腦輔助教學(CAI)、遠距教學、地理資訊系統(GIS)等
100
11.8.3 多媒體的整合和互動應用
多媒體整合(Integration)是利用電腦來安排與整合
多種媒體，可產生更多樣化的作品
例如某一段背景配樂在影片中的哪個時間點開始播放、新聞播
報中子母畫面的相對位置、字幕出現在畫面上的位置與時間等
在電腦網路應用的普及與高速傳輸下，多媒體在企
業界和生活中的整合應用非常多，列舉如下：
多媒體簡報(Multimedia Presentations)：應用多媒體簡報系
統進行產品特點或工作的重點說明
視訊會議(Video Conferencing)：視訊會議是一種重要的多媒
體通信系統，它將電腦的交互性、通信的分佈性和電視的真實
性融為一體。現在的視頻會議系統已經有成熟的產品
家庭視聽：這是多媒體最常見的應用。由於數位化的多媒體具
有傳輸儲存方便、保真度非常高等特色，使得數位化的音樂和
影像進入了家庭，如CD、VCD、DVD等設備
多媒體資料庫：使用多媒體資料庫快速查詢影片、圖案、聲音
等
101
11.8.3 多媒體的整合和互動應用
多媒體互動(Interaction)是一種特殊的多媒體整合
應用，它提供了多媒體與使用者的互動功能，讓使
用者能自由選擇想看的內容，相關應用列舉如下：
公共導覽系統：經由展示模擬方式，導覽系統可導引我們
很快地瞭解環境或事物
虛擬實境：
• 虛擬實境是一項與多媒體技術密切相關的邊緣技術，它
通過綜合應用電腦圖像處理、類比與仿真、傳感技術、
顯示系統等技術和設備，以類比仿真的方式，提供用戶
一個真實反映操作物件變化與相互作用的三維圖像環境
，從而構成一個虛擬世界，並通過特殊設備（如頭盔和
資料手套）或攝影辨識，提供用戶一個與該虛擬世界相
互作用的三維互動式用戶介面。
• 最新且商業化的虛擬實境代表是體感遊戲Kinect，它是
藉由三組攝影機拍攝使用者的動作，然後透過軟體的辨
識進行遊戲的操作，而遊戲中的人物就會隨著使用者的
動作而改變，未來這一項技術將會使用於智慧型電視，
例如只需要揮一揮手，就可以進行轉台，而不再需要使
用遙控器。
圖11-47中華電信的MOD
是多媒體整合應用之一
隨選視訊(Video on Demand)：隨選視訊系統是一種由使
用者主導的視訊選擇系統。所謂使用者主導乃指使用者可
以隨時隨地主動地選擇需要的視訊節目，並且可以隨意地
控制視訊節目的播放方式
102
11.8.4 多媒體的未來發展
未來對多媒體的發展，主要可分為幾個不同研究議題：資料
壓縮、多媒體資訊特性與建模、多媒體資訊的組織與管理、
多媒體資訊的表現與互動、多媒體通信與分佈處理、多媒體
的軟硬體平臺、虛擬實境技術及多媒體應用開發
展望未來，網路和電腦技術相交融的互動式多媒體將成為21
世紀多媒體主流發展方向
未來人們不僅可以從網路上接受資訊、選擇資訊，還可以發送資訊，
並且資訊還是以多媒體的形式進行傳輸
利用互動式網路多媒體技術，人們能夠在家裡購物、點播自己喜歡的
電視節目
不過，互動式多媒體技術的實現，會以電視還是個人電腦為
基礎設備，還未有定論，也有可能兩者在未來合而為一
103
11.8.4 多媒體的未來發展
多媒體正以迅速、意想不到的方式進入人們生活的多個層
面，目前的趨勢是各方面都將朝著當今最新技術綜合的方
向發展，包含大容量光碟記憶體、網際網路和互動電視
多媒體不僅影響資訊的包裝方式和我們如何運用這些資訊
，而且也將改變我們的未來和通信方式
圖11-48 iPad載體有助於多媒體電子書的創新發展
104
重點回顧 & 本章結束
Q&A討論時間
105

多媒體介紹

Transcript 多媒體介紹

Directory