Transcript ch10

單元十
聲音電路
單元十 聲音電路







10-1
10-2
10-3
10-4
10-5
10-6
10-7
語音與音樂
合成技術
音頻響應單元
音樂與聲音合成器
語言合成器
語音認知器簡介
音效卡
10-1 語音與音樂

語音與音樂

電腦的輸出週邊設備以文字及圖形的顯示、列印、儲存為主。


人們希望電腦能以音樂來表示輸出資料,甚至能以語言來表示,
如同人們對話交談一般,使人們與電腦之間,不再只是靜靜的按
鍵或從螢幕來讀取資訊。
對電腦而言,音頻輸出不外乎是音樂、聲音及語音三者。


以電腦來做音樂台成器,不但可以產生各種樂器的音色,更可模
擬各種不同聲音如蟲鳴、鳥叫…各種自然界的聲音,當然,這些
聲音、音樂的合成需要軟體與硬體的配合才可能實現。
電腦在音頻輸出週邊設備方面,大致有下列三種主要類型:



錄音的重播。
音樂和聲音的合成。
語言的合成。
10-2 合成技術

常見的音頻合成方法




相位累加
相加合成
調頻合成
相位累加合成技術




相位累加合成技術又稱為直接數位合成術。
累積器以循環不息的方式連續產生各種聲頻相位。
採用數位處理方式,適合以微處理器來完成
http://www.infinet.com.tw/support/app/TM/20040623DDS/2
0040623DDS_P1.asp
10-2 合成技術

相加合成技術


相加會成技術又稱為數位諧波合成技術。
利用微處理器來控制每一諧波的振幅和頻率以達到合成的目的






任一波形是由一基本波與不同的諧波成份組合而成」。
利用微處理器將各諧波依不同比例合成一所需波形。
利用此種合成技術“幾乎可產生任何聲音波形。
在硬體配合方面,必須為每一聲音諧波設計一種可控制其頻率與
振幅的正弦波產生器
通常需要10一15個諧波才能合成所需之聲音波形
因此硬體較為複雜,軟體配合方面,必須能控制各諧波的頻率與
振幅,對八位元微處理機而言。較難以處理,但是十六位元微處
理器或三十二位元微處理器則不成問題。
10-2 合成技術

調頻合成技術


以一函數波形(通常是正弦波)去調變另一振盪器,藉以改變其
輸出頻率或相位的一種方式。
振盪器未受調制時的振盪頻率稱為載波,而用以調變之信號則
稱之為調變波。



當載波和調變波的比值改變時,調頻波的頻譜也隨之改變,所產
生的聲音也隨之變化。
只要適當地控制載波與調變波頻率的比值,即可產生不同頻譜
利用調頻合成技術可簡單地獲得所需的聲音信號波形
10-3 音頻響應單元

音頻響應單元又稱為音頻播放單元,




將語言經類比至數位轉換電路(ADC)處理成數位信號。儲存於
半導體記憶體中,以免除因磁帶機馬達驅動的機械問題。
其工作原理為將語音(經類比至數位轉換器轉換成數位化資料
,儲存在EPROM內,亦可存於隨機記憶體內)
以報時台為例,只需將時間以時、分、秒組合,即可發出任一
時刻的報時語音,簡單又方便。
通常在這種自動播放系統中,約可使用128個至256個語音字彙
,存於記憶體內,使用時,要求出其柑關位址。再取出資料,
送到數位至類比轉換中(DAC)器,轉換成原來錄製的語音。達
到自動播音的要求。
10-4 音樂與聲音合成器

合成器藉著軟體程式控制電腦將聲音元素組合成音樂或聲音




一切音樂與聲音是人造的。
由程式設計師將基本的聲音元素以某種方式加以合成而得到,
與播放單元所播放再生的原音並不相同,
可任意組合產生各種不同音調、音色的聲音
主要用於






樂團演奏的和聲之用,
電子風琴或電子琴的合聲用
作曲家或音樂家作音樂實驗用
電影或電視上製造各種聲音效果
電視遊樂器中產生或模擬射擊、碰撞、爆炸、背景音樂之用,
個人電腦中演奏音樂、製造音響效果之用
10-4 音樂與聲音合成器

簡單型的聲音合成器




可產生128個到256個可程式化的音調
其頻率範圍一般在1OOHz~3OkHz之間正弦波音調
且為一個聲道輸出。
較複雜的音樂合成器




則可同時產生多種音調,可以用來產生和聲效果,音調不只
256種
可利用記憶體預存不同音色的波形資料組合模擬樂器的音色。
利用組合語言程式來產生各種音調
使用者可行設計或規劃樂譜以演奏音樂

在樂譜中通常包括音階、節拍、音長、休止、反覆、音色、音量
、拍子等各種符號其操作範圍一般在4~6個音程內,有2~4個聲道
輸出。
10-4 音樂與聲音合成器

音樂合成器




一般音樂合成器具有左右聲道輸出能力,其音調範圖則涵蓋了
大部份鋼琴琴鍵的範圍
標準鋼琴琴鍵有88鍵,最低音約為27Hz,
除了較低音的七個琴鍵外,其它音調都可以合成器來模擬產生
硬體部份通常包含下列主要部份:






資料控制振盪器
諧波重生器
聲調電路
音節電路中
節拍產生器
http://www.nsc.gov.tw/_newfiles/popular_science.asp?add_
year=2003&popsc_aid=197
10-4 音樂與聲音合成器

資料控制振盪器




作用在於產生音效合成的基準音正弦波
由於每一音程有十二個半音,因此有合成器設有十二個獨立的正
弦波產生器。
可只振盪一個正弦波信號.再利用除頻電路產生十二個音的信號
目前大部分合成器都由微處理器負責控制,輸入輸出均以數位方
式處理,即輸出信號頻率是由輸入的數位資料來加以控制,因此
稱為資料控制振盪器
10-4 音樂與聲音合成器

諧波產生器




一般樂器的波形中,除了基本波之外,均含有不同程度的諧波成
份,才能使其音色悅耳且具有獨特的聲音。
和用正反器做成除頻電路,將基本信號經四級除2的除頻器,可
產生四個不同頻率的信號波形,分別以第一至第四元素稱之。
第一元素的頻率最低;第四元素的頻率最高,為第一元素的八倍
10-4 音樂與聲音合成器

聲調電路



由於諧波產生電路的輸出信號不適合直接混合以產生所需波形
,因其電壓在2.2V到3.8V之間變化,準位並不一致。
經CMOS緩衝閘加以緩衝,在獲得較為一致的電壓準位後再加到
混合電路中。
四個諧波信號經緩衝後,送到一組電阻階梯網路,經一個CMOS
的傳輸閘才將聲音信號輸出。
10-4 音樂與聲音合成器

音節電路





控制合成信號衰減速度的電路。
決定一個樂器的音質的另一個因素為其聲音的衰減速度,有些樂
器的聲音可慢慢衰減,有些則會迅速衰減,合成器要合成某樂器
的音質、音色,就必須能控制其衰減速度。
音節電路基本上是一類比乘法器。
輸入電壓來自聲調電路輸出。控制信號則來自微處理器,依樂器
的特質來加以控制,控制其衰減的幅度,
圖10-7所示為較完整的音節電路,衰減幅度由電容器上的電荷來
控制,只要改變電容器的放電速度,即可控制衰減速度。
10-4 音樂與聲音合成器

節拍產生器



節拍產生器用以控制各音符的演奏時間,
利用CMOS反相器做成振盪器,振盪頻率在0.25H,到I5Hz之間。
輸出連接到一個節拍單擊電路
10-4 音樂與聲音合成器

音樂合成器軟體




音樂合成器必須藉著微處理器的控制。才能發揮其功能,演奏
音樂。
必須有一個功能強大,使用方便的軟體,才能隨心所欲地控制
合成器。
完整的音樂合成軟體由主程式和許多副程式組成。
微處理機利用指標去取入存於記憶體內的音樂碼的資料,它可
能是十二個音符之一、音符長度、音程變換,或是休止符代碼
,經解碼後,可知其所代表之意義,再依其指示完成應做的工
作,即送出各種控制信號給合成器,使其演奏音符。如此一再
循環,直到樂曲奏完為止。
10-4 音樂與聲音合成器

音階與頻率之關係




鋼琴的琴鍵,由黑色、白色相間的琴鍵所組成
相鄰的二個琴鍵其頻率相差 12 2  1.0594630094
4 ,因此,La
的頻率由55、110、220、440、880、1760、3520、7040(單位
微赫芝,Hz)以倍數遞增
音樂合成器必須產生12個半音的頻率,再以除頻或倍頻方式即
可產生所有音階的頻率訊號,供做合成之用
合成軟體除了要產生各種頻率之外,還要控制波形,以產生各
種樂器特有的音色,以及輸出音量的衰減速率。才能重現完美
的音樂合成效果。
10-5 語言合成器

語言合成器





將各種人類語音的音素組合成人類的語音。
除了音素表現不同意義外,更要配合重音的變化才能完全表達
意義
在典型的語言系統中,通常要用63個音素組合與4個重音指令
。
程式設計者可將各指令混合運用、組合,以合成各種不同的語
音。
語音合成器的應用



幫助視覺障礙的人們。
協助兒童做拼音練習之用
目前則在工、商企業界普遍應用

商店:「歡迎光臨」、「謝謝光臨」。
10-5 語言合成器

一般語音合成器的主要元件有下列三者:



人類聲道的電子類比裝置。
軟體程式,可指定控制參數,發出語音。
聲音的控制界面電路。
10-5 語言合成器

人類的聲道







人類聲道的結構,由喉門、咽頭、嘴唇、鼻孔,長度在16公分
~19公分之間。
發聲時。氣體自肺部排出,經聲帶時造成聲帶的振動,利用口
腔、鼻腔做為共振室,以舌頭。唇型配合控制發出的聲音,
口腔內的肌肉控制了共振管道,控制氣體流量、聲帶張量,及
口腔形狀、舌頭位置等。
英語全部由26個字母,配合一些符號組成。
理論上。只要以字母的語音為音素,即可組成各字的語音,
實際應用中,因同一字母所發出的語音與音長並不相同,。要
將重音一併處理。
另外。同一字母在不同字中會有不同發音,因此,語言合成器
必須能將一個由一組字母組成的字轉成個人發音習慣的語音。
10-5 語言合成器



要使語音合成器發出與人類近似的語音,必須能將母音、子
音、重音等音素組合發聲。
語言合成器必須有母音和子音產生電路。
母音產生電路



人類的聲道有如一條長約17.3公分的共振管道
發聲時,在500、1500和250OHz處形成駐波,此即為語音素頻
率。
這三個頻率是決定母音音素品質的共振頻率帶的中央頻率。因
此可發出各種不同的聲音。
10-5 語言合成器

子音產生電路

子音的產生較母音的產生更複雜




和母音產生類似的電路外,
氣音雜音源
鼻音共振器
擦音共振器
10-6 語音認知器

語音認知器



一種最直接的輸入方式
有人稱之為自動語音認知器,簡稱ASR,或稱為聲音資料輸入
,簡稱VDE。目前已大量應用於工商企業界。如自動化倉儲、
品質管制…等。
語音認知器可適用在下列場合:




只使用一套特定的字彙,即使用的語句不多時。
操作員需同時使用手、眼處理事務。無法用手來輸入命令時。
操作者無法直接下達命令,如操作員與電腦間距離頗遠,但可
利用無線電傳送口述命令時。
較為特殊資料輸入方式時。
10-6 語音認知器

語音認知動作原理

一般語音認知系統包含三個部份:




對麥克風的輸入及控制台的操作是以聲音或影像(顯示於顯示器
上)的方式回讀給操作者。
微處理機控制器:含感音特性偵測器,參考音型記憶相關處理器
及認知程式。
輸出有關界面。
人們說話時,含有音感特性的類比信號將被轉成數位信號,將
文字的數位資料值和內存的字彙的數位信號比較。如果吻合時
,系統即認知該字,否則拒絕接受,換言之,必須先在系統中
建立常用字彙資料庫才能供辨認之用,因此,其字彙的數量受
其記憶容量限制。
10-6 語音認知器







語音認器知的體系
單字有限字彙語音認知系統
連續語音系統
單字會意會意
連續語音會意系統。
多音源認知系統。
無限字彙系統
10-7 音效卡

音效卡的主要作用是讓電腦發出聲音








一般的聲音
樂器的聲音
說話的聲音
機器的聲音
大自然的聲音(風聲、雨聲、動物的鳴叫聲…等
電腦合成製造的聲音
聲音是一種連續的振動。其頻率範圍在2OHz一2OkHz之間,
人類耳朵可以感受振動的變化。
波形三要素



波幅
頻率
相位
10-7 音效卡




不同樂器或者不同的人,因為發聲結構不同,波幅、頻率、
相位不同將會呈現不同音色,甚至不同的波形組合亦會有所
不同
任一波形均可以傅利葉級數加以分析。任何一個波形均可由
基本波及不同振幅、相位的諧波所組成。
只要有基本波及不同的諧波,理論上可以合成任意波形,不
同的組成有不同音色,音效卡就是以這個原理設計而成。
所謂頻率是指一種每秒中出現的重複變化的次數,單位為赫
茲(Hz)音頻範圍在0~30OkHz之間,人耳只能聽到20一2OkHz
左右,這類波形一般是以正弦波的形式存在,因為它的變化
是周而復始的連續變化,是屬於類比的信號,而電腦通常只
能直接處理數位信號,因此。必須將類比信號先轉換成數位
信號。這個電路就稱為類比/數位轉換電路,簡稱ADC。
10-7 音效卡

A/D轉換電路原理
是將一個波形。以固定時間切割為N等份。每一等份再轉為對
應的數位值。切割的速度就是取樣頻率,取樣頻率愈高傳真度
愈高,愈接近原來波形。
 在 MPGl 的規格中,取樣頻率為2205OHz,(22kHz),轉換後的
數位值以8位元表示,MPG2的取樣頻率提升為44100Hz(44kHz)
,數位值改以16位元表示。
 以8位元而言。錄音1分鐘的檔案大小為:
8bit×2205OHz×60秒=1323000Bytes二l.26MB
 以16位元而言。錄音1分鐘的檔案大小為:
16×441000×60=52920000Bytes=50.45MB

10-7 音效卡

聲音之合成技術


一般音效卡合成聲音或音效常用的合成方法



聲音經麥克風輸入,再經取樣及A/D轉換為數位信號,輸入到
電腦處理後,不能直接送到喇叭來發出聲音,必須先經過數位
類比轉換電路(DAC)轉換為類比信號才能送到喇叭來輸出聲音
。
FM
Wave table
FM (Frequency Modulation)



稱為調頻合成技術,係利用一個信號去調變載波。調頻時會產
生不同的旁波帶成份而產生不同音色,模擬各式樂器的聲音。
這種方式的音效卡的聲音品質較差,但成本及體積都很小,
像Adlib就採用這種技術。
10-7 音效卡

Wave table


MIDI






稱為波形表技術,係先將各式不同樂器的聲音錄下,轉為數位
信號儲存於電腦中,播放時取出指定樂器的數位資料送到音效
卡,轉換為類比信號,重現樂器的聲音。
Musical Instrument Digital Interface的簡稱。
在1983年由電子樂器廠商及國際標準委員會共同制定的轉換標
準,
可以透過指令控制要輸出的樂器。頻率、長度等,
MIDI規定了每個電子樂器的頻道(1~16 channel),音階、節奏
一分鐘的MIDI音樂只須2OkBytes左右 midi
在音效上有一個和搖桿插座共用的輸入埠。可以連接MIDI電
子樂器電鍵盤,經由演奏及轉換,直接轉為MIDI格式儲存。