Transcript 第3章
Multimedia Technology
多媒体技术及应用
第三章 音频技术与应用
3.1 数字音频技术基础
• 声音: 是振动的波,随时间连续变化的物理量。
•
声音的3个重要指标:振幅、周期和频率。
• 声音的可听域:20Hz~20KHz
部分声源的频带宽度
声源类型
频带宽度(Hz)
男性语音
100-9000
女性语音
150-10000
电话声音
200-3400
电台调频广播
20-15000
高级音响设备
20-20000
2
3
• 声音的三要素:
(1)音调 代表声音的高低。频率越高,音调越高。
(2)音色 声音的特色,判别声源的主要依据。
(3)音强 声音的强度或音量。
3.1.2 数字音频与数字音频技术
4
• 数字音频信号:
数字化的声音称为数字音频信号
•
数字音频信号不仅包含自然界中的所有声音,还可以通
过计算机处理,如编辑、合成、调整频率等方式获得自
然界中没有的声音。
5
• 声音的数字化过程
采样、量化和编码
采样:声音信号在时间上离散化
量化:采样后的声音在幅值上离散化
编码:将量化后的数值用二进制代码表示
6
• 数字音频质量
主要取决与采样频率、量化位数、声道数量以及编码算法
• 声音数据量
数据量=(采样频率×量化位数)÷8×声道数×时间÷ 压缩率
例 3-1
7
• 数字激光唱盘CD-DA的标准采样频率为44.lkHz,量化位
数为16位,立体声。计算每分钟CD音乐的数据量是多少?
解:数据量=(44100×l6)÷8×2×60 ≈10 Mb
例 3-2
8
• 一首长度为3分钟的MP3音乐,采样频率为44.lkHz,量化
位数为16位,立体声,压缩比为10:1。计算这首音乐的数
据量是多少?
数据量=(44100×l6)÷8×2×3×60 ÷ 10 ≈ 3 Mb
3.1.3 音频文件格式
9
• WAV:微软公司开发用于windows平台,是最早的数字音频格式。
• MIDI:
Musical Instrument Digital Interface,乐器数字接口
是数字音乐/电子合成乐器的统一国际标准。MIDI文件中存储的是一
些指令,由声卡按照指令将声音合成出来。
• CDA:CD音乐格式。
• MP3:
MPEG-1 Audio Layer 3缩写,压缩比约为10:1。
10
• WMA:
Windows Media Audio缩写,微软公司开发的网络音频格式。
• MP4:
采用“知觉编码”为关键技术的压缩技术,只有特定用户才可播放。
• QuickTime:苹果公司推出的数字流媒体。
• RealAudio:
Real Networks 公司推出的文件格式,可实时传输信息。
主要有RA、RM、RMX三种,随着网络带宽的不同而改变声音的质量,
在保证大多数人听到流畅声音的前提下,令带宽较宽的听众获得更好
的音质。
3.1.4 音频格式转换
11
• 音频格式转换原理
首先用解码器将音频文件解码为波形,然后用新的编码器
编码。
• 音频格式转换工具
Awave Studio,Adobe Audition,千千静听等。
例 3-3
12
• 使用“千千静听”音频播放软件,将WMA音乐格式转换为
MP3音乐格式 。
3.2 声音艺术
13
• 贝多芬 :“音乐是比一切智慧、一切哲学更高的启示”。
• 多媒体艺术创作不仅需要丰富多彩的视觉艺术,还需要优
美的听觉艺术。因此,欣赏音乐和创作音乐是实现多媒体
声音艺术的关键。
3.3 音频素材采集
•
•
•
•
直接采集数字音频
外部录制
内部录制
MIDI合成
14
3.3.2 简单的数字音频采集与制作系统
15
• 输入设备:采集音频信号,如麦克风、声音播放设备和MIDI设备
• 编辑设备:安装有声卡的计算机
• 输出设备:监听编辑后的音频效果,如音箱和耳机。
输入
编辑
输出
音频输入设备
音频编辑设备
音频输出设备
3.3.3 实时音频录制 例3-4
16
• 使用“AD Sound Recorder”软件,将QQ网络视频或语音聊
天过程中的语音录制下来,保存为MP3音频文件。
3.4 语音合成技术
17
• 语音合成技术
利用计算机合成出清晰、自然、连续
的人类语音的一种技术。
• 语音合成技术使得计算机具有同人类一样的说话能力。
例3-5
18
• 使用“方正畅听”软件朗读word文档,并将声音保存为MP3
文件。
3.5 语音识别技术
19
• 语音识别技术 指计算机通过识别和理解过程将语音
转变为相应文本或命令的技术。
• 有了语音识别技术,计算机就可以“听懂” 人类的语言内容
并理解语言的含义。
例3-6
20
• 使用ViaVoice9.0软件,以语音朗读的方式向Word文档中
输入文字 。
3.6 音频处理软件Audition3.0
21
菜单栏
工具栏
文件效
果器栏
音轨显示区
基本功能区
电平显示区
例3-7
22
• 使用Adobe Audition3.0软件,录制卡拉OK并制作为MP3。
3.6.4 音频编辑
23
• 音频编辑 主要是对音频波形进行剪切、复制、删除、
分离、合并、锁定、包络编辑和时间伸缩等处理。
例 3-8
24
• 移花接木--将声音文件 “我喜欢音乐”编辑为“我我喜欢
音乐音乐音乐”。
例 3-9
• 为音频制作淡入淡出效果。
25
3.6.6 使用音频插件 例 3-10
• 使用插件进行卡拉OK后期效果制作。
26
实验
• 实验一 使用Audition为视频配乐
• 实验二 使用Audition消除mp3中的原唱声音
• 实验三 使用Audition实现音乐变速和变调效果
27
28
题目
1.不属于声音三要素的是_____。
A. 频率
B. 音调
C. 音强
D. 音色
2.以下_____是近似无损的音频格式。
A. MP3
B. WAV
C. WMA
D. MP4 3
3. 以下_____是能够实现语音合成技术的应用软件。
A. ViaVoice
B. 方正畅听
C. 千千静听
D. Audition
29
题目
4. 为了使计算机能够“听懂”人类的语言所采用的技术是_____?
A. 语音合成技术
B. 语音识别技术
C. 文语转换技术
D. 模式识别技术
5. 为音频制作淡入淡出效果需要对效果面板中的_____进行设置?
A. 选择“振幅和压限”中的“振幅/淡化”
B. 选择“振幅和压限”中的“硬性限制”
C. 选择“振幅和压限”中的“标准化”
D. 选择“振幅和压限”中的“包络”
Multimedia Technology
答案:ABBBA