Transcript 第3章
Multimedia Technology 多媒体技术及应用 第三章 音频技术与应用 3.1 数字音频技术基础 • 声音: 是振动的波,随时间连续变化的物理量。 • 声音的3个重要指标:振幅、周期和频率。 • 声音的可听域:20Hz~20KHz 部分声源的频带宽度 声源类型 频带宽度(Hz) 男性语音 100-9000 女性语音 150-10000 电话声音 200-3400 电台调频广播 20-15000 高级音响设备 20-20000 2 3 • 声音的三要素: (1)音调 代表声音的高低。频率越高,音调越高。 (2)音色 声音的特色,判别声源的主要依据。 (3)音强 声音的强度或音量。 3.1.2 数字音频与数字音频技术 4 • 数字音频信号: 数字化的声音称为数字音频信号 • 数字音频信号不仅包含自然界中的所有声音,还可以通 过计算机处理,如编辑、合成、调整频率等方式获得自 然界中没有的声音。 5 • 声音的数字化过程 采样、量化和编码 采样:声音信号在时间上离散化 量化:采样后的声音在幅值上离散化 编码:将量化后的数值用二进制代码表示 6 • 数字音频质量 主要取决与采样频率、量化位数、声道数量以及编码算法 • 声音数据量 数据量=(采样频率×量化位数)÷8×声道数×时间÷ 压缩率 例 3-1 7 • 数字激光唱盘CD-DA的标准采样频率为44.lkHz,量化位 数为16位,立体声。计算每分钟CD音乐的数据量是多少? 解:数据量=(44100×l6)÷8×2×60 ≈10 Mb 例 3-2 8 • 一首长度为3分钟的MP3音乐,采样频率为44.lkHz,量化 位数为16位,立体声,压缩比为10:1。计算这首音乐的数 据量是多少? 数据量=(44100×l6)÷8×2×3×60 ÷ 10 ≈ 3 Mb 3.1.3 音频文件格式 9 • WAV:微软公司开发用于windows平台,是最早的数字音频格式。 • MIDI: Musical Instrument Digital Interface,乐器数字接口 是数字音乐/电子合成乐器的统一国际标准。MIDI文件中存储的是一 些指令,由声卡按照指令将声音合成出来。 • CDA:CD音乐格式。 • MP3: MPEG-1 Audio Layer 3缩写,压缩比约为10:1。 10 • WMA: Windows Media Audio缩写,微软公司开发的网络音频格式。 • MP4: 采用“知觉编码”为关键技术的压缩技术,只有特定用户才可播放。 • QuickTime:苹果公司推出的数字流媒体。 • RealAudio: Real Networks 公司推出的文件格式,可实时传输信息。 主要有RA、RM、RMX三种,随着网络带宽的不同而改变声音的质量, 在保证大多数人听到流畅声音的前提下,令带宽较宽的听众获得更好 的音质。 3.1.4 音频格式转换 11 • 音频格式转换原理 首先用解码器将音频文件解码为波形,然后用新的编码器 编码。 • 音频格式转换工具 Awave Studio,Adobe Audition,千千静听等。 例 3-3 12 • 使用“千千静听”音频播放软件,将WMA音乐格式转换为 MP3音乐格式 。 3.2 声音艺术 13 • 贝多芬 :“音乐是比一切智慧、一切哲学更高的启示”。 • 多媒体艺术创作不仅需要丰富多彩的视觉艺术,还需要优 美的听觉艺术。因此,欣赏音乐和创作音乐是实现多媒体 声音艺术的关键。 3.3 音频素材采集 • • • • 直接采集数字音频 外部录制 内部录制 MIDI合成 14 3.3.2 简单的数字音频采集与制作系统 15 • 输入设备:采集音频信号,如麦克风、声音播放设备和MIDI设备 • 编辑设备:安装有声卡的计算机 • 输出设备:监听编辑后的音频效果,如音箱和耳机。 输入 编辑 输出 音频输入设备 音频编辑设备 音频输出设备 3.3.3 实时音频录制 例3-4 16 • 使用“AD Sound Recorder”软件,将QQ网络视频或语音聊 天过程中的语音录制下来,保存为MP3音频文件。 3.4 语音合成技术 17 • 语音合成技术 利用计算机合成出清晰、自然、连续 的人类语音的一种技术。 • 语音合成技术使得计算机具有同人类一样的说话能力。 例3-5 18 • 使用“方正畅听”软件朗读word文档,并将声音保存为MP3 文件。 3.5 语音识别技术 19 • 语音识别技术 指计算机通过识别和理解过程将语音 转变为相应文本或命令的技术。 • 有了语音识别技术,计算机就可以“听懂” 人类的语言内容 并理解语言的含义。 例3-6 20 • 使用ViaVoice9.0软件,以语音朗读的方式向Word文档中 输入文字 。 3.6 音频处理软件Audition3.0 21 菜单栏 工具栏 文件效 果器栏 音轨显示区 基本功能区 电平显示区 例3-7 22 • 使用Adobe Audition3.0软件,录制卡拉OK并制作为MP3。 3.6.4 音频编辑 23 • 音频编辑 主要是对音频波形进行剪切、复制、删除、 分离、合并、锁定、包络编辑和时间伸缩等处理。 例 3-8 24 • 移花接木--将声音文件 “我喜欢音乐”编辑为“我我喜欢 音乐音乐音乐”。 例 3-9 • 为音频制作淡入淡出效果。 25 3.6.6 使用音频插件 例 3-10 • 使用插件进行卡拉OK后期效果制作。 26 实验 • 实验一 使用Audition为视频配乐 • 实验二 使用Audition消除mp3中的原唱声音 • 实验三 使用Audition实现音乐变速和变调效果 27 28 题目 1.不属于声音三要素的是_____。 A. 频率 B. 音调 C. 音强 D. 音色 2.以下_____是近似无损的音频格式。 A. MP3 B. WAV C. WMA D. MP4 3 3. 以下_____是能够实现语音合成技术的应用软件。 A. ViaVoice B. 方正畅听 C. 千千静听 D. Audition 29 题目 4. 为了使计算机能够“听懂”人类的语言所采用的技术是_____? A. 语音合成技术 B. 语音识别技术 C. 文语转换技术 D. 模式识别技术 5. 为音频制作淡入淡出效果需要对效果面板中的_____进行设置? A. 选择“振幅和压限”中的“振幅/淡化” B. 选择“振幅和压限”中的“硬性限制” C. 选择“振幅和压限”中的“标准化” D. 选择“振幅和压限”中的“包络” Multimedia Technology 答案:ABBBA