Transcript ch01
1
目录
1.1 多媒体的基本概念
1.2 多媒体技术的应用与发展
1.3 多媒体的关键技术
1.4 多媒体信息的计算机表示
1.5 多媒体数据压缩技术
1.6 多媒体与因特网
2
1.1
多媒体的基本概念
1.1.1 多媒体的定义
1.1.2 多媒体中的媒体元素及其特征
3
1.1.1
多媒体的定义
何谓多媒体呢?
“多媒体”一词译自英文“Multimedia”
即“Multiple”和“Media”的合成
其核心词是媒体
4
媒体(medium)在计算机领域有
两种含义:即媒质和媒介。
媒质:存储信息的实体,如磁盘、
光盘、磁带、半导体存储器等。
媒介:传递信息的载体,如数字、
文字、声音、图形和图像等。
5
多媒体的定义
多媒体是融合两种或两种以上媒体的一种
人-机交互式信息交流和传播媒体,使用
的媒体包括文字、图形、图像、音频和视
频。
6
1.1.2
多媒体中的媒体元素及特征
多媒体媒体元素是指多媒体应用中
可显示给用户的媒体组成。
文本
图形
图像
动画
视频
音频
7
文本
文本分为非格式化文本文件和格式
化文本文件。
非格式化文本文件:只有文本信息
没有其他任何有关格式信息的文件,又
称为纯文本文件。如“.TXT ”文件。
格式化文本文件:带有各种文本排
版信息等格式信息的文本文件。
如“.DOC ”文件。
8
图形
图形(Graphic)一般指用计算机绘
制的画面,如直线、圆、圆弧、矩形、
任意曲线和图表等。
图形的格式是一组描述点、线、面
等几何图形的大小、形状及其位置、维
数的指令集合。
在图形文件中只记录生成图的算法
和图上的某些特征点,因此也称矢量图。
9
由于图形只保存算法和特征点,因
此占用的存储空间很小。但显示时需经
过重新计算,因而显示速度相对慢些。
10
图像
图像(Image)是指由输入设备捕捉的
实际场景画面,或以数字化形式存储的任
意画面。
静止的图像是一个矩阵,阵列中的各
项数字用来描述构成图像的各个点(称为
像素点 pixel )的强度与颜色等信息。这种
图像也称为位图( bit-mapped picture )。
11
图像文件在计算机中的存储格式有
多种,如 BMP、PCX、TIF、TGA、GIF、
JPG 等,一般数据量都较大。
图像处理时要考虑三个因素:
分辨率
图像深度与显示深度
图像文件大小
12
分辨率
数字化图像的大小,即该
图像的水平与垂直方向的
像素个数。
13
图像深度和显示深度
图像深度(也称图像灰度、颜色深度)
表示数字位图图像中每个像素上用于表示颜
色的二进制数字位数。
显示深度:表示显示器上每个点用于显
示颜色的 2 进制数字位数。
若显示器的显示深度小于数字图像的深
度,就会使数字图像颜色的显示失真。
14
颜色深度与显示的颜色数目
颜色深度 颜色总数
图像名称
1
2
单色图像
4
16
索引16 色图像
8
256
索引256 色图像
16
65536
HI—Color 图像
24
16672216
True Color 图像
15
图像文件大小
用字节表示图像文件大小时,一幅未经
压缩的数字图像的数据量大小计算如下:
图像数据量大小 = 像素总数×图像深度÷8
例如:一幅 640×480 的 256 色图像为
640×480×8/8 = 307200 字节
16
Comparison:
宽度:271
高度:300
颜色:2
大小:9.9 KB
宽度:271
高度:300
颜色:4
大小:19.8 KB
17
Comparison:
宽度:271
高度:300
颜色:256
大小:79.4 KB
宽度:271
高度:300
颜色:真彩色
大小:238.2 KB
18
音频
数字音频(Audio)可分为波形声音
语音和音乐。
19
波形声音实际上已经包含了所有的
声音形式,它可以将任何声音都进行采
样量化,相应的文件格式是WAV 文件或
VOC文件。
语音也是一种波形,所以和波形声
音的文件格式相同。
音乐是符号化了的声音,乐谱可转
变为符号媒体形式。对应的文件格式是
MID 或CMF 文件。
20
计算机音频技术主要包括声音的采
集、数字化、压缩/解压缩以及声音的
播放。
数字化主要包括采样和量化这两个
方面。
采样频率(sampling rate)是将模拟
声音波形转换为数字时,每秒钟所抽取
声波幅度样本的次数,单位是
Hz(赫兹)。
21
量化数据位数(也称量化级)是每
个采样点能够表示的数据范围,经常采
用的有8 位、12 位和16 位。
例如,8 位量化级表示每个采样点
可以表示256 个不同量化值,而16 位量
化级则可以表示65536 个不同的量化值
记录声音时,如果每次生成一个声
道数据,称为单声道;每次生成两个声
波数据,称为立体声(双声道)。
22
数字音频的存储量:
可用以下公式估算声音数字化后每
秒所需的存储量(未经压缩的)
存储量 = 采样频率×量化位数÷8
若使用双声道,存储量再增加一倍
例如,数字激光唱盘(CD-DA)的标
准采样频率为44.1 kHz,量化位数为16
位,立体声。一分钟 CD-DA 音乐所需的
存储量为
44.1 K×16×2×60÷8
= 10584 KB
23
Comparison:
01001010
+127
…
+64
+32
0
-32
-64
…
-128
Sampling
Resolution
8 bit
Sampling
Frequency
11 KHz
24
Comparison:
0010101100011000
+32767
…
+512
+128
0
-128
-512
…
-32768
Sampling
Resolution
16 bit
Sampling
Frequency
22 KHz
25
动画
动画是活动的画面,实质是一幅幅
静态图像的连续播放。动画的连续播放
既指时间上的连续,也指图像内容上的
连续。
计算机设计动画有两种:一种是帧
动画,一种是造型动画。
26
帧动画是由一幅幅位图组成的连续
的画面,就如电影胶片或视频画面一样
要分别设计每屏幕显示的画面。
造型动画是对每一个运动的物体分
别进行设计,赋予每个动元一些特征,
然后用这些动元构成完整的帧画面。动
元的表演和行为是由制作表组成的脚本
来控制。
存储动画的文件格式有FLC、MMM等
27
视频
视频是由一幅幅单独的画面序列
(帧frame)组成 ,这些画面以一定
的速率(fps)连续地投射在屏幕上,
使观察者具有图像连续运动的感觉。
视频文件的存储格式有AVI、MPG
MOV等。
28
视频标准主要有NTSC制和PAL制
两种。
NTSC 标准为30fps,每帧525行。
PAL 标准为25fps,每帧625行。
视频的技术参数有:
帧速
数据量
图像质量
29
1.2
多媒体技术的应用与发展
1.2.1 多媒体技术的应用
1.2.2 多媒体技术的发展方向
30
1.2.1 多媒体技术的应用
就目前而言,多媒体技术已在商业
教育培训、电视会议、声像演示等方面
得到了充分应用。
在教育与培训方面的应用
在通信方面的应用
在其他方面的应用
31
在教育与培训方面的应用
多媒体技术使教材不仅有文字、静
态图像,还具有动态图像和语音等。使教
育的表现形式多样化,可以进行交互式
远程教学。
利用多媒体计算机的文本、图形、
视频、音频和其交互式的特点,可以编制
出计算机辅助教学 CAI( Computer
Assisted Instruction )软件,即课件。
32
在通信方面的应用
多媒体技术在通信方面的应用主要有:
可视电话
视频会议
信息点播(Information Demand)
计算机协同工作 CSCW
(Computer Supported
Cooperative Work)
33
信息点播有桌上多媒体通信系统和
交互电视ITV。
计算机协同工作CSCW是指在计算机
支持的环境中,一个群体协同工作以完
成一项共同的任务。
计算机的交互性,通信的分布性和
多媒体的现实性相结合,将构成继电报
电话、传真之后的第四代通信手段。
34
在其他方面的应用
多媒体技术给出版业带来了巨大的
影响,其中近年来出现的电子图书和电
子报刊就是应用多媒体技术的产物。
利用多媒体技术可为各类咨询提供
服务,如旅游、邮电、交通、商业、金
融、宾馆等。
多媒体技术还将改变未来的家庭生
活,多媒体技术在家庭中的应用将使人
们在家中上班成为现实。
35
1.2.2
多媒体技术的发展方向
目前,多媒体主要从以下几个方向发展:
1 多媒体通信网络环境的研究和建立
将使多媒体从单机单点向分布、协同多
媒体环境发展,在世界范围内建立一个
可全球自由交互的通信网。
对该网络及其设备的研究和网上分
布应用与信息服务研究将是热点。
36
2 利用图像理解、语音识别、全文检
索等技术,研究多媒体基于内容的处理、
开发能进行基于内容的处理系统是多媒
体信息管理的重要方向。
3 多媒体标准仍是研究的重点:各类
标准的研究将有利于产品规范化,应用
更方便。它是实现多媒体信息交换和大
规模产业化的关键所在。
37
4 多媒体技术与相邻技术相结合,提
供了完善的人机交互环境。多媒体仿真
智能多媒体等新技术层出不穷,扩大了
原有技术领域的内涵,并创造新的概念。
5 多媒体技术与外围技术构造的虚拟
现实研究仍在继续进展。多媒体虚拟现
实与可视化技术需要相互补充,并与语
音、图像识别、智能接口等技术相结合,
建立高层次虚拟现实系统。
38
将来多媒体技术将向着以下六个方向
发展;
1).高分辨化,提高显示质量;
2).高速度化,缩短处理时间;
3).简单化,便于操作;
4).高维化,三维、四维或更高维;
5).智能化,提高信息识别能力;
6).标准化,便于信息交换和资源共享。
39
1.3 多媒体的关键技术
1.3.1 视频音频数据压缩/解压缩技术
1.3.2 多媒体专用芯片技术
1.3.3 大容量信息存储技术
1.3.4 多媒体输入与输出技术
1.3.5 多媒体软件技术
1.3.6 多媒体通信技术
1.3.7 虚拟现实技术
40
1.3.1
视频音频数据压缩/解压缩技术
选用合适的数据压缩技术,有可能
将字符数据量压缩到原来的1/2左右,语
音数据量压缩到原来的1/2-1/10,图像
数据量压缩到原来的1/2-1/60。
如今已有压缩编码/解压缩编码的
国际标准JPEG 和MPEG 。
41
1.3.2 多媒体专用芯片技术
专用芯片是多媒体计算机硬件体系
结构的关键。为了实现音频、视频信号
的快速压缩、解压缩和播放处理,需要
大量的快速计算,只有采用专用芯片,
才能取得满意的效果。
多媒体计算机专用芯片可归纳为两
种类型:一种是固定功能的芯片;另一
种是可编程的数字信号处理器(DSP)
芯片。
42
1.3.3 大容量信息存储技术
利用数据压缩技术,在一张CD-ROM
光盘上能够存取70多分钟全运动的视频
图像或者十几个小时的语言信息或数千
幅静止图像。
在CD-ROM 基础上,还开发了 CD-I
和CD-V、可录式光盘CD-R、高画质、高
音质的光盘DVD以及PHOTO CD 等。
43
1.3.4
多媒体输入与输出技术
多媒体输入/输出技术包括媒体变换
技术、媒体识别技术、媒体理解技术和
综合技术。
媒体变换技术是指改变媒体的表现
形式。如当前广泛使用的视频卡、音频
卡(声卡)都属媒体变换设备。
媒体识别技术是对信息进行一对一
的映像过程。例如,语音识别技术和触
摸屏技术等。
44
媒体理解技术是对信息进行更进
一步的分析处理和理解信息内容。如
自然语言理解、图像理解、模式识别
等技术。
媒体综合技术是把低维信息表示
映像成高维的模式空间的过程。例如
语音合成器就可以把语音的内部表示
综合为声音输出。
45
1.3.5
多媒体软件技术
多媒体软件技术主要包括以下六个
方面的内容:
多媒体操作系统
多媒体素材采集与制作技术
多媒体编辑与创作工具
多媒体数据库技术
超文本/超媒体技术
多媒体应用开发技术
46
多媒体操作系统
多媒体操作系统是多媒体软件的
核心。它负责多媒体环境下多任务的
调度、保证音频、视频同步控制以及
信息处理的实时性,提供多媒体信息
的各种基本操作和管理;具有对设备
的相对独立性与可扩展性。
Windows、OS/2 和Macintosh 操
作系统都提供了对多媒体的支持。
47
多媒体素材采集与制作技术
素材的采集与制作主要包括采集并
编辑多种媒体数据。如声音信号的录制
编辑和播放;图像扫描及预处理;全动
态视频采集及编辑;动画生成编辑;音
/视频信号的混合和同步等。
48
多媒体编辑与创作工具
多媒体编辑创作软件又称多媒体创
作工具,是多媒体专业人员在多媒体操
作系统之上开发的,供特定应用领域的
专业人员组织编排多媒体数据,并把它
们连接成完整的多媒体应用系统的工具。
高档的创作工具用于影视系统的动
画制作及特技效果,中档的用于培训、
教育和娱乐节目制作,低档的用于商业
简介、家庭学习材料的编辑。
49
多媒体数据库技术
多媒体信息是结构型的,致使传统
的关系数据库已不适用于多媒体的信息
管理,需要从下面四个方面研究数据库
1).多媒体数据模型
2).媒体数据压缩和解压缩的模式
3).多媒体数据管理及存取方法
4).用户界面
50
超文本/超媒体技术
超文本是一种新颖的文本信息管理
技术,它提供的方法是建立各种媒体信
息之间的网状链接结构,这种结构由节
点组成。
对超文本进行管理使用的系统称为
超文本系统。也即浏览器,或称为导航
图。
若超文本中的节点的数据不仅可以
是文本,还可以是图像、动画、音频、
视频,则称为超媒体。
51
超文本
1965年美籍丹麦科学家Ted Nelson在计算机上处理文本文
件时想到一种把文本中遇到的相关文本组织在一起的方法,
让计算机能够响应人的思维以及能够方便地获取所需要的信
息。他为这种方法杜撰了一个词,称为超文本(hypertext)。
这个词的真正含义是"链接",用来描述计算机中的文件的组
织方法,后来人们把用这种方法组织的文本称为"超文本"。
传统文本以线性方式组织,而超文本以非线性方式组织。
“非线性”是指文本中遇到的一些相关内容通过链接组织在
一起,用户可以很方便地浏览这些相关内容,这种文本的组
织方式与人们的思维方式和工作方式比较接近。
52
超文本中带有链接关系的文本通常用下划线和不同的颜色
表示。文本①中的"超文本"与②中的"超文本"建立有链接关
系,①中的"超媒体"与③中的"超媒体"建立有链接关系,③
中的"超链接"与④中的"超链接"建立有链接关系…
图1-01 超文本的概念
53
超链接(hyper link):指文本中的词、短语、符号、图像、
声音剪辑或影视剪辑之间的链接,或者与其他的文件、超文
本文件之间的链接,也称为“热链接(hot link)”或“超文本链
接(hypertext link)”。
词、短语、符号、图像、声音剪辑、影视剪辑和其他文件
通常被称为对象或文档元素(element),因此超链接是对象之
间或者文档元素之间的链接。建立互相链接的这些对象不受
空间位置的限制,它们可以在同一个文件内也可以在不同的
文件之间,也可以通过网络与世界上的任何一台连网计算机
上的文件建立链接关系。
54
超媒体
20世纪70年代,用户语言接口方面的先驱者Andries Van
Dam创造了一个新词“电子图书”(Electronic Book) 。电子图
书中自然包含有许多静态图片和图形,它的含义是你可以在
计算机上去创作作品和联想式地阅读文件,它保存了用纸做
存储媒体的最好的特性,而同时又加入了丰富的非线性链接,
这就促使在80年代产生了超媒体(hypermedia)技术。
超媒体不仅可以包含文字而且还可以包含图形、图像,动
画、声音和电视片断,这些媒体之间也是用超级链接组织的,
而且它们之间的链接也是错综复杂的。
55
超媒体与超文本的不同
1.超文本主要是以文字的形式表示信息,建立的链接关系主
要是文句之间的链接关系。
2.超媒体除了使用文本,还使用图形、图像、声音、动画或
影视片断等多种媒体来表示信息,建立的链接关系是文本、
图形、图像、声音、动画和影视片断等媒体之间的链接关系。
图1-02 超媒体的概念
56
多媒体应用开发技术
多媒体应用的开发会使一些采用不
同问题解决方法的人集中到一起,包括
计算机开发人员、音乐创作人员,图像
艺术家等,他们的工作方法以及思考问
题的方法都将是完全不同的。
对于项目管理者来说,研究和推出
一个多媒体应用开发方法学将是极为重
要的。
57
1.3.6
多媒体通信技术
多媒体通信技术包含语音压缩、图
像压缩及多媒体的混合传输技术。
58
1.3.7
虚拟现实技术
虚拟现实的定义可归纳为:利用计
算机技术生成的一个逼真的视觉、听觉
触觉及嗅觉等的感觉世界,用户可以用
人的自然技能对这个生成的虚拟实体进
行交互考察。
虚拟现实技术是在众多相关技术上
发展起来的一个高度集成的技术,是计
算机软硬件技术、传感技术、机器人技
术、人工智能及心理学等飞速发展的结
晶。
59
1.4
多媒体信息的计算机表示
1.4.1 声音文件的基本格式
1.4.2 图像及图像文件格式
1.4.3 视频和动画的文件格式
60
1.4.1 声音文件的基本格式
1. WAV 文件
2. MIDI
61
WAV 文件
Windows 所用的标准数字音频称为
波形文件,文件的扩展名是“.WAV”,它
记录了对实际声音进行采样的数据。它
可以重现各种声音,但产生的文件很大。
采用的软件压缩方法主要有ACM
和PCM 等。人的讲话声使用8位量化级
11.025 KHz采样率就能较好的还原。CD
音质需要16位量化级、44.1 KHz的采样
率。
62
MIDI
MIDI文件的扩展名为“.MID”,它与
波形文件不同,记录的不是声音本身,
而是将每个音符记录为一个数字,因此
比较节省空间,可以满足长时间音乐的
需要。
MIDI 的主要限制是缺乏重现真实
自然的能力。采用波表法进行音乐合成
的声音卡可以使MIDI 音乐的质量大大
提高。
63
1.4.2
图像及图像文件格式
图像是由一些排成行和列的点组成
的,通常称为位图或点阵图。
图像文件在计算机中的存储格式有
多种,如”.BMP”、”.PCX”、”.TIF”、”.TGA”
“.GIF”、”.JPG” 等。
64
1.BMP格式
BMP 是标准的WINDOWS 和OS/2 的
图形和图像的基本位图格式,有压缩
(RLE)和非压缩之分。BMP 支持黑白
图像、16色和256色的伪彩色图像以及
RGB 真彩色图像。
2.PCX格式
是使用游程长编码(RLE)方法进
行压缩的图像文件格式文件。支持黑白
图像、16色和256色的伪彩色图像、灰
度图像以及RGB 真彩色图像,
65
3.GIF格式
GIF 是压缩图像存储格式,它使用
LZW 压缩方法,压缩比较高,文件长度
较小。支持黑白图像、16色和256色的
彩色图像。
4.TIF格式
TIF 格式是工业标准格式,支持所
有图像类型。文件分成压缩和非压缩两
大类。
66
5.JPG和PIC格式
JPG 和PIC 都使用JPEG 方法进行
图像数据压缩。这两种格式的最大特点
是文件非常小。它是一种有损压缩的静
态图像文件存储格式。支持灰度图像、
RGB 真彩色图像和CMYK 真彩色图像。
6.PCD格式
PCD格式是Photo-CD 的专用存储格
式,文件中含有从专业摄影照片到普通
显示用的多种分辨率的图像,所以数据
量都非常大。
67
Comparison:
Einstein.bmp
颜色:真彩色
大小:239.1 KB
压缩比:1.0
Einstein.gif
颜色:256
大小:61.4 KB
压缩比:1.3
68
Comparison:
Einstein.jpg
颜色:真彩色
大小:11.1 KB
压缩比:21.4
Einstein.tif
颜色:真彩色
大小:238.4 KB
压缩比:1.0
69
1.4.3
视频和动画的文件格式
动画文件的格式主要有两种:
FLIC 格式和MMM 格式。
视频文件的使用一般与标准
有关,主要有AVI、MOV、MPG、
DAT、DIR 等。
70
1. FLIC动画
早期版本的FLIC文件只支持
320×200×256 色模式,文件的扩展名
为“.FIY”。较新版本支持的分辨率和颜
色数都有所提高,文件的扩展名也改为
“.FLC”。它使用了无损压缩方法,画面
效果十分清晰,但本身不能存储同步声
音。可以由Animator Pro和3DS MAX软件生成.
2. MMM动画 (Microsoft Multimedia Movie)
MMM格式是微软多媒体动画的文件
格式,一般都集成在应用程序中.
71
3. AVI文件
AVI文件将视频和音频信号混合交错
地存储在一起。其文件扩展名为“.AVI”,
采用了Intel公司的Indeo视频有损压缩
技术,较好地解决了音频信息与视频信息
同步的问题。
4. MOV文件
MOV 是Macintosh 计算机用的影视
文件格式。也采用了Intel公司的Indeo
视频有损压缩技术,以及视频与音频信息
混排技术。
72
5. MPG文件
是PC机上全屏幕活动视频的标准文
件格式,它是使用MPEG 方法进行压缩的
全运动视频图像。
6. DAT文件
DAT 是Video CD 或Karaoke CD数
据文件的扩展名,也是基于MPEG 压缩
方法的一种文件格式。
7. DIR格式
DIR是Marco Media公司使用的
Director 多媒体著作工具产生的电影
文件格式。
73
1.5
多媒体数据压缩技术
1.5.1 多媒体数据的冗余类型
1.5.2 数据压缩方法
1.5.3 视频编码的国际标准
74
1.5.1
多媒体数据的冗余类型
图像数据表示中存在着大量的冗
余,图像数据压缩技术就是利用图像
数据的冗余性来减少图像数据量的方
法。常见图像数据冗余类型如下:
1. 空间冗余
2. 时间冗余
3. 视觉冗余
75
空间冗余
一幅图像表面上各采样点的颜色之
间往往存在着空间连贯性,基于离散像
素采样来表示物体表面颜色的像素存储
方式可利用空间连贯性,达到减少数据
量的目的。
例如,在静态图像中有一块表面颜
色均匀的区域,在此区域中所有点的光
强和色彩以及饱和度都是相同的,因此
数据有很大的空间冗余。
76
时间冗余
运动图像一般为位于一时间轴区间
的一组连续画面,其中的相邻帧往往包
含相同的背景和移动物体,只不过移动
物体所在的空间位置略有不同,所以后
一帧的数据与前一帧的数据有许多共同
的地方,这种共同性是由于相邻帧记录
了相邻时刻的同一场景画面,所以称为
时间冗余。
同理,语音数据中也存在着时间冗
余。
77
视觉冗余
人类的视觉系统对图像场的敏感度
是非均匀的。但是,在记录原始的图像
数据时,通常假定视觉系统近似线性的
和均匀的,对视觉敏感和不敏感的部分
同等对待,从而产生比理想编码(即把
视觉敏感和不敏感的部分区分开来的编
码)更多的数据,这就是视觉冗余。
78
1.5.2
数据压缩方法
压缩处理一般是由两个过程组成:
一是编码过程,即将原始数据经过编码
进行压缩,以便存储与传输;二是解码
过程,此过程对编码数据进行解码,还
原为可以使用的数据。
数据压缩可分为两种类型:一种叫
做无损压缩,另一种叫做有损压缩。
无损压缩
有损压缩
混合压缩
79
无损压缩
无损压缩常用在原始数据的存档,
如文本数据、程序以及珍贵的图片和图
像等。
其原理是统计压缩数据中的冗余
(重复的数据)部分。常用的有:
RLE (run length encoding)行程编码
Huffman 编码
算术编码
LZW (lempel-ziv-welch)编码
80
(1)、行程编码(RLE)
RLE 编码是将数据流中连续出现的
字符用单一记号表示。
例如,字符串AAABCDDDDDDDDBBBBB
可以压缩为3ABC8D5B 。
RLE编码简单直观,编码/解码速度
快,因此许多图形和视频文件,如.BMP
.TIFF及AVI等格式文件的压缩均采用此
方法.
81
(2)、Huffman编码
它是一种对统计独立信源能达到最
小平均码长的编码方法。
其原理是,先统计数据中各字符出
现的概率后,再按字符出现频率高低的
顺序分别赋以由短到长的代码,从而保
证了文件的整体的大部分字符是由较短
的编码构成的。
82
有损压缩
图像或声音的频带宽、信息丰富,
人类视觉和听觉器官对频带中某些频率
成分不大敏感,有损压缩以牺牲这部分
信息为代价,换取了较高的压缩比。
常用的有损压缩方法有:PCM(脉冲
编码调制)、预测编码、变换编码、插值
与外推等。
新一代的数据压缩方法有:矢量量
化和子带编码、基于模型的压缩、分形
压缩及小波变换等。
83
混合压缩
混合压缩是利用了各种单一压缩的
长处,以求在压缩比、压缩效率及保真
度之间取得最佳折衷。
该方法在许多情况下被应用,如
JPEG 和MPEG 标准就采用了混合编码的
压缩方法。
84
1.5.3 视频编码的国际标准
1、静止图像压缩标准
2、运动图像压缩标准
3.视频通信编码标准
85
静止图像压缩标准
国际标准化组织(ISO)和国际电报
电话咨询委员会(CCITT)联合成立的
“联合照片专家组“ JPEG
(joint photographic experts group)
于1991年提出的
“多灰度静止图像的数字压缩编码“
(简称JPEG标准)。
这是一个适应于彩色和单色多灰度
或连续色调静止数字图像的压缩标准。
86
JPEG标准支持很高的图像分辨率
和量化精度。它包含两部分:
第一部分是无损压缩,基于差分
脉冲编码调制(DPCM)的预测编码。
第二部分是有损压缩,基于离散
余弦变换(DCT)和Huffman编码, 通常
压缩20-40倍。
87
运动图像压缩标准
视频图像压缩的一个重要标准是
MPEG (Moving Picture Experts Group)
于1990年形成的一个标准草案
(简称MPEG标准)。
它兼顾了JPEG标准和CCITT专家组
的H.261标准。
88
MPEG标准分成MPEG视频、MPEG音频
和MPEG系统三大部分。
MPEG算法除了对单幅图像进行编码
外(帧内编码),还利用图像序列的相关
特性去除帧间图像冗余,大大提高了视
频图像的压缩比。
压缩比可达到60-100倍。
89
视频通信编码标准
多媒体通信中的电视图像编码标准
都采用H.261和H.263。H.261主要用来
支持电视会议和可视电话。
电视图像数据压缩后的数据速率为
P×64kb/s,其中P是一个可变参数,取
值范围是1-30。
H.263是在H.261的基础上开发的电
视图像编码标准,用于低位速率通信的
电视图像编码。
90
1.6 多媒体与因特网
因特网(Internet)是一个通过网络
设备把世界各国的计算机相互连接在一
起的计算机网络。在这个网络上,使用
普通的语言就可以进行相互通信、协作
研究、从事商业活动,共享信息资源。
因特网是二十世纪全球发展最迅速
影响最深远和冲击最大的信息存取和处
理工具。
91
万维网WWW (Word Wide Web)是一个
在因特网上运行的全球性分布式信息系
统。由于它支持文本、图像、声音、影视
等数据类型,而且使用超文本、超链接技
术把全球范围里的信息链接在一起,所以
也称为超媒体环球信息系统。
万维网技术是因特网上环球信息系统
设计技术上的一个重大突破,是目前最热
门的多媒体技术。
92
本章小结
本章对多媒体和多媒体技术的定义
及特点、多媒体计算机要解决的关键技
术以及多媒体技术的应用和发展、媒体
信息的计算机表示等问题作了较详细的
讨论。
多媒体计算机技术是综合处理声、
文、图、音频、视频等信息的技术,多
媒体计算机具有信息载体的多样性、集
成性和交互性的特点。
93
多媒体的关键技术包括多媒体计算
机系统要解决的关键技术(如媒体数据
的压缩编码和解码技术、专用芯片技术、
多媒体数据的输入/输出技术)和多媒体
应用设计中的关键技术两个方面。
94
多媒体的应用丰富多彩,不仅涉及
到计算机的各应用领域,也涉及到教育
培训、电子出版、通信、文化娱乐等领
域或行业。
多媒体计算机技术将朝着高分辨率
化、高速度化、简单化、标准化和智能
化方向发展。
95