DSP技术概要第1章

Download Report

Transcript DSP技术概要第1章

DSP原理及应用
山东大学
刘忠国:[email protected]
cellphone:18764171197
Tel:84192
关于考核
成绩考核方式:
期末考试(闭卷70%)+平时成绩(30%)
平时成绩包含:
考勤,作业,上课提问,两次小测验
(第6,11周)
参考文献

1、 《DSP原理与应用教程》
★ 张卫宁 等编著,科学出版社出版。

2、《DSP原理及应用》
★ 邹彦 等编著,电子工业出版社出版。

3、http://www.ti.com/:

TMS320C64x-C64x+ DSP CPU and Instruction Set
Reference Guide (Rev. J)-spru732j.pdf

TMS320C54x DSP CPU and Peripherals Reference
Set Volume 1_spru131g.pdf

TMS320C54x DSP Reference Set Volume 2
Mnemonic Instruction Set_spru172c.pdf,
第1章:DSP技术概要
目录
1.1 DSP系统和芯片的结构特点
1.2 DSP的发展概况及趋势
1.3 DSP芯片的分类、性能及其应用
第1章:DSP技术概要
 数字信号处理概述
数字信号处理是利用计算机或专用
处理设备,以数字的形式对信号进行分
析、采集、合成、变换、滤波、估算、
压缩、识别等加工处理,以便提取有用
的信息并进行有效的传输与应用。
数字信号处理包括两个方面的内容:
(1)数字信号处理算法的研究,研究如何以最小的运
算量和存储器的使用量来完成指定的任务,如FFT
算法,语音和图像的压缩编码算法、信号的调制与
解调和加密与解密算法、信道的辨识与均衡算法、
自适应信号处理算法、非线性滤波算法、模式识别
算法等等。算法是各种应用的理论基础。
(2) 数字信号处理系统的实现,研究如何利用各种
硬件、软件或者硬件与软件结合的方式,更加灵活
、高效、高计算精度、低成本、低功耗地实现各种
数字信号处理系统。
数字信号处理器DSP(Digital Signal
Processors)是一种用于数字信号处理
的可编程微处理器。它的诞生与快速发
展,使各种数字信号处理算法得以实时
实现,为数字信号处理的研究和应用打
开了新局面,提供了低成本的实际工作
环境和应用平台,推动了新的理论和应
用领域的发展。
1.1 DSP系统和芯片的结构特点
1.1.1 DSP系统的基本结构
• 实时处理(Real-Time):数字信号处理与信号的输入和输出保持同步。
• 非实时处理(Non Real-Time):先对信号进行采样并存储,然后再对
其进行处理。
x(t)
y(t)
x(n)
y(n)
DSP系统的处理过程:
① 预处理包含放大器和滤波器,放大器将传感器转后的电信
号放大到合适的幅值,滤波器的作用是滤掉高于折叠频率
的分量和噪声,以防止信号频谱的混叠;
② 经采样和A/D转换器,将滤波后的信号转换为数字信号x(n);
③ 数字信号处理器对x(n)进行处理,得数字信号y(n);
④ 经D/A转换器,将y(n)转换成模拟信号;
⑤ 经低通滤波器,滤除高频分量,得到平滑的模拟信号y(t)。
3、数字信号处理的实现方式
数字信号处理的实现是用硬件、软件或软硬结合的
方法来实现各种算法。数字信号处理的实现一般有以
下几种方法:
③⑥
用单片机实现,用于不太复杂的数字信号处理。不适
①
在通用计算机(PC机)上用软件(如Malab
、C语言
用基于通用DSP核的ASIC芯片实现。随着专用集成电
⑤ 用专用的DSP芯片实现,可用在要求信号处理速度极
、Fortran)实现,但速度慢,不适合实时数字信号处理,只
合于以乘法-累加运算为主的密集型DSP算法;
路ASIC(Application
Specific Integrated Circuit)的广泛使用,可
用于算法的模拟;
快的特殊场合,如专用于FFT、数字滤波、卷积、相关算法的
以将DSP的功能集成到ASlC中。一般说来,DSP核是通用DSP
④ 用通用的可编程DSP芯片实现,具有可编程性和强大
② 在通用计算机系统中加入专用的加速处理机实现,用
DSP芯片,相应的信号处理算法由内部硬件电路实现。用户无
器件中的CPU部分,再配上用户所需的存储器(包括Cache、
的处理能力,可完成复杂的数字信号处理的算法,在实时DSP
以增强运算能力和提高运算速度。不适合于嵌入式应用,专用
需编程,但专用性强,应用受到限制;
RAM、ROM、flash、EPROM)和外设(包括串口、并口、主机
性强,应用受到限制;
领域中处于主导地位;
接口、DMA、定时器等),组成用户的ASIC。
第1章:DSP技术概要
1.1.2 DSP芯片的结构特点
☆ 经典的DSP算法举例
•
求两序列信号h(n)、x(n)的卷积:

h( n) * x ( n) 
•
m 
求两序列信号y(n)、x(n)的相关函数:
 xy (m) 
•
•
数字滤波器的数学表达式为 :
对信号进行快速傅立叶变换FFT :
 h ( m) x ( n  m )

 x ( n ) y ( n  m)
n 
N
M
k 1
k 0
y (n)   ak y (n  k )   bk x(n  k )
N 1
X (k )   x(n)WNnk
n 0
☆数字信号处理的突出特点:ΣAi×Xi 、高速实时
第1章:DSP技术概要
☆ DSP特别适合于数字信号处理的结构
1. 采用改进型哈佛结构
计算机的总线结构分为: 冯·诺依曼结构
哈佛结构
冯·诺依曼结构
多数微处理器和单
片机采用如图所示
冯·诺依曼结构。
结构特点:
程序和数据共用同一套总线,对程序和数据需
要分时读写,执行速度慢,数据吞吐量低,计算
机结构简单,不适于进行高速度的数字信号处理。
哈佛结构与特点
(b)
改
进
型
哈
佛
结
构
(a)
哈
佛
结
构
• 程序、数据具有独立的存储空间,有独立的程序总线
和数据总线,可同时对程序和数据进行寻址和读写访
问,执行速度高,数据吞吐量大,计算机结构复杂,
非常适于进行高速的数字信号处理。
第1章:DSP技术概要
• DSP采用的是改进型哈佛总线结构,如上图(b)
所示
改进之处主要体现在下列3点:
1)片内RAM可映像至数据空间,也可映像至程序空间。
2)片内ROM可映像至程序空间,也可映像至数据空间。
3)具有根装载(Bootloader)功能。
第1章:DSP技术概要
ROM/
Flash
SARAM
外部地址
总线
B0
DARAM
B1, B2
DARAM
MemoryMapped
Registers
PAB
DRAB
DWAB
外部数据
总线
PRDB
DRDB
DWEB
Control Bus
On-Chip
Peripherals/
Registers
CPU
External
Signals
TMS320C2000系列DSP的总线结构图
第1章:DSP技术概要
2.流水线操作
☆指令的执行通常分为以下4个阶段:
F:取指 Fetch
D :译码 Decode
O :取操作数 Operand
X :执行 Execute
第1章:DSP技术概要
☆采用冯·诺依曼结构的微处理器指令流如下图
CPU是在完成一条指令的全部4个操作阶段后再
去执行另一条指令的,从时间上看是一种串行执
行的过程,因此需要花费较多的CPU时钟周期。
取指—译码— 取操作数— 执行 取指—译码—取操作数—执行 取指—译码—取操作数—执行
指令n-2
指令n-1
4*n个操作周期
指令n
第1章:DSP技术概要
☆ DSP采用多级流水线结构
所谓流水线操作就是将一条指令的不同阶段分
配在连续的几个周期上,通过不同的硬件去完
成指令的不同执行阶段(称为级)。
指令操作
取指—译码— 取操作数— 执行
各操作对应不同的硬件
第1章:DSP技术概要
• 一个4级流水线的示意图如图1-6所示。虽然就一条指
令而言,似乎要用4个时钟周期才能完成全部操作,
但从多条指令的角度看,则可认为每条指令的运行时
间是单周期。这样,就使指令的运行速度得到了很大
提高。
第1章:DSP技术概要
3. 片内集成有硬件
乘法器和乘加单元
• DSP内集成了乘加单元,从
硬件结构上为高速完成卷积、
相关、FFT及数字滤波等信
号处理算法提供了基础。
• TMS320C54x系列DSP内
集成了17×17位硬件乘法
器,和40位的加法器。
TMS320C54x系列乘加单元
第1章:DSP技术概要
C64x CPU
Instruction Fetch
Instruction Dispatch
Advanced Instruction
Packing
Advanced
Emulation
Interrupt
Control
Control Registers
Instruction Decode
L1
+
+
+
+
Data Path 1
Register File A
Data Path 2
Register File B
A15-A0
B15-B0
A31-A16
B31-B16
S1
+
+
+
+
M1
x
x
x
x
x
x
D1
+
+
D2
+
+
M2
x
x
x
x
x
x
S2
+
+
+
+
L2
+
+
+
+
TMS320C6000系列
片内有2个硬件乘法器,
支持在单周期内完成
下列乘法运算。
• 16位×16位
• 16位×32位
• 双16位×16位
• 4个8位×8位
TMS320C64x -CPU
第1章:DSP技术概要
4. 功能强大的CPU结构
• DSP的CPU一般包括:算术逻
辑运算单元ALU、累加器、硬
件乘法器、乘加单元、加法器、
桶型移位器、程序地址产生和
数据地址产生等部分。
• 例如:TMS320C6000采用双
数据通道和8个功能单元的结
构。CPU在单周期内可同时执
行8条指令,具有超长指令字
(VLIW)操作能力。
TMS320C64xCPU Core( 内核)
第1章:DSP技术概要
5.硬件循环重复机制
• 许多DSP芯片具有指令重复循环的专用硬件及重复操作
指令,能够自动重复执行单条或一段指令。
• 进入重复机制的指令会自动变为单周期指令,大大减少
了执行时间.
• TMS320C5000中有重复计数器RPTC。当执行一条重
复指令RPT #N时,会将重复值N送入RPTC,则紧接
RPT后面的那条指令将被重复执行N+1次。每重复执行
一次,RPTC的内容自动减1,直至减至零为止。这样
可通过硬件自动完成循环操作过程。
6. 复合操作指令
• 复合操作是指在一条单字单周期指令中可分别完成多个操
作任务。由于DSP具有特殊的多总线哈佛结构和CPU硬件,
综合了CISC和RISC的优点,大多数指令是复合指令。
• 以TMS320C24x的MPYA (乘且累加前次乘积)指令为例。
MPYA *+,AR3;设AR为AR1,执行后会发生下列事件:
(1)(PC)+ 1 → PC
(2) (ACC)+ 移位后的(PREG)→ ACC
(3) (TREG)× (数据存储器)→ PREG
(4) (AR1)+ 1 → AR1
(5) 令AR3为当前辅助寄存器AR
(6) ARP=011b ,ARB=001b
第1章:DSP技术概要
7.嵌入式功能
• DSP片内配置有大量片
内外设,不用外扩很多
器件,既可组成独立的
应用系统。
• DSP芯片具有强大的扩
展接口能力,可有效连
接一系列外扩器件。
• DSP=数字信号处理能
力+嵌入式功能
主机接口
系统时钟
通信端口
Bootloader
程序存储器
DSP
CPU内核
数据存储器
定时/计数器
测试和开发
仿真接口(JTAG)
电源控制
通用DSP片内硬件结构
模拟I/O
编解码器
第1章:DSP技术概要
1.2 DSP的发展概况和趋势
1.2.1 DSP的发展概况
• 1978年,AMI( American Microsystem Inc.) 宣布第一个DSP S2811问世
• 1980年,日本NEC公司推出的D7720是第一片具有硬件乘法器的商
用DSP
• 1982年,美国TI公司推出首枚低成本高性能的DSP-TMS32010芯片
• 90年代以来,数字信号处理器技术获得了惊人的发展
• 进入21世纪,ADI( Analog Device Instrument)公司推出主频600MHz的
TS201浮点DSP,TI公司推出主频1GHz的TMS320C6416定点DSP
• 近年来,DSP在国内外应用市场上取得了长足进展,特别是在无线
通信、宽带网络以及由此而拓展的流媒体应用领域都取得了重大突
破。
第1章:DSP技术概要
☆目前全球DSP市场中的主要厂商
• TI公司位居榜首,在全球DSP市场的占有率为44%左右
• Motorola公司的占有率为13.2%左右
• ADI公司的占有率为10.2%左右
• 其他一部分由 Hitachi、NEC、Zilog和
STMicroelectoncs等公司占据
第1章:DSP技术概要
☆ TI公司主推的三大DSP平台
TMS320C5000™
TMS320C2000™
•
•
•
•
最佳测控
电机控制
家用电器
变频电源控制
工业自动化
•
•
•
•
•
TMS320C6000™
低功耗
手机
电信
数码相机
便携式媒体播放器
医疗器械
•
•
•
•
高性能
无线基站
视频流、 视频会议
视频安防/监控制
医疗成像
第1章:DSP技术概要
☆ C2000系列DSP子系列
•
C2xx子系列:16位定点DSP、20MIPS
代表器件:TMS320F206PZ
•
C24x子系列:16位定点DSP、20MIPS
代表器件:TMS320F240
•
LF240x子系列:16位定点DSP、40MIPS
代表器件:TMS320LF2407
•
F28x子系列:32位定点DSP、150MIPS
代表器件:TMS320F2812、TMS320F2810
第1章:DSP技术概要
Automotive - EPS
Battery operated
precision for steering
Digital Power Supply
Tire Pressure
Low cost pressure
sensing based on tire
rotation speed
measurement
Provides control, sensing,
PFC, and other functions
TV screen
Deflection of electron beam
for small angle and sharp
corner TV screen
Printer
Print head control
Paper path motor control
Optical Networking
Control of laser diode
C2000系列DSP应用领域
“Segway”
Many new cool
Application to come
第1章:DSP技术概要
☆ C5000系列DSP子系列
•
C54x子系列:16位定点DSP、100~160MIPS
代表器件:TMS320VC5402、VC5409、VC5416
C55x子系列:16位定点DSP、400MIPS
代表器件:TMS320VC5510、VC5509、VC5502
•
C54x+ARM7子系列:
代表器件:TMS320VC5470、VC5471、DSC21
•
C55x+ARM9子系列:
即OMAP平台:Open Multimedia Applications Platform
代表器件:OMAP5910
第1章:DSP技术概要
TI DSP占手机市场
的60%
TI DSP被前8位
数码相机制造商
中的7个所选中
TI DSP 被前10位因特网
消费类电子产品制造商中
的8个所选中
TI DSP占VOIP网
关市场的80%
TI DSP占IP电话
设计的 80%
TI DSP 被前10位
无线基站制造商
中的8个所采用
C5000系列DSP的应用
第1章:DSP技术概要
☆ C6000系列DSP子系列
•
•
C62x子系列:32位定点DSP、1200~2400MIPS
代表器件:
TMS320C6205
代表器件:
TMS320C6211
C64x子系列:32位定点DSP,4000~5760MIPS
代表器件:
•
TMS320C6414、C6415、C6416
数字媒体器件:TMS320DM640、DM641、DM642
C67x子系列:32位浮点DSP、1200~1800MIPS,
900~1350MFLOPS
代表器件: TMS320C6701
代表器件:
TMS320C6711、C6712、C6713
第1章:DSP技术概要
Broadband Communications
DSL modems
• Modems 池
• 基站收发器
• 无线局域网
• 区域用户交换机
• 语音识别
• 多媒体网关
• 专业音频设备
• 网络照相机
• 机器视角
• 安全认证
• 工业扫描仪
• 高速打印机
• 高级加密器
•
Wireless 3G Base Stations
Medical Imaging
C6000系列DSP的应用
第1章:DSP技术概要
☆目前TI公司和ADI公司的主流DSP的一些特性如表
第1章:DSP技术概要
1.2.2 DSP的发展趋势
1.单片DSP的发展
将围绕性能、价格和功耗这三大要素进行进一步的改善
2.DSP与其它可编程处理器技术相结合
将FPGA与DSP技术相结合,可实现宽带信号处理,大大
提高信号处理速度
3.DSP与SoC(System on Chip)技术相结合
利用DSP核嵌入技术将一个系统集成在一块芯片上,提高
设计速度,降低开发成本,可直接使用DSP系统开发技术
来开发内部嵌有DSP内核的SoC.
DSP芯片性能发展比较
年份
制造工艺/um
1980
1990
2000
2010
4,NMOS
0.8, CMOS 0.1, CMOS 0.02, CMOS
处理速度/MIPS
5
40
5000
50000
内部RAM/字节
256
2K
32K
1M
价格
$150
$15
$5
$0.15
12.5
0.1
0.001
功耗/ mW/MIPS 250
MIPS(Million Instructions Per Second) 每秒百万条指令
第1章:DSP技术概要
1.3 DSP芯片的分类、性能及其应用
1.3.1 DSP 芯片的分类
1. 按照数据格式分类 : 定点DSP芯片
浮点DSP芯片
2.按照芯片的用途分类:通用型DSP
专用型DSP
3.按照芯片结构分类:静态DSP在某种频率范围内任何频率都工作
为某种应用目的而专门设计的ASIC系统
硬连线逻辑电路或积木式结构
第1章:DSP技术概要
1.3.2 DSP芯片的性能
1.MIPS (Million Instructions Per Second) :百万条指
令/每秒。 如TMS320C6416在时钟为1GHz时的峰值
性能可达8000MIPS
2.MOPS (Million Operations Per Second :百万次操
作/每秒。如TMS320C6201在时钟为200MHz时的峰
值性能可达2400MOPS
3.MFLOPS (Million Float Operations Per Second :
百万次浮点操作/每秒。如ADSP-TS201S的峰值性能
可达14.4GFLOPS
第1章:DSP技术概要
1.3.2 DSP芯片的性能
4.MBPS(Million Bits Per Second):百万位/每秒
如TMS320C6000的总线时钟为200MHz时,其总线数
据吞吐率为800M字节/秒
5.MAC执行时间:完成一次乘-累加运算所需时间
大部分DSP可在单周期内完成一次MAC
6.FFT执行时间完成一个N点FFT运算所需时间
第1章:DSP技术概要
1.3.3 DSP芯片的应用
作业
习题1.3-1.5