聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> DSP芯片特点及选择.doc-

DSP芯片特点及选择.doc-

时间:    下载该word文档
6 DSP 芯片特点及选择
DSPDigital Signal Proceccing 芯片也称为数字信号处理器 , 它是仿真系统硬件构成的核心器件 , 它的性能对仿真功能的实现非常 重要。只有选定3DSP芯片,才能设计其外围电路及系统的其它电路。 总的来说,DSP芯片的选择应根据仿真系统的规模,运算速度、存贮 容量而定,但一般来说,选 DSP芯片时应考虑到如下因素[2]
1 DSP芯片的运算速度。运算速度是 DSP芯片的一个最重要的 能指标,也是选择DSP芯片时所需要考虑的一个主要因素。DSP 片的运算速度可以用以下几种性能指标来衡量:
a. 指令周期(执行一条指令所需的时间) b. MAC寸间(一次乘法加上一次加法的时间)
c. FFT执行时间(运行一个NFFT程序所需的时间)。 d. MIPS(每秒执行百万条指令)。 e. MOPS 每秒执行百万次操作) f. MFLOPTS每秒执行百万次浮点操作)。 g. BOPS(每秒执行十亿次操作)
2 DSP芯片的价格。 3 DSP芯片的硬件资源。

4 DSP芯片的运算精度。 5 DSP芯片的开发工具。 6 DSP芯片的功耗。
般而言,定点DSP芯片的价格较便宜,功耗较低,但运算精 度稍低。而浮点DSP芯片的优点是运称精度高,用C语言编程方 便,开发周期短,但价格和功耗相对较高。 6.1 DSP芯片的特点和种类
DSP芯片是一种特别适合于进行数字信号处理运算的微处理器, 其主要应用是实时快速地实现各种数字信号处理算法,一般具有如下 主要特点[2]: 1 在一个指令周期内可完成一次乘法和一次加法; 2 程序和数据空间分开,可以同时访问指令和数据; 3 片内具有快速RAM通常可通过独立的数据总线在两块中同 时访问;
4 具有低开销或无开销循环及跳转的硬件支持; 5 快速的中断处理和硬件I/O支持;
6 具有在单周期内操作的多个硬件地址产生器; 7 可以并行执行多个操作;
8 支持流水线操作,使取指、译码和执行等操作可以重叠执行。 1978年出现的第一个单片DSP以来,DSP芯片在这20几年来得 了高速发展,DSP芯片的应用也越来越广泛,根据其用途可分为通 用型DSP芯片和专用型DSP芯片;按基础特性分为静态DSP芯片和一
致性
DSP芯片;按数据格式分为定点 DSP芯片和浮点DSP芯片。 美国德州仪器公司(Texas Instruments,简称TI)推出的TMS DSP芯片已经成为当今世界上最有影响的 DSP芯片[2] , TI 司在1982年推出第一代 DSP芯片TMS320K > TMS320C1系列,随 后推出第二代 DSP芯片TMS320*TMS320C2系列,第三代DSP TMS320C3系列,第四代DSP芯片TMS320C4系列,第五代DSP TMS320C5列,第六代 DSP芯片 TMS320C6系列。 6.2 TMS320系列DSR芯片
可编程DSP芯片是一种具有特殊结构的微处理器,为了达到快速 进行数字信号处理的目的,DSP芯片一般都具有程序和数据分开的总 线结构、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适 合数字信号处理的指令集。
6.2.1 TMS320系列DSP芯片的基本结构。
TM320系列DSP芯片基本结构包括:(1)哈佛结构;(2)流水线 作;(3)专用的硬件乘法器;(4)特殊的DSP指令;(5)快速的指 令周期。
这些特点使得TMS32C系列DSP芯片可以实现快速的DSP运算, 并使大部分运算(例如乘法)能够在一个指令周期内完成。由于TMS320 DSP芯片是软件可编程器件,因此具有通用微处理器具有的方便 灵活的特点。
1)哈佛结构
哈佛结构是不同于传统的冯诺曼(VonNeuman结构的并行体

系结构,其主要特点是将程序和数据存储在不同的存储空间中, 即程 序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编 址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数 据总线两条总线,从而使数据的吞吐率提高了一倍。
为了进一步提高运行速度和灵活性,TMS320系列DSP芯片在基 本哈佛结构的基础上作了改进,一是允许数据存放在程序存储器中, 并被算术运算指令直接使用, 增强了芯片的灵活性; 二是指令存储在 高速缓冲器Cache)中,当执行此指令时,不需要再从存储器中读 取指令,节约了一个指令周期的时间。
2)流水线
与哈佛结构相关,DSP芯片广泛采用流水线以减少指令执行时间, 从而增强了处理器的处理能力。TMS320系列处理器的流水线深度从 2~6不等。也就是说,处理器可以并行处理 2~6条指令,每条指令 处于流水线上的不同阶段。
3)专用的硬件乘法器
TMS32C系列DSP芯片中具有一个专用的硬件乘法器,用 1~4 指令就能完成一次乘法和一次加法运算, 因此,在一个指令周期内可 完成乘法运算, 而在通用的微处器中, 乘法指令是靠一系列加法来实 现的,因此,TMS32(系列DSP乘法速度远远高于通用微处理器。
4)特别的DSP指令
利用DSP的特殊指令可以将多条指令才能完成的功能用一条指 令来完成,这样可大大提高运算速度。
5)快速的指令周期

哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSF指令再 加上集成电路的优化设计,可使 DSP芯片的指令周期在200ms以下。 6.2.2 几种TMS32C系列DSP芯片的比较
(1 第一代TMS32C系列DSP芯片TMS320C1是定点DSP芯片,采用
二级流水线,其主要特点如下: •指令周期:160 ns/200ns/280ns •片内 RAM 144 /256 (TMS320C15/E15/C17/E17 •片内 ROM 1.5K /4K (TMS320C15/C17 * 4K字片内程序 EPROMTMS320E15/E17 .4K字外部全速存储器扩展
*并行乘法器:乘积为32
.桶形移位器:将数据从存储器移到 ALU *并行移位器
允许文本交换的4X 12位堆栈 .两个间接寻址的辅助寄存器
* 双通道串行口( TMS32011 TMS320C17/E1 * 片内压扩硬件(TMS32011 TMS320C17/E1 * 协处理器接口( TMS320C17/E1
器件封装:40脚双列直插(DIP /44脚塑封(PLCC
(2 第二代TMS32C系列DSP芯片TMS320C2系列是定点用三级流水线,其主要特点如下:
DSP芯片,
* 指令周期:100ns/120ns/80ns *片内掩膜ROM 4K
•片内RAM 544字,分B0B1B2三块 *程序和数据空间均为64K 具有8级硬件堆栈、8个辅助寄存器
.具有全静态双缓冲串行口,可与许多串行器件直接接口 *与低速片外存储器通信的等待状态插入 •采用HOLD操作的DMA .FFT变换用的比特反转寻址 «扩展精度算术和自适应滤波支持
从外部存储器全速执行的 MAC/MAC指令
具有在多处理器之间进行同步的能力,支持多处理器共享存储
• 1-8umCMO工艺,68 PGA PLCC封装
(3 第三代TMS320系列DSP芯片TMS320C3系列芯片是浮点
DSP 芯片,采用四级流水线。其主要特点如表 6-1
6-1三种TMS320C3芯片的比较
特征 指令周期
TMS320C30 50/60/74ns
TMS320C31 33//40/50/60/74
ns
TMS320C32 33/40/50ns STRB0 8/16/32 STRB 1 8/16/32 IOSTRB 32
数据/程序总线
主总线STRB 32
STRB 32位数数据,24位地址扩
据,
展总线IOSTRB 32
24位地址
位数据,13位地址

内部RAM 串行I/O 用户程序、数据
ROM DMA空制器 程序和数据存储器
宽度 外部中断触发 中断矢量表地址
程序引导 40/32浮点/整数
乘法器
整数/浮点算术逻 辑单元ALU 两个辅助寄存器算 术单元(ARAU(和
2K 2个串行口 4K/16K字节
单通道 32 电平触发 固定


2K 1个串行口
单通道 32 电平触发 固定 用户可选

512 1个串行口

双通道
程序16/32位可选数 8/16/32位可选 电平/边沿可选 用户可重定位 用户可选



4 第四代TMS320系列DSP芯片TMS320C4系列芯片是浮点
DSP 芯片,采用五级流水线,其主要特点如下:
.具有6个用于处理器间高速通信的通信口,每个口的最大数 据吞吐量20Mbyte/s的异步传输速率。
6DMA通道实现了 I/O操作与CPL操作的并行化。
CPL处理能力达275MOP,S数据吞吐量为320Mbyte/s,指令周 期时间40ns/50ns
.两条分开的外部数据、地址总线支持共享存储器系统和高速 数据速率、单周期传输。
片内分析模块支持高效的并行处理调试。
片内程序高速缓冲存储器(Cache)和双向存取/单周期RAM 提高了存储器访问的性能。
-分开的内部程序、数据和 DMA总线使程序和数据的I/O操作
咼度并
行化,最大限度地保证了 CPL的性能。
5 第五代TMS320系列 DSP芯片TMS320C5系列芯片是定点
DSP 芯片,采用四级流水线,其主要特点如下: 25/35/50ns 的指令周期(20~40MIPS 224KX 16位最大可寻址外部存储空间(64K程序、64K数据、 64KI/O32K全局)
算术逻辑单元(ALU, 32位累加器(ACC以及32位加法器 的缓冲器(ACCB 并行逻辑单元(PLU
*结果具有32位的16X 16位并行乘法器 .单周期乘累加指令
.具有一个专用算术单元的8个辅助寄存器,可用于间接寻址 8级硬件堆栈
* 0~16位数据左移和右移
.两个间接寻址的循环缓冲器,用于循环寻址 程序代码的单指令重复和程序块重复
.全双工同步串行口,用于完成 TMS320C5与其他串行器件之 间的直接直接通信
时分多址访问(TDM串行口 -内部定时器,可用软件控制

-64K并行I/O 口,其中16个有存储器映像 .可软件编程的等待状态发生器 .扩展保持操作,用于并发外部 DMA
.四级流水线操作,用于延迟跳转、调用、返回指令 *比特反转寻址方式,用于FFT运算
-JTAG扫描仿真接口( IEEE标准,P1149.1
6)第六代TMS32C系列DSP芯片TMS320C6系列芯是一种新型定 DSP芯片,该芯片的内部结构与以前的 DSP芯片不同,内部集成了 多个功能单元,可同时执行 8条指令,运算能力达1600MIPS其主 要特点有:
运行速度快。指令周期为5ns,运算能力为1600MIPS
*内部结构不同于一般DSP芯片。内部同时集成了 2个乘法器和 6个算术运算单元,且它们之间是高度正交的,使得在一个指令 周期内最大能支持832bit的指令;
指令集不同。为充分发挥其内部集成的各执行单元的独立运行 力,TI公司使用了 VelociTT超长指令字(VLIW)结构。它在 一条指令中组合了几个执行单元,结合其独特的内部结构,可在 一个时钟周期内并行执行几个指令;
.大容量的片内存储器和大范围的寻址能力。片内集成了
512K
字程序存储器和512K字数据存储器,并拥有32bit的外部存储 器界面;
-智能外设。内部集成了 4DMA接口,2个多通道缓存串口,

232bit计时器;
低廉的使用成本。
根据上述比较,结合仿真系统的特点,考虑DSP的功能和性能比, 选择了 TI公司第三代产品TMS320C31-4C浮点DSP芯片。 6.3 TMS320C31-40 DSP 芯片
TMS320C312-4C为主频40MH才旨令周期为50ns的浮点DSP片, 它是TMS320C3的简化和改进型,它去掉了扩展总线,一个半行口 内部的4KROM增加了程序的引导功能,其内部包含了 2KX 32

的快速RAM块。分开的程序总线、数据总线和 DMA总线使得取指、读 写数据和DMA操作可并行进行,64X 32位的指令Cache用来存储经 使用的代码块,这可大大减少片外访问的次数,从而提高程序运行 度,一般来讲,其运算速度为 20MIPS40MFLOP,S采用132脚的 PQFP封装,其内部结构框图为图6-1

线.

631 中央处理单元CPU 中央处理单元CPU DSP芯片的核心组成部件,其性能直接决 定了 DSP的运算速度,图6-2CPU的内部结构图。


CPU内有一个40/32位的浮点/定点法器和一个浮点/整数算术逻
辑单兀,使DSP在单周期内完成乘法和一个加法运算,大大提咼了 DSP勺运算速度。CPU内还有一组寄存器,CPU寄存器组有28个内部 寄存器,他们可以由乘法器和算术逻辑单元进行操作, 此寄存器组包 括:
8个扩展精度寄存器(R7-Ro 8个辅助寄存器(AR-AR 2个指针寄存器(IRIRi .1个块大小寄存器(BK -1个数据页面寄存器(DP -1个堆栈寄存器(SR 1个状态寄存器(ST
1CPU/DM中断使能寄存器(IE
1CPU中断标记寄存器(IF 1I/O标记寄存器(IOF
1个重复计数器(RC2个块重复(RS RE寄存器 1个程序计数器(PC 632内部存储器


64 X 32位的指令缓存器极大提高了重复运算的指令使用效率,减 少了片外寻址(等待)的次数,它由 CPU犬态寄存器中的3位(bit 块定清除、使能或冻结Cache的状态。 6.3.3 片内
DMA 片内DM/主要由地址生存器和控制寄存器组成。 6.3.4 外设
1 个串行口,支持 8/16/24/32 位。 2 32 位定时器。
6.3.5 TMS320C31-40 的软件资源 1 丰富的指令系统
TMS320C31-40的汇编语言指令集特别适合于数字信号处理。所有 令占一个机器字长, 大部分指令是单周器的。 指令集共有 113 条指 令,可以分为六类:数据传送类、二操作数算术 / 逻辑类、三操作数 算术/逻辑类、程序控制类、互锁操作类及并行操作类。
12 条数据传
送指令可从存储器中读一个字装入寄存器, 将一个字从寄存器中存入 储器中及进行堆栈操作。二操作数指令有 35条,提供整数、浮点、 逻辑运算及多精度算术操作。 17 条三操作数指令可以在一个指令周 期内完成具有三个操作数的运算, 其中两个是源操作数, 另一个是目 的操作数。程序控制指令共 16 条,它们影响程序的流向,其中有块 重复指令RPT厨口单指令重复指令RPTS除了有标准跳转指令外,还 有延迟跳转指令,有些指令具有条件运算功能。 5 条互锁操作指令主
要用来进行多处理器
之间的通信。剩下的 28 条指令都是并行操作指 令,每条并行指令由两条指令用符号“H”连接,并行操作指令可使
“II”前后的两条指令并行完成。需要注意的是,并不是任意两条指 令都可构成并行指令。 2 灵活的程序控制
TMS320C31-4C提供相当灵活的程序流控制。软件的程序控制包 括重复、跳转、调用、陷阱及返回等。
重复方式可以实现无开销循环。块重复指令RPTB可以使一块代 重复执行指定的次数,而单指令重复指令 RPTS使 一条指令重复执 行指定的次数,由于 RPTS取指次数只有一次,因此减少了总线冲突 的机会。但RPTS指令禁止中断。因此在需要中断的场合,一般用RPTB 指令代替RPTS指令。
跳转指令分为标准跳转和延迟跳转。标准跳转首先将流水线清 空然后执行跳转, 这需 4 个周期才能执行完毕。 延迟跳转并不将流水 线清空,而是保证在程序跳转之前执行它下面的 3 条指令, 这样使得 跳转指令本身仅需 1 个指令周期。 3 流水线操作
流水线操作是TMS320C31-4具有高性能的特性之一。5个功能 元控制TMS320C31-4的操作:取指(F)、译码(D)、读操作数R)、 执行(E)和DMA流水线操作就是一个基本指令的取指、译码、 操作数和执行的并行操作。尽管DMA勺优先级最低,但由于DMA
器具有自己的数据和地址总线,因此,通过合适的数据结构, DMA CPU的冲突可以减少甚至消除。
流水线冲突可以分为下列三大类:跳转冲突、寄存器冲突和存 储器冲突 (4 寻址方式多样
TMS320C31-4C支持5组寻址模式和6种寻址方式。5组寻址模 通用寻址方式;三操作数寻址方式;并行寻址方式; 立即数寻址方式;条件跳转寻址方式。6种寻址方式是:寄存器 寻址;接寻址;间接寻址;短立即数寻址;长立即数寻址; PC指令相对寻址。
6.3.6 TMS320C31-40 的特点
TMS320C31-40 具有 40/32 位的浮点 / 定点剩法器及算术逻辑单 元、2KX 32位的快速RAM块、64X 32位的指令Cache及丰富的软件 资源,特别是TMS320C31-45个功能4级指令流水线及I/OCPU 作的并行性等特点使TMS320C31-40 DSP芯片具有高性能,其性能 特殊如下:
(1指令周期50ns,运算速度20MIPS40MFLOPS ( 2 二个各为 1KX 32 位单周期存取的快速 RAM (3 64 32 位长的指令缓存器( Cache
(4 32位长的指令和数据,16M空间24位寻址范围(大寻址范围 ( 5 40/32 位浮点 / 定点乘法器和算术逻辑单元。 ( 6 1 32 位桶形移位寄存器。

(7 二个地址发生器中包含 8 个辅助寄存器。 ( 8 寄存器和二个辅助寄存器运算单元。 (9片内DMA$制器用于并发的I/OCPL操作。 10)具有整数、浮点数及逻辑运算功能。
11)单周期内完成平行的算术逻辑运算及乘法指令。 12)具有块指令重复功能。 13)可实现零开销的循环指令。 14)条件转移和返回指令。
15)支持多处理器之间的互锁功能。 161 24位寻址 32位数据总线。
171 个串行口支持 8/16/24/32 位数据格式的传输。 18)两个 32 位长度的空时器。
192 个通用外部标记寄存器及 4 个外部断引脚。 20)灵活的引导装载方式。 21 132脚的PaFp封装方式

免费下载 Word文档免费下载: DSP芯片特点及选择.doc-

  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服