DSP器件及其应用-DSP的硬件结构

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

DSP芯片的特点
独立的DMA总线和控制器
有一组或多组独立的DMA总线,与 CPU的程序、数据总线并行工作,在 不影响CPU工作的条件下,DMA速度 目前已达800Mbyte/s
DSP的硬件结构
中央处理器 总线 数据存储器RAM、程序存储器ROM 外设。
DSP的硬件结构 CPU
通用微处理器的CPU由ALU和CU组成,其 算术运算和逻辑运算通过软件来实现,如 加法需要10个机器周期,乘法是一系列的 移位和加法,需要数十个机器周期。 DSP的ቤተ መጻሕፍቲ ባይዱPU设置硬件乘法器,可以在单周 期内完成乘法和累加
27
TMS320C54x的硬件结构
内容简介
TMS320C54x(简称C54x)系列DSP是TI公司推出的低功 耗、高性能的16位定点数字信号处理器,具有很好的操作 灵活性和很高的运行速度。由于TMS320C54x使用CPU的 并行运行特性、特殊硬件逻辑、特定的指令系统和多总线 技术等来提高运算速度,并使用高级的IC硬件设计技术来 提高处理器工作速度及降低功耗,使其具有功耗小、高度 并行等优点,可以满足众多领域实时处理的要求。 本章详细介绍TMS320C54x的硬件结构,主要包括总线结 构、中央处理单元、存储器。
条件存储指令。 从中断快速返回指令。
37
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.2 TMS320C54x的主要特性
5.电源 具有多种节电模式,可用IDLE1、IDLE2和IDLE3指令来控制 处理器功耗,使CPU工作在省电方式。
可控制关断时钟输出信号CLKOUT。
39
TMS320C54x的硬件结构
2 总线结构
(2) 3条数据总线(CB、DB和EB) 3条数据总线(CB、DB和EB)将内部各单元(如CPU,数 据地址生成电路,程序地址生成电路,片内外围设备以及数 据存储器)连接在一起。 其中,CB和DB用来传送从数据存储器读出的数据;EB用来 传送写入存储器的数据。
28
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.1 TMS320C54x的内部结构
TI 公司推出的同一代TMS320系列DSP产品的CPU结构是相同 的,只是在片内存储器和片内外围设备的配置上不一定相同。 TMS320C54x系列DSP处理器产品虽然很多, 但其体系结构基 本上是相同的,特别是处理器内部CPU 结构是完全相同的,不 同处理器只是在时钟频率、工作电压、片内存储器容量大小、 外围设备和接口电路的设计上会有所不同。
40
TMS320C54x的硬件结构
2 总线结构
(3) 4条地址总线(PAB、CAB、DAB和EAB) 4条地址总线(PAB、CAB、DAB和EAB)用于传送执行指 令所需要的地址。 TMS320C54x可以利用两个辅助寄存器算术运算单元 (ARAU0 和 ARAU1),在每个周期产生两个数据存储器 的地址。 TMS320C54x还有一条访问片内外设的片内双向总线。这条 双向总线通过CPU接口内的总线交换器与DB和EB相连。利 用这条双向总线的访问过程需要2个或更多个周期来读/写, 具体时间取决于外围电路的结构。由此可见,DSP处理系统 中应当尽量避免器件内外大量数据交换,以保证系统高速特 性。 41
片内RAM有两种类型,即片内双访问RAM(DARAM)和片 内单访问RAM(SARAM)。
35
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.2 TMS320C54x的主要特性
3.片内外设
软件可编程等待状态发生器。 可编程分区切换逻辑电路。 带有内部振荡器或用外部时钟源的片内锁相环时钟发生器。 支持全双工操作的串行口,可进行8位或16位串行通信。 片内的串行口根据型号不同可分为4种:单通道同步串行口 (SP)、带缓冲器单通道同步串行口( BSP)、并行带缓冲器多通 道同步串行口(McBSP)、时分多通道带缓冲器串行口( TMD)。 处理器不同串行口配置也不尽相同。 可与主机直接连接的8位或16位并行主机接口(HPI)。 16位可编程定时器。 6通道直接存储器访问(DMA)控制器。 外部总线关断控制,以断开外部的数据总线、地址总线和控制信 号。 数据总线具有总线保持特性。 36
TMS320C54x的硬件结构
表: 各种读/写方式用到的总线
读/写方式 PAB 程序读 程序写 单数据读 双数据读 32位长数据读 (hw) (lw) (hw) (lw) 地址总线 CAB DAB EAB
程序总 线
PB CB
数据总线 DB EB
单数据写
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.2 TMS320C54x的主要特性
2.存储器 16位192K字的可寻址存储空间(64K字的程序存储空间、 64K字的数据存储空间和64K字的I/O空间),此外, C549、VC5402、VC5409、VC5410和VC5416等带有扩展 程序存储器,程序存储空间最大可扩展至8M字。 片内ROM,可配置为程序存储器和数据存储器。
③ 向数据存储器写一个操作数。
DSP芯片的特点
流水操作(pipeline)
DSP芯片的特点
独立的硬件乘法器
在卷积、数字滤波、FFT、相关、矩阵运算等算 法中,都有 y ai xi 一类的运算,大量重复 乘法和累加
i 1 n
通用计算机的乘法用软件实现,用若干个机器 周期。 DSP有硬件乘法器,用MAC指令(取数、乘法、 累加)在单周期内完成。
TMS320C54x的硬件结构
2 总线结构
TMS320C54x的结构是以8条16位总线为核心的,即1条程 序总线(PB)、3条数据总线(CB、DB和EB)和4条地址 总线(PAB、CAB、DAB和EAB),这些总线形成了支持 高速指令执行的硬件基础。8条16位总线的功能如下: (1) 1条程序总线(PB) 程序总线(PB)传送由程序存储器取出的指令操作代码和 立即操作数。 PB既可以将程序空间的操作数据(如系数表)送至数据空 间的目标地址中,以执行数据移动,也可以将程序空间的操 作数据传送到乘法器和加法器中,以便执行乘法/累加操 作。 。
DSP的硬件结构:举例
DSP的硬件结构:举例 ALU
DSP的硬件结构:举例
ADSP2100
DSP的硬件结构:举例
MOTOROLA DSP56002
DSP的硬件结构:举例 Lucent DSP1600 core
TMS320C54x的硬件结构
TMS320C54x的内部结构和主要特性 总线结构 中央处理单元(CPU) 存储器 本章小结
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.2 TMS320C54x的主要特性
1.CPU 部分 先进的多总线结构(1条程序总线、3条数据总线和4条对应的 地址总线)。 40位算术逻辑运算单元(ALU),包括1个40位桶形移位寄存 器和2个独立的40位累加器。 17位×17位并行乘法器与40位专用加法器相连,用于非流水线 式单周期乘法/累加(MAC)运算。 比较、选择、存储单元(CSSU),用于加法、比较、选择运 算。 指数编码器,是一个支持单周期指令EXP的专用硬件,可以在 单个周期内计算40位累加器中数值的指数。 双地址生成器,包括8个辅助寄存器和2个辅助寄存器算术运算 34 单元(ARAU)。
存储器中读出,从而减少了指令执行作需要的时间。如:TMS320C6200系
列的DSP,整个片内程序存储器都可以配制成高速缓冲结构。
改进型的哈佛结构 DSP芯片都采用多总线结构,可同时进行取指令和多个数据存 取操作,并由辅助寄存器自动增减地址进行寻址,使CPU在一 个机器周期内可多次对程序空间和数据空间进行访问,大大 地提高了DSP的运行速度。如:TMS320C54x系列内部有P、C 、D、E等4组总线,每组总线中都有地址总线和数据总线,这 样在一个机器周期内可以完成如下操作: ① 从程序存储器中取一条指令; ② 从数据存储器中读两个操作数;
DSP的硬件结构 TMS320C2xx的片内存储器及总线
DSP的硬件结构
外设(peripherals)
时钟发生器(振荡器与锁相环) 定时器(Timer) 软件可编程等待状态发生器 通用I/O 同步串口(SSP)与异步串口(ASP) JTAG扫描逻辑电路(IEEE 1149.1标准)
便于对DSP作片上的在线仿真和多DSP条件下的调试
MIPS--Million Instruction Per Second MFLOPS--Million Floating Operation Per Second
DSP芯片的特点
哈佛结构
程序 存储器
CPU
哈佛结构
数据 存储器
改进的哈佛结构
DSP芯片的特点
改进型的哈佛结构 改进型的哈佛结构是采用双存储空间和数条总线,即一条程序总线和多 条数据总线。其特点如下: ① 允许在程序空间和数据空间之间相互传送数据,使这些数 据可以由算术运算指令直接调用,增强芯片的灵活性; ② 提供了存储指令的高速缓冲器(cache)和相应的指令,当 重复执行这些指令时,只需读入一次就可连续使用,不需要再次从程序
CPU:包括算术逻辑运算单元、乘法器、累加器、移位寄存 器、各种专用用途的寄存器、地址生成器及内部总线。 片内存储器系统:包括片内的程序ROM、片内单访问的数据 RAM和双访问的数据RAM、外部存储器接口。 片内外设与专用硬件电路:包括片内定时器、各种类型的串 口、主机接口、片内锁相环(PLL)时钟发生器及各种控制 电路。 此外,在DSP处理器中还包含有仿真功能及其IEEE 1149.1标 准接口(JTAG),用于处理器开发应用时的仿真。 33
DSP的硬件结构
TMS320C2xx的CPU(部分)
DSP的硬件结构
硬件乘法器
DSP的硬件结构
CALU(中心算术逻辑单元)
DSP的硬件结构
DSP的硬件结构 数据地址发生器(DAG) 在通用CPU中,数据地址的产生和 数据的处理都由ALU来完成 在DSP中,设置了专门的数据地址 发生器(实际上是专门的ALU), 来产生所需要的数据地址,节省公 共ALU的时间
DSP器件及其应用
第二章 DSP的硬件结构
DSP芯片的特点
DSP的硬件结构,大体上与通用的微 处理器相类似,由CPU、存储器、总线、 外设、接口、时钟等部分组成,但又有 其鲜明的特点。
DSP芯片的特点
冯.诺依曼结构与哈佛结构
DSP芯片的特点
哈佛结构
程序与数据存储空间分开,各有独立 的地址总线和数据总线,取指和读数 可以同时进行,从而提高速度,目前 的水平已达到90亿次浮点运算/秒 (9000MFLOPS)

TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.2 TMS320C54x的主要特性
4.指令系统 单指令重复和块指令重复操作指令。 用于程序和数据管理的块存储器传送指令。 32位长操作数指令。 同时读入2个或3个操作数的指令。
可以并行存储和并行加载的算术指令。
6.片内仿真接口 具有符合IEEE1149.1标准的片内仿真接口(JTAG),可与主 机相连,用于系统处理器的开发与应用。 7.速度
单周期定点指令的执行时间为25/20/12.5/10/8.3/7.5/6.25ns, 相应的CPU运行速度为 40/50/80 /100/120/133/160MIPS。 38
29
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
30DSP的内部组成框图 TMS320C54x
31 TMS320C54x DSP 的内部硬件结构图
TMS320C54x的硬件结构
1 TMS320C54x的内部结构和主要特性
1.1 TMS320C54x的内部结构
TMS320C54x内部结构基本上可以分为3大部分:
相关文档
最新文档