第2章 DSP芯片的基本结构和特征

合集下载

dsp

摘要随着数字信号处理技术在通讯、多媒体、信息家电等各个领域得到了广泛的应用，数字信号处理器(DSP)无论从制造工艺、体系结构等方面都取得了巨大的发展。

因此设计有自主产权的DSP处理器IP核具有很高的实用价值及意义。

通过对片上串行接口的模块划分，完成了串口寄存器模块、时钟与帧同步信号控制器模块、接收控制器模块和发送控制器模块的详细设计和FPGA验证。

其中，设计了一种采用一个主控状态机和两个从状态机协同工作的层次化结构方案，规整高效地实现了接收控制器模块和发送控制器模块。

通过对6通道DMA控制器的模块划分，完成了内部寄存器组、优先级编码模块、内部寄存器寻址、地址产生模块和有限状态机等模块的详细设计和FPGA验证。

其中，设计了一种采用模计数和循环比较的结构方案，实现了对6个DMA通道进行分级循环优先级控制的机制。

论文从主机接口(HPI)寄存器、状态机两个方面论述和设计实现一个8位外总线接口。

并完成了内部定时器和可编程等待状态发生器的设计。

目前该兼容DSP处理器的设计已经完成，通过了FPGA验证，能运行基本的功能验证程序，为进一步研发该DSP的可重用IP模块打下了基础。

关键字：数字信号处理器，串行接口，直接寄存器访问控制器，主机接口、定时器、等待状态发生器引言：近年来，我国电子信息产业和市场高速增长，不仅推动了DSP处理器芯片的广泛应用，而且吸引了国内外众多厂商涉足我国DSP处理器产品市场，促使DSP处理器芯片需求量持续增大，市场竞争日渐激烈。

尽管DSP处理器在我国的应用已经有了相当的基础，而且有lO多家集成电路设计企业从事DSP系统及相关产品的开发与应用，但目前在国内芯片市场上还很少见到国内厂商自己的DSP 处理器芯片。

因此研制有自主知识产权的DSP处理器设计技术，以及相应的DSP 系统设计技术与应用能力，仍然是我国科技工作者和IT企业的重大挑战。

1．2．1 DSP处理器的发展史人们对DSP技术的研究兴趣开始于二十世纪七十年代，主要是研究诸如调制解调器和集中转接系统等电信设备。

第2章 DSP芯片介绍

16 bit instructions defined parallel instructions
C55x C54x Mnemonic Mnemonic
Superset of 54x Mnemonic 8,16,24,32,40,48 bit instructions defined parallel instructions user defined parallel instructions
Low Power
Ch 3
Ch 4 Ch 5
•< 72 mW active power •144-pin LQFP •Ultra-small 144
Small Size
Байду номын сангаас
Addressing Unit 8 Auxiliary Registers 2 Addressing Units Power Management
WD Timer
Peripheral Bus
CAN 2.0B McBSP 2 SCI SPI A/D Converter
Peripheral s optimized for digital control
LF2407 Shown
12-Bits, 16 Channels
C2000系列MCU
Roadmap
Automotive - EPS Battery operated precision for steering
Tire Pressure Low cost pressure sensing based on tire rotation speed measurement
“Segway” Many new cool Application to come

DSP原理及应用第二章DSP的硬件结构总结(精)

第2章DSP的硬件结构DSP的硬件结构：DSP与标准微处理器有许多共同的地方，都是由CPU、存储器、总线、外设、接口、时钟组成。

从广义上讲，可以说DSP是一种CPU。

但DSP和一般的CPU 又有不同， DSP有自己的一些独特的特点，比如采用哈佛结构、流水线操作、独立的硬件乘法器、独立的DMA总线和控制器等。

Von Neuman结构与Harvard结构：Harvard结构：程序与数据存储空间分开，各有独立的地址总线和数据总线，取指和读数可以同时进行，从而提高速度，目前的水平已达到90亿次浮点运算/秒（9000MFLOPS）。

MIPS--Million Instruction Per SecondMFLOPS--Million Floating Operation Per Second流水操作（pipeline）：独立的硬件乘法器：在卷积、数字滤波、FFT、相关、矩阵运算等算法中，都有A(kB(n-k一类的运算，大量重复乘法和累加。

通用计算机的乘法用软件实现，用若干个机器周期。

DSP有硬件乘法器，用MAC指令（取数、乘法、累加）在单周期内完成。

独立的DMA总线和控制器：有一组或多组独立的DMA总线，与CPU的程序、数据总线并行工作，数据的传递和处理可以独立进行，DMA内部总线与系统总线完全分开，避开了总线使用上的瓶颈。

在不影响CPU工作的条件下，DMA速度已达800Mbyte/s。

CPU:通用微处理器的CPU由ALU和CU组成，其算术运算和逻辑运算通过软件来实现，如加法需要10个机器周期，乘法是一系列的移位和加法，需要数十个机器周期。

DSP的CPU设置硬件乘法器，可以在单周期内完成乘法和累加.移位:通用微处理器的移位，每调用一次移位指令移动1-bitDSP可以在一个机器周期内左移或右移多个bit，可以用来对数字定标，使之放大或缩小，以保证精度和防止溢出；还可以用来作定点数和浮点数之间的转换.溢出:通用CPU中，溢出发生后，设置溢出标志，不带符号位时回绕，带符号位时反相，带来很大的误差DSP把移位输出的最高位（MSB）存放在一个位检测状态寄存器中，检测到MSB=1时，就通知下一次会发生溢出，可以采取措施防止.数据地址发生器（DAG）:在通用CPU中，数据地址的产生和数据的处理都由ALU来完成在DSP中，设置了专门的数据地址发生器（实际上是专门的ALU），来产生所需要的数据地址，节省公共ALU的时间.外设（peripherals）:时钟发生器（振荡器与PLL）定时器（Timer）软件可编程等待状态发生器通用I/O同步串口（SSP）与异步串口（ASP）JTAG扫描逻辑电路（IEEE 1149.1标准便于对DSP作片上的在线仿真和多DSP条件下的调试’C54x的内部结构:中央处理器CPU 、内部总线控制、特殊功能寄存器、数据存储器RAM 、程序存储器ROM、I/O功能扩展接口、串行口、、主机通信接口HPI、定时系统、中断系统。

DSP芯片的基本结构和特征ppt课件

芯片内部的特殊结构紧密相关的
• 学习DSP芯片的结构和特征，对于深入理解
DSP芯片的操作过程，掌握DSP芯片的开发和应用技术具有很重要的意义
二、基本结构
程序存储器
程序地址发生单元
数据存储器
外部存储器接口
数据总线
程序总线
数据地址发生单元
指令缓存
DMA 处理器
定时器
时钟单元
等待状态发生器
DSP芯片的基本结构和特征
1. 引言 2. 基本结构 3. 中央处理单元CPU 4. 总线结构和流水线 5. 片内存储器 6. 片内外设
7. TI定点DSP芯片 8. TI浮点DSP芯片 9. 其他DSP芯片简介 10.小结 11.习题与思考题
一、引言
• 在DSP芯片操作中，许多特殊功能是与DSP
C20x
（ns）（字）（字）（字）串口串口
C203
25/35/50
-
544
-
1
1
C204
25/35/50
4K
544
-
1
1
C205
25/35/50
-
4.5K
-
1
1
F206
25/35/50
-
4.5K
32 K
1
1
F207
25/35/50
-
4.5K
32 K
2
1
C209
35/50
4K
4.5K
-
-
-
七、TI定点DSP芯片
三、CPU
3.4 乘累加单元
CB15－CB0 DB15－DB0 PB15－PB0
40 累加器A

DSP芯片的原理与开发技术课后题部分答案

DSP课后习题答案总结第一章：概述1.2 简述DSP应用系统的典型结构和特点答：DSP系统的典型结构和工作过程：①对输入信号进行带限滤波和抽样；②进行A/D变换，将信号变换成数字比特流；③根据系统要求，DSP芯片对输入信号按照特定算法进行处理；④D/A转换，将处理后的数字样值转换为模拟信号；⑤平滑滤波，得到连续的模拟信号波形。

DSP系统的特点：接口方便、编程方便、稳定性好、精度高、可重复性好、集成方便等。

1.3 简述DSP应用系统的一般设计过程。

答：1.定义系统性能指标2.采用高级语言进行性能模拟3.设计实时DSP应用系统4.借助开发工具进行软硬件调试5.系统集成与独立系统运行1.8 设计DSP应用系统时，如何选择合适的DSP芯片。

答：根据实际应用系统的需要选择，以达到系统的最优化设计。

一般来说，需要考虑：DSP芯片的运算速度：DSP芯片的运算速度衡量指标：①指令周期；②MAC时间；③FFT执行时间；④MIPS；⑤MOPS；⑥MFLOPS；⑦BOPSDSP芯片的价格：DSP芯片的硬件资源DSP芯片的运算精度：一般字长为16bits，浮点芯片一般为32bitsDSP芯片的开发工具DSP芯片的功耗其他因素：例如，DSP芯片的封装形式、质量标准、供货情况、生命周期等。

1.11 中英文全称对照：DSP:Digital Signal ProcessingTI:Texa InstrumentsMAC:Multillier and AccumulatorMIPS:Million Istructions Per SecondMOPS: Million Operations Per SecondMFLOPS: Million Floating-point Operations Per SecondBOPS:Billion Operations Per secondDIP:Dual In-line PackagePGA:Pin Grid ArryPLCC:Plastic Leaded Chip CarrierPQFP:Plastic Quad Flat PackPWM:Pulse Width Modulation第二章：DSP芯片的基本结构和特性2.2 ALU和累加器的区别。

第2章TMS320C6000DSP芯片概述

DM642 每周期能够提供4个16位MACs，每秒可提供2880百万个MACs，或者8个8位MACs，每秒 5760M MACs。
第26/100页
DM642的结构框图
The Video Port 0 (VP0) peripheral is muxed with the McBSP0 peripheral and the McASP0 control pins.
数字信号处理器原理A
第2章 TMS320C6000 DSP芯片概述
西安邮电大学通信与信息工程学院 2014年3月
目录
第2章 TMS320C6000 DSP芯片概述
2.1 DSP芯片概述 2.1.1主要类型 2.1.2 TI公司的DSP芯片 2.1.3 TI公司DSP芯片的命名规则
2.2 TMS320DM642 DSP芯片概况 2.2.1 DM642概述 2.2.2 DMS642的器件特性 2.2.3 DM642原理框图 2.2.4 DM642的应用领域
第2/100页
本章学习目标
了解DSP芯片的分类; 了解TI公司的DSP芯片类型；掌握TI公司芯片的命名规则；掌握DM642芯片的器件特性、原理框图；了解DM642芯片的应用领域；
知识要点：
DM642的器件特性、原理框图。
第3/100页
前言
随着信息技术的高速发展，数字信号处理器(Digital Signal Processor，DSP)的应用范围越来越广，普及率越来越高;
第17/100页
2.1 DSP芯片概述
TMS320C5000系列DSP芯片：
适合通信设备的开发，如媒体播放器、3G电话、电子图书、无线Modem、GPS接收装置、指纹识别系统等；

定时器控制寄存器

专用的硬件乘法器
• 在通用的微处理器中，乘法指令是
由一系列加法来实现的，故需许多个指令周期来完成 • DSP具有专用的硬件乘法器，乘法可在一个指令周期内完成
1）多总线结构
2）40位算术逻辑单元（ALU）
3）17×17位并行乘法器
4）比较、选择和存储单元（CSSU） 5）指数编码器 6）两个地址发生器
为了快速实现数字信号处理运算，DSP芯片一般都采用特殊的硬件结构，正是这种针对运算的特殊的结构和设计，使它区别于通常的CPU或 MCU(微控制器)。 TMS320系列DSP芯片的主要硬件特点包括：哈佛结构、流水线操作、多总线、多处理单元、硬件配置强、耗电省。
DSP芯片的基本结构和特征
DSP芯片的基本结构哈佛结构流水线操作专用的硬件乘法器特殊的DSP指令快速的指令周期
11
1B 1C 1D
1E 1E~
REA（块重复结束寄存器） PMST （处理器工作方式） XPC（程序计数器扩展）保留
辅助寄存器(AR0～AR7)：这8个16位的辅助寄存器可以由算术逻辑单元(ALU)访问，也可以由辅助寄存器算术单元(ARAU) 进行修改。它们主要的功能是产生16位的数据地址，也可以同来作为通用寄存器和计数器。
暂存器T
1.
2. 3. 4.
为乘法指令或乘/累加指令存放一个乘数；为带有移位操作的指令（如：ADD ，LD，SUB 等）存放一个动态的移位数；为BITT指令存放一个动态位地址；参与EXP指令和NORM指令的操作。
状态转移寄存器TRN
1. 2.
为计算新的测量值存放中间结果； CMPS（比较、选择、存储单元）指令在累加器高位和低位比较的基础上会修改TRN的内容

DSP第2章 'C54x的硬件结构2

2013年8月15日
DSP原理及应用
6
3．工作方式状态寄存器PMST
主要设定和控制处理器的工作方式和存储器的配置，反映处理器的工作状态。
15~7 6 5 4 AVIS 3 2 1 0 SST
IPTR MP/MC OVLY
DROM CLKOFF SMUL
中断向量指针
CPU 工作方式选择位
③ 暂存器SPRAM。
2013年8月15日
DSP原理及应用
14
特殊功能寄存器
功能：主要用于程序的运算处理和寻址方式的选
择和设定。地址范围：0000H~001FH。外设寄存器 ’C5402的CPU寄存器共有27个，CPU访问这功能：用来控制片内外设电路的状态和存放数据。些寄存器时，不需要插入等待时间。地址范围：0020H~005FH。包括串行口通信控制寄存器组、定时器定时控暂存器SPRAM 制寄存器组、时钟周期设定寄存器组等。功能：用来暂存变量。地址范围：0060H~007FH。
中断屏蔽寄存器 10H 中断标志寄存器 11H 保留 ( 用于测试 ) 12H 保留 ( 用于测试 ) 13H 保留 ( 用于测试 ) 14H 保留 ( 用于测试 ) 15H 状态寄存器0 16H 状态寄存器1 17H 累加器A低字(15~0位) 18H 累加器A高字(31~16位) 19H 累加器A保护位(39~32位) 1AH 累加器B低字(15~0位) 1BH 累加器B高字(31~16位) 1CH 累加器B保护位(39~32位) 1DH 暂存寄存器 1EH DSP原理及应用状态转移寄存器 1FH
2013年8月15日
存储器映像的CPU寄存器，存储器映像的外设寄存器特殊功能寄存器

DSP芯片的基本结构

DSP芯片的基本结构DSP芯片的基本结构包括：1.哈佛结构；2.流水线操作；3.专用的硬件乘法器；4.特殊的DSP指令；5.快速的指令周期。

哈佛结构哈佛结构的主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。

与两个存储器相对应的是系统中设置了程序总线和数据总线，从而使数据的吞吐率提高了一倍。

由于程序和存储器在两个分开的空间中，因此取指和执行能完全重叠。

流水线与哈佛结构相关，DSP芯片广泛采用流水线以减少指令执行的时间，从而增强了处理器的处理能力。

处理器可以并行处理二到四条指令，每条指令处于流水线的不同阶段。

CLLOUT1，取指N N-1 N-2，译码N-1 N N-2，执行N-2 N-1 N，专用的硬件乘法器，乘法速度越快，DSP处理器的性能越高。

由于具有专用的应用乘法器，乘法可在一个指令周期内完成。

特殊的DSP指令DSP芯片是采用特殊的指令。

快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计可使DSP芯片的指令周期在200ns以下。

DSP芯片的选择方法一般而言，定点DSP芯片的价格较便宜，功耗较低，但运算精度稍低。

而浮点DSP芯片的优点是运算精度高，且C语言编程调试方便，但价格稍贵，功耗也较大。

例如TI的T MS320C2XX/C54X系列属于定点DSP芯片，低功耗和低成本是其主要的特点。

而TMS320C3X/C4X/C67X属于浮点DSP芯片，运算精度高，用C语言编程方便，开发周期短，但同时其价格和功耗也相对较高。

DSP应用系统的运算量是确定选用处理能力为多大的DSP芯片的基础。

运算量小则可以选用处理能力不是很强的DSP芯片，从而可以降低系统成本。

相反，运算量大的DSP系统则必须选用处理能力强的DSP芯片，如果DSP芯片的处理能力达不到系统要求，则必须用多个DSP芯片并行处理。

DSP芯片的基本结构和特征

DSP芯片的基本结构和特征引言DSP芯片（Digital Signal Processor，数字信号处理器）是一种专用于数字信号处理任务的微处理器。

它具有高处理速度和低功耗等特点，广泛应用于音频、视频、通信、雷达、图像处理等领域。

本文将介绍DSP芯片的基本结构和特征，以便读者更好地了解和应用该技术。

1. DSP芯片的基本结构DSP芯片的基本结构通常包括三个主要部分：中央处理单元（CPU）、存储器和数字信号处理模块。

下面将详细介绍这些部分的功能和特点。

1.1 中央处理单元（CPU）中央处理单元是DSP芯片的核心，负责控制和执行指令。

它通常由一个或多个运算单元（ALU）和一个控制单元组成。

ALU负责执行算术和逻辑运算，而控制单元则负责解码和执行指令序列。

中央处理单元是DSP芯片实现高速运算的关键部分。

1.2 存储器存储器是DSP芯片的重要组成部分，用于存储程序代码、数据和中间结果。

它通常包括两种类型的存储器：指令存储器（程序存储器）和数据存储器。

指令存储器用于存储程序代码和指令，而数据存储器用于存储数据和中间结果。

存储器的大小和访问速度对DSP芯片的性能有重要影响。

1.3 数字信号处理模块数字信号处理模块是DSP芯片的核心功能模块，用于执行数字信号处理任务。

它通常包括以下几个功能单元：时钟和定时器单元、数据通路单元、乘法器和累加器（MAC）单元以及控制逻辑单元。

时钟和定时器单元用于提供时序控制和定时功能，数据通路单元用于数据传输和处理，乘法器和累加器单元用于高速乘加运算，控制逻辑单元用于控制和协调各个功能单元的操作。

2. DSP芯片的特征DSP芯片相较于通用微处理器具有一些明显的特征，下面将介绍几个主要特征。

2.1 高速运算能力DSP芯片具有高速运算能力，主要得益于其专门的运算单元和并行处理能力。

相较于通用微处理器，DSP芯片能够更快地执行算术和逻辑运算，满足实时信号处理的需求。

2.2 低功耗设计DSP芯片在设计过程中注重功耗的控制，以满足移动设备和嵌入式系统等低功耗应用的需求。

第二章DSP芯片结构和CPU外围电路

▪ 数据地址产生单元(DAGEN)和程序地址产生单元(PAGEN) ▪ 数据空间和和程序空间位同一物理空间，采用统一编址
第三页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
2.1.2 TMS320C55x CPU
CPU有4个功能单元：指令缓冲单元(I单元)，程序流程单元(P单元) ，地址数据流程单元 (A单元)和数据计算单元(D单元)
第十七页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
5、DPLL模式控制寄存器CLKMD
(1) BREAKLN为失锁指示(只读) ▪ 0：表示由于某种原因引起PLL失锁；
▪ 1：表示处于锁定状态，或发生对CLKMD寄存器的写操作。
(2) LOCK为锁定模式指示(只读) ▪ 0：表示DPLL处于旁路模式
时钟发生器由一个数字锁相环(DPLL)和一个模式控制寄存器
(CLKMD)组成。
CLKIN pin
DPLL
CLKOUT pin
CLKMD pin
CLKMD 寄存器
第十二页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
(3) 两种工作模式(模式控制寄存器标志位的定义)
▪ 若PLL_ENABLE＝0，DPLL工作于旁路(BYPASS)模式。 ▪ 若PLL_ENABLE＝1，DPLL工作于锁定(LOCK)模式。旁路模式中：DPLL只对输入时钟CLKIN作简单的分频，分频次数由
I单元的立即数和D单元的寄
存器值产生所需的地址，并将产生地址送到PAB。
第六页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
▪ 在程序流程单元中，控制和影响程序地址的寄存器有5类：

第2章TMS320C6000DSP芯片概述

第2章TMS320C6000DSP芯片概述
2.1 DSP芯片概述
TMS320C5000系列DSP芯片：
➢ 适合通信设备的开发，如媒体播放器、3G电话、电子图书、无线Modem、GPS接收装置、指纹识别系统等；
TMS320C6000系列DSP芯片：
➢ 硬件结构功能强大，适用于高速信号处理设备中，如图像图形处理、无线网络、多媒体网关、宽带视频转换器、视频主/从模式服务器和网络相机等。
第2章TMS320C6000DSP芯片概述
2.1 DSP芯片概述 DSP的主要生产厂商
➢ DSP芯片的生产厂家很多，类型多样，主要的产品如表2-1 所示
第2章TMS320C6000DSP芯片概述
2.1 DSP芯片概述 2.1.2 TI公司的DSP芯片
▪ TI公司是DSP芯片的主要生产厂家之一； ▪ 该公司研发出多款高性能的DSP产品，例如： ▪ 定点型DSP芯片C1x、C2x、C2xx、C5x、C54x和
第2章 TMS320C6000DSP芯片
概述
2020/11/25
第2章TMS320C6000DSP芯片概述
目录
第2章 TMS320C6000 DSP芯片概述
2.1 DSP芯片概述 2.1.1主要类型 2.1.2 TI公司的DSP芯片 2.1.3 TI公司DSP芯片的命名规则
2.2 TMS320DM642 DSP芯片概况 2.2.1 DM642概述 2.2.2 DMS642的器件特性 2.2.3 DM642原理框图 2.2.4 DM642的应用领域
C6x等； ▪ 浮点型DSP芯片C3x、C4x、C67x等； ▪ 多处理器型DSP芯片C8x等。 ▪ 从DSP芯片出现的先后顺序来看，TT公司的DSP产

DSP课件第2章硬件结构

5、电源
采用高性能静态CMOS技术，供电电压为3.3V。可用IDLE指令进入低功耗模式。
6、在片仿真接口
具有符合IEEEll49.1标准的在片仿真接口（JTAG）。
7、速度
单周期定点指令的执行时间为50ns、35ns或25ns(20MIPS，28.5MIPS，或40MIPS)。
2.2 TMS320LF240x的总线结构
INTM：中断模式位
用来允许（INTM=0）或禁止（INTM=1）所有的可屏蔽中断。用 SETC OVM或CLRC OVM可将该位置1或清0。LST指令不影响OVM位。
DP：数据页面指针
当使用直接寻址方式时，DP存放存储器的数据页，DP与指令代码的最低7位构成16位存储器地址。
数据存储器地址
SARAM的地址可以用于数据存储器和程序存储器。可通过软件配置为外部存储器或内部SARAM。
SARAM在一个机器周期内只能访问一次。当CPU要求多次访问时， SARAM会向CPU提供一个未准备好的信号，然后在每个周期内执行一次访问。
闪速存储器（Flash）是电可擦除的、可编程的、可长期保存数据的存储器。
CPU的基本组成包括： 32位中央算术逻辑运算单元（CALU）； 32位累加器（ACC）；输入与输出数据比例移位器； 16位×16位的乘法器（MUL）以及乘积比例移位器。
CPU功能结构图
2、输入比例部分
功能：将来自存储器的16位数据左移0~16位送往中央算术逻辑单元（CALU）。
移位方法：左移后有使用的低位LSB填0，高位MSB填0或用符号扩展，取决于状态寄存器ST1的符号扩展模式位SXM（D10）。 SXM=0 填0 SXM=1 符号扩展
中央算术逻辑单元

第2章-DSP内核结构及存储器映射

2.1.3 中央算术逻辑单元（CALU）
中央算术逻辑单元执行大部分的算术和逻辑运算功能，并且实现大多数的功能都只要1个时钟周期，这些功能包括：16位加、16位减、布尔逻辑操作、位测试、移位和循环功能。有关中央算术逻辑单元的结构框图，如下图。
2.1 CPU内部结构
2.1.4 累计器（ACC）
当CALU工作时，会将计算结果送至32位累加器，累计器负责将结果进行单移位或者循环移位，然后将结果输出到数据定标移位器。
2.2 存储器和I/O空间
❖ I/O空间的访问都可用IN和OUT指令。当用IN或OUT指令时，信号IS将变成有效，因此可用信号IS作为外围I/O设备的片选信号。访问外部I/O端口与访问程序存储器、数据存储器复用相同的地址总线和数据总线。数据总线的宽度为16位，若使用8位的外设，即可使用高8位数据总线，也可使用低8位数据总线，以适应特定应用的需要。
块模1C令时。L时块，钟K置O钟时芯使进1U且钟片能行后T正且进该锁引需常正入模相脚要运常那块倍输用行运种时频出户；行低钟的C用P当；功，系软U该当耗以数时件位该模使。钟清值位式当A；0/，为值。C当DL清为0转该K时0P0换位的S，时正=值方禁，0常为法0止禁进01是该止时行对模该4，；倍该块模C当频位L时块该K；写钟时O位当1U。钟值。T。引为检脚0
2.2.5 外部存储器接口及其操作
1. 外部存储器接口简介
这里以 TMS320LF2407A 为例介绍外部存储器接口及其操作， TMS320LF2407A包含2K×16位字的SARAM和544×16位字的片上DARAM，其中DARAM被分成B0、B1和B2三个单元。通过不同的设置，可将SARAM 和DARAM的B0单元用作程序存储器，又可将它们用作数据存储器。当系统用慢速的程序存储器存放程序时，为提高运行速度，通常将程序放到SARAM 和DARAM的B0单元中；此时这部分RAM映射到程序空间。对于许多应用来说，仅有的SRAM是不够的，需要进行扩展来作为程序存储器或数据存储器。

DSP基本体系结构和特点

DSP基本体系结构和特点⼀、数字信号处理的优越性⽬前，数字信号处理(Digital Signal Processing，简称DSP)已经成为信号处理技术的主流。

因为与早期的模拟信号相⽐，数字信号处理有着巨⼤的优势。

早期的模拟信号处理主要通过运算放⼤电路进⾏不同的电阻组配实现算术运算，通过电阻、电容的组配实现滤波处理等，其中有⼀个很明显的问题是不灵活、不稳定，参数修改困难，需要采⽤多种阻值、容值的电阻、电容，并通过电⼦开关选通才能修改处理参数；⽽且对周围环境变化的敏感性强，温度、电路噪声等都会造成处理结果的改变。

⽽数字信号处理可以通过软件修改处理参数，因此具有很⼤的灵活性。

由于数字电路采⽤⼚⼆值逻辑，只要环境温度、电路噪声的变化不造成电路逻辑的翻转，数字电路都可以不受影响地完成⼯作，因此具有很好的稳定性。

具体来说，DSP在以下⼀些⽅⾯表现出它的优越性：⾸先，DSP芯⽚采⽤改进的哈佛结构（Havard structure）。

其主要特点是程序和数据具有独⽴的存储空间，有着各⾃独⽴的程序总线和数据总线，由于可以同时对数据和程序进⾏寻址，⼤⼤地提⾼了数据处理能⼒，⾮常适合于实时的数字信号处理。

TI公司的DSP芯⽚结构是基本哈佛结构的改进类型。

改进之处是在数据总线和程序总线之间进⾏局部的交叉连接。

这⼀改进允许数据存放在程序存储器中，并被算术运算指令直接使⽤，增强了芯⽚的灵活性。

只要调度好两个独⽴的总线就可使处理能⼒达到最⾼，以实现全速运⾏。

改进的哈佛结构还可使指令存储在⾼速缓存器中(Cache)，省去了从存储器中读取指令的时间，⼤⼤提⾼了运⾏速度。

其次，DSP指令系统是流⽔线操作。

在流⽔线操作中，⼀个任务被分解为若⼲个⼦任务，各个任务可以在执⾏时相互重叠。

DSP指令系统的流⽔线操作是与哈佛结构相配合的，增加了处理器的处理能⼒，把指令周期减⼩到最⼩值，同时也就增加了信号处理器的吞吐量。

以TI 公司的TMS320系列产品为例，第⼀代TMS320处理器(例如TMS320C10)采⽤了⼆级流⽔线操作；第⼆代产品(例如TMS320C25)采⽤了三级流⽔线操作；第三代DSP芯⽚(例如TMS320C30)采⽤了四级流⽔线操作。

DSP芯片的基本特征(精)

DSP芯片的基本特征数字信号处理器(Digital Signal Prcessor,是一种特别适合于进行数字信号处理运算的微处理器。

自1979年诞生以来，短短二十年时间，DSP显示了巨大的应用潜力，在信号处理、通信、语言、图形图像、军事、仪器仪表、自动控制、家用电器等领域，得到广泛的应用，起着不可替代的作用，其主要应用特点是实时快速地实现各种数字信号处理算法。

DSP 一般具有如下一些特点：(1在一个指令周期内可完成一次乘法和一次加法；(2程序和数据空间分离，可以同时访问指令和数据；(3片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问；(4具有低开销或大开销循环及跳转的硬件支持；(5具有在单周期内操作的多个硬件地址产生器，可以并行执行多个操作；支持流水线操作，使取值、译码和执行等操作可以重叠执行。

在自动控制系统中，DSP的高速计算能力显示了比一般微处理器更多的优点，具有广阔的应用前景。

利用DSP的高速计算能力可以增加采样速度和完成复杂的信号处理和控制算法，Kalman滤波、自适应控制矢量控制、状态观测器等复杂算法利用DSP芯片可以方便地实现。

DSP的信号处理能力还可用来减少位置、速度、磁通等传感器，无传感器运行之所以成为可能。

在自适应系统中，系统参数和状态变量通过状态观测器的计算可采用DSP有效地实现。

同样，由于高运算速度，DSP也可有效地用于神经之网络和模糊逻辑化地运动控制系统。

在实际工程应用中，DSP的高速能力还可以消除噪声污染和不精确的输入及反馈信号数据，对要求速度较快的PWM控制算如空间矢量算法。

TMS320F2812A DSP的基本特性DSP是一种特殊用途的单片机内核概述TMS320F2812DSP内核采Harvard结构体系,即相互独立的数据总线，提供了片内程序存储器和数据存储器、运算单元、一个32位算术/逻辑单元、一个32 位累加器、一个16位乘法器和一个16位桶形移位器组成，体系采取串行结构，运用流水线技术加快程序的运行，可在一个处理周期内完成乘法加法和移位计算，其内核计算速度为20MIPS(—个指令周期为50 ns。

DSP2

xushufang@
3）C6000系列：C62XX，C67XX，C64X 该系列以高性能著称，最适合宽带网络和数字影像应用。32bit，其中：C62XX和C64X是定点系列，C67XX是浮点系列。该系列提供EMIF扩展存储器接口。该系列只提供 BGA封装，只能制作多层PCB。且功耗较大。同为浮点系列的C3X中的VC33现在虽非主流产品，但也仍在广泛使用，但其速度较低，最高在150MIPS。 4）OMAP系列：OMAP处理器集成ARM的命令及控制功能，另外还提供DSP的低功耗实时信号处理能力，最适合移动上网设备和多媒体家电。其他系列的DSP曾经有过风光，但现在都非TI主推产品了，除了C3X系列外，其他基本处于淘汰阶段，如：C3X的浮点系列（C30，C31，C32），C2X和 C5X系列（C20，C25，C50），每个系列的DSP都有其主要应用领域。
2.1 DSP芯片的基本结构
DSP core （CPU）存储器片内外设与专用硬件电路

xushufang@
2.2 ’C54xDSP的主要特点

xushufang@
1.2
TMS 320C 54x
数字信号处理器
围绕8条总线构成的增强型哈佛结构高度并行和带有专用硬件逻辑的CPU设计高度专业化的指令系统模块化结构设计先进的IC工艺能降低功耗和提高抗辐射能力的新的静电设计方法
2. ’C54xDSP主要特性---存储器

xushufang@
1.2
TMS 320C 54x
数字信号处理器
192K字可寻址存储空间(’C548和’C549 中存储空间可扩展至8M字): • 64K字程序存储器 • 64K字数据存储器 • 64K字I/O空间片内ROM, 可配置为程序/数据存储器双寻址在片RAM(DARAM) 单寻址在片RAM(SARAM)（’C548和 ’C549）

DSP的基本结构和特征

DSP的基本结构和特征DSP的基本结构和特征编程DSP芯⽚是⼀种具有特殊结构的微处理器，为了达到快速进⾏数字信号处理的⽬的，DSP芯⽚⼀般都采⽤特殊的软硬件结构：(1) 哈佛结构。

DSP采⽤了哈佛结构，将存储器空间划分成两个，分别存储程序和数据。

它们有两组总线连接到处理器核，允许同时对它们进⾏访问，每个存储器独⽴编址，独⽴访问。

这种安排将处理器的数据吞吐率加倍，更重要的是同时为处理器核提供数据与指令。

在这种布局下，DSP得以实现单周期的MAC指令。

在哈佛结构中，由于程序和数据存储器在两个分开的空间中，因此取指和执⾏能完全重叠运⾏。

(2) 流⽔线。

与哈佛结构相关，DSP芯⽚⼴泛采⽤2-6级流⽔线以减少指令执⾏时间，从⽽增强了处理器的处理能⼒。

这可使指令执⾏能完全重叠，每个指令周期内，不同的指令都处于激活状态。

(3) 独⽴的硬件乘法器。

在实现多媒体功能及数字信号处理的系统中，算法的实现和数字滤波都是计算密集型的应⽤。

在这些场合，乘法运算是数字处理的重要组部分，是各种算法实现的基本元素之⼀。

乘法的执⾏速度越快，DSP处理器的性能越⾼。

相⽐与⼀般的处理器需要30-40个指令周期，DSP 芯⽚的特征就是有⼀个专⽤的硬件乘法器，乘法可以在⼀个周期内完成。

(4) 特殊的DSP指令。

DSP的另⼀特征是采⽤特殊的指令，专为数字信号处理中的⼀些常⽤算法优化。

这些特殊指令为⼀些典型的数字处理提供加速，可以⼤幅提⾼处理器的执⾏效率。

使⼀些⾼速系统的实时数据处理成为可能。

(5) 独⽴的DMA总线和控制器。

有⼀组或多组独⽴的DMA总线，与CPU的程序、数据总线并⾏⼯作。

在不影响CPU⼯作的条件下，DMA的速度已经达到800MB/S以上。

这在需要⼤数据量进⾏交换的场合可以减⼩CPU的开销，提⾼数据的吞吐率。

提⾼系统的并⾏执⾏能⼒。

(6) 多处理器接⼝。

使多个处理器可以很⽅便的并⾏或串⾏⼯作以提⾼处理速度。

(7) JTAG（Joint Test Action Group）标准测试接⼝（IEEE 1149标准接⼝）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第2章DSP芯片的基本结构和特征2.1 引言可编程DSP芯片是一种具有特殊结构的微处理器，为了达到快速进行数字信号处理的目的，DSP芯片一般都具有程序和数据分开的总线结构、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适合数字信号处理的指令集。

本章将首先介绍DSP芯片的基本结构，然后介绍TI公司的各种DSP芯片的特征，最后简要介绍其他公司的DSP芯片的特点。

2.2 DSP芯片的基本结构为了快速地实现数字信号处理运算，DSP芯片一般都采用特殊的软硬件结构。

下面以TMS320系列为例介绍DSP芯片的基本结构。

TMS320系列DSP芯片的基本结构包括：（1）哈佛结构；（2）流水线操作；（3）专用的硬件乘法器；（4）特殊的DSP指令；（5）快速的指令周期。

这些特点使得TMS320系列DSP芯片可以实现快速的DSP运算，并使大部分运算（例如乘法）能够在一个指令周期内完成。

由于TMS320系列DSP芯片是软件可编程器件，因此具有通用微处理器具有的方便灵活的特点。

下面分别介绍这些特点是如何在TMS320系列DSP芯片中应用并使得芯片的功能得到加强的。

2.2.1 哈佛结构哈佛结构是不同于传统的冯·诺曼（V on Neuman）结构的并行体系结构，其主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。

与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线，从而使数据的吞吐率提高了一倍。

而冯·诺曼结构则是将指令、数据、地址存储在同一存储器中，统一编址，依靠指令计数器提供的地址来区分是指令、数据还是地址。

取指令和取数据都访问同一存储器，数据吞吐率低。

在哈佛结构中，由于程序和数据存储器在两个分开的空间中，因此取指和执行能完全重叠运行。

为了进一步提高运行速度和灵活性，TMS320系列DSP芯片在基本哈佛结构的基础上作了改进，一是允许数据存放在程序存储器中，并被算术运算指令直接使用，增强了芯片的灵活性；二是指令存储在高速缓冲器（Cache）中，当执行此指令时，不需要再从存储器中读取指令，节约了一个指令周期的时间。

如TMS320C30具有64个字的Cache。

2.2.2 流水线与哈佛结构相关，DSP芯片广泛采用流水线以减少指令执行时间，从而增强了处理器的处理能力。

TMS320系列处理器的流水线深度从2~6级不等。

第一代TMS320处理器采用二级流水线，第二代采用三级流水线，而第三代则采用四级流水线。

也就是说，处理器可以并行处理2~6条指令，每条指令处于流水线上的不同阶段。

图2.1所示为一个三级流水线操作的例子。

图2.1 三级流水线操作在三级流水线操作中，取指、译码和执行操作可以独立地处理，这可使指令执行能完全重叠。

在每个指令周期内，三个不同的指令处于激活状态，每个指令处于不同的阶段。

例如，在第N个指令取指时，前一个指令即第N-1个指令正在译码，而第N-2个指令则正在执行。

一般来说，流水线对用户是透明的。

2.2.3 专用的硬件乘法器在一般形式的FIR滤波器中，乘法是DSP的重要组成部分。

对每个滤波器抽头，必须做一次乘法和一次加法。

乘法速度越快，DSP处理器的性能就越高。

在通用的微处理器中，乘法指令是由一系列加法来实现的，故需许多个指令周期来完成。

相比而言，DSP芯片的特征就是有一个专用的硬件乘法器。

在TMS320系列中，由于具有专用的硬件乘法器，乘法可在一个指令周期内完成。

从最早的TMS32010实现FIR的每个抽头算法可以看出，滤波器每个抽头需要一条乘法指令MPY：LT ；装乘数到T寄存器DMOV ；在存储器中移动数据以实现延迟MPY ；相乘APAC ；将乘法结果加到ACC中其他三条指令用来将乘数装入到乘法器电路（LT），移动数据（DMOV）以及将乘法结果（存在乘积寄存器P中）加到ACC中（APAC）。

因此，若采用256抽头的FIR滤波器，这四条指令必须重复执行256次，且256次乘法必须在一个抽样间隔内完成。

在典型的通用微处理器中，每个抽头需要30 ~ 40个指令周期，而TMS32010只需4条指令。

如果采用特殊的DSP指令或采用TMS320C54X等新一代的DSP芯片，可进一步降低FIR抽头的计算时间。

2.2.4 特殊的DSP指令DSP芯片的另一个特征是采用特殊的指令。

2.2.3节中介绍的DMOV就是一个特殊的DSP指令，它完成数据移位功能。

在数字信号处理中，延迟操作非常重要，这个延迟就是由DMOV来实现的。

TMS32010中的另一个特殊指令是LTD，它在一个指令周期内完成LT、DMOV和APAC三条指令。

LTD和MPY指令可以将FIR滤波器抽头计算从4条指令降为2条指令。

在第二代处理器中，如TMS320C25，增加了2条更特殊的指令，即RPT和MACD 指令，采用这2条特殊指令，可以进一步将每个抽头的运算指令数从2条降为1条：RPTK 255 ；重复执行下条指令256次MACD ；LT, DMOV, MPY及APAC2.2.5 快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计，可使DSP芯片的指令周期在200ns 以下。

TMS320系列处理器的指令周期已经从第一代的200ns降低至现在的20ns 以下。

快速的指令周期使得DSP芯片能够实时实现许多DSP应用。

2.3 TI定点DSP芯片自1982年TI推出第一个定点DSP芯片TMS32010以来，TI的定点DSP芯片已经经历了TMS320C1X、TMS320C2X/C2XX、TMS320C5X 、TMS320C54X、TMS320C62X等几代产品，产品的性能价格比不断提高，应用越来越广泛。

下面分别介绍这些芯片的主要特征。

2.3.1 TMS320C1X2.3.1.1 基本特点第一代TMS320系列DSP芯片包括：TMS32010、TMS32011、TMS320C10、TMS320C15/E15和TMS320C17/E17。

其中，TMS32010和TMS32011采用2.4μm的NMOS 工艺，而其他几种则采用1.8μm CMOS工艺。

这些芯片的典型工作频率为20MHz。

TMS320第一代DSP芯片的主要特点如下:∙指令周期：160ns/200ns/280ns∙片内RAM：144字/256字（TMS320C15/E15/C17/E17）∙片内ROM：1.5K字/4K字（TMS320C15/C17）∙4K字片内程序EPROM（TMS320E15/E17）∙4K字外部全速存储器扩展∙并行乘法器：乘积为32位∙桶形移位器：将数据从存储器移到ALU∙并行移位器∙允许文本交换的4×12位堆栈∙两个间接寻址的辅助寄存器∙双通道串行口（TMS32011,TMS320C17/E17）∙片内压扩硬件（TMS32011,TMS320C17/E17）∙协处理器接口（TMS320C17/E17）∙器件封装：40脚双列直插（DIP）/44脚塑封（PLCC）2.3.1.2 TMS320C10TMS320 DSP芯片的第一代产品是基于TMS32010和它的CMOS版本TMS320C10的结构。

TMS32010于1982年推出，是第一个能够达到5 个MIPS的微处理器。

TMS32010采用改进的哈佛结构，即程序和数据空间相互独立。

程序存储器可在片内（1.5K字）或片外（4K字）。

片内数据RAM为144字。

有四个基本的算术单元：算术逻辑单元（ALU）、累加器（ACC）、乘法器和移位器。

(1) ALU：32位数据操作的通用算术逻辑单元。

ALU可进行加、减和逻辑运算；(2) ACC：累加器存储ALU的输出，也是ALU的一个输入。

它采用32位字长操作，分高16位和低16位两部分。

处理器提供高16位和低16位的专门指令：SACH（高16位）和SACL（低16位）；(3) 乘法器：16×16位并行乘法器由三个单元组成：T寄存器、P寄存器和乘法器阵列。

T寄存器存储被乘数，P寄存器存储32位乘积。

为了使用乘法器，被乘数首先必须从数据RAM中装入到T寄存器，可用LT、LTA和LTD指令。

然后执行MPY（乘）或MPYK（乘立即数）指令。

乘和累加器操作可用LTA、LTD和MPY、MPYK指令在两个指令周期内完成；(4) 移位器：有两个移位器可用于数据移位。

一个是桶形移位器，另一个是并行移位器。

桶形移位器又称定标移位器。

当数据存储器的数据送入累加器或与累加器中的数据进行运算时，先通过这个移位器进行0~16位左移，然后再进行运算。

并行移位器即输出移位器，其作用是将累加器中的数据左移0、1或4位后再送入数据存储器中，以实现小数运算或小数乘积的调整。

在TMS32010/C10基础上又派生了多个处理器，它们可提供不同的处理器速度、存储器扩展和各种I/O集成。

2.3.1.3 TMS320C1X的其他芯片1．TMS320C15/E15TMS320C15/E15与TMS32010的代码和管脚全兼容，提供256字的片内RAM和4K 字的片内ROM（C15）或EPROM（E15）。

TMS320C15的指令周期有200ns和160ns （TMS320C15-25）两种。

2．TMS320C17/E17TMS320C17/E17是一个专用的微处理器。

它有4K字的片内程序ROM（C17）或EPROM （E17），一个全双工串行通信的双通道串行口，片内硬件压扩器（律/A律），一个用于串行通信的串行口定时器，及一个协处理器接口。

协处理器接口可以在处理器和4/8/16位微处理器之间提供直接接口。

TMS320C17/E17与TMS32010目标代码兼容，且可用相同的开发工具。

该处理器是基于TMS320C10的CPU内核，外加片内的外设存储器和I/O模块。

TMS320C17/E17可认为是半定制的DSP芯片。

表2.1 是TMS320第一代产品的比较表。

表2.1 TMS320第一代处理器2.3.2 TMS320C2X第二代TMS320 DSP芯片包括TMS32020、TMS320C25/E25、TMS320C26及TMS320C28。

在这些芯片中，TMS32020是一个过渡的产品，其指令周期为200ns，与TMS32010相当，而其硬件结构则与TMS320C25一致。

在第二代DSP芯片中，TMS320C25是一个典型的代表，其他芯片都是由TMS320C25派生出来的。

其中TMS320E25将内部4K 字的ROM改为EPROM；TMS320C26去掉了内部的4K字ROM，而将片内RAM增加到1.5K字；TMS320C28则将内部ROM增加到8K字。