第五章 DSP的汇编指令

合集下载

dsp汇编指令系统介绍(精)

汇编指令集本节根据指令的功能来分，提供六张表来说明指令集的概况：累加器、算数和逻辑指令（表2）；辅助寄存器和数据页指针指令（表3）；TREG、PREG和乘法指令（表4）；转移指令（表5）；控制指令（表6）；I/O和存储器操作（表7）。

在每张表中，指令按字母顺序排列。

执行每条指令所需要的周期数在表中给出，所有指令都假设从内部程序存储器和内部数据存储器中执行，指令的周期数适用于单指令执行，不适用于重复方式。

编程时，用户必须对每条指令的寻址方式了解清楚，因此这里也在表中给出了每条指令的寻址方式。

由于指令的操作码对用户编程没有多大指导意义，在这里就没有列出来。

为了参照起见，我们先定义这六张概述表的符号意义：ACC 累加器。

ARBITXCM 辅助寄存器。

4位数值，用于指定数据存储器数值中的哪一位将被BIT指令所测试。

2位数值，CMPR指令执行CM值所声明的比较：若CM=00，测试当前AR=AR0否；若CM=01，测试当前AR<AR0否；若CM=10，测试当前AR>AR0否；若CM=11，测试当前AR≠AR0否。

ShiftTP 4位右移量。

用于条件执行指令的2位数值，代表如下4种条件：若BIO引脚为低，TP=00；若TC位=1，TP=01；若TC位=0，TP=10；无条件TP=11。

ARX 用于LAR和SAR指令的3位数据值，指定被操作的辅助寄存器。

52表2 累加器、算数和逻辑指令 ABS周期|（ACC）|→ACC 1（ACC）+（数据存储器地址）×12shift→ACC（ACC）＋（数据存储器地址）×216→ACC 1（ACC）＋k→ACC 1shift（ACC）+lk×2→ACC 2指令功能（ACC）+（数据存储器地址）＋（C）→ACC寻址方式直接/间接直接/间接短立即数长立即数指令说明ACC取绝对值移位时低位填0，若SXM＝1,高位用符号扩展；若SXM＝0，高位填0；结果存在ACC中，该指令使C=0。

第五章 DSP的汇编指令..

令执行的条件:
TCx(测试/控制标志为1) ！TCx(测试/控制标志为0)
TC1&TC2 TC1&!TC2 TC1|TC2 TC1|!TC2 TC1^TC2 TC1^!TC2
!TC1&TC2 !TC1&!TC2 !TC1|TC2 !TC1|!TC2 !TC1^TC2 !TC1^!TC2
第五章 TMS320C55x系列DSP的汇编指令
4、双16比特算术指令: [（1）语法、（2）操作数、（3）状态位] 在D单元中利用其ALU的双16比特模式，同时执行(并行)两个16
比特算术运算，包括加－减、减－加、两个加和两个减运算。
例：
▪ M40=0时，D单元按32位运算模式，因此累加器溢出、进位、符号扩
展和移位操作都以第31比特为准。
▪ M40=1时，D单元按40位运算模式，因此累加器溢出，进位，符号扩
展和移位操作都以第39比特为准。
BCLR M40 ; Clear M40
BSET M40 ; Set M40
第五章 TMS320C55x系列DSP的汇编指令
第五章 TMS320C55x系列DSP的汇编指令
一、算术运算指令用于完成加减乘除等运算，按照功能可分成以下几类：
▪ 加法指令 ▪ 减法指令：减法，条件减法，条件加/减 ▪ 乘法指令：乘法，乘加，乘减，双乘加/减 ▪ 双16比特算术指令 ▪ 比较运算指令：比较并求极值,最大/最小值,存储单元比较,寄存器比较 ▪ 移位指令：条件移位、带符号的移位。 ▪ 寄存器修改：辅助寄存器修改、堆栈指针SP修改 ▪ 隐含的并行指令 ▪ 专用指令：绝对值、归一化、有限冲激响应滤波FIR、最小均方LMS等
✓ M40=0时: 溢出位在第31位检测

DSP汇编编程及应用举例

1．DSP汇编语言程序的编写（1）汇编语言源程序以.asm为其扩展名。

（2）汇编语言源程序的每一行都可以由4个部分组成，句法如下：[标号] [:] 助记符[操作数] [；注释]其中可用空格或TAB键隔开标号——供本程序的其他部分或其他程序调用。

标号是任选项，标号后面可以加也可以不加冒号“：”。

标号必须从第一列写起，标号最多可达到32个字符（A～Z ，a～z ，0～9 ，_ ，以及$），但第1个字符不能以数字开头。

引用标号时，标号的大小写必须一致。

标号的值就是SPC（段程序计数器）的值。

如果不用标号，则第一个字符必须为空格、分号或星号（*）。

助记符——助记符指令、汇编指令、宏指令和宏调用。

作为助记符指令，一般用大写；汇编命令和宏指令，以英文句号“.”开始，且为小写。

汇编命令可以形成常数和变量，当用它控制汇编和连接过程时，可以不占用存储空间。

指令和汇编命令都不能写在第1列。

操作数——指令中的操作数或汇编命令中定义的内容。

操作数之间必须用逗号“，”分开。

有的指令操作无操作数，如NOP、RESET。

注释——注释从分号“；”开始，可以放在指令或汇编命令的后面，也可以放在单独的一行或数行。

注释是任选项。

如果注释从第1列开始，也可以用“*”表示注释。

（3）常用的汇编命令如表所示。

（4）汇编语言程序中的数据形式如表所示2．程序2．1 程序一编程目的：了解DSP的输入和输出方法程序功能：求乘积之和y=a1*x1+a2*x2+a3*x3+a4*x4.title "mpy_add.asm".mmregs ；将存储映像寄存器导入列表STACK .usect "STACK",10h ；给堆栈段分配空间.bss a,4 ；将9个字空间分配给各个变量.bss x,4.bss y,1PA0 .set 0 ；将端口PA0全部置0.def start ；定义标号start.data ；定义数据代码段table: .word 4,4,4,4.word 4,4,4,4.text ；定义文本代码段start: STM #0,SWWSR ；将等待寄存器设为0，表示不等待STM #STACK+10h,SP ；设堆栈指针STM #a,AR1 ；将AR1指向变量a的地址RPT #7 ；从程序存储空间转移7＋1个值到数据储存空间MVPD table,*AR1+CALL SUM ；调用SUM子程序end: B end ；循环等待SUM: STM #a,AR3 ；将AR3指向变量a的地址STM #x,AR4 ；将AR4指向变量x的地址RPTZ A,#3 ；将A清0，并重复执行下一条指令3＋1次MAC *AR3+,*AR4+,ASTL A,@y ；将寄存器A中的低16位存入y地址空间PORTW @y,PA0 ；将y地址中的值输出到输出口RET ；子程序返回.end ；程序结束等待位的设置：C54x片内有一部件——软件可编程等待状态发生器，控制着外部总线的工作。

DSP指令大全(最全)

附录6 TMS320C54x 指令系统一览表(按指令功能排列) 一、算术运算指令二、逻辑运算指令三、程序控制指令6.注：?条件“真”，§条件“假”，※延迟指令。

四、加载和存储指令4.6.7.五．伪指令2.初始化常数（数据和存储器）的伪指令3.调整段程序计数器伪指令（SPC）.align 把SPC调整到页边界.even 把SPC调整到偶数字边界4.控制输出列表格式化伪指令5.条件汇编伪指令.break [well-defined expression] 如果条件真结束.loop汇编，．break结构是可选项.else 如果.if条件为假，汇编代码块.else结构是可选项.elseif well-defined expression——如果if条件为假且．elseif条件为真，汇编代码块.else结构是可选项.endif 结束．if代码块.endloop 结束．1oop代码块.if well-defined expression 如果条件为真则汇编代码块.loop [well-defined expression] 开始代码块的重复汇编6. 汇编符号.asg [”] character string [”],substitution symbol——把字符串赋予替代的符号..endstruct 结束结构定义.equ 使值和符号相等.eval well-defined expression，substitution symbol 根据数字替代符号完成运算.newblock 取消局部标号.set 使数值和符号相等.struct 开始结构定义.tag 把结构属性赋予标号7.宏指令宏定义：Macname .macro[参数1]，[…]，[参数n]宏调用：[标号][:] macname [参数1]，[…],[参数n]8.编译软件指令①汇编器：asm500.exeasm500[input file[object file [listing file] [-options]]-c—使汇编语言文件中大小没有区别。

dsp汇编指令系统介绍(精)

在每张表中，指令按字母顺序排列。

编程时，用户必须对每条指令的寻址方式了解清楚，因此这里也在表中给出了每条指令的寻址方式。

由于指令的操作码对用户编程没有多大指导意义，在这里就没有列出来。

为了参照起见，我们先定义这六张概述表的符号意义：ACC 累加器。

ARBITXCM 辅助寄存器。

4位数值，用于指定数据存储器数值中的哪一位将被BIT指令所测试。

2位数值，CMPR指令执行CM值所声明的比较：若CM=00，测试当前AR=AR0否；若CM=01，测试当前AR<AR0否；若CM=10，测试当前AR>AR0否；若CM=11，测试当前AR≠AR0否。

ShiftTP 4位右移量。

用于条件执行指令的2位数值，代表如下4种条件：若BIO引脚为低，TP=00；若TC位=1，TP=01；若TC位=0，TP=10；无条件TP=11。

ARX 用于LAR和SAR指令的3位数据值，指定被操作的辅助寄存器。

DSP汇编指令索引

指令
指令
隐含并行
105
算术运算指令
绝对值 FIR滤波最小均方补码归一化饱和和舍入平方距离位域比较位域抽取位域扩展
107 108 109 109 109 110 110 111 111 111
位操作指令
存储器位操作
112
寄存器位操作
113
状态位设置扩展辅助寄存器操作指令按位与/或 /异或/取反位计数逻辑移位循环移位

114
115 116 117 118
逻辑运算指令
TMS320C55x的指令系统 Page 累加器、辅助寄 MOV 存器或临时寄存 SWAP 119 器装载、存储、 SWAPP 移移动、和交换 SWAP4 动存储单元间的移 DELAY 122 指动及初始化 MOV 令 POP 入栈和出栈 122 PSH CPU寄存器装载、 124 MOV 存储和移动 B 跳转 127 BCC CALL CALLCC 调用与返回 128 RET RETCC INTR 程中断与返回 128 TRAP 序 RETI 控 PRT 制 PRTADD 指 PRTSUB 重复 128 令 PRTCC PRTB PRTBLOCAL XCC 条件执行 XCCPART 129 IDLE 空闲空操作 NOP 软件复位 RESET
指令
TMS320C55x的指令系统
Page MPYM::MOV MACM::MOV MASM::MOV ADD::MOV SUB::MOV MOV::MOV ABS FIRSADD FIRSSUB LMS NEG MANT ::NEXP EXP SAT ROUND SQDST BAND BFXTR BFXPA BTST BNOT BCLR BSET BTSTSET BTSTCLR BTSTNOT BTST BNOT BCLR BSET BTSTP BCLR BSET MOV AMAR AMOV POPBOTH PSHBOTH NOT AND/OR/XOR BCNT SFTL ROL

DSP汇编指令缩写

DSP汇编指令缩写ABS Absolute value of AccumulatorADD add to accumulatorADDC add to accumulator with carryADDT add to accumulator with shift specified by TREGAND and with accumulatorCMPL complement accumulatorLACC load accumulator with shiftLACL load low accumulator and clear high accumulatorLACT load accumulator with shift specified by TREGNEG negate accumulatorNORM normalize contents of accumulatorOR or with accumulatorROL/ROR rotate accumulator left/rightSACH/SACL store high/low accumulator with shiftSFL/SFR shift accumulator left/rightSUB subtract from accumulatorSBUC conditional subtractSUBS subtract from accumulator with sign extension suppressed SUBT subtract from accumulator with shift specified by TREGXOR exclusive or with accumulatorZALR zero low accumulator and load high accumulator with rounding ADRK add short limmediate value to ARBANZ branch on AR not zeroCMPR compare AR with AR0LAR load ARMAR modify ARSTR store ARSBRK subtract short limmediateAPAC add PREG to accumulatorLPH load PREGLT load TREGLTA load TREG and ACC previous productLTD load TREG ACC previous product and move dateLTS load TREG and subtract previous productMAC multiply and accumulateMACD multiply and accumulate wit data moveMPY multiplyMPY A multiply and accumulate previous productMPYS multiply and subtract previous productMPYS multiply unsignPAC load accumulator with PREGSPAC subtract PREG from accumulatorSPH/SPL store high/low PREGSPM set PREG output shift modeSQRA/SQRS square value and accumulate/subtract previous product B branch unconditionallyBACC branch to location specified by ACCBANZ branch on AR not zeroBCND branch conditionallyCALA call subroutione at location specified by ACCCALL call unconditionallyCC call conditionallyINTR software interruptNMI nonmaskable interruptRET return from subroutineRETC return conditionallyTRAP software interruptBIT bit numberBITT test bit specified by TREGCLRC clear control bitIDEL idle until interruptLDP load data page pointerLST load status registerNOP no operationPOP pop top of stack to low ACCPOPD pop top of stack to data memoryPSHD push data-memory value onto stackPUSH push low ACC onto stackRPT repeat next instructionSETC set control bitSPM set PREG output shift modeSST store status registerBLDD block move from data memory to data memory BLPD block move from data memory to data memory DMOV data move in data memoryIN input data from portOUT output data to portSPLK store long immediate value to data memory TBLR table readTBLW table write。

c54xx系列DSP汇编指令详解

x
意义或运算异或运算
减1 赋值于表示一个立即数 x 的补码
|x|
x 的绝对值
0x
十六进制数据
>>
右移
<<
左移
×
乘法
*
指针指向的地址
TMS320C54xx 系列 DSP 的指令一共有 129 条，按功能分为如下几类：算术指令、逻辑指令、程序控制指令、存储和装入指令以及循环指令。下面根据每种指令功能的不同，
目的累加器的反 if dst=A，then dst_=B if dst=B then dst_=A
E 地址总线 EAB 地址寄存器 23 位立即数表示的程序存储器地址 ST1 寄存器中的分数方式位十六进制数据十六进制数据累加器 A 的高端（位 32～16） ST1 寄存器中的保持方式位中断标志寄存器 ST1 寄存器中的中断屏蔽位少于 9 位的短立即数
3 位立即数（0 ≤ k3 ≤ 7 ） 5 位立即数（-16 ≤ k5 ≤ 15 ） 9 位立即数（0 ≤ k9 ≤ 115 ）
16 位长立即数使用长字寻址 32 位单数据存储器操作数存储器映射寄存器，AR0～AR7 或 SP
存储器映射寄存器，AR0～AR7 或 SP
紧跟 XC 指令的字数，n=1 或 2 指定在 RSBX、SSBX 和 XC 指令中修改的状态寄存器 N=0，状态寄存器 ST0 N=1，状态寄存器 ST1 ST0 寄存器中的累加器 A 的溢出标志 ST0 寄存器中的累加器 B 的溢出标志目的累加器（A 或 B）的溢出标志目的累加器反（A 或 B）的溢出标志源累加器（A 或 B）的溢出标志 ST1 寄存器中的溢出方式位 16 位立即数表示的端口地址
③ 乘法指令

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2、累加器溢出状态(ACOVx)
当AC0~AC3寄存器溢出时，目的累加器的溢出状态位ACOV0～3被置1。以下情况会清零ACOVx位
复位； CPU执行一个跳转，条件调用，条件返回或执行一条测试ACOVx的指令；通过BCLR指令清除；溢出位检测受ST1_55中的M40位影响，即：
进位标志的检测受ST1_55中的M40位影响 M40=0时: 进位标志的检测与第31位相关
M40=1时: 进位标志的检测与第39位相关
第五章 TMS320C55x系列DSP的汇编指令
5、分数模式(FRCT)
FRCT＝0：关闭小数模式
FRCT＝1：打开小数模式
BCLR FRCT BSET FRCT
第五章 TMS320C55x系列DSP的汇编指令
3、乘法指令 [（1）语法、（2）操作数、（3）状态位] 常规乘法(MPY)：在D单元的一个MAC中执行乘法运算。乘加和乘减运算(MAC/MAS)：在D单元的一个MAC中执行乘法，然后执行加法或减法运算。
双乘加/减(Dual-MAC/S): 利用D单元的两个MAC同时执行两个乘法或
在实际编程时，只要指令满足这三条基本规则，即可写成并行方式，然后进行编译。如果编译有错，则可参照pp.77-78的8条详细规则进行检测。
第五章 TMS320C55x系列DSP的汇编指令 5.4 TMS320C55x DSP的汇编指令
TMS320C55x DSP的汇编指令按操作分为以下6类算术运算指令比特操作指令一条指令的属性包括：语法(Syntax) 执行的操作操作数相关的状态位是否有并行使能位长度(Size) 执行周期(Cycles) 在流水线(Pipeline)上的执行阶段在哪个功能单元执行(Executed) 是否可以重复执行等
第五章 TMS320C55x系列DSP的汇编指令
规则3：并行指令含有两个数据存储器访问时，必须使用间接寻址模式。
以上三条规则是基本规则，缺一不可。
例如：
MOV *AR，AC1 ||ADD @var，AR2 ；2个字节；3个字节
两条指令访问两个数据存储单元，第二条指令没有使用间接
寻址，不满足规则3，所以不能并行。
；A单元的ALU来完成
第五章 TMS320C55x系列DSP的汇编指令
(3)内置并行指令与用户自定义并行指令的混合形式在不引起资源冲突的情况下，将隐含并行的指令按用户自定义方式与另一条指令并行执行。例：
MPY *AR0， *CDP， AC0 ；隐含的或内置的并行指令 :: MPY *AR1， *CDP， AC1 ||MOV #5, AR1
M40=0时，D单元按32位运算模式，因此累加器溢出、进位、符号扩
展和移位操作都以第31比特为准。
M40=1时，D单元按40位运算模式，因此累加器溢出，进位，符号扩
展和移位操作都以第39比特为准。
BCLR M40
; Clear M40
BSET M40
; Set M40
第五章 TMS320C55x系列DSP的汇编指令
乘加/乘减运算。 AC0 02 6000 3400 AC1 00 C000 0000 M40 1 0 AC0 02 6000 3400 AC1 00 4800 0000 M40 1 0 0
例1(常规乘法)
MPY AC0，AC1 说明：AC1= AC0(32~16)×AC1(32~16)
FRCT ACOV1
第五章 TMS320C55x系列DSP的汇编指令
可以作为指令执行的条件有： (1)累加器的值
ACx==#0
ACx<=#0 (2)溢出标志和进位标志 overflow(ACx) CARRY
ACx!=#0
ACx>#0 !overflow(ACx) !CARRY *ARx！=#0 *ARx>#0
பைடு நூலகம்ACx<#0
第五章 TMS320C55x系列DSP的汇编指令
1、高速数字信号处理中常采用汇编语言编程。 2、汇编语言中的两种指令集 (1) 助记符指令集：有助于记忆的符号来表示指令。 (2) 代数指令集：类似于代数表达式，运算关系清楚明了。
注意：DSP的软件开发工具只支持单一的指令形式，不支持助记
符指令和代数指令的混合形式。 3、术语、符号和缩写见P93的表5－1 4、运算符见表5－2
例1(常规减法)：
BCLR CARRY ；BORROW=1 AMOV #010000h，XAR1 AMOV #0300h，AR1 MOV #0200h，* AR1 MOV #0300h，AC0 SUB *AR1，BORROW，AC0，AC1 ； AC1＝AC0－(*AR1)－BORROW=00FFh
第五章 TMS320C55xDSP的汇编指令
5.1状态比特和执行条件一条指令的执行可能会受到某些状态位的影响，也可能会改变某些状态位的值，这些状态位都在状态寄存器。
第五章 TMS320C55x DSP的汇编指令
1、40比特运算模式(M40)
用于控制D单元的运行模式，会影响累加器溢出、进位标志等。
7 、测试/控制标志(TCx)
主要用于保存某些测试指令的结果；
可以作为指令执行的条件；
举例：CMP AC1 = = T1, TC1；；如果AC1 = T1，那么TC1＝1。
BCLR TC1 BSET TC1 ; Clear TC1 ; Set TC1
BCLR TC2 ; Clear TC2 BSET TC2 ; Set TC2
扩展辅助寄存器操作指令
逻辑操作指令 MOVE操作指令程序控制指令
第五章 TMS320C55x系列DSP的汇编指令
例如： -----------------------------------------------------------------------------------| ADD uns(*AR3)，CARRY，AC1，AC0 | No | 3 | 1 | X | D - ALU | -----------------------------------------------------------------------------------说明： NO：不能并行执行 3：指令的长度为3字节 1：周期为1 X：在X(执行)流水线阶段处理 D – ALU：在D单元ALU执行。执行结果：AC0=(*AR3)+CARRY+AC1 状态位： Affected by CARRY，C54CM，M40等
FRCT
0 ACOV1
第五章 TMS320C55x系列DSP的汇编指令
4、双16比特算术指令: [（1）语法、（2）操作数、（3）状态位] 在D单元中利用其ALU的双16比特模式，同时执行(并行)两个16
比特算术运算，包括加－减、减－加、两个加和两个减运算。
移位指令：条件移位、带符号的移位。
寄存器修改：辅助寄存器修改、堆栈指针SP修改隐含的并行指令
专用指令：绝对值、归一化、有限冲激响应滤波FIR、最小均方LMS等
第五章 TMS320C55x系列DSP的汇编指令
1、加法指令在D单元或A单元中执行加法运算。当有一个目的操作数为累加器ACx时，在D-ALU中执行。当目的操作数为辅助或临时寄存器时，在A-ALU中执行当目的操作数为Smen时，在D-ALU中执行当移位位数不是立即数16时(移位指令)，在D单元的移位器中执行。
这类指令是利用双MAC来实现的，C55x中，这视为一条单指令。
第五章 TMS320C55x系列DSP的汇编指令
(2) 用户自定义的双指令的并行这两条指令的并行是通过用户或C编译器定义的。两条指令同时执行两个操作，用并行符“||”区分并行执行的两条指令。例：
MPYM *AR1＋， *CDP， AC1 ；D单元的一个MAC来完成 ||XOR AR2，T1
第五章 TMS320C55x系列DSP的汇编指令
5.3 C55x指令的并行执行 1、并行指令的分类
C55只支持有限的指令并行执行，能支持三种类型的指令并行。
(1) 隐含的或内置的单指令并行
一条指令同时执行两个不同的操作，用“::”来分隔指令的两
个部分。
MPY *AR0， *CDP， AC0 :: MPY *AR1， *CDP， AC1
; Clear FRCT ; Set FRCT
第五章 TMS320C55x系列DSP的汇编指令
6、中断模式(INTM)
INTM＝0：允许所有可屏蔽中断
INTM＝1：关闭所有可屏蔽中断
BCLR INTM ; Clear INTM
BSET INTM
; Set INTM
第五章 TMS320C55x系列DSP的汇编指令
（1）语法
（2）操作数（3）状态位举例：ADD uns(*AR3)，CARRY，AC1，AC0
第五章 TMS320C55x系列DSP的汇编指令
2、减法指令常规减法：在D单元或A单元执行减法操作。
条件减法：在D单元中执行，先执行减法，然后根据结果进行移位。
条件加/减：在D单元根据TC1或TC2的状态执行加/减运算。（1）语法；（2）操作数；（3）状态位
；用户自定义并行
第五章 TMS320C55x系列DSP的汇编指令
2、指令并行的规则只有满足以下三条基本规则，并行指令才可以使用，若非法使用并行指令，可能会导致不可预测的执行结果。规则1：指令长度要少于6个字节
受I单元指令译码器的限制，只有两条指令长度不超过6字节的，
才可以作为并行处理。[IBQ大小为64字节/译码器大小为6字节] 规则2：没有硬件资源冲突如果两条指令不存在操作数、总线、内部交叉单元和寄存器之间的冲突，则可以并行。