Thumb指令集和ARM指令集的对比

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Thumb指令集和ARM指令集的对比

Thumb指令

Thumb指令可以看做是ARM指令压缩形式的子集,是针对代码密度的问题而提出的,它具有16位的代码密度。Thumb不是一个完整的体系结构,不能指望处理程序只执行Thumb指令而不支持ARM指令集。因此,Thumb指令只需要支持通用功能,必要时,可借助完善的ARM指令集,例如:所有异常自动进入ARM状态。

在编写Thumb指令时,先要使用伪指令CODE16声明,而且在ARM指令中要使用BX指令跳转到Thumb指令,以切换处理器状态。编写ARM指令时,可使用伪指令CODE32声明。

代码密度:单位存储空间中包含的指令的个数。例如

ARM指令是32位的,而Thumb指令时16位的,如果在1K的存储空间中,可以放32条ARM指令,就可以放64条Thumb指令,因此在存放Thunb 指令时,代码密度高。

Thumb指令集与ARM指令集的区别

Thumb指令集不是完整的指令集,它是ARM指令集的子集。但是Thumb 指令具有更高的代码密度,即占用存储空间小,仅为ARM代码规格的65%,但其性能却下降的很少。所以,Thumb指令集使ARM处理器能应用到有限的存储带宽,并且,代码密度要求很高的嵌入式系统中去。Thumb指令集没有协处理器指令、信号量指令以及访问CPSR或SPSR的指令,没有乘加指令及64位乘法指令等,且指令的第二操作数受到限制;除了跳转指令B有条件执行功能外,其他指令均为无条件执行;大多数Thumb数据处理指令采用2地址格式。Thumb指令集与ARM指令集的区别一般有如下几点:

1. 跳转指令

程序相对转移,特别是条件跳转与ARM代码下的跳转相比,在范围上有更多的限制,转向子程序是无条件的转移。

2. 数据处理指令

数据处理指令是对通用寄存器进行操作,在大多数情况下,操作的结果须放入其中一个操作数寄存器中,而不是第三个寄存器中。

数据处理操作比ARM状态的更少,访问寄存器R8—R15受到一定限制。

(除MOV和ADD指令访问寄存器R8—R15外,其他数据处理指令总是更新CPSR中ALU状态标志)访问寄存器R8—R15的Thumb数据处理指令不能更新CPSR中的ALU状态标志。

3. 单寄存器加载和存储指令

在Thumb状态下,单寄存器加载和存储指令只能访问寄存器R0—R7

4. 批量寄存器加载和存储指令

LDM和STM指令可以将任何范围为R0——R7的寄存器子集加载或存

储。 PUSH 和POP 指令使用堆栈指令R13 作为基址实现满递减堆栈.除

R0~R7 外,PUSH 指令还可以存储链接寄存器R14,并且POP 指令可以加载

程序指令PC

Thumb指令集与ARM指令集效用分析

在ARM处理器中,内核同时支持32位的ARM指令和16位的Thumb令。对于ARM指令来说,所有的指令长度都是32位,并且执行周期大多为单周期,指令都是有条件执行的。而thumb指令的特点如下:

1.指令执行条件经常不会使用;

2.源寄存器与目标寄存器经常是相同的;

3.使用的寄存器数量比较少;

4.常数的值比较小;

5.内核中的桶式移位器(barrel shifter)经常是不使用的;

一.目标代码大小(密度)

16位的Thumb指令一般可以完成和32位ARM相同的任务。当用户使用C程序来处理应用时,如果编译为Thumb指令,那么它的目标代码大小只有编译为ARM指令时的65%左右,这样就增加了指令密度。一般认为:

Thumb代码所需的存储空间约为ARM代码的60%~70%。

Thumb代码使用的指令数比ARM代码多约30%~40%。

二.性能

1、在存储器是32位的情况下,ARM性能略好

这是因为同样的代码编译的结果Thumb指令将会比ARM多30%-40%,Thumb 指令仍旧花费同样指令周期来从32-bit块内存预取。

2、在16-bit内存上,即使有比ARM多的代码,这时Thumb性能也较好

这是因为Thumb每一条指令预取需要一个周期而每条ARM指令需要两个周期,因此尽管thumb指令比arm指令要多,但是依然比arm要快。

另外,在16-bit内存上,Thumb的性能降低了;这是因为数据去操作和特殊的堆栈操作,即使在Thumb下,堆栈操作仍是32-bit操作,导致低的性能

在 16-bit内存架构上。一个改进的方法是提供32-bit的内存来放置堆栈。在这种情况下的性能提高到了32-bit内存架构的水平。主要的差别是因为使用的整型的(32-bit)全局数据将仍被存储在16-bit内存上。另外,与ARM代码相比较,使用Thumb代码,存储器的功耗会降低约30%。

相关文档
最新文档