图染色法的寄存器分配
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图染色法的寄存器分配
计算机科学与技术系98级吴汉唐
摘要
本文讲述了寄存器分配的图染色法理论。
Chaitin 和他的同伴,在IBM 的Yorktown Heights研究中心,实现了第一个基于图染色法的全局的寄存器分配器。后来,Rice 大学的Preston Briggs 对Chaitin的算法进行了改进和扩展。
Chaitin的算法悲观地假设任何高度数的结点都不能被染色,只能被抛出(spilled)。Briggs的算法乐观地认为高度数的结点有可能被染色,从而获得更低的抛出开销(spill costs),和更快的代码。
一介绍
(一)编译器和优化
一个优化编译器分为三个层次:
●前端把源语言转换为中间代码。这个转换依赖于源语言的结构,需要几
遍扫描(pass)代码才能完成。编译时的错误检查就在这一层。我们可
以理想地认为前端是只与语言有关的、与机器无关的。
●优化器包含几遍的扫描(pass),每一遍扫描对中间代码执行特定的转
换。我们感兴趣的是全局优化,就是从整个函数搜集有用信息,再去做
优化。一般的全局优化包括强度削减(strength reduction),循环不变
量移动(loop-invariant code motion)和公共子表达式消除(common subexpression elimination)。优化器最好是与语言和机器都无关的。
●后端把中间代码转换为针对特定机器的目标代码。这个转换过程又称为
代码生成,也需要几遍扫描才能完成。这几遍扫描包括指令选择
(instruction selection),指令调度(instruction scheduling),
寄存器分配(register allocation)。后端在很大程度上是与语言无关
的,与机器有关的。
这个划分简化了每一个层次的开发和维护,使得在不同的编译器中复用每个层次成为可能。例如,一个完全与机器无关的FORTRAN语言前端可以用到为不同机器设计的编译器中。
当然,这还是一个理想的观点。在实际中,每个层次都表现出既与语言相关又与机器相关。这些相关限制复用和维护,也成为编译器设计人员努力要克服的难关。
(二)优化和寄存器分配
寄存器是位于CPU内部的少量的高速存储器。寄存器与内存有很大的不同:
●寄存器很少。一个寄存器可以用几个比特直接定位。内存空间很大。内
存的定位一般是通过间接的“寻址方式”,其中可能包含一个或多个对寄
存器的引用。
●寄存器很快。在一个周期内,可以同时读两个寄存器,写第三个寄存器。
内存要慢些,一次访问就需要几个周期。
因为寄存器的个数受限和高速度,它们成为大多数计算机体系结构中的关键资源之一。寄存器分配器作为后端的一个模块,控制寄存器的分配和使用。
寄存器很重要。最简单的情况,每条机器指令的操作数要放在寄存器里。在计算复杂表达式的过程中产生的中间结果也要在寄存器里。更复杂的编译器会把经常使用的变量放在寄存器里,来避免反复地存取。如果是一个带优化的编译器,它会把公共子表达式消除或者循环不变量移动以后的重用值,放在寄存器里。
分配寄存器的任务有几个层次
●寄存器只在一个表达式的范围内分配。这是一项为了减少寄存器需求量
的指令调度的技术。
●更先进的分配器可以在一个基本块的范围内管理寄存器。
●全局分配器在一个函数的范围内工作。Chaitin 的分配器就在这样的例
子。
●程序间的寄存器分配是对一些函数工作,通常是一个完整的程序。
为了支持全局的优化,全局的寄存器分配是必须的。
(三)寄存器分配和图染色法
实现好的寄存器分配总是很困难。即使是最简单的实现也会因为机器的特殊细节变得复杂。可靠的分配器必要能很好地对付复杂的程序和稀少的寄存器的情况。
图染色法提供了一种简化的抽象。它建立一张表示分配过程中的各种限制的冲突图(interference graph),并对它染色,把许多表面上各异的细节纳入统一的模式。图中的结点代表生命期(live range),边代表生命期之间的冲突关系。一般说来,如果两个生命期在函数的某一点是同时活跃(live)的,它们就相互冲突,不能占有同一个寄存器。假设k 就是机器中可供分配的寄存器数目,如果图中的所有结点可以用k 种或者更少的颜色染色,有边相连的一对顶点接受不同的颜色,那么这种图染色方案对应一种寄存器分配方案。如果找不到一种k-染色方案,只好修改代码重新染色。
1.使寄存器使用率最小
寄存器分配的目标是使不得不执行的load 和store指令的数目最小。把寄存器分配问题化归到图染色问题巧妙地转移了目标:以前是最小化存取内存的开销,变成最小化寄存器使用率。
2.使被抛出代码最少
即使有最好的染色算法和大量的寄存器,有时候也不得不把某些值抛到内存里。这样就产生了几个难题。首先我们希望插入load 和store 指令的动态开销最小。我们必须设法选择抛出某些生命期,使得抛出开销低,又能减轻图中寄存器分配的压力。还有,我们考虑最好在哪里插入load 和store 指令。
所有这些问题都很复杂,而且是互相关联的。
二背景
(一)用图染色法来分配寄存器
我们假设分配器工作在一种类似汇编代码的低级的中间代码上。这种代码被优化器处理过,寻址模式和执行顺序是确定的。当然,这些假设忽略了分配器和编译器其他部件之间可能的协同关联。为了以后讨论的简化,我们还假设机器是load-store的体系结构。
在分配以前,中间代码可以引用无限数目的寄存器。我们把这些分配之前的不受限制的寄存器叫做“虚拟寄存器”。分配的目标就是重写中间代码,使它只使用目标机器提供的寄存器——机器寄存器。
在寄存器分配中我们关心的是赋值(definition)和生命期(live range)。一个生命期是由共同的使用(use)连接的一个或多个赋值。所有组成一个生命期的赋值将用同一个虚拟寄存器命名。在分配之后,任意一个机器寄存器通常对应几个生命期。
为了把寄存器分配转化为图染色的模型,编译器首先构造一个冲突图G。G 中的结点代表生命期,边代表冲突关系。这样,在图G中结点i与结点j有一条边相连当且仅当生命期l i 与生命期l j冲突,就是它们在某一点同时是活跃的。与一个生命期l i冲突的那些生命期被称为l i的邻居。在图中邻居的数目就是l 的度数,记做l i o
i
为了找到图G的一种寄存器分配,编译器首先寻找图G的一种k染色方案。如果机器寄存器的数目是k,我们就找到一种切实可行的寄存器分配方案。因为为任意一个图找到k染色方案是一个NP结问题,只能采用启发式算法来寻找染色方案,这就不能保证为每个可以k-染色的图找到k-染色方案。
(二)Yorktown 分配器
Chaitin和他的同事在IBM的Yorktown Heights研究中心为PL8 编译器实现的分配器,是基于图染色法的全局的寄存器分配器的第一个实现。下图显示了Yorktown 分配器的流程。
图(1)