图染色法的寄存器分配

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图染色法的寄存器分配

计算机科学与技术系98级吴汉唐

摘要

本文讲述了寄存器分配的图染色法理论。

Chaitin 和他的同伴，在IBM 的Yorktown Heights研究中心，实现了第一个基于图染色法的全局的寄存器分配器。后来，Rice 大学的Preston Briggs 对Chaitin的算法进行了改进和扩展。

Chaitin的算法悲观地假设任何高度数的结点都不能被染色，只能被抛出（spilled）。Briggs的算法乐观地认为高度数的结点有可能被染色，从而获得更低的抛出开销（spill costs），和更快的代码。

一介绍

（一）编译器和优化

一个优化编译器分为三个层次：

●前端把源语言转换为中间代码。这个转换依赖于源语言的结构，需要几

遍扫描（pass）代码才能完成。编译时的错误检查就在这一层。我们可

以理想地认为前端是只与语言有关的、与机器无关的。

●优化器包含几遍的扫描（pass），每一遍扫描对中间代码执行特定的转

换。我们感兴趣的是全局优化，就是从整个函数搜集有用信息，再去做

优化。一般的全局优化包括强度削减（strength reduction），循环不变

量移动（loop-invariant code motion）和公共子表达式消除（common subexpression elimination）。优化器最好是与语言和机器都无关的。

●后端把中间代码转换为针对特定机器的目标代码。这个转换过程又称为

代码生成，也需要几遍扫描才能完成。这几遍扫描包括指令选择

（instruction selection）,指令调度（instruction scheduling）,

寄存器分配（register allocation）。后端在很大程度上是与语言无关

的，与机器有关的。

这个划分简化了每一个层次的开发和维护，使得在不同的编译器中复用每个层次成为可能。例如，一个完全与机器无关的FORTRAN语言前端可以用到为不同机器设计的编译器中。

当然，这还是一个理想的观点。在实际中，每个层次都表现出既与语言相关又与机器相关。这些相关限制复用和维护，也成为编译器设计人员努力要克服的难关。

（二）优化和寄存器分配

寄存器是位于CPU内部的少量的高速存储器。寄存器与内存有很大的不同：

●寄存器很少。一个寄存器可以用几个比特直接定位。内存空间很大。内

存的定位一般是通过间接的“寻址方式”，其中可能包含一个或多个对寄

存器的引用。

●寄存器很快。在一个周期内，可以同时读两个寄存器，写第三个寄存器。

内存要慢些，一次访问就需要几个周期。

因为寄存器的个数受限和高速度，它们成为大多数计算机体系结构中的关键资源之一。寄存器分配器作为后端的一个模块，控制寄存器的分配和使用。

寄存器很重要。最简单的情况，每条机器指令的操作数要放在寄存器里。在计算复杂表达式的过程中产生的中间结果也要在寄存器里。更复杂的编译器会把经常使用的变量放在寄存器里，来避免反复地存取。如果是一个带优化的编译器，它会把公共子表达式消除或者循环不变量移动以后的重用值，放在寄存器里。

分配寄存器的任务有几个层次

●寄存器只在一个表达式的范围内分配。这是一项为了减少寄存器需求量

的指令调度的技术。

●更先进的分配器可以在一个基本块的范围内管理寄存器。

●全局分配器在一个函数的范围内工作。Chaitin 的分配器就在这样的例

子。

●程序间的寄存器分配是对一些函数工作，通常是一个完整的程序。

为了支持全局的优化，全局的寄存器分配是必须的。

（三）寄存器分配和图染色法

实现好的寄存器分配总是很困难。即使是最简单的实现也会因为机器的特殊细节变得复杂。可靠的分配器必要能很好地对付复杂的程序和稀少的寄存器的情况。

图染色法提供了一种简化的抽象。它建立一张表示分配过程中的各种限制的冲突图（interference graph），并对它染色，把许多表面上各异的细节纳入统一的模式。图中的结点代表生命期（live range），边代表生命期之间的冲突关系。一般说来，如果两个生命期在函数的某一点是同时活跃（live）的，它们就相互冲突，不能占有同一个寄存器。假设k 就是机器中可供分配的寄存器数目，如果图中的所有结点可以用k 种或者更少的颜色染色，有边相连的一对顶点接受不同的颜色，那么这种图染色方案对应一种寄存器分配方案。如果找不到一种k－染色方案，只好修改代码重新染色。

1.使寄存器使用率最小

寄存器分配的目标是使不得不执行的load 和store指令的数目最小。把寄存器分配问题化归到图染色问题巧妙地转移了目标：以前是最小化存取内存的开销，变成最小化寄存器使用率。

2.使被抛出代码最少

即使有最好的染色算法和大量的寄存器，有时候也不得不把某些值抛到内存里。这样就产生了几个难题。首先我们希望插入load 和store 指令的动态开销最小。我们必须设法选择抛出某些生命期，使得抛出开销低，又能减轻图中寄存器分配的压力。还有，我们考虑最好在哪里插入load 和store 指令。

所有这些问题都很复杂，而且是互相关联的。

二背景

(一)用图染色法来分配寄存器

我们假设分配器工作在一种类似汇编代码的低级的中间代码上。这种代码被优化器处理过，寻址模式和执行顺序是确定的。当然，这些假设忽略了分配器和编译器其他部件之间可能的协同关联。为了以后讨论的简化，我们还假设机器是load－store的体系结构。

在分配以前，中间代码可以引用无限数目的寄存器。我们把这些分配之前的不受限制的寄存器叫做“虚拟寄存器”。分配的目标就是重写中间代码，使它只使用目标机器提供的寄存器——机器寄存器。

在寄存器分配中我们关心的是赋值（definition）和生命期（live range）。一个生命期是由共同的使用（use）连接的一个或多个赋值。所有组成一个生命期的赋值将用同一个虚拟寄存器命名。在分配之后，任意一个机器寄存器通常对应几个生命期。

为了把寄存器分配转化为图染色的模型，编译器首先构造一个冲突图G。G 中的结点代表生命期，边代表冲突关系。这样，在图G中结点i与结点j有一条边相连当且仅当生命期l i 与生命期l j冲突，就是它们在某一点同时是活跃的。与一个生命期l i冲突的那些生命期被称为l i的邻居。在图中邻居的数目就是l 的度数，记做l i o

i

为了找到图G的一种寄存器分配，编译器首先寻找图G的一种k染色方案。如果机器寄存器的数目是k，我们就找到一种切实可行的寄存器分配方案。因为为任意一个图找到k染色方案是一个NP结问题，只能采用启发式算法来寻找染色方案，这就不能保证为每个可以k－染色的图找到k－染色方案。

(二)Yorktown 分配器

Chaitin和他的同事在IBM的Yorktown Heights研究中心为PL8 编译器实现的分配器，是基于图染色法的全局的寄存器分配器的第一个实现。下图显示了Yorktown 分配器的流程。

图（1）