控制流与数据流分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章控制流分析

优化需要从程序中获得足够多的信息。控制流分析就是用来获取程序控制结构信息的形式化分析方法,它是数据流分析,依赖分析的基础。

7.1控制流分析方法概述

7.1.1过程内控制流分析方法主要有下面3种:

1.用dominator图找出循环,把循环标记出来供后面的优化使用。因为循环是程

序中最值得改进的地方,所以这种方法广泛被现在的编译器采用。

2.Interval分析:这是一类分析方法的统称,用来分析单个过程的结构,并把它

分解成为一系列有层次的结构称为interval。这些结构的层次关系可以用一棵树来

表示,就叫控制树。接下来许多分析和优化就可以基于控制树来做。

3.结构分析:结构分析是Interval分析中的特别重要且有代表性的一种,而且它

在许多编译器或优化方法中被用到,所以单独作为一种控制流分析方法。

这三种分析方法各有优劣之处,且三种方法并不是互相隔离的,具体实现时可以根据需求做出折衷选择。

7.1.2控制流图和BB

上面三种分析方法都是基于控制流图(CFG)的基本单元BB来做的。因为控制流图和BB大家都知道,所以这里省略它们的基本概念。只是在识别BB的方法

上补充一点:对call语句的处理。

对call语句的处理:一般情况下call语句调用目标过程后会返回call语句顺序的下一条语句。这时call语句和它顺序的下一条语句都不会被作为入口语句。

但是,如果一个call语句有好几个返回地址(例如:Fortran中有alternate返回地

址),那么call语句的下一条语句就应该作为入口语句,否则BB中将有一条既

不是顺序执行又不在BB末尾的指令。C库函数中的setjump( )和longjump( )也

有类似情况。

7.13 EBB

EBB与控制流分析的关系不大,只是因为刚介绍了BB,所以把EBB也顺带介绍一下。EBB跟BB相比可以使指令调度这种局部优化在选择指令时范围更宽。

介召EBB之前先要知道join node

1. join node的概念:若一个节点不止一个前驱(随便有几个后继),那么该节点就

叫做join node。

2. EBB:除了第一个节点外,其余节点都不是join节点的最大CFG子图。(这

里的第一个节点指的是唯一一个前驱不在该EBB之内的节点,其余节点都不是

join节点因而只有唯一前驱,而且前驱属于该EBB之内,所以一个EBB就是以

join节点为根的一棵树) 图可见《muchnick一书》p177 Fig7.8

完全对称的,我们可以有branch node和reverse EBB的概念,这里略。

3.找EBB的算法:《muchnick一书》p176 Fig7.6 7.7

Build_EBB(r, succ, pred):

作用:给定某个join node,求以它为根的EBB树。

思想:它调用Add_Bbs( )从join节点r出发在CFG上做深度优先搜索,若遇

到非join节点就把它加入该EBB,然后沿该节点继续深度优先搜索;若遇到

join节点就把它放入一个单独的集合EbbRoots里,然后控制返回它的父节点

继续搜索。

Build_All_Ebbs(r, succ, pred):

作用:找到CFG中所有EBB

思想:把CFG的根放入EbbRoots集合里,并把它作为r调用Build_EBB(r, succ,

pred);然后对EbbRoots中的join node队列依次调用Build_EBB(r, succ, pred),

得到所有EBB。

7.2深度/广度优先搜索,前序/后序遍历

7.3Dominators和PostDominators

7.3.1dom,idom基本概念

dominate(简写为dom) 是一个二元关系,a dom b表示从CFG的entry节点到b

节点的任意一条路径都会经过a节点。这时把a叫做b的dominator。

idom关系由dom关系得来,a idom b表示a dom b,且不存在节点c同时满足a dom

c、c dom b。

由CFG的节点集N和idom关系构成的边集组成一棵树,叫idom树,这棵树反

映了CFG上所有节点间dom和idom关系。

7.3.2求dominator和idominator

求dominator的常规算法用的是迭代计算的方法,收敛结果即所求每个节点的

domintor集合。该算法大家比较熟悉,略。

求idominator的算法要基于domintor算法的结果,用下图来简单阐述:

《muchnick 一书》p184 Fig7.15

思想:任取节点i 属于Domin(n)-{n},固定i ,依次检查Domin(n)-{n}-{i}中节点

s ,若s 属于Domin(i),则从Domin(n)中删除节点s ,因为它不可能成为节点n 的

idominator 了。检查完集合Domin(n)-{n}-{i}中剩余节点s 之后,再改变节点i ,

继续上面做的检查。直到domin(n)-{n}集合中只剩一个节点,该节点就是节点n

的idominator 。

求Postdominator 的算法与求dominator 的算法对称,只要把算法Fig7.14中

的pred 函数改为succ 函数就行了。

7.3.3 计算dominator 的快速算法

该算法的详细介绍见Lengauer and Tarjan A Fast Algorithm for Finding Dominators

in a Flowgraph

常规算法时间复杂度为O(n 2 . e),快速算法的时间复杂度为O(n . α(e,n)),α

(e,n)是ackermann 函数的倒数,增长非常缓慢。

先给一个定义sdom(w):

sdom(w) = min{ u| 存在路径v0=u,v1,…,vk=w 且vj>w (1<= j<= k-1) }

先对CFG 作深度优先搜索,搜索树为T ,里面的u ,w ,v1,…,vk 都是T 中先序遍历

的访问顺序,后面经常就用这个顺序号来指代节点。

Sdom(w)表示: 节点u 有路径到达w ,且路径上除u 之外的其它节点的序号都大于w 。取CFG 中满足这个条件且序号最小的u 作为sdom(w)。

引入sdom 函数的目的是由sdom 可以计算idom(w)

因为算法比较复杂,不能几句话说清楚,所以先给个梗概。即我们首先会给

出一些引理和定理,由它们得到sdom(w)的递推计算方法和基于sdom 函数的idom(w)的递推计算方法,然后按照特定的顺序使用递推计算方法计算得到sdom 和idom 。

引理和定理的意义不直观,可能需要了解证明过程才能清楚,可以查看上面的论

文,这里只在附录中给出最重要的定理的证明。(引理1 2 3可以先跳过不看)

引理1:如果v,w 都是G 中的点,且v<=w,那么v 到w 的任何路径都要经过v 和w 在深度

优先树T 上的公共祖先。

引理2:sdom(w) --+ w ;idom(w) -- * sdom(w)

sdom(w) --+ w 表示在T 上sdom(w)是w 的祖先,且

sdom(w)!=w

相关文档
最新文档