编译原理第4章语法分析自上而下

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ABb BAc Bd
是间接左递归
※ 消除左递归的方法：
(1) 消除直接左递归：
方法：改为右递归。保持其语言不变。
直接左递归的消除
候选式：
A->Aα|β β
βα
βαα βααα ……
A -> βA’ A’-> α A’ | ε
例4.2 文法： E —＞ E+T | T T —＞ T*F | F F —＞（E）| i
对于这样的文法，其推导过程可以根据当前的输入符号决定选择哪个产生式往下推导，因此，分析过程是唯一确定的。
文法G: S —＞ cAd
A —＞ ab
A —＞ a
输入串w : c a d
S
IP
c A a d
分析过程：
4）报告失败，撤销A的子 3）IP—> ‘a’ 2）α=c 1）w——输入串；树，回到A; A d； A扩展，第一式ab, 与 IP—> ‘c’ IP—> ‘c’ 指针回退到IP—> ‘a’; IP—> ‘a’与ab匹配； A还有替换式未试过，而又匹配； S——扩充； IP—> ‘d’,但d与b不匹配; 可能匹配；

2、消除回溯、提左公因子
例如，有产生式：语句->if 条件 then 语句 else 语句 | while 条件 do 语句 |begin 语句表 end 若要寻找一个语句，那么关键字 if，while，begin就提示某个替换式是唯一的替换式。
回溯原因
若当前符号 = a，下一步要展开A ，而 A ->α1|α2|„|αm ，那么，要知道哪一个αi是获得以a开头的串的式。怎样选择αi？
语法分析的任务：
对任一给定 w ∈ VT*，判断 w ∈ L（G）? 语法分析器：按照产生式规则，做识别w的工作
源程序
单词符号
词法分析器
取下一个单词符号
语法分析器
语法分析
编译程序后续部分
符号表
语法分析器在编译程序中的地位
语法分析算法分类
分析算法分类：
自上而下分析法（自顶向下）：
从文法的开始符号出发，反复使用各种产生式，寻找与输入符号匹配的最左推导。自下而上分析法（自底向上）：从输入符号串开始，逐步进行归约（最右推导的逆过程），直至归约到文法的开始符号。

其次，由于回溯，如果走了一大段错路，
最后必须回头，那么，就应把已经做的一大堆语义工作（指中间代码产生工作和各种表格的簿记工作）推倒重来。回溯会引起时间和空间的大量消耗应设法消除回溯。最后，如果被识别的语句是错的，算法无法指出错误的确切位置。
问题解决--消除左递归 1. 一个文法含有下列形式的产生式时，
4.1.2 递归下降分析程序构造
在不含左递归和每个非终结符的所有候选式的终结首符集都两两不相交条件下，构造一
个不带回溯的自上而下分析程序，该分析程序
由一组递归过程组成，每个过程对应文法的一
个非终结符。
这样的一个分析程序称为递归下降分析器。
递归下降分析器
文法G消除左递归得： E→TE' E'→+TE'| T→FT'
E
TE’
i
i+i*i
上述分析方法的实现：
①每一非终结符对应一个递归子程序；在只生成有限个串的文法，过程是无须递归的，而对生成无数个串的文法，递归是不可避免的；
②递归子程序：是一个过程，一旦发现它的某个候选式与输入串匹配，它就按此式扩充（语法树），指针移过已匹配子串。否则，返回error，保持原来的（语法树）和指针不变。
语法分析方法
递归子程序
自顶向下
预测分析(LL（1）分析器) 算符优先
自底向上
LR(0)、SLR(1)，LR(1)、LALR（1）
自上而下语法分析的一般过程
从文法的开始符号出发，反复使用各种产生式，寻找与输入符号匹配的最左推导。如果能够推导出，则该输入串是给定文法的句子；如果不能推导出，则该输入串不是给定文法的句子。

消除隐含的左递归算法与非终极符排序方法无关；例如，文法G46按S、Q、R排序
所得文法对应正
规式相同。 …………..
=bc(abc)*(abc)|c(abc)*(abc)| (abc)*(abc)|bc|c =bc(abc)+|c(abc)+|(abc)(abc) *|bc (abc) 0 |c (abc) 0 =bc((abc)+| (abc) 0) |c((abc)+|(abc) 0) |(abc)(abc) * =bc(abc)*|c(abc)*|(abc) (abc) * =(abc|bc|c)(abc)*=V1
上下文无关文法的句型的推导
最左（最右）推导：在推导的任何一步
αβ，其中α、β是句型，都是对α中的最左（右）非终结符进行替换最右推导被称为规范推导。由规范推导所得的句型称为规范句型
句型的分析
句型分析就是识别一个符号串是否为某文法
的句型，是某个推导的构造过程。在语言的编译实现中，把完成句型分析的程序称为分析程序或识别程序。分析算法又称识别算法。从左到右的分析算法，即总是从左到右地识别输入符号串，首先识别符号串中的最左符号，进而依次识别右边的一个符号。
a
b
语法树的形成过程
匹配结束，语法树形成
例：文法G为：S→xAy
| z，A→**|*
输入串=#x*y# 自上而下的分析过程：
（1）S有两个侯选式“xAy”和“z”，侯选式“xAy” 与输入串“x*y”相匹配，故推导：SxAy。（2）非终极符A也有两个侯选式“**”和“*”，若选第一个侯选式“**”对句型进行推导，则得： SxAyx**y，不相匹；推导回溯到句型“xAy”；再用非终极符A的第二个侯选式“*”进行推导，即：SxAyx*y。且都是终极符，输入串“x*y” 是所给文法的句子。
}/*替换为直接左递归*/
消除关于Ai规则的直接左递归； }；化简所得到的文法（去掉无用产生式），结束。
例子G46:
S→Qc|c Q→Rb|b R→Sa|a 有推导：S ⇒ Qc ⇒ Rbc ⇒ Sabc, 存在左递归。按R、Q、S排序，执行算法①得： i=1，j从1至0，R的产生式R→Sa|a无直接左递归，无需消除直接左递归。 i=2，j从1至1，R的产生式代入Q的产生式得： Q→Sab|ab|b，无直接左递归。
消除方法：
若：A —＞ Aα|β ，修改为： A —＞ βA′
A′—＞ αA′|ε
消去直接左递归后：E —＞ TE′ E′—＞ +TE′|ε
T —＞ FT′
T′—＞ *FT′|ε
F —＞（E）| i
一般地，若文法的产生式为：
P→P1| P2|……|Pn|1|2|……|m 其中：j 不以P打头，i 非空（1≤j≤m，1≤i≤n）；消除左递归后，为： P→1P'|2 P'|……|m P'
i=3，j从1至2， j=1，S的候选式不含R，所以无需替换； j=2，S的候选式含Q，将Q→Sab|ab|b代入S的候选式得： S→Qc|c S→Sabc|abc|bc|c Q→Rb|b 再消除直接左递归得： R→Sa|a S→abcS'| bcS'| cS' S'→abcS'|ε 消除无用产生式：Q→Sab|ab|b，R→Sa|a，得文法G47： S→abcS'| bcS'| cS' S'→abcS'|ε 文法G47对应的正规式：V1=(abc|bc|c)(abc)* 。
使用记号：
sym存放读单词子程序读来的单词，称为当前输入符号，进入程序前，输入串的第一个符号应读入sym中；
•使用过程：
advance()将读单词子程序的单词指针下移一个单词位置，且读出指针所指的单词，存入sym。

将过程调用示意图写成程序，程序称为递归下降分析器。
过程调用程序示意图
E'→+TE'| void E'(void) { if(sym=='+') { advance(); T(); E'(); } } F→(E)|i void F(void) { if(sym=='i') advance(); else if(sym=='(') { advance(); E(); if(sym=')') advance(); else error(); } else error(); }
相应的语法树： S S S

P A P A

P
S

A P
A
S→pA S→qB A→cAd A→a W=pccadd
c A d
c A d
c A d
c A d a
c A d
文法G(S)：S→pA A→cAd
S→qB A→a
该来自百度文库法的特点：
（1）每个产生式的右部都由终结符号开始；
（2 ）如果两个产生式有相同的左部，则它们的右部由不同的终结符开始。
4.1 语法分析——自上而下分析
内容语法分析的任务与分类
自上而下分析面临的问题
递归下降分析程序构造
LL(1)分析法
句型、句子、语言的定义
句型
有文法G，若S
* x，且x∈V*，则称x是文法G的
句型。
句子
有文法G，若S
的句子。
* x，且x∈VT*，则称x是文法G
例：G： S→0S1， S→01 S 0S1 00S11 000S111 00001111
L(G43)= L(G41)
G41过程调
用图
输入串为#aa#
文法G42=({P,B} , {a}, {P→B|a, B→Pa}, P)
过程调用图--输入串为#aa#
自上而下分析面临的问题
首先，是文法的左递归问题。一个文法是含有左递归的，如果存在非终结符P的产生式P ⇒Pα 含有左递归的文法将使上述的自上而下的分析过程陷入无限循环。即，当试图用P去匹配输入串时，我们会发现，在没有识别任何输入符号的情况下，又得重新要求P去进行新的匹配。因此，使用自上而下分析法必须消除文法的左递归性。
T'→*FT'|
F→(E)|i
给出#i+i*i#的最左推导：过程调用程序示意图 E=>TE'=>FT'E'=> iT'E'=>iE' => i+TE'=> i+FT'E'=> i+iT'E'=> i+i*FT'E'=>i+i*iT'E'=> i+i*iE'=> i+i*i
当前句型应选候选式当前输入符号余下的符号
P'→1P'|2 P'|……|n P'|
（2）消除隐含的左递归
＋要求文法中不含回路，即无AA的推导 ①给文法VN中的符号一个排序：A1, A2, …, An； for (i=1; i<=n; i++) { for (j=1; j<= i-1; j++) { 把形如Ai→Aj的规则改成 Ai→1|2|…|k 其中：Aj→1|2|…|k是关于Aj的所有规则；
过程调用示意图描述句型的推导过程
例4.1 文法G41=({P,U} , {a} , {P→aU, U→P|}, P)，L(G41)={an|n≥1} 例4.2 文法G42=({P,B} , {a}, {P→B|a, B→Pa}, P)， L(G42)= L(G41)
例4.3 文法G43=({P}, {a}, {P→aP|a}, P)，
①以a为头的αi如果只有一个，则替换唯一；
②若以a为头有多个αi的，则替换不唯一，需要回溯，这是文法的问题，应该变换文法。
解决办法--提取左公因子
要求文法的任一非终极符的侯选式之间无左公因子，使相匹的侯选式是唯一的，提取左公因子的方法是增加非终结符，改写文法。
提取左公因子
--例如： S→if B then S else S | if B then S 其中，S表示语句，if 、then、else为终极符。提取左公因子，增加非终结符S3，产生式改成： S→if B then S S3 S3→else S | 经过反复提取左因子，就能够把每个非终结符（包括新引进者）的所有候选首符号变成为两两不相交。为此付出的代价是，大量引进新的非终结符和 ε-产生式。
主旨：从文法开始符号出发，自上而下的为输入串建立一棵语法树
自顶向下语法分析要解决的关键问题

假定要被代换的最左非终结符号是B，且有n 条规则：B→A1|A2|…|An，那么如何确定用哪个右部去替代B？
例1：文法G(S)：S→pA S→qB
A→cAd
A→a
输入串 W=pccadd
SpA pcAd pccAdd pccadd
a) AA AVN, V*
b) AB
B A A,BVN, ， V*
称为左递归文法。
其中a)是直接递归，b)是间接递归。如果一个文法是
左递归时，则不能采用自顶向下分析法。
例：文法S Sa
S b 是直接左递归所产生的语言是：L＝{ ban | n≥0}
例：文法为：AaB

编译原理第4章 语法分析 自上而下

编译原理第4章语法分析自上而下