自底向上的语法分析解读
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.2 自底向上的语法分析
自底向上()的语法分析是从给定的符号串出发,试图逐
ห้องสมุดไป่ตู้
步将它们归约为文法的开始符号. 的语法分析采用的是最左(规范)归约 本节中介绍两种分析方法,即优先分析法和LR分析法; 分析也需要一个分析栈用于存放分析过程中所得的文 法符号,开始时,先将#入栈,然后逐步地将输入符号移进 栈,当句柄在栈顶形成时,则进行归约,否则移进下一符 号.在分析的每一步,分析动作都是由当前栈里的内容和 扫描到的符号确定的. 分析动作有:移进,归约,报错,接受.
E1 = +, +=T1 T = * * = F (=E E=) 从相应的语法树不难看出, +<i, +<F, +<T, i>*, F>*, *<i,以及: 考查句型 E1+i*i 及 T*(E1+T1) *<(, (<E1, E1>), T1>)
文法G’[E]的简单优先矩阵
通常,我们可把文法的全部优先关系用一矩阵 来表示.例如前面所给文法G’[E]相应的优先矩阵为:
优先关系矩阵的构造(续)
<? 由定义4.6, si<sj WVN: si= W >? W =? LEAD+ sj
si (= )(LEAD+) sj; 由定义4.7, 有si<sj W1= W2 W1 LAST+ si W2 LEAD* Sj; 其中 W1 LAST+ si si TRANSPOSE(LAST+) W1 (或:~(LAST+);以及 LEAD* = I+LEAD+ ,I为恒等关系 综上所述, si<sj si ~(LAST+) (=) (LEAD*) sj 利用上述结论我们可构造出相应的关系矩阵(见P131). 对于所得的矩阵(三个), 若无冲突的单元,则相应文法G 就是简单优先文法,可进行简单优先分析.
(三)算符优先分析的算法
在算符优先文法中,由于优先关系仅定义于VT符中,所以
当句柄仅由一个VN符构成时,无法通过优先关系识别出; 在扫描句型时,利用两个VT符之间的关系,我们总能找出 一个被归约的子串(不一定是句柄),称为最左素短语. 素短语 (1)是一个短语,(2)它至少含有一个VT符,(3) 满足(1),(2)的最小短语. 算符优先分析的句型具有形式 w=#N1a1N2a2…NnanNn+1#, 其中,aiVT , NiVN{ } 寻找最左素短语的方法: 从左到右扫描w,找到第一个 ai>ai+1时,记下ai,再回扫,找到第一个aj-1 < aj,此时, NjajNj+1aj+1…NiaiNi+1就是应被子归约的最左素短语
算符优先关系矩阵的构造
‘<’矩阵的构造 a<b,则由 U…aA... P 有 a(=)A;
由A=>+ [B]b … 有 W[B]b...P A=>* W…=>[B]b… 即 A LEAD* W W LEADVT b 从而有 a(= )(LEAD*)(LEADVT) b ‘<’矩阵的构造 a>b,则由 U…Ab... P,有A (= ) b, 再由A=>+…a[B],有W...[B]bP A=>* ...W=>…b[B] 从而,有 A (LAST*) W W LASTVT a,进而,有 a (~LASTVT) (~ LAST*) A 最后,得a (~LASTVT) (~ LAST*) (= ) b 例 G[E]是算符文法,P137-P138给出了其优先矩阵的构造过程. P139给出了优先矩阵.注意,算符优先分析的矩阵比简单优先矩阵 小得多.
E E E1 T1 T F + * ( ) i E1 T1 T F + = > > > = = < < < < < = < > > > > * ( ) = > > > > i
= > < < <
< < < > >
(二) 简单优先分析的算法
利用优先矩阵进行分析的方法是,逐次查看当前句型
X1X2…Xm相邻两个符号的优先关系,一旦出现 Xi+k>Xi+k+1, Xi+k即为句柄的尾符号,然后从Xi+k开始向 左查看已扫描过的符号,直到发现Xi-1<Xi,Xi即为句柄的 头符号. 可以证明, Xi到Xi+k 之间的符号恰好构成了当前句型的 句柄. 教材中P128程序4-4给出了简单优先分析的驱动程序.
i F
F→i T→F
i T*F T E1 + T1 E1 成功
F→i T→T*F T1→T E1→ E1 + T1 E→E1
(三) 简单优先分析矩阵的构造
首先,我们在V上定义若干二元关系
定义4.2 LEADV2 A LEAD B iff AB…P; A LEAD+ B iff A=>+ B…; 定义4.3 LASTV2 A LAST B iff A…BP; A LAST+ B iff A=>+ …B 定义4.4 逆关系: TRANSPOSE(R)或 ~R; 定义4.5 si= sj iff U…sisj... P; 定义4.6 si<sj iff U... siW... P W=>+sj…, sj VT; 定义4.7 si>sj iff U…W1W2...P W1=>+…siw2=>*sj… sjVT
4.2.2 算符优先分析法
一、算符文法与算符优先文法
定义4.8 若文法G的产生式右部不含两个VN符相邻的情况, 则称G为算符文法.G的VT符被称为算符 可以证明,算符文法不会含有两个VN符相邻的句型 常见语言不一定是算符文法,但可容易地对其进行改造 例 PASCAL中的循环语句:
<循环语句><循环子句><语句> <循环子句>for<变量>:= <循环表> do<语句> 可将其改为 <循环语句> for <变量> := <循环表> do <语句> <循环表> <表达式> to <表达式>
自底向上语法分析的例子
文法: SAB|c AbA|a BaSb|c, 输入为bbaacb
步 骤 0 1 2 3 4 5 6 7 8 9 10 11 12 分析栈内容 # #b #bb #bba #bbA #bA #A #Aa #Aac #AaS #AaSb #AB #S 余留符号串 bbaacb# baacb# aacb# acb# acb# acb# acb# cb# b# b# # # # 下步动作 移进 移进 移进 按 A→a 归约 按 A→bA 归约 按 A→bA 归约 移进 移进 按 S→c 归约 移进 按 B→aSb 归约 按 S→AB 归约 分析成功
符号串i+i*i的语法分析过程
步骤 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 分析栈 # #i #F #T # T1 # E1 # E1 + # E1 + i # E1 + F # E1 + T # E1 + T * # E1 + T * i # E1 + T * F # E1 + T # E1 + T1 # E1 #E 优先关系 < > > > > = < > > = < > > > > > > r i + + + + + i * * * i # # # # # # 余留输入串 +i*i# i*i# i*i# i*i# i*i# i*i# *i# i# i# i# # # # # # # # 句柄 i F T T1 所用产生式 F→i T→F T1→T E1→ T1
算符优先关系的定义
设文法G是一算符文法,且不含-产生式. U,A,BVN,aVT 定义4.9 (LEADVT) U LEADVT a U[A]a... P 定义4.10 (LASTVT) U LASTVT a U…a[A] P 定义4.11 a=b U…a[A]b... P 定义4.12 a<b U…a[A]... P (A=>+ [B]b…) 定义4.13 a>b U…[A]b... P (A=>+ …a[B]) 由上述定义可知,=关系的关系矩阵可容易地构造;
方法:在文法的符号之间建立一种(实际是
三种)优先关系RVV,在分析的过程中, 利用优先关系的比较,来确定当前句型的 句柄; 在找到句柄后按相应的产生式归约之,并 将归约出的VN符号压入栈,再进行新的比 较,…,直到出错或分析成功.
(一)简单优先关系的定义
设G是已化简的文法,s,tV,若G中存在规范句型 =…st…, 则s,t
程序4-4 简单优先分析驱动程序
int parser(void){ int i=0,k=0,r;stack[0]='#'; r=a[k++]; do{ int j,LeftSide; while(!IsHigherThan(stack[i],r)) {stack[++i]=r;r=a[k++];} j=i; while(! IsLowerThan (stack[j-1], stack[j])) j--; LeftSide= RightSideOfAProduction (stack[j],stack[i],i-j+1); if(LeftSide){ /*LeftSide!=0 means the production exists */ i=j;stack[i]=LeftSide; }else /* There is no production which matches the right side */ if(i==2 && r=='#' && stack[i] == STARTSYSBOL) return SUCCESS; else return ERROR; } while (1); } /* end of parser */
(四)简单优先分析的局限性
简单优先分析法对文法要求严格.常见的文法一般不是~. 例如,当一文法具有左递归符号,且它出现在某产生式右部的内部时,
就会出现冲突: 当U…sisj...P sjsj...P时,由前者,si=sj,由后 者,si<sj 同理,当某符号具有右递归,且出现于某右部的中间时,会有=与>的 冲突. 一般说来,通过消除左(右)递归可解决此类冲突: U…siW...P Wsj...P,这种方法称为分层法或析出法.例如,书中P133给出文法 G[E]的优先矩阵有冲突,通过分层法,将文法改造后所得的文法及 优先矩阵见P129图4-4. 应当指出,分层法不是万能的.当U<V与U>V同时成立时,无法解决; 分层法引入了大量的新VN符号,使矩阵迅速增大,分析效率也大大 降低.
关于自底向上分析
分析过程是最左归约的(规范的);
注意,在分析过程中,一旦句柄在栈顶形成,则立
即归约; 有时栈顶出现了某产生式的右部,但它不一定是 句柄(如前例中第七步,栈顶的a不是句柄); 从分析过程可容易地建立一棵语法树,可用作语 法分析的输出.建立树的方法见P125,这里略.
4.2.1 简单优先分析法
若s和t在任何句型中都不可能相邻出现,则我们规定二者无关系. 注意,这种优先关系是不对称的!
简单优先文法的定义
定义4.1 若一文法G的任何两个符号之间至多存在一 种优先关系,且任意两个不同的产生式无相同的右部,则 称G为简单优先文法
例4.4 考虑文法G’[E]:
EE1 E1E1+T1 |T1 T1T TT*F | F F(E) | i 由文法的产生式可直接看出: E=>E1=>E1+T1=>E1+T =>E1+T*F =>E1+T*i =>E1+F*i =>E1+i*i E=> E1=> T1=> T =>T*F => T*(E) =>T*(E1) =>T*(E1+T1)
与的句柄之间的关系必有下述情况之一: A A
A
… … s t ... … … s t … ... … … s t … ... 1. s在句柄中, 3. s不在句柄中,而t 2. s与t均在句 而t不在句柄中 在句柄中 柄中 对于上述情况,我们规定, 情况1: s>t; 情况2: s=t; 情况3: s<t 另外,还有一种情况,就是s和t均不在句柄中,那么一定存在某句 型使得它们进入上述三种情况之一.
自底向上()的语法分析是从给定的符号串出发,试图逐
ห้องสมุดไป่ตู้
步将它们归约为文法的开始符号. 的语法分析采用的是最左(规范)归约 本节中介绍两种分析方法,即优先分析法和LR分析法; 分析也需要一个分析栈用于存放分析过程中所得的文 法符号,开始时,先将#入栈,然后逐步地将输入符号移进 栈,当句柄在栈顶形成时,则进行归约,否则移进下一符 号.在分析的每一步,分析动作都是由当前栈里的内容和 扫描到的符号确定的. 分析动作有:移进,归约,报错,接受.
E1 = +, +=T1 T = * * = F (=E E=) 从相应的语法树不难看出, +<i, +<F, +<T, i>*, F>*, *<i,以及: 考查句型 E1+i*i 及 T*(E1+T1) *<(, (<E1, E1>), T1>)
文法G’[E]的简单优先矩阵
通常,我们可把文法的全部优先关系用一矩阵 来表示.例如前面所给文法G’[E]相应的优先矩阵为:
优先关系矩阵的构造(续)
<? 由定义4.6, si<sj WVN: si= W >? W =? LEAD+ sj
si (= )(LEAD+) sj; 由定义4.7, 有si<sj W1= W2 W1 LAST+ si W2 LEAD* Sj; 其中 W1 LAST+ si si TRANSPOSE(LAST+) W1 (或:~(LAST+);以及 LEAD* = I+LEAD+ ,I为恒等关系 综上所述, si<sj si ~(LAST+) (=) (LEAD*) sj 利用上述结论我们可构造出相应的关系矩阵(见P131). 对于所得的矩阵(三个), 若无冲突的单元,则相应文法G 就是简单优先文法,可进行简单优先分析.
(三)算符优先分析的算法
在算符优先文法中,由于优先关系仅定义于VT符中,所以
当句柄仅由一个VN符构成时,无法通过优先关系识别出; 在扫描句型时,利用两个VT符之间的关系,我们总能找出 一个被归约的子串(不一定是句柄),称为最左素短语. 素短语 (1)是一个短语,(2)它至少含有一个VT符,(3) 满足(1),(2)的最小短语. 算符优先分析的句型具有形式 w=#N1a1N2a2…NnanNn+1#, 其中,aiVT , NiVN{ } 寻找最左素短语的方法: 从左到右扫描w,找到第一个 ai>ai+1时,记下ai,再回扫,找到第一个aj-1 < aj,此时, NjajNj+1aj+1…NiaiNi+1就是应被子归约的最左素短语
算符优先关系矩阵的构造
‘<’矩阵的构造 a<b,则由 U…aA... P 有 a(=)A;
由A=>+ [B]b … 有 W[B]b...P A=>* W…=>[B]b… 即 A LEAD* W W LEADVT b 从而有 a(= )(LEAD*)(LEADVT) b ‘<’矩阵的构造 a>b,则由 U…Ab... P,有A (= ) b, 再由A=>+…a[B],有W...[B]bP A=>* ...W=>…b[B] 从而,有 A (LAST*) W W LASTVT a,进而,有 a (~LASTVT) (~ LAST*) A 最后,得a (~LASTVT) (~ LAST*) (= ) b 例 G[E]是算符文法,P137-P138给出了其优先矩阵的构造过程. P139给出了优先矩阵.注意,算符优先分析的矩阵比简单优先矩阵 小得多.
E E E1 T1 T F + * ( ) i E1 T1 T F + = > > > = = < < < < < = < > > > > * ( ) = > > > > i
= > < < <
< < < > >
(二) 简单优先分析的算法
利用优先矩阵进行分析的方法是,逐次查看当前句型
X1X2…Xm相邻两个符号的优先关系,一旦出现 Xi+k>Xi+k+1, Xi+k即为句柄的尾符号,然后从Xi+k开始向 左查看已扫描过的符号,直到发现Xi-1<Xi,Xi即为句柄的 头符号. 可以证明, Xi到Xi+k 之间的符号恰好构成了当前句型的 句柄. 教材中P128程序4-4给出了简单优先分析的驱动程序.
i F
F→i T→F
i T*F T E1 + T1 E1 成功
F→i T→T*F T1→T E1→ E1 + T1 E→E1
(三) 简单优先分析矩阵的构造
首先,我们在V上定义若干二元关系
定义4.2 LEADV2 A LEAD B iff AB…P; A LEAD+ B iff A=>+ B…; 定义4.3 LASTV2 A LAST B iff A…BP; A LAST+ B iff A=>+ …B 定义4.4 逆关系: TRANSPOSE(R)或 ~R; 定义4.5 si= sj iff U…sisj... P; 定义4.6 si<sj iff U... siW... P W=>+sj…, sj VT; 定义4.7 si>sj iff U…W1W2...P W1=>+…siw2=>*sj… sjVT
4.2.2 算符优先分析法
一、算符文法与算符优先文法
定义4.8 若文法G的产生式右部不含两个VN符相邻的情况, 则称G为算符文法.G的VT符被称为算符 可以证明,算符文法不会含有两个VN符相邻的句型 常见语言不一定是算符文法,但可容易地对其进行改造 例 PASCAL中的循环语句:
<循环语句><循环子句><语句> <循环子句>for<变量>:= <循环表> do<语句> 可将其改为 <循环语句> for <变量> := <循环表> do <语句> <循环表> <表达式> to <表达式>
自底向上语法分析的例子
文法: SAB|c AbA|a BaSb|c, 输入为bbaacb
步 骤 0 1 2 3 4 5 6 7 8 9 10 11 12 分析栈内容 # #b #bb #bba #bbA #bA #A #Aa #Aac #AaS #AaSb #AB #S 余留符号串 bbaacb# baacb# aacb# acb# acb# acb# acb# cb# b# b# # # # 下步动作 移进 移进 移进 按 A→a 归约 按 A→bA 归约 按 A→bA 归约 移进 移进 按 S→c 归约 移进 按 B→aSb 归约 按 S→AB 归约 分析成功
符号串i+i*i的语法分析过程
步骤 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 分析栈 # #i #F #T # T1 # E1 # E1 + # E1 + i # E1 + F # E1 + T # E1 + T * # E1 + T * i # E1 + T * F # E1 + T # E1 + T1 # E1 #E 优先关系 < > > > > = < > > = < > > > > > > r i + + + + + i * * * i # # # # # # 余留输入串 +i*i# i*i# i*i# i*i# i*i# i*i# *i# i# i# i# # # # # # # # 句柄 i F T T1 所用产生式 F→i T→F T1→T E1→ T1
算符优先关系的定义
设文法G是一算符文法,且不含-产生式. U,A,BVN,aVT 定义4.9 (LEADVT) U LEADVT a U[A]a... P 定义4.10 (LASTVT) U LASTVT a U…a[A] P 定义4.11 a=b U…a[A]b... P 定义4.12 a<b U…a[A]... P (A=>+ [B]b…) 定义4.13 a>b U…[A]b... P (A=>+ …a[B]) 由上述定义可知,=关系的关系矩阵可容易地构造;
方法:在文法的符号之间建立一种(实际是
三种)优先关系RVV,在分析的过程中, 利用优先关系的比较,来确定当前句型的 句柄; 在找到句柄后按相应的产生式归约之,并 将归约出的VN符号压入栈,再进行新的比 较,…,直到出错或分析成功.
(一)简单优先关系的定义
设G是已化简的文法,s,tV,若G中存在规范句型 =…st…, 则s,t
程序4-4 简单优先分析驱动程序
int parser(void){ int i=0,k=0,r;stack[0]='#'; r=a[k++]; do{ int j,LeftSide; while(!IsHigherThan(stack[i],r)) {stack[++i]=r;r=a[k++];} j=i; while(! IsLowerThan (stack[j-1], stack[j])) j--; LeftSide= RightSideOfAProduction (stack[j],stack[i],i-j+1); if(LeftSide){ /*LeftSide!=0 means the production exists */ i=j;stack[i]=LeftSide; }else /* There is no production which matches the right side */ if(i==2 && r=='#' && stack[i] == STARTSYSBOL) return SUCCESS; else return ERROR; } while (1); } /* end of parser */
(四)简单优先分析的局限性
简单优先分析法对文法要求严格.常见的文法一般不是~. 例如,当一文法具有左递归符号,且它出现在某产生式右部的内部时,
就会出现冲突: 当U…sisj...P sjsj...P时,由前者,si=sj,由后 者,si<sj 同理,当某符号具有右递归,且出现于某右部的中间时,会有=与>的 冲突. 一般说来,通过消除左(右)递归可解决此类冲突: U…siW...P Wsj...P,这种方法称为分层法或析出法.例如,书中P133给出文法 G[E]的优先矩阵有冲突,通过分层法,将文法改造后所得的文法及 优先矩阵见P129图4-4. 应当指出,分层法不是万能的.当U<V与U>V同时成立时,无法解决; 分层法引入了大量的新VN符号,使矩阵迅速增大,分析效率也大大 降低.
关于自底向上分析
分析过程是最左归约的(规范的);
注意,在分析过程中,一旦句柄在栈顶形成,则立
即归约; 有时栈顶出现了某产生式的右部,但它不一定是 句柄(如前例中第七步,栈顶的a不是句柄); 从分析过程可容易地建立一棵语法树,可用作语 法分析的输出.建立树的方法见P125,这里略.
4.2.1 简单优先分析法
若s和t在任何句型中都不可能相邻出现,则我们规定二者无关系. 注意,这种优先关系是不对称的!
简单优先文法的定义
定义4.1 若一文法G的任何两个符号之间至多存在一 种优先关系,且任意两个不同的产生式无相同的右部,则 称G为简单优先文法
例4.4 考虑文法G’[E]:
EE1 E1E1+T1 |T1 T1T TT*F | F F(E) | i 由文法的产生式可直接看出: E=>E1=>E1+T1=>E1+T =>E1+T*F =>E1+T*i =>E1+F*i =>E1+i*i E=> E1=> T1=> T =>T*F => T*(E) =>T*(E1) =>T*(E1+T1)
与的句柄之间的关系必有下述情况之一: A A
A
… … s t ... … … s t … ... … … s t … ... 1. s在句柄中, 3. s不在句柄中,而t 2. s与t均在句 而t不在句柄中 在句柄中 柄中 对于上述情况,我们规定, 情况1: s>t; 情况2: s=t; 情况3: s<t 另外,还有一种情况,就是s和t均不在句柄中,那么一定存在某句 型使得它们进入上述三种情况之一.