编译原理作业集-第二章

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二章高级语言及其语法描述
本章要点
1. 程序语言的定义；
2. 高级程序语言一般结构和主要共同特征；
3. 正确理解上下文无关文法基本概念，包括：
文法的定义、推导、句型、句子、语言、语法树、二义性等；
4. Chomsky文法分类；
本章目标
掌握和理解程序语言的定义、高级语言的一般特征及程序语言的语法描述。

本章重点
1. 语法，词法规则与语法规则；
2. 语义和语义规则；
3. 数据类型与操作；
4. 推导，最左推导和最右推导；
5. 语法分析树和二义性；
本章难点
1. 二义性文法；
2. Chomsky各个文法类；
作业题
一、单项选择题：
（按照组卷方案，至少15道小题）
1. Chomsky把文法分成四种类型，0型、1型、2型和3型。

3型文法也称为，2型文法也称为。

a.上下文无关文法
b.上下文相关文法
c.正则文法
d.短语文法
2. 许多广为使用的语言，如Fortran、C、Pascal等，属于。

a. 强制式语言
b. 应用式语言
c. 基于规则的语言
d. 面向对象的语言
3. 设G是一个文法，S是开始符号。

若S⇒*α，α∈(V T∪V N)*，则称α是一个。

a. 句子
b. 句型
c. 推导
d. 语言
4. 一个数据类型通常包括的三种要素中，没有下面的。

a. 用于区别这种类型的数据对象的属性；
b. 这种类型的数据对象可以具有的值；
c. 对这种类型的数据对象的内存分配；
d. 可以作用于这种类型的数据对象的操作；
5. Chomsky把文法分成四种类型，其中，也称正规文法
a. 0型
b. 1型
c. 2型
d. 3型
6. 语言的词法规则一般用Chomsky的型文法来描述：
a. 0
b. 1
c. 2
d. 3
7. 文法
S→(L)|a
L→L，S|S
中，下面是该文法中的终结符号。

a. S
b. ，
c. L
d. |
8. 文法G所描述的语言是的集合。

a. 文法G的字母表∑中的所有符号组成的符号串；
b. 文法G的字母表∑的闭包∑*中的所有符号串；
c. 文法G的识别符号推出的所有符号串；
d. 文法G的识别符号推出的所有终结符号串；
9. 语言L={αcα | α∈(a|b)*}，该语言是_____________语言。

a. 3型语言，
b. 2型语言，
c. 1型语言，
d. 0型语言
10. 设有文法G：
I→I1 | I0 | Ia | Ic | a | b | c |
下面符号串中不是该文法的句子是：
a. ab0，
b. a0c01，
c. aaa，
d. bc10
11. 给定文法A→bA|cc，下面的符号串中，是该文法句子的是________。

a. bcbc，
b. bbbcc，
c. bcbcc，
d. bccbcc；
12. Chomsky定义的四种形式语言文法中，2型文法可由（G ）识别。

a. 图灵机；
b. 确定性有限自动机；
c. 下推自动机；
d. 非确定性有限自动机；
13. 若文法G定义的语言是无限集，则文法必然是。

a. 上下文无关的
b. 递归的
c. 二义性的
d. 无二义性的
14. 文法S→aaS|abc 定义的语言是。

a. {a2k bc|k>0}
b. {a k bc|k>0}
c. {a2k-1bc|k>0}
d. {a k a k bc|k>0}
15. 文法：G：S→xSx | y所识别的语言是（）。

a. xyx
b. (xyx)*
c. x*yx*
d. x n yx n（n≥0）
一．答案：1. c.；2. a.；3. b；4. c；5. d；6. d；7. b；8. d；9. d；10. a；11. b；12. c；13. b；
14. c；15. d；
二、填空题：
（按照组卷方案，至少15道小题）
1. 假设G是一个文法，α是由终结符和非终结符组成的串，S是文法的开始符号，如果S=>*α，则称α是。

2. 在赋值语句中，赋值号‘：=’左右两边的变量名扮演着两种不同的角色，为了区分一个名字的这两种特征，我们把一个名字所代表的称为该名的左值，把一个名字的称为该名字的右值。

3. 对于文法G，仅含终结符号的句型称为。

4. 设有文法G[S]，其部分产生式:
E→E+T | T
T→T*F | F
F→(E) | a
则V N ={ },V T={ }。

5. 由文法产生的集合是文法产生的语言。

6. Chomsky语法定义的3型文法又可以分为。

7. 一个上下文文法G的四个组成部分分别是：。

8. 已知语言：{a n b n a m b m|n，m≥0}，其语法定义为：G=({a，b}，{S，A，B}，S，P)，其中P为：。

9. 已知某语言的语法定义为：G=({a},{S}S, P )，且P: S→aS | ε，则该语言为。

10. 已知某语言为{ωcw R|ω∈{a，b}*}，其语法定义为G=({a，b，c}，{S}，S，P)，其中P 为：。

11. 所谓最右推导是指。

12. 已知文法G(Z):
E→ET+|T
T→TF*|F
F→FP↑|P
P→E|i
试写出其识别的一个句子：_____________________。

13. 文法G[S]：S→aA|a， A→aS为_______型文法，其确定的语言的为：_______ 。

14. 在一棵语法树生长过程中的任何时刻，就是一个句型。

15. 我们说G=(V T，V N，S，P)是一个0型文法，如果它的每一个产生式α→β是这样一种结构：。

二．答案：1. 句型；2. 单元的地址（或者：单元、存储单元的地址），值（或者：单元的内容）3. 句子；4. V N={E，T，F}，V T={+，*，(，)，a}；5. 句子；6. 右线性文法和左线性文法；7. 开始符号，产生式集合，终结符集合，非终结符集合；8. S→AB；A→aAb|ε；B→aBb|ε；
9. {a n|n≥0}；10. S→aSa|bSb|ε；11. 任何一步α⇒β都是对α中的最右非终结符进行替换。

12. iii↑*+；13. {a2n+1|n≥0}；14. 所有那些没有后代的末端结点从左到右排列起来；15. α∈(V N∪V T)*且至少含有一个非终结符，而β∈(V N∪V T)*。

三、判断题：
（按照组卷方案，至少15道小题）
1. 一棵语法树表示了一个句型所有的不同推导过程，包括最右推导和最左推导。

（）
2. 可能有两个不同的文法G和G′，期中一个是二义的而另一个是无二义的，但是却有L(G)＝L(G′)。

（）
3. 变量既持有左值又持有右值，而常数和带有算符的表达式一般认为只持有右值。

（）
4. 文法G:
S→bA
A→aA|a
定义的语言是所有以b开头的后跟至少一个a的字符串的集合。

（）
5. 设有文法G：
S→S*S | S+S | (S) | a
该文法是二义的。

（）
6. 正则文法一定不是二义的。

（）
7. 上下文无关文法可以产生语言L={ a n b n c i | i>=1,n>=1 }。

（）
8. 不存在任何正规文法能产生语言L={a n b n | n>=1}。

（）
9. 对于每一个左线性文法G1，都存在一个右线性文法G2，使得L(G1)=L(G2)。

（）
10. 正规文法产生的语言都可以用上下文无关文法来描述。

（）
11. 上下文无关文法比正规文法有更强的描述能力。

（）
12. 文法的二义性和语言的二义性在概念上是相同的，也就是说，对于某个语言，不可能存在两个以上的文法来描述它。

（）
13. 二义性是可以判定的，也就是说，可以编这么一个程序，输入该文法后，该程序能确切地给出该文法是否二义的答案。

（）
14. 说明语句旨在定义名字的性质。

编译程序把这些性质登记在符号表中，并检查程序中名字的引用和说明是否一致。

实际上，许多说明语句并不能翻译成相应的目标代码。

（）
15. C语言是一个允许子程序嵌套定义的语言。

（）
三．答案：1. √；2. √；3. √；4. √；5. √；6. ×；7. √；8. √；9. √；10. √；11. √；12. ×；13. ×；14. √；15. ×；
四、名词解释：
（按照组卷方案，至少3道小题）
1. 二义性文法；
2. 推导和直接推导；
3. 句型，句子和语言；
4. 上下文无关文法；
5. 语法；
6. 正规文法（左线性文法和右线性文法）；
四．答案：
1. 如果一个文法存在某个句子对应两棵以上不同的语法树，则称这个文法是是二义性文法。

2. 设A→γ是一个产生式，且α、β∈(VT⋃VN)*，若αAβ=>αγβ，则称αAβ直接推出αγβ；或者说，αγβ是αAβ的一个直接推导。

如果α1=>α2=>……=>αn，则称这个序列是从α1到αn的一个推导。

3. 设G是一个文法，S是它的开始符号。

如果S=>*α，则称α是一个句型。

仅含终结符的句型叫句子。

文法G所产生的句子的全体叫文法G的语言，记为L(G)，L(G)={α| S=>*α，α∈V T*｝。

4. 上下文无关文法G是一个四元式(V T，V N，S，P)，其中：
V T是一个非空有限集合，其中的每一个元素称为终结符；
V N是一个非空有限集合，其中的每一个元素称为非终结符，V N∩V T=∅；
S是一个非终结符，称为开始符号；
P是一个产生式有限集合，每个产生式的形式是P→α，其中P∈V N，α∈(V T⋃V N)*。

开始符号S至少必须在某个产生式的左部出现一次。

5. 若文法G= (V T，V N，S，P)的任何产生式为A→αB或A→α，其中，α∈V T*，A，B∈V N，则称G是右线性文法；
若文法G= (V T，V N，S，P)的任何产生式为A→Bα或A→α，其中，α∈V T*，A，B∈V N，则称G是左线性文法；
左线性文法和右线性文法均为正规文法。

五、简答题：
（按照组卷方案，至少3道小题）
1. 作为描述程序语言的上下文无关文法，对它有哪些限制？
答：
第一点：文法中不含任何下面形式的产生式：P→P；
第二点：每个非终结符P都必须有用处。

也就是说，必须存在含P的句型；或者说，对P 不存在永不终结的回路。

2. 什么是二义性文法？从输入串abab来说明下面文法二义吗？
S→aSbS|bSaS|ε
该文法产生的语言是什么？
答：
如果一个文法存在某个句子对应两棵以上不同的语法树，则称这个文法是二义的。

例如输入串abab，它有两棵语法树如下：
所以，该文法是二义的。

此文法产生的语言是：所有a 的个数与b 的个数相等的由a 和b 组成的字符串。

3. 文法 G[S]为：
S →Ac|aB A
→ab
B →bc
该文法是否为二义的？为什么？答：对于串 abc
(1)S=>Ac=>abc (2)S=>aB=>abc
即存在两不同的最右推导。

所以，该文法是二义的。

或者：
对输入字符串 abc ，能构造两棵不同的语法树，所以它是二义的。

4已知文法G=({A,B,C}，{a,b,c}，P ，A), P 由以下产生式组成:
A →abc A →aBbc
Bb→bB
Bc→Cbcc
bC→Cb
aC→aaB
aC→aa
此文法所表示的语言是什么？
答：
分析文法的规则：
每使用一次Bc→Cbcc，b、c的个数各增加一个；
每使用一次aC→aaB或aC→aa, a的个数就增加一个；
产生式Bb→bB、bC→Cb起连接转换作用。

由于A是开始符号，由产生式A→abc推导得到终结符号串abc；由产生式A→aBbc推导得到B后，每当使用产生式Bb→bB、Bc→Cbcc、bC→Cb、aC→aaB就会递归调用B一次，所产生的a、b、c的个数分别增加一个，因此推导所得的终结符号串为abc、aabbcc、aaabbbccc、…所以文法描述的语言为{ a n b n c n|n>0}.
5已知文法G[Z]:
Z→0U|1V
U→1Z|1
V→0Z|0
（1）请写出此文法描述的只含有４个符号的全部句子。

（2）G[Z]产生的语言是什么？
（3）该文法在Chomsky文法分类中属于几型文法？
答：
(3)该文法属于3型文法。

七、应用题：
1. 试分析下面给出的if-then-else语句的文法，它的提出原本是为了矫正dangling-else(else 悬挂)文法的二义性：
stmt→ if expr then stmt | matched-stmt
matched-stmt→ if expr then matched-stmt else stmt | other
expr→e
考虑句子if e then if e then other else if e then other else other，试说明此文法仍然是二义性的。

答：
1. 考虑句子if e then if e then other else if e then other else other
它具有如下所示的两种分析树
则上面给出的if-then-else文法仍是二义性的。

(b) 试对于句子not(true or false)构造一棵分析树。

答：
(a) 终结符号为：{or, and, not, (, ), true, false}
非终结符号为：{bexpr, bterm, bfactor}
开始符号为：bexpr
(b) 句子not(true or false)的分析树为：
(c) 用归纳法说明如下：
(1) 不含运算的布尔表达式，常数true和false由此文法产生：
bexpr => bterm => bfactor => true
bexpr => bterm => bfactor => false
(2) 设结论对于少于n(n≥1)个运算的布尔表达式成立，即
若be1和be2是含有少于n个运算的布尔表达式，则有：bexpr=>+be1,bexpr=>+be2。

(3) 对于含有n个运算的布尔表达式，可表示成下面三种
形式：
(a) (be1) or (be2)
(b) (be1) and (be2)
(c) not (be1)
对于(a)：bexpr => bexpr or bterm
=> bterm or bterm => bfactor or bterm
=> (bexpr) or bterm =>+(be1) or bterm
=> (be1) or bfactor => (be1) or (bexpr)
=>+ (be1) or (be2)
同理，有：
Bexpr=>+ (be 1) and (be 2) Bexpr=>+ not (be 1)
综上所述，此文法所产生的语言是全体布尔表达式。

3. 已知文法G[S],其产生式为：S →(S)| ε
（a ）L(G)是什么？
（b ）对于(a)的结果，请给出证明。

答：
(a) 解：0}n |){(L(G )n
n
≥= (b)证明：
首先证明0}n |){(L(G )n n
≥⊆ 对推导次数进行归纳
1):当推导次数为1时，使用产生式S →ε，此时左括号与右括号个数为0 2):假设推导次数为n 时(a)成立,即: 1
n 1
n 1
n 1
n ...)))(((......)))S (((...S ----+
⇒⇒
则推导次数为n+1次时，多使用一次产生式S →(S)即:
n
n
n
n
1
n 1
n ...)))(((......)))S (((......)))S (((...S ⇒⇒⇒--+
推导次数为n+1次时(a)成立。

根据(1)(2)可得：0}n |){(L(G )n
n
≥⊆ 其次证明L(G )0}n |){(n
n
⊆≥ 对n 进行归纳
1):当n=0时,使用产生式S →ε 即可；
2):假设当n=k 时,结论成立，即L(G ))(k
k
∈，下面证n=k+1时结论成立。

由L(G ))(k
k
∈，其推导过程如下：
k
k
k
k
...)))(((......)))S (((...S ⇒⇒+
当n=k+1时，推导过程如下：
1
k 1k 1k 1k k k ...)))(((......)))(((...S ...)))S (((...S +++++
⇒⇒⇒
故L(G ))(1
k 1k ∈++
根据(1)(2)可得：L(G )0}n |){(n
n
⊆≥ 根据1，2可知：0}|){(L(G )n
n
≥= 4. 试构造生成下列语言的上下文无关文法： (1) { a n b n c i | n≥1, i≥0 }
(2) { w | w ∈{a,b}+，且w 中a 的个数恰好比b 多1 } (3) { w | w ∈{a,b}+，且|a|≤|b|≤2|a| } 答：
（1）把a n b n c i 分成a n b n 和c i 两部分，分别由两个非终结符号生成，因此，生成此文法的产生式为： S → AB A → aAb|ab B → cB|ε
（2）令S 为开始符号，产生的w 中a 的个数恰好比b 多一个，令E 为一个非终结符号，产生含相同个数的a 和b 的所有串，则产生式如下： S → aE|Ea|bSS|SbS|SSb E → aEbE|bEaE|ε
(3) 设文法开始符号为S ，产生的w 中满足|a|≤|b|≤2|a|。

答：
从规则2可推出: a,aa,aaa,……
从规则3可推出: b,bb,bbb,……
再从规则1可推出句子：
ab, aab, aabb, aaab, abbb,……
即，从S出发可推出多个a后跟多个b的字符串，且a的个数与b的个数不尽相同。

故：L(G)={a m b n| m,n≥1}
6. 考虑下面上下文无关文法G[S]：
S→SS*|SS+|a
(1) 对于符号串aa+a*分别给出最左推导和最右推导过程，并为该串构造语法树。

(2)G[S]的语言是什么？
答：
(1)此文法生成串aa+a*的最右推导：
S=>SS*=>SS*=>Sa*=>SS+a*=>Sa+a*=>aa+a*
此文法生成串aa+a*的最左推导：
S=>SS*=>SS+S*=>*=>aS+S*=>aa+S*=>aa+a*
(2)该文法生成的语言是：*和+的后缀表达式，即逆波兰式。

7 令文法G为
N→D | ND
D→0 | 1 | 2 | 3 | 4 | 5 | 6| 7 | 8 | 9
(1) G的语言L（G）是什么？
(2) 给出句子0127、34和568的最左推导和最右推导。

答：
（1）
∵N N⇒ND⇒NDD⇒NDDD⇒NDDDD……⇒DD……D
∴L(G)=｛d(n+1)|n≥0, d∈{0, 1, …, 9}｝
允许以0开头的自然数（十进制无符号整数）；
（2）
0127最左推导：N⇒ND⇒NDD⇒NDDD⇒DDDD⇒0DDD⇒01DD⇒012D⇒0127
0127最右推导：N⇒ND⇒N7⇒ND7⇒N27⇒ND27⇒N127⇒D127⇒0127
8 写一个文法，使其语言是奇数集，且每个奇数不以0开头。

答：（首先分析题意，本题是希望构造一个文法，由它产生的句子是奇数，并且不以0开头，也就是说它的每个句子都是以1、3、5、7、9中的某个数结尾。

如果数字只有一位，则1、3、5、7、9就满足要求，如果有多位，则要求第1位不能是0，而中间有多少位，每位是什么数字（必须是数字）则没什么要求，因此，我们可以把这个文法分3部分来完成。

分别用3个非终结符来产生句子的第1位、中间部分和最后一位。

引入几个非终结符，其中，一个用作产生句子的开头，可以是1－9之间的数，不包括0；一个用来产生句子的结尾，为奇数；另一个则用来产生以非0整数开头后面跟任意多个数字的数字串，进行分解之后，这个文法就很好写了。

）
令S表示不以0开始的奇数集合。

S → 〈奇数头〉〈整数〉〈奇数尾〉|〈奇数头〉〈奇数尾〉|〈奇数尾〉
〈奇数尾〉→ 1|3|5|7|9
〈奇数头〉→ 2|4|6|8|〈奇数尾〉
〈整数〉→ 〈整数〉〈数字〉|〈数字〉
〈数字〉→ 0|〈奇数头〉
9写一个上下文无关文法CFG，使其语言是能被5整除且不以0开头的无符号整数的集合。

（如｛5,10,15，….｝）
答：
能被5整除的数从形式上看，是以0和5结尾的数字串。

题目要求的不以0开头，并要注意0不是该语言的句子。

所求文法为：
G(S)：S→MF｜5
F→5｜0
M→MD｜N
D→N｜0
N→1｜2｜3｜4｜5｜6｜7｜8｜9
10证明下面的文法是二义的：
S→iSeS｜iS｜i
答：（根据文法的二义性的定义，如果要证明该文法是二义的，必须找到一个句子，使得该句子具有两个不同的最右推导或两个不同的语法树。

我们首先分析这个文法，根据我们对程序语言的了解，不难发现，这个文法应该是用来表示if….else….结构的（用“i”代表“if”或语句集，“e”代表“else”）。

因此我们就要到if….else…结构中去找二义性。

我们知道，程序语言一般都规定else部分是和它前面离它最近的没有被匹配的的if语句进行匹配。

而上面的这个文法体现不出这种限制，因此我们可以找这样一个句子，在else前面有两个if （如句子iiiei），else和不同的if进行匹配时就会产生不同的语义。

）
解答：
考虑句子iiiei，存在如下两个最右推导：
S => iSeS => iSei => iiSei => iiiei
S => iS => iiSeS => iiSei => iiiei
11 某程序设计语言的表达式由运算符θ1、θ2、θ3、标识符、（、）组成，其中θ1和θ2的优先级相同，θ3的优先级低于θ1、θ2的优先级，优先级相同的运算符从右往左计算，可以用括号改变运算的顺序，则下述四种文法中哪一个可以描述上述的表达式文法？
设E为识别符号，终结符号集={θ1、θ2、θ3、（、）、I}，非终结符号集={E、T、F}。

两个运算符连续出现，后推导出（或先被规约）的，表明其运算先被处理，因此优先级高；反之，先推导出（或后被规约）的，表明其运算后被处理，因此优先级低。

）题意要求：θ1和θ2的优先级相同，θ3的优先级低于θ1、θ2的优先级，因此θ3比θ1、θ2先推导出来，即应为图3所示的四种情形。

U
U
θ3 U V
V
(1)
θ1
U
U
θ3 U V
V (2)
θ1
U
U θ3 U V
V
(3)
θ2
U
U
θ3 U V
V
(4)
θ2
图3可能的文法推导顺序因此a 和b 不成立。

又因为优先级相同的运算符从右往左计算，应采用右递归，即应为图4所示的情形。

U
U
1 V W
V
(1)
θ1
U
U
2 V W
V
(2
θ2
U
U
θ3 V W
V
(3)
θ3
图4可能的文法递归结构故c 不成立,应为d 。