编译原理第3章文法和语言
编译原理的文法和语言总结与梳理
编译原理的⽂法和语⾔总结与梳理梳理⽂法和语⾔的内容,理解与总结。
我们都知道,⼀种语⾔必定他的⽂法去描述,它的完整定义包括语法和语义两个⽅⾯。
语⾔和语法是指⼀组规则,⽤它可以形成和产⽣⼀个合适的程序。
⽬前⼴泛使⽤的是上下⽂⽆关⽂法,也就是⽤上下⽂⽆关⽂法作为程序设计的描述⼯具,⽐如⽤A:=B+C表⽰是⼀个合法的赋值语句,则A:=B+就不是合法的赋值语句。
什么是⽂法?⽂法相当于语⾔学(⼈类语⾔)中的语义分析,即分析⼀个句所表⽰的含义。
它是产⽣中间代码或⽬标代码的依据。
⽤EBNF(EBNF是⼀种称为扩展巴克斯范式的形式描述)表⽰就是:<句⼦> ::= <主语><谓语> <主语> ::= <代词>< 名词> <代词>::= 我 | 你 | 他 <名词>::= 王明 | ⼤学⽣ | ⼯⼈ | 英语 <谓语> ::= <动词><直接宾语> <动词> ::= 是 | 学习 <直接宾语> ::=<代词> |<名词>(1)⽂法的形式化定义: G=(V T , V N , P , S) V T:终结符集合,终结符是⽂法所定义的语⾔的基本符号,有时也称为token。
V N:⾮终结符集合,⾮终结符是⽤来表⽰语法成分的符号,有时也称为"语法变量",可以推出其它的语法成分P:产⽣式集合S:开始符号(2)符号串运算: 符号串的连接:εx=xε=x; 集合的乘积:AB={xy|x∈A,y∈B};{ε}A=A{ε}=A; 符号串的幂运算:x=abc,x^2=abcabc; 集合的幂运算正闭包A+与闭包A*:A*={ε}∪A+(3)⽂法分类:(4)语⾔的定义与运算 语⾔:在某⼀确定字母表上的特定符号串的集合。
空集ε,集合{ ε }也是符合此定义的语⾔。
编译原理第3章文法和语言
第3章文法和语言第1题文法G=({A,B,S},{a,b,c},P,S)其中P为:S→Ac|aBA→abB→bc写出L(G[S])的全部元素。
答案:L(G[S])={abc}第2题文法G[N]为:N→D|NDD→0|1|2|3|4|5|6|7|8|9G[N]的语言是什么?答案:G[N]的语言是V+。
V={0,1,2,3,4,5,6,7,8,9}N=>ND=>NDD....=>NDDDD...D=>D......D或者:允许0开头的非负整数?第3题为只包含数字、加号和减号的表达式,例如9-2+5,3-1,7等构造一个文法。
答案:G[S]:S->S+D|S-D|DD->0|1|2|3|4|5|6|7|8|9第4题已知文法G[Z]:Z→aZb|ab写出L(G[Z])的全部元素。
答案:Z=>aZb=>aaZbb=>aaa..Z...bbb=>aaa..ab...bbbL(G[Z])={anbn|n>=1}第5题写一文法,使其语言是偶正整数的集合。
要求:(1)允许0打头;(2)不允许0打头。
答案:(1)允许0开头的偶正整数集合的文法E→NT|DT→NT|DN→D|1|3|5|7|9D→0|2|4|6|8(2)不允许0开头的偶正整数集合的文法E→NT|DT→FT|GN→D|1|3|5|7|9D→2|4|6|8F→N|0G→D|0第6题已知文法G:<表达式>::=<项>|<表达式>+<项> <项>::=<因子>|<项>*<因子><因子>::=(<表达式>)|i试给出下述表达式的推导及语法树。
(5)i+(i+i)(6)i+i*i答案:(5)<表达式>=><表达式>+<项>=><表达式>+<因子>=><表达式>+(<表达式>)=><表达式>+(<表达式>+<项>)=><表达式>+(<表达式>+<因子>)=><表达式>+(<表达式>+i)=><表达式>+(<项>+i)=><表达式>+(<因子>+i)=><表达式>+(i+i)=><项>+(i+i)=><因子>+(i+i)=>i+(i+i)(6)<表达式>=><表达式>+<项>=><表达式>+<项>*<因子>=><表达式>+<项>*i=><表达式>+<因子>*i=><表达式>+i*i=><项>+i*i=><因子>+i*i=>i+i*i<表达式><表达式>+<项><因子><表达式><表达式>+<项><因子>i<项><因子>i<项><因子>i()<表达式><表达式>+<项><项>*<因子><因子>i<项><因子>ii第7题证明下述文法G[〈表达式〉]是二义的。
编译原理 文法和语言
文法与语言的对应关系
文法描述语言的语 法
文法的主要作用是描述语言的 语法结构,即规定什么样的句 子是合法的。因此,文法与语 言之间存在一种对应关系,即 文法规则定义了语言的语法规 则。
语言反映文法的特 性
语言作为文法规则的体现,反 映了文法的一些特性。例如, 语言的简洁性、一致性、无歧 义性等特性都与文法的制定密 切相关。
编译原理与文Biblioteka 和语言的关系编译原理利用文法和语言的 概念来描述程序设计语言的 语法和语义,从而实现对程
序的正确翻译。
文法和语言提供了编译器设 计的理论基础,使得编译器 能够按照预定的规则对程序 进行词法分析、语法分析和
语义分析等处理。
编译原理的发展推动了文法 和语言理论的深入研究,同 时也促进了程序设计语言的 发展和进步。
程序设计语言和自然语言
程序设计语言是一种用于编写计算机程序的语言,具有严格的语法和语义 规则;自然语言是人类日常交流所使用的语言,具有灵活性和歧义性。
静态语言和动态语言
静态语言在编译时检查类型错误,如C、C等;动态语言在 运行时检查类型错误,如Python、JavaScript等。
语言的表示方法
01
语言的上下文相关性
语言中的句子往往具有上下文相关性,即句子的含义和合 法性可能依赖于其所在的上下文环境。这就要求文法在描 述语言时,需要考虑到这种上下文相关性。
语言的歧义性
有些语言存在歧义现象,即同一句子可能有多种不同的解 释。这就要求文法在描述语言时,需要具有足够的精确性 和明确性,以避免产生歧义。
产生式规则中左部是非终结符,右部是终 结符和非终结符的序列,且右部中至多有 一个非终结符。
文法的表示方法
巴科斯-诺尔范式(BNF)
编译原理第三章 文法和语言
方幂:A的n次方幂就是将n个A相乘。 字母表的闭包与正闭包:
字母表A的闭包是A上的所有符号串(包括空字符串) 的集合。* 字母表A的正闭包是A上的所有的非空符号串的集合。 + 无穷集合
3.3 文法和语言的形式定义
使用3.2的术语对3.1中描述汉语句子的规 则加以形式化,然后给出文法和语言的形 式定义。 规则也称为重写规则、产生式或生成式。 规则形如或者::=的(,)有序 对,其中是某字母表V的正闭包V+中的一 个符号,是V*中的一个符号。称为规则 的左部,称为规则的右部。
3.3 文法和语言的形式定义
推导的概念:如果是文法G的规则, 和是V*中的任意符号,若有符号串v和w, 如果存在一个推导序列 定义3.2--3.4 u0=>u1 =>…=>un 并且u0=v,un=w,那么我们说v可以推导到w, 或者w规约到v。
若n=1记作v=>w,称为直接推导; 若n1记作+ => ,称为长度为n(n1)的推导; 若n0记作* => ,称为长度为n(n0)的推导;
L(G[Z])={anbn|n2}
3.4 文法和语言的分类
文法分类的原因: 对计算机科学有深刻的影响,我们在以后 的学习中将会体会到。 Chomsky文法的定义: (VN,VT,P,S)
该定义是我们前面讲的定义的一个更加形式化的表达。 在这个定义中,文法规则的左部可以是一个非空符号 串。 Chomsky文法被分为四类,我们主要用2型和3型文法。 几类文法的差异是对产生式施加不同的限制
一些基本原理、概念
形式化的方法:用一整套带有严格规定的符号体系 来描述问题的方法。
例:s=2*3.1415*r*(r+h)的非形式化描述
【考研计算机专业课】天津大学 编译原理讲义 第三章文法和语言
L(G)={anbncn|n≥1}
2型文法也称上下文无关文法,用于描述多数 现今程序设计语言的语法结构。
例,文法G =({S},{a,b},P,S) P定义为: S→aSb|ab L(G)={anbn|n≥1}
3型文法也称正则文法,由其产生的语言叫做 正规语言,即正规集。
例,文法G =({S},{0,1},P,S) P定义为: S→0S|1S|0|1 L(G)=(0|1)*
例,文法G的产生式为: E→T|E+T T→F|T*F F→(E)|i E E+T E+F E+i3 T+i3 T*F+i3 T*i2+i3 F*i2*,i3 ,i1*i2 ,i1*i2+ i3都是句型i1*i2+i3的短语。
i1 ,i2,i3 均为直接短语。
i1是句柄。
i2+i3是否句型i1*i2+i3的短语?
+ 不是,尽管有E i2+i3,但不存在从E到i1*E的推导。
3.1.2 文法的Chomsky分类
0型文法(短语结构文法):
设文法G=(VN,VT,P,S) ,其产生式形式为: α →β α ∈V*VNV* ,β ∈V*
如果对 0 型文法分别加上以下的第 i 条限制,则我们 就得到 i 型文法。 1.G的任何产生式α →β 均满足|α |<|β |,S→ε除外;
1. 文法是描述语言的语法结构的形式规则(即 语法规则)。
文法是一个四元组: G[S]=(VN,VT,P,S) VN为非终极符集合; VT为终极符集合; VN∩VT =Ф ; 一般令V= VN∪VT ,V中的符号称为文法符号; P为产生式集合; P中的每个产生式写为: α →β ;α ∈V*VNV*, β ∈V* S为开始符号。
编译原理(清华)第三章文法和语言
例 文法G: S→0S1,S→01 有直接推导: 0S1 00S11 ( S→0S1 ) 00S11 000S111 ( S→0S1 ) 000S111 00001111 ( S→01 ) S 0S1 ( S→0S1 )
推导和归约 若存在v=w0 w1 ... wn=w ,(n>0) 则称v推导出w,或w归约到v,记为v=+>w 若有v =+>w,或v=w,则记作v=*>w
2. 符号串 – 定义:由字母表中的符号组成的任何有穷序列 – 例: 0,00,10是字母表∑={0‚1}上的符号串 a,ab,aaca是Α={a‚b,c}上的符号串 – 在符号串中,符号是有顺序的,顺序不同,代 表不同的符号串,如:ab和ba不同 – 不含任何符号的符号串称为空串,用ε表示 注意:{ε}并不等于空集合{ } – 符号串长度: 符号串中含有符号的个数 如: |abc|=3 | ε|=0
3.3 文法和语言的形式定义
1.文法的定义 2.文法的简化表示法 3.推导与归约 4.句型、句子、语言的定义 5.文法的等价
1.文法的定义
产生式(规则) 产生式是一个有序对(α,β),通常写作 α→β(或α::=β ) 文法定义: 文法G(Grammar)定义为四元组(VN,VT,P,S) VN (Nonternimal):非终结符集 VT (Terminal):终结符集 P (Production): 产生式(规则)集合 S: 开始符号或识别符号
第三章
文法和语言
学习目标: 掌握:自上而下与自下而上的分析方法 理解:文法的形式定义,推导,归约,句 型,句子,语言,上下文无关文法,规范 句型,语法树,短语,直接短语,句柄 了解:文法的类型,文法使用中的限制, 文法的二义性
编译原理(第二版)第3章 文法和语法
〈动词〉::= 是 | 学习
〈直接宾语〉::=〈代词〉|〈名词〉
“我是大学生”是否是该语言的句子?
〈句子〉::=〈主语〉〈谓语〉 〈主语〉::=〈代词〉|〈名词〉 〈代词〉::= 你 | 我 | 他 〈名词〉::= 王明 | 大学生 | 工人 | 英语 〈谓语〉::=〈动词〉〈直接宾语〉 〈动词〉::= 是 | 学习 〈直接宾语〉::=〈代词〉|〈名词〉 〈句子〉
}的文法。
分析:n≧1,所以必须用递归规则。a和b的 个数 一样多,但c的个数不同,所以将生成 含 a,b的部分与生成含e的部分分开,A生成 ab,B生成e. G[Z]:Z→AB
A→aAb|ab
B→eB|ε
4)文法的等价
• 若L(G1)=L(G2),则称文法G1和G2是等价的。
如文法G1[A]:A→0R 与 G2[S]:S→0S1 等价
设 z = abc, 那么 z 的头是: ε ,a ,ab , abc(除 abc 外都是固有头) z 的尾是: ε ,c ,bc , abc(除 abc 外都是固有尾)
4、符号串的运算
符号串的长度:符号串中符号的个数.符号串s的长度 记为|s|。 ε的长度为0 符号串的连接:符号串x、y的连接,是把y的符号写在 x的符号之后得到的符号串xy 例 x=ST,y=abu 则 xy=STabu
|x|=2,|y|=3,|xy|=5
εx = xε= x
方幂:符号串x自身连接n次得到的符号串 xx…xx(n个x)定义为 xn x0=ε , x1=x, x2=xx, x3=xxx x=AB, 则 x0=ε , x1=AB, x2=ABAB, x3=ABABAB 对于 n>0, xn = xxn-1 = xn-1x
例如: 汉语的字母表中包括汉字、数字及标点符号等。 C语言的字母表是由字母、数字、若干专用符号及IF、 FOR之类的保留字组成。
编译原理课程设计之第三章上下文无关文法及分析
14
无关文法及分析
1. 上下文无关文法(即2型文法)的形式定义:
上下文无关文法是一个四元组(VT , VN , P , S):
① ②
终非结终符 结集 符合 集合VTVN(与VT产的不生左相式部交)
产生式 的右部
③ 产生式或文法规则A→α形成的集合P,
其中A∈VN,α∈(VT∪VN)* 4) 开始符号S,其中S∈VN
25
无关文法及分析
3.2 上下文无关文法的形式定义
1. 上下文无关文法(即2型文法)的形式定义 2. chomsky文法的分类 3. 推导和规约的定义 4. 句型和句子的定义 5. 最左和最右推导 6. 文法定义的语言 7. 递归产生式和递归文法 8. 文法和语言
mcy
编译原理课程设计之第三章上下文
mcy
编译原理课程设计之第三章上下文
1
无关文法及分析
第三章 上下文无关文法及分析
本章的目的是为语言的语法 描述寻求形式工具,要求该 工具对程序设计语言给出精 确无二义的语法描述。
mcy
编译原理课程设计之第三章上下文
2
无关文法及分析
第三章 上下文无关文法及分析
✓3.1 语法分析过程 ▪ 3.2 上下文无关文法的形式定义
下面的2型文法描述了包含加法、减法和乘法的简 单整型算术表达式的语法结构。
文法G[exp]:
exp → exp op exp exp →(exp) exp → number
34-3 是符合该 语法结构的简单 整型算术表达式 (句子)吗?
op → + | - | *
mcy
编译原理课程设计之第三章上下文
令G是一个如上所定义的文法,则G=(VT,VN,P,S)
编译原理第三章
例如:Σ={a,b} Σ*={ε,a,b,aa,ab,ba,bb,aaa,aab,…} + ={a,b,aa,ab,ba,bb,aaa,aab,…}
13
语言
语言:字母表上的一个语言是上的一些符号 串的集合 (上的每个语言是*的一个子集)。 例如: Σ={a,b} Σ*={ε,a,b,aa,ab,ba,bb,aaa,aab,…} 语言1:集合{ab,aabb,aaabbb,…,anbn,…}或 {w|w∈Σ*且w=anbn,n≥1}为字母表上的一 个语言。 语言2:集合{a,aa,aaa,…}或{w|w∈Σ*且 w=an,n≥1} 为字母表上的一个语言。 语言3:ε是一个语言。 语言4:即 是一个语言。 14
20
文法的定义
文法G定义为四元组(VN,VT,P,S)
VN :非终结符集 VT :终结符集 P:产生式(规则)集合 S:开始符号, S∈VN,S必须要在一条规则 的左部出现。 VN∩VT= φ 。 V=VN∪VT,称为文法G的文法符号集合
21
文法示例1
例3.1 文法G=(VN,VT,P,S) VN = { A }, VT ={ 0, 1 } P={ A→0A1, A→01 } A为文法G的开始符号 习惯上只将产生式写出。并有如下约定: 第一条产生式的左部是开始符号 用尖括号括起的是非终结符,否则为终结符。或 者大写字母表示非终结符,小写字母表示终结符 G可写成G[S],S是开始符号 例: G: A→0A1 或 G[A]: A→0A1 A→01 A→01
4
预备知识 -----文法的直观概念
<句子>::=<主语><谓语> <主语>::=<代词>|<名词> <代词>::=我|你|他 <名词>::=王明|大学生|工人|英语 <谓语>::=<动词><直接宾语> <动词>::=是|学习 <直接宾语>::=<代词>|<名词>
编译原理 第三章 文法和语言
8
3.2 符号和符号串
四. 符号串集合(语言)的运算
设L和M是两个符号串集合,则 1.合并:L∪M={s|s∈L or s∈M} 2.连接:LM={ st|s∈L and t∈M} 3.方幂: L0={ε}, L1=L, L2=LL, ..., Ln=Ln-1L 4. 语言L的闭包,记作L*, L*=∪Li(i>=0) =L0∪L1∪L2∪L3 ∪… 5.语言L的正闭包,记作L+(L+=L L*) L+=∪Li(i >=1) =L1∪L2∪L3∪L4∪…
16
推导的定义
例: <程序><分程序>. (<程序> → <分程序>. ) <分程序>. <变量说明部分> <语句>. (<分程序> → <变量说明部分> <语句>) VAR<标识符>;BEGIN READ(<标识符>)END. VAR A;BEGIN READ(<标识符> ) END. (<标识符> →A) VAR A;BEGIN READ(<标识符> ) END. VAR A;BEGIN READ( A) END. (<标识符> →A)
22
文法G[S]: 例 文法 : (1)S→aSBE ) → (2)S→aBE ) → (3)EB→BE ) → (4)aB→ab ) → (5)bB→bb ) → (6)bE→be ) → (7)eE→ee ) → L(G)={ anbnen | n≥1 } ≥ G生成的每个串都在 生成的每个串都在L(G)中 生成的每个串都在 中 L(G)中的每个串确实能被 生成 中的每个串确实能被G生成 中的每个串确实能被 分析参见课本P37. 分析参见课本P37.
编译原理第三章
一个句子的表示:羊吃草 <句子> => <主语><谓语> => <名词><谓语> => 羊<谓语> => 羊<动词><直接宾语> => 羊吃<直接宾语> => 羊吃<名词> => 羊吃草 利用上述的规则,可以生成很多句子:“马吃 草”,“他喂马”等,而“羊草吃”不符合上述 规则,不是句子。这些规则称为我们判别句子结 构是否合法的依据,换句话说,这些规则看成是 一种源语言,用来描述汉语。这里仅仅涉及汉语 句子的描述。其中一种描述源语言称为文法。 “草吃羊”也是上述规则生成的一个合法的句子,
第3章 文法和语言 教学要求: 1、掌握:文法的概念,语言的定义, 符号串,文法的形式定义,0型文法, 1型文法,2型文法,3型文法 2、理解:自上而下与自下而上的分析 方法 3、了解:上下文无关文法的ε 规则
预备知识 1、一个程序设计语言是一个记号系统, 其完整定义应包括语法和语义两个方面 2、语法是一组规则,用它可以形成和产 生一个合法的程序,定义什么样的符号 序列是合法的,与符号的含义无关 3、语义是一组规则,定义程序语言的含义 如类型匹配,变量作用域等
编译原理文法和语言
为什么对符号、符号串、符号串集合 以及它们的运算感兴趣?
若A为某语言的基本字符集 A={a,b,……z,0,1,……,9, +,-,×,_/, ( , ), =……} B为单词集 B ={begin, end, if, then, …,<标识符>,<常量>,……} 则B A* 。
语言的句子是定义在B上的符号串。
§3.2
文法和语言的形式定义
三、推导和归约
2. 推导/归约
若存在直接推导序列 v w0 w1 ... wn=w,(n>0) + 则记为v w,称v推导出(产生)w,或w归
约到v。 如果v w,或v w,则记作v w 。
+
*
§3.2
文法和语言的形式定义
三、推导和归约
2. 推导/归约 例: S 0S1 00S11 000S111 00001111
编译原理
第三章
文法和语言
§3.1 符号和符号串 §3.2 文法和语言的形式定义 §3.3 文法的分类 §3.4 语法树和二义性
§3.5 有关文法的实用限制
程序设计语言和自然语言的组成结构
语 言 的 组 成 语程 言序 设 计
语言: 句子: 单词: 编程语言 语句: 单词:
句子的集合 多个单词按一定规则组成 多个字符按一定规则组成 程序的语句集合 多个单词按语法规则组成 多个字符按词法规则组成
§3.2
文法和语言的形式定义
四 、句型、句子和语言
1. 句型 有文法G[S],若S x,则称x是文法G的句型。 2. 句子 对文法G[S],若S x,且x∈VT*,则称x是文 法G的句子。 例:G[S]: S→0S1, S→01 S 0S1 00S11 000S111 00001111 G的句型S,0S1 ,00S11 ,000S111,00001111等 G的句子00001111, 01等
编译原理文法和语言
<谓语>::=<动词><直接宾语>
<动词>::=是|学习
<直接宾语>::=<代词>|<名词>
§3.2 文法和语言的形式定义
一、文法的直观理解
3.由产生式推导句子 推导方法:从一个要识别的符号开始推导,
即用相应产生式的右部来替代产生式的左部, 每次仅用一条产生式去进行推导。
例:给定一组语法规则,考察一个句子: “我是大学生”的推导过程。
§3.2 文法和语言的形式定义
三、推导和归约
1.直接推导/直接归约
如α→β是文法G的产生式,γ和δ∈V*, 若有 v,w满足:v=γαδ,w= γβδ, 其中 则称v直接推导到 w,也称w直接归约到v,记作 v w
例2:文法G[S]: S→0S1, S→01 若v=S,w=0S1, 有直接推导S0S1
§3.2 文法和语言的形式定义
四 、句型、句子和语言
3. 语言
文法G生成的语言记为L(G),它是文法G 的一切句子的集合:
L(G)={x|S * x,且x ∈VT*}
例:G[S]: S→0S1, S→01 S 0S1 00S11 0n-1S1n-1 0n1n L(G)={0n1n|n≥1}
§3.2 文法和语言的形式定义
<谓语>
<代词> 我
<动词> 是
<直接宾语> <代词>
大学生
§3.2 文法和语言的形式定义
二、文法的形式定义
其中: ① 非终结符号:出现在
定义: 文法G[S]定义为一个四元产能组生推,式出的符左号部或或符右号部串,,且
VN :G[非S]终=(结V符N,号V集T,P,S)用分②来。终表结示 符语号言:的不语出法现成在
编译原理语法1(文法和语言)
3.1 文法和语言
3.1.1 文法和语言的基本概念 – 2、文法 (定义) • 文法通常表示成四元组G[S] = (VT,VN,S,ξ): (1) VT为终结符号集,这是一个非空有限集,它的每个元素 称为终结符号。 (2) VN为非终结符号集,它也是一个非空有限集,其每个元 素称为非终结符号,且有VT∩VN = Φ; (3) S为文法开始符,是一个特殊的非终结符号,即S∈VN;
语法分析: 定位
– 语法分析是编译过程的第二个阶段,也是核心部分
任务 – 根据语言的语法规则对单词序列进行语法分析,识别合法的 语法单位(如表达式、语句、程序段等),若不存在语法错 误则给出正确的语法结构 – 理论依据:上下文无关文法
方法 – 自顶向下分析(推导:开始符号 句子) – 自底向上分析(规约:句子 开始符号)
3.1 文法和语言
3.1.2 形式语言分类
– 1、0型文法与0型语言
如果文法G[S]的每一个产生式具有下列形式:
α→β
其中,α∈V*VNV* (注:V = VN∪VT),即至少含有一个非终 结符;β∈V*;则称文法G[S]为0型文法或短语文法,记为
PSG(Phrase Structure Grammar)。0型文法相应的语言称为0型
VT ={+ * ( ) i} VN = {E, T, F} S =E ξ 为以下产生式的集合:
E→E + T | T
T→T * F | F
F→ (E)|i
VT ={+ * ( ) i} VN = {E} S =E
ξ:
E→i| E+E| E*E |(E)
两种文法都可以识别包含加和乘运算的表达式,它们的区 别将在后面的课程中讲解
编译原理第三章文法和语言
符号串集合:若集合A中的一切元素都是 某字母表上的符号串,则称A为字母表上 的符号串集合。
2019/4/9
19
两个符号串集合A和B的乘积(连接): AB={| A且 B} 注:1)串集的自身乘积称作串集的方幂 2)A0={ɛ}
,w=abc5,直接推导:abc<数字> abc5, 使用的规则:<数字> →5,这里γ=abc,δ=ε
v=abc<数字>
2019/4/9 37
定义3.3
如果存在直接推导的序列: v w0 w1 ... wn=w (n>0) 则称v 推导出(产生)w(推导长度为n), 或称w归约到v。记作v w 定义3.4 若有v w,或v=w, * 则记为v w
2019/4/9
35
对于例3.1的文法G:S→0S1,S→01 ,可以给 出直接推导的一些例子如下: v=0S1,w=0011,直接推导:0S1 0011, 使用的规则:S→01,这里=0,=1。 v=S,w=0S1,直接推导:S 0S1,使用的 规则:S→0S1,这里=,= v=0S1,w=00S11,直接推导:0S1 00S11 ,使用的规则:S→0S1,这里=0,=1。
2019/4/9 40
定义3.6 由文法G所产生的语言记为L(G), 它是文法G的一切句子的集合: * L(G)={x|S x,其中S为文法的开始符号, 且 x ∈ V T *} 例:G: S→0S1, S→01 L(G)={0n1n|n≥1}
2019/4/9
41
例3.3 文法G[S]: (1)S→aSBE (2)S→aBE (3)EB→BE (4)aB→ab (5)bB→bb (6)bE→be (7)eE→ee
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
或者:允许0开头的非负整数?
第3题
为只包含数字、加号和减号的表达式,例如9-2+5,3-1,7等构造一个文法。
答案:
G[S]:
S->S+D|S-D|D
D->0|1|2|3|4|5|6|7|8|9
第4题
已知文法G[Z]:
Z→aZb|ab
第11题
令文法G[E]为:
E→T|E+T|E-T
T→F|T*F|T/F
F→(E)|i
证明E+T*F是它的一个句型,指出这个句型的所有短语、直接短语和句柄。
答案:
此句型对应语法树如右,故为此文法一个句型。
或者:因为存在推导序列:E=>E+T=>E+T*F,所
以E+T*F句型
此句型相对于E的短语有:E+T*F;相对于T的短语
有T*F
直接短语为:T*F
句柄为:T*F
第13题
一个上下文无关文法生成句子abbaa的推导树如下:
(1)给出串abbaa最左推导、最右推导。
(2)该文法的产生式集合P可能有哪些元素?
(3)找出该句子的所有短语、直接短语、句柄。
B
a
S
A B S
a
S B A
εb b a
答案:
(1)串abbaa最左推导:
答案:
(1)
S→AA
A→aAb|ε
(2)
S→1S0|A
A→0A1|ε
(3)
S→0S0|1S1|ε
第16题
给出生成下述语言的三型文法:
(1){an|n>=0}
(2){anbm|n,m>=1}
(3){anbmck|n,m,k>=0}
答案:
〈表达式〉〈运算符〉〈表达式〉〈运算符〉〈表达式〉
〈表达式〉〈运算符〉〈表达式〉〈运算符〉a
〈表达式〉〈运算符〉〈表达式〉*a
〈表达式〉〈运算符〉a*a
〈表达式〉+a*a
a+a*a
第8题
文法ab
B→bc
该文法是否为二义的?为什么?
答案:
对于串abc
(1)S=>Ac=>abc(2)S=>aB=>abc
S=>SS*=>SS*=>Sa*=>SS+a*=>Sa+a*=>aa+a*
(2)该文法生成的语言是:*和+的后缀表达式,即逆波兰式。
S
A c
a b
S
a B
b c
S
S S*
S S+a
a a
第10题
文法S→S(S)S|ε
(1)生成的语言是什么?
(2)该文法是二义的吗?说明理由。
答案:
(1)嵌套的括号
(2)是二义的,因为对于()()可以构造两棵不同的语法树。
=><表达式>+(<因子>+i)
=><表达式>+(i+i)
=><项>+(i+i)
=><因子>+(i+i)
=>i+(i+i)
(6)<表达式>
=><表达式>+<项>
=><表达式>+<项>*<因子>
=><表达式>+<项>*i
=><表达式>+<因子>*i
=><表达式>+i*i
=><项>+i*i
=><因子>+i*i
第3章文法和语言
第1题
文法G=({A,B,S},{a,b,c},P,S)其中P为:
S→Ac|aB
A→ab
B→bc
写出L(G[S])的全部元素。
答案:
L(G[S])={abc}
第2题
文法G[N]为:
N→D|ND
D→0|1|2|3|4|5|6|7|8|9
G[N]的语言是什么?
答案:
G[N]的语言是V+。V={0,1,2,3,4,5,6,7,8,9}
S=>ABS=>aBS=>aSBBS=>aBBS=>abBS=>abbS=>abbAa=>abbaa
最右推导:
S=>ABS=>ABAa=>ABaa=>ASBBaa=>ASBbaa=>ASbbaa=>Abbaa=>abbaa
(2)产生式有:S→ABS|Aa|εA→a B→SBB|b
可能元素有:εaa ab abbaa aaabbaa……
(3)该句子的短语有:
a是相对A的短语
ε是相对S的短语
b是相对B的短语
εbb是相对B的短语
aa是相对S的短语
aεbbaa是相对S的短语
直接短语有:aεb
句柄是:a
第14题
给出生成下述语言的上下文无关文法:
(1){anbnambm|n,m>=0}
(2){1n0m 1m0n|n,m>=0}
(3){WaWr|W属于{0|a}*,Wr表示W的逆}
N→D|1|3|5|7|9
D→0|2|4|6|8
(2)不允许0开头的偶正整数集合的文法
E→NT|D
T→FT|G
N→D|1|3|5|7|9
D→2|4|6|8
F→N|0
G→D|0
第6题
已知文法G:
<表达式>::=<项>|<表达式>+<项>
<项>::=<因子>|<项>*<因子>
<因子>::=(<表达式>)|i
=>i+i*i
<表达式>
<表达式>+<项>
<因子>
<表达式>
<表达式>+<项>
<因子>
i
<项>
<因子>
i
<项>
<因子>
i
()
<表达式>
<表达式>+<项>
<项>*<因子>
<因子>i
<项>
<因子>
i
i
第7题
证明下述文法G[〈表达式〉]是二义的。
〈表达式〉∷=a|(〈表达式〉)|〈表达式〉〈运算符〉〈表达式〉
试给出下述表达式的推导及语法树。
(5)i+(i+i)
(6)i+i*i
答案:
(5)<表达式>
=><表达式>+<项>
=><表达式>+<因子>
=><表达式>+(<表达式>)
=><表达式>+(<表达式>+<项>)
=><表达式>+(<表达式>+<因子>)
=><表达式>+(<表达式>+i)
=><表达式>+(<项>+i)
即存在两不同的最右推导。所以,该文法是二义的。
或者:
对输入字符串abc,能构造两棵不同的语法树,所以它是二义的。
第9题
考虑下面上下文无关文法:
S→SS*|SS+|a
(1)表明通过此文法如何生成串aa+a*,并为该串构造语法树。
(2)G[S]的语言是什么?
答案:
(1)此文法生成串aa+a*的最右推导如下
写出L(G[Z])的全部元素。
答案:
Z=>aZb=>aaZbb=>aaa..Z...bbb=>aaa..ab...bbb
L(G[Z])={anbn|n>=1}
第5题
写一文法,使其语言是偶正整数的集合。要求:
(1)允许0打头;
(2)不允许0打头。
答案:
(1)允许0开头的偶正整数集合的文法
E→NT|D
T→NT|D
〈运算符〉∷=+|-|*|/
答案:
可为句子a+a*a构造两个不同的最右推导:
最右推导1〈表达式〉〈表达式〉〈运算符〉〈表达式〉
〈表达式〉〈运算符〉a
〈表达式〉*a
〈表达式〉〈运算符〉〈表达式〉*a
〈表达式〉〈运算符〉a*a
〈表达式〉+a*a
a+a*a
最右推导2〈表达式〉〈表达式〉〈运算符〉〈表达式〉