形式语言学ch5

合集下载

形式语言学_Ch8_上下文无关语言的性质

形式语言学_Ch8_上下文无关语言的性质

8.1 上下文无关语言的泵引理
证明要点:
(1)用CNF作为CFL的描述工具。
(2)对于任意的z∈L,|≤2k-1成立。
( 3 )仅当 z 的语法树呈图 8-1 所示的满二 元树时,才有 |z|=2k-1,其他时候均有|z|<2k-1。
(4) 取N=2|V|=2|V|+1-1,z∈L,|z|≥N。
CFL也有类似性质?
8.1 上下文无关语言的泵引理
CFL的自嵌套特性:如果L是一个CFL,CFG G=(V, T, P,S) 是产生 L的文法。当 L是一个无穷语言时,必存在 w∈L, A∈V,α,β∈(V∪T) *,且 α 和 β中至少有一个不
为ε,使得如下派生成立
S* γAδ+γαAβδ+ z
uviwxiy=aN+(i-1)hbN+(i-1)fcNdNL
i≠1成立。 由泵引理,L不是CFL。

8.1 上下文无关语言的泵引理
L={anbmck|n≠m, m≠k,k≠n} 是CFL么?
取z=aNbN+ncN+m其中,n≠m, n≠0,m≠0。
只能让v或者x由若干个a组成,才有可能随着i的变化,
L1 L2 L1 L2 L1 L2
8.2 CFL的封闭性
定理8-3 CFL与RL的交是CFL。
证明: (1)构造
设PDA M1=(Q1,∑,Γ,δ1,q01,Z0,F1)
DFA M2=(Q2,∑,δ2,q02,F2)
L1=L(M1)
L2=L(M2)
8.2 CFL的封闭性
取PDA M=(Q1×Q2,∑,Γ,δ,[q01,q02],Z0,F1×F2)
8.1 上下文无关语言的泵引理

第2章形式语言概论

第2章形式语言概论
G=(VN,VT,P,S) 其中: VN={I, L, D} VT={a,b,c, … x,y,z,0,1,2,…
,P9=}{ I→L| I L| I D L→a | b | c | … | x | y | z D→0 | 1 | 2 | 3 | … | 9
S=I }
文法的形式定义
若将定义标识符的文法设计成: G=(VN,VT,P,S )
1. 字母表 元素的非空有穷集合。 例如,∑={ a, b, c } 根据字母表的定义,Σ是字母表,
它由a、b、c三个元素组成。
字母表和符号串
注意: (1) 字母表中至少包含一个元素。 (2) 字母表中的元素, 可以是字母、 数字或其他符号。 例如,∑' ={0, 1} 是一个字母表,由0、1两个元素 组成。
第2章 形式语言概论
形式语言理论是编译的重要理论 基础。本章主要介绍编译理论中用到 的有关形式语言理论的最基本概念, 重点介绍如何采用形式化的方法描述 程序设计语言。
第2章 形式语言概论
字母表和符号串 文法和语言的形式定义 文法和语言的分类 短语、直接短语和句柄 语法树和文法的二义性
概述
当n=1 L={aa, bb} L={a2n, b2n | n≥1}
当n=2 L={aaaa, bbbb} 当n=3 L={aaaaaa, bbbbbb}
…… L={aa, bb, aaaa, bbbb, aaaaaa, bbbbbb, … …} 即语言L是由偶数个a,偶数个b这样的 符号串组成的集合。
幂运算定义为:
A0={} A1=A A2=AA
… An= AA … A=AAn-1(n>0)
n
符号串的运算
例如,设A={ a, b },则 A0={} A1=A={ a, b } A2=AA={ aa, ab, ba, bb } A3=AAA=A2A

形式语言学_Ch1_基础知识

形式语言学_Ch1_基础知识

A∪B={a|a∈A或者a∈B}
n
A1∪A2∪…∪An={a|i,1≤i≤n,使得a∈Ai} i1 Ai
A1∪A2∪…∪An ∪…={a|i,i∈N,使得a∈Ai} Ai i 1
当一个集合中的元素都是集合时,我们将这样的集合称为 集族. 设S是一个集族,则S中的所有元素的并为
A {a | A S, a A}
本专业人员4种基本的专业能力 计算思维能力 算法的设计与分析能力 程序设计和实现能力 计算机软硬件系统的认知、分析、设计与应用能力
计算思维能力 逻辑思维能力和抽象思维能力 构造模型对问题进行形式化描述 理解和处理形式模型
课程目的和基本要求
知识 掌握正则语言、上下文无关语言的文法、识别模型及 其基本性质、图灵机的基本知识。
形式语言与自动机理论的产生与作用
语言学家乔姆斯基,最初从产生语言的角度研究语言。 1956年,他将语言L定义为
一个字母表∩中的字母组成的一些串的集合: L∩*。 字母表上按照一定的规则定义一个文法(grammar), 该文法所能产生的所有句子组成的集合就是该文法产 生的语言。
形式语言与自动机理论的产生与作用
A-B={a|a∈A且aB} ‚-‛为减(差)运算符,A-B读作A减B
⑴ A-A=Φ ⑵ A-Φ=A
⑶ A-B ≠ B-A
⑷ A-B=A iff A∩B=Φ
⑸ A∩(B-C)=(A∩B)-(A∩C) ⑹ |A-B|≤|A|
对称差(symmetric difference)
属于A但不属于B,属于B但不属于A的所有元素组成的集合 叫A与B的对称差,记作A⊕B
1951年到1956年间,克林(Kleene) 在研究神经细胞中, 从识别的角度,建立了识别语言的系统——有穷状态自 动机。 1959年,乔姆斯基发现文法和自动机分别从生成和识别 的角度去表达语言,而且证明了文法与自动机的等价性, 这一成果被认为是将形式语言臵于了数学的光芒之下, 使得形式语言真正诞生了。

形式语言学和功能语言学 英语

形式语言学和功能语言学 英语

形式语言学和功能语言学英语English:Formal language study and functional language study are two different approaches to understanding and analyzing language. Formal language study focuses on the structure, form, and rules of a language, including grammar, syntax, and phonetics. It aims to understand the internal logic of a language and how it is constructed. On the other hand, functional language study focuses on the use of language in context, including its social, cultural, and communicative functions. It aims to understand how language is used to convey meaning, achieve communicative goals, and express social identity. Both approaches are important for a comprehensive understanding of language, as they provide different perspectives and insights into the nature and use of language.中文翻译:形式语言学和功能语言学是理解和分析语言的两种不同方法。

语言学Chapter 5

语言学Chapter 5

Collocative meaning搭配意义
It refers to the associations a word acquires on account of its mutual expectancy with some other words which tend to occur in its environment. Example: pretty and handsome pretty {girl, boy, woman, flower, etc.} handsome {boy, man, car, vessel, etc.} cows may wander, but may not stroll. one trembles with fear, but quiver with excitement.
Social/stylistic meaning社会/文体意 义
It refers to what language conveys about the social circumstances of its use. It relates to people’s recognition of different dimensions and levels of style with the same language steed (poetic) residence (formal) horse (general) abode (poetic) nag (slang) home (general) gee-gee (baby language) domicile (very formal, official)
thereferentialtheory?古希腊哲学家柏拉图认为语言形式是语言中的一个词语义是它所代表所指示所表示的世界上的实体指称referent

第5讲 形式语言理论(2012)

第5讲 形式语言理论(2012)

无法区分诸如“old
man and woman”的语
言歧义 无法产生如 abab, aabaab这样的句子
用什么语法描述自然语言
2型文法---上下文无关文法
能够担负描写自然语言的重任
• •

1.能处理具有嵌进结构的句子 2.能生成abab, aabbaabb这样的句子 3.可以判断有歧义句子的结构
但生成一切自然语言的句子是有困难的,
如:大姐、二姐、三姐分别是二十、十八 和六十岁。 P40
用什么语法描述自然语言—总结
正则语法描述能力太弱、上下文有关语法计 算复杂度太高,上下文无关语法使用最为普 遍 从描述能力上说,上下文无关语法不足以描 述自然语言——自然语言中上下文相关的情 况非常常见 从计算复杂度来说,上下文无关语法的复杂 度是多项式的,其复杂度可以忍受 为弥补上下文无关语法描述能力的不足,需 要加上一些其他手段扩充其描述能力

其中 VN={S,A,B,C}, VT={a,b,c} P由下列规则组成:

例:G2=<VN,VT,P,S>

(1)S→ABC (4)B→Bb
(2)A→aA (5)B→b
(3) A→a

特点:与1型文法相比,多出的限制是u和v必须是 “空”的(因为规则的左边必须是非终结符),即非终 结语符的改写不受它出现的语境制约。
0型文法--例
例:G=<VN,VT,P,S>
其中 VN={S,D}, VT={0,1,2,3,…,9} P={S→D|SD D→0|1|2|3|4|5|6|7|8|9}
该文法将产生所有非负整数
解析:
S->D;
S->SD->DD; S->SD->SDD->DDD…

形式语言学_Ch9_图灵机导引

形式语言学_Ch9_图灵机导引

9.1.1 基本TM
例 9-1 设M1=({q0, q1, q2},{0, 1},{0, 1, B},δ,q0 , B ,{q2}),
其中δ的定义如下,对于此定义,也可以用表表示。
δ(q0, 0)= (q0, 0, R) δ(q0, 1)= (q1, 1, R) δ(q1, 0)= (q1, 0, R) δ(q1, B)= (q2, B, R) 0 1 B (q2, B, R)
function)。 δ(q , X)=(p , Y, R)表示M在状态q读入符号X,将状态改
为p,并在这个X所在的带方格中印刷符号Y,然后将读 头向右移一格; δ(q , X)=(p , Y , L)表示M在状态q读入符号X,将状态改 为p,并在这个X所在的带方格中印刷符号Y,然后将读 头向左移一格。
状态q0启动,读头正注视着输入带最左端的符号;
9.1.1 基本TM
FQ,是M的终止状态集,q∈F,q为M的一个终止状
态。与FA和PDA不同,一般地,一旦M进入终止状态, 它就停止运行。 Γ 为带符号表 (tape symbol),X∈Γ,X为M的一个带符
号,表示在 M的运行过程中, X 可以在某一时刻出现在 输入带上;
列如下: q01001100101100├ 1q1001100101100
├ 10 q101100101100├ 100q11100101100 ├ 1001 q2100101100├10011q300101100
M2遇到第三个1时,进入终止状态q3,输入串的后缀
00101100还没有被处理。但是,由于M2已经进入终止状 态,表示符号串1001100101100被M2接受
形式语言学
Introduction to Form

形式语言简介.ppt

形式语言简介.ppt
这是形式语言所研究的问题。
接收一个语言,目的就是使用某种自 动机模型来接收句子,该模型所接收 的所有句子,也形成一个语言。
这是自动机所研究的问题。
本章介绍形式语言的基本内容。
语言的形式定义
设是一个字母表, L*, L称为字母表上的一个语言, wL, w称为语言L的一个句子。
2.1 例子语言
A→+|-|*|/
+、-、*、/ 称为A的侯选式。
E→ i E→EAE E→(E) 也可以记为: E→ i|EAE|(E)
注意:
这组产生式 没有表示出运算符的优先级。
表示出运算符的优先级的产生式: E→E+T|E-T|T T→T*F|T/F|F F→(E)|i
其中: E代表表达式,T代表项,F代表因子 (E)代表的是带小括号的表达式。 表示:先算因子,再*、/,最后+、-。
规则(的个数)是有限的,但可以产生无 限个句子和长度无限的句子;
因为规则是递归的。
BNF的描述方式
巴科斯和诺尔采用的巴科斯-诺尔范式(BNF-Backus-Naur Form)描述规则:
<括号匹配串>::= ( )
<括号匹配串>::=(<括号匹配串>) <括号匹配串>::= <括号匹配串> <括号匹配串>
S称为非终结符,在推导过程中,可以被 代替的符号。
(和)称为终结符,在推导过程中,不可以 被代替的符号。
→ 是产生式系统的元符号,不属于非终 结符,也不属于非终结符。
例2-1:由偶数个0组成的串的语言。 规则的自然语言描述方式:
①00是该语言的基本的句子; ②若S是句子,则00S是句子。
形式化的描述方式: S→00 S→00S

10形式语言学诸理论

10形式语言学诸理论

五,范畴理论
有些领属词组造成句法结构的复杂变化:得字句 "得"后是主谓词组 他哭得眼睛都肿了——哭得他眼睛都肿了 他把几个孩子吓得脸都白了——他吓得几个孩子脸 都白了 他搬书搬得满头是汗——搬书搬得他满头是汗 她哭得我们也伤心了——*哭得她我们也伤心了 她讲这故事讲得大家都烦了——*讲这故事讲得她大 家都烦了 复句的部分承前启后 你要想知道梨子的滋味,你就得亲口尝一尝e. 反动派的样子是可怕的,e实际上并没有什么了不起 的力量.
三,约束理论
"统治原则""X统治Y,当且仅当X从属于 Y所属的第一个有分叉的节点,而X和Y互 不从属",也就是在句法结构"树形图" 中,一个节点可以"统治"其平级节点和 平级以下的节点,但"不统治"其上级节 点和本身下级节点. "约束原则":A"照应词"B"代名 词"C"指称词"
四,指向理论
五,范畴理论
有些领属词组造成句法结构的特殊变化:结构 歧义 他拔了一颗牙——他拔了(病人)一颗牙—— (医生)拔了他一颗牙 他修好了自行车. 拉住孩子的手,咬死猎人的狗,剃头的
二,移位理论
其实,这个限制是有问题的,汉语中如果 连续修饰成分不是指人名词,左侧的成分 就有可能分段移出:a.他只看过《红楼梦》 前20回. b.《红楼梦》他只看过前20回. 有时还可以移出右侧的中心语成分: a.你最好买新鲜点的蔬菜. b.蔬菜你最好买新鲜点的.
二,移位理论
四是主语从句结构限制:由一个句子结构做主语时,这个结构 中的任何成分都不能移出来. That you raised this suggestion is unsuitable.(你提这个建议 不合适) *The suggestion that you raised t is unsuitable. S' NP S NP 其实,这个限制是有问题的,汉语中"主语从句结构"的成分 有时可以移出来: a.他说这种话恐怕不合适. 他去北京恐怕不合适. b.这种话他说恐怕不合适. 北京他去恐怕不合适.

形式语言学阶段

形式语言学阶段

六个阶段
• 第四阶段是“修正的扩展的标准理论”,以1977年出版的《关于形 “修正的扩展的标准理论” 《 式和解释的论文集》为代表, 式和解释的论文集》为代表,1972年的主要变化在于表层结构对语义 解释也起一定的作用,而在1977年的理论中,语义解释则被全部放到 了表层。此外,这一阶段还提出了“虚迹”的理论。 第五阶段是从1980年到 从 年到1986年,以《约束论》与《管辖和约束演讲 年 约束论》 年到 为代表。 集》为代表。这本书是根据乔姆斯基1979年在意大利比萨的一次学术 会议上提出的“支配”和“约束”理论整理成的。这一阶段的理论有 两个重大变化:一是在原来的规则系统之外增加了原则系统,二是提 出了“虚范畴”。目前,支配和约束理论仍然处于不断的修正和发展 中。 • 第六阶段是1990年以来的最简方案,乔氏认为人类语言是受共同的原 年以来的最简方案, 年以来的最简方案 则支配的,从儿童语言习得看,变异的参数应该是有限的。在这一阶 段,明确把句法分为词库和计算系统两大部分,并把参数变异限制在 词库部分。而词库只有两个方面:一是意义与声音结合的方式是约定 俗成的;二是词库常规意义的形态特征。
六个阶段
• 第一阶段是“古典理论”时期,从1957年到1965年,《句法结构》 “古典理论”时期, 《句法结构》 是这个时期的代表作, 是这个时期的代表作,有重要影响的理论有短语结构规则、转换规则 以及语素音位规则。古典理论最显著的一个特点就是主张语法自主, 把语义排除在语法之外,在这一点上与此前流行的结构语言学的理论 是一致的。 第二阶段是“标准理论”时期,从1965年到1972年,代表作是《句 代表作是《 “标准理论”时期, 代表作是 法理论要略》 法理论要略》,其语法包括四部分规则,即基础部分、转换部分、语 义部分和语音部分。标准理论中最引人注目的修正是把语义纳入到语 法中来,提出语法结构有深层和表层之别,深层结构决定语义,他通 过转换规则而转化为表层结构。这一修正使它跟古典理论有了原则区 别。 • 第三阶段是“扩展的标准理论”时期,从1972年到1980年,1972年 “扩展的标准理论”时期, 出版的《深层结构、表层结构和语义解释》标志着这一时期的开始, 《深层结构、表层结构和语义解释》 这一阶段,乔氏认为表层结构对意义也有一定的作用。

形式科学 语言学

形式科学 语言学

形式科学语言学形式科学语言学是一门研究语言结构、语法、语义等方面的学科,以形式语言为主要研究对象。

形式语言是指一种被定义为有限组规则形式的字符串的集合,通常用来表示人工语言和计算机语言等形式化语言。

形式科学语言学主要运用各种数学工具和方法,以及计算机技术来研究语言的结构,规律和特性,从而更好地理解和应用语言。

形式科学语言学的历史可以追溯到20世纪初的逻辑学和数学。

著名的逻辑学家、哲学家弗雷格和罗素在《数学原理》一书中将语言视为一个逻辑系统,并提出了形式化符号逻辑。

后来,另一位逻辑学家高德尔在其着名的著作《哥德尔不完备定理》中旨在证明数学中的不完备性问题。

这些经典的学术研究为形式科学语言学的发展奠定了重要基础。

随着计算机技术的发展,形式科学语言学也逐渐成为计算语言学的一个分支。

计算语言学旨在利用计算机技术来分析和生成人类语言及其结构的方式。

在这个领域,形式科学语言学的应用广泛,它被用于自然语言处理、机器翻译、语音识别、文本自动分类和信息检索等方面。

形式科学语言学的主要研究方向包括形式语言、语法、语义、自然语言处理和计算语言学等。

在形式语言方面,形式科学语言学主要关注的是如何定义一个文法并利用该文法来生成一个语言的所有句子。

形式语言通常是人工构造的一种语言,具有严格定义的句法规则和语义解释。

在语法方面,形式科学语言学主要研究语言的句法结构,包括句子的成分和句式,以及它们的功能和关系。

语言的语法规则被描述为一种形式化的推导系统,用于定义一种语言中正确的句子的建立和排除错误的句子。

在语义方面,形式科学语言学主要研究语言的意义和解释,包括形式化语义学和计算语义学。

形式化语义学主要研究语言的含义是如何从句子的词汇和句法中推导出来的。

而计算语义学则更关注语义信息的计算方式,以及如何将其应用于自然语言处理和语音识别等计算任务中。

在自然语言处理方面,形式科学语言学主要研究如何利用计算机技术来处理语言数据,实现机器自然语言的理解和生成。

新编简明英语语言学教程ch5PPT课件

新编简明英语语言学教程ch5PPT课件
The contextualist view of meaning is based on the presumption that one can derive meaning from or reduce meaning to observable contexts. Two kinds of context arc recognized: the situational context and the linguistic context.
The inherent meaning of the linguistic form. It is the collection of all the features of the linguistic form; It’s abstract and de-contextualized. It’s the aspect of meaning dictionary compilers are interested in. It is concerned with the intralinguistic relations.
Jill
Jack
S_________r--------s_________R
When Jill sees an apple and wants to have it, she has a physical Stimulus, ….
5.3 Lexical meaning
5.3.1 Sense and reference Sense
i. Dialectal synonyms — synonyms used in different regional dialects
British English autumn lift luggage lorry petrol flat windscreen torch

新编简明英语语言学教程ch5

新编简明英语语言学教程ch5
by WU Gengtang 广东技术师范学院 2011年 Copy Left
Synonymy
the sameness or close similarity of meaning
i. Dialectal synonyms — synonyms used in different regional dialects
a view of the nature of the meaning and reference of proper names generally attributed to Gottlob Frege and Bertrand Russell. The theory consists essentially in the idea that the meanings (semantic contents) of names are identical to the descriptions associated with them by speakers, while their referents are determined to be the objects that satisfy these descriptions.
② Complementary antonymy
It is characterized by the feature that the denial of one member of the pair implies the assertion of the other and the assertion of one means the denial of the other.
by WU Gengtang 广东技术师范学院 2011年 Copy Left

ch5课件

ch5课件

5. 1. 1. Concept

the meaning triangle
concept/idea
train /trein/
reference
5.1.2 Concept

It is universal to all men alike regardless of culture, race, language and so on, whereas meaning belongs to language, so is restricted to language use.
5.2 Motivation


Nevertheless, English does have words whose meanings can be reasonably explained to a certain extent. There are mainly four types of motivation.
5. 2. 2. Morphological Motivation

BUT blackmail ≠ mail black in colour 讹诈
greenhand ≠ hand green in colour 新手


Words like these are structurally opaque. They are morphologically non-motivated.



Every word that has meaning has sense, but not reference. probable, nearly, and, if, but, yes (no reference, but each has some sense) pavement—sidewalk pal—chum

形式语言理论

形式语言理论

特点
形式语言与自然语言有两个重要的区别。形式语言的界限是明确的,而自然语言的界限往往不明确。因为自 然语言有许多方言和习惯用法,而且处于不断发展之中。其次,自然语言不管如何庞大,它总是有限的。形式语 言则以无限的语言为主要研究对象。例如,所有由n个ɑ构成的字(n≥1)组成一个语言Lɑ={ɑ,ɑɑ,ɑɑɑ,…},它 就是无限的。因此,研究形式语言遇到的第一问题就是描述问题。描述的手段必须是严格的,而且必须能以有限 的手段描述无限的语言。
上述定义的4种语言类具有依次包含关系,即对于i=0,1,2,在不考虑空字符串时,i型语言都真包含i+1型 语言。
变换文法描述
周期时控文法乔姆斯基用变换文法作为形式语言的描述手段。例如,语言Lɑ可用如下的变换文法描 述:{S→ɑ,S→ɑS}。这个文法由两条变换规则组成。每一步变换(也叫推导)都用一条变换规则的右部替换它的 左部。S是出发点,代表Lɑ中任何一个可能的句子。例如,句子ɑɑɑɑɑ可以这样推导出来: S→ɑS→ɑɑS→ɑɑɑS→ɑɑɑɑS→ɑɑɑɑɑ。推导共分五步。前四步用了第二条规则,第五步用了第一条规则。按这个 办法,可以生成Lɑ中的所有句子,即整个Lɑ语言。
历史发展
形式语言的研究始于20世纪初,把形式语言用于模拟自然语言是50年代中期的事。当时,许多数理语言学家 致力于用数学方法研究自然语言的结构,尤其是1946年电子计算机出现以后,人们很快想到用计算机来作自然语 言的机械翻译。可是这项工作在取得一些初步的成功以后便停滞不前,翻译的质量很难提高,主要是因为当时对 自然语言结构的理解太表面化。1956年,N.乔姆斯基发表了用形式语言方法研究自然语言的第一篇文章。他对语 言的定义方法是:给定一组符号(一般是有限多个),称为字母表,以∑表之。又以∑表示由∑中字母组成的所 有符号串(或称字,也包括空字)的集合。则∑的每个子集都是∑上的一个语言。例如,若令∑为26个拉丁字母 加上空格和标点符号,则每个英语句子都是∑中的一个元素,所有合法的英语句子的集合是∑的一个子集,它构 成一个语言。乔姆斯基的语言定义方法为人们所公认,一直沿用下≤|β|,即得到一型文法。由一型文法生 成的语言称一型语言。一型文法也可以这样定义:它的所有产生式均取γAδ→γωδ的形式,其中γ,ω,δ∈ (V∪∑),|ω|>0,A∈V。其直观意义是:在左有γ,右有δ的环境下,A可以被ω所替换。因此,一型文法和一 型语言又分别叫上下文有关文法和上下文有关语言。

形式语言学_Ch6_文法的乔姆斯基体系

形式语言学_Ch6_文法的乔姆斯基体系

结果为句子
结果为句型
6.1.1 上下文无关文法的派生树
最左派生(leftmost derivation)
α 的派生过程中,每一步都是对当前句型的最左变量
进行替换。 左句型(left sentencial form) 最左派生得到的句型可叫做左句型。
最右归约(rightmost reduction)
6.1.1 上下文无关文法的派生树
文法 Gexp1句子 x+x/y↑2的结构。
6.1.1 上下文无关文法的派生树
派生树(derivation tree) 一棵(有序)树(ordered tree) 树的每个顶点有一个标记X,且X∈V∪T∪{ε } 树根的标记为S; 如果非叶子顶点v标记为A,v的儿子从左到右依次为 v1,v2,…,vn,并且它们分别标记为X1,X2,…, Xn,则AX1X2…Xn∈P; 如果X是一个非叶子顶点的标记,则X∈V; 如果顶点v标记为ε ,则v是该树的叶子,并且v是其 父顶点的惟一儿子。
6.1.1 上下文无关文法的派生树
必要性 由于AX1X2…Xm,所以, AX1X2…Xm∈P ,从而
再将所有Xi子树对应地接在Xi所标示的定点上,即得 该树结果为α。 得证。
6.1.1 上下文无关文法的派生树
例 6-1设 Gbra: S S(S)|ε , (( )(( )))和 (S)((S))的派生树。
与最左派生相对的归约叫做最右归约。
6.1.1 上下文无关文法的派生树
最右派生(rightmost derivation)
α 的派生过程中,每一步都是对当前句型的最右变量
进行替换。 右句型(right sentencial form) 最右派生得到的句型可叫做右句型。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章 正则语言的性质
RL性质 泵引理及其应用 并、乘积、闭包、补、交 正则代换、同态、逆同态的封闭性
从RL固有特征寻求表示的一致性 Myhill-Nerode定理 FA的极小化
RL的几个判定问题 空否、有穷否、两个DFA等价否、成员关系
5.1 RL的泵引理
泵引理(pumping lemma) 设L为一个 RL ,则存在仅依赖于L的正整数N,对于 ∀z∈L,如果|z|≥N,则存在u、v、w,满足 ⑴ z=uvw; ⑵ |uv|≤N; ⑶ |v|≥1; ⑷ 对于任意的整数i≥0,uviw∈L; ⑸ N不大于接受L的最小DFA M的状态数。
封闭的可直接由定理5.4得出,关于逆同态,令DFA M满
则 L = L(B),其中B是DFA (Q, Σ,δ , q0,Q − F ) 即:A的接受状态都是B的非接受状态,反之亦然.因此 w属
于L(B)当且仅当δ^(q0,w)属于Q-F,而后者成立当且仅当 w不属于 L(A).
5.2正则集合的封闭性质

L∈{a},Σ ={a,b}
a
q0
q
b
a,b
M
d
a,b
7
5.1 RL的泵引理
⑶ 由于泵引理指出,如果L是 RL ,则对任意的z∈L, 只要|z|≥N,一定会存在u、v、w,使uviw∈L对所有的i成 立。因此,我们在选择z时,就需要注意到论证时的简洁和 方便。
⑷ 当一个特意被选来用作“发现矛盾”的z确定以后,就 必须依照|uv|≤N和|v|≥1的要求,说明v不存在(对“存在u、 v、w”的否定) 。
1
5.1 RL的泵引理
证明思想
5.1 RL的泵引理
证明: DFA在处理一个足够长的句子的过程中,必定会重复地经 过某一个状态。换句话说,在DFA的状态转移图中,必定存 在一条含有回路的从启动状态到某个终止状态的路。由于是 回 路 , 所 以 , DFA 可 以 根 据 实 际 需 要 沿 着 这 个 回 路 循 环 运 行,相当于这个回路中弧上的标记构成的非空子串可以重复 任意多次。
9
5.2正则集合的封闭性质
定理5.1 正则集合在并、连接和Kleene闭包运算下是封 闭的。
(r1 + r2),(r1r2)及(r1)* 仍是正则式,所以正则集
合的并、连接和Kleene闭包表示正则集合
定理5.2 正则集合对补运算的封闭,即若 L ⊆ Σ* 是一正则集合, L = Σ* − L 也是正则集合。 证明:令L=L(M) M为一DFA M = (Q, Σ,δ , q0,F )
果,其中 wi ∈Rai , wi为Rai 中的任意的字。
12
5.2正则集合的封闭性质
用f表示代换,则f为一个映射 f : Σ → 2∆* ∆ 为 一字母表 Σ到∆* 的字集合映射,f把 Σ 中每个符 号与一个正则集合联起来,可以把f扩展成
f : Σ* → 2∆* 1. f (ε ) = ε 2. f ( xa ) = f ( x ) f ( a )再扩充到集合上
而L(M’)恰好是R经代换后得到的集合, 所以该集合是正则集合。 例
令 f (0) = a, f (1) = b*, f (0) ={a}, f (1) ={b}*
前二者为正则表示
f (010)}{ } { }{ } F (L) = {a}* a + b* b* * = a* a + b* b* *
uviw=0N-k-j(0k)i0j1N22N =0N+(i-1)k1N22N
6
5.1 RL的泵引理
uv0w=0N+(0-1)k1N22N = 0N-k1N22N
注意到k≥1, N-k+N=2N-k<2N 0N-k1N22N ∉L 这个结论与泵引理矛盾。所以,L不是 RL。
5.1 RL的泵引理
用来证明一个语言不是 RL 不能用泵引理去证明一个语言是 RL。 ⑴ 由于泵引理给出的是 RL 的必要条件,所以,在用它 证明一个语言不是 RL 时,我们使用反证法。 ⑵ 泵引理说的是对 RL 都成立的条件,而我们是要用它 证明给定语言不是 RL ,这就是说,相应语言的“仅仅依赖 于L的正整数N”实际上是不存在的。所以,我们一定是无 法给出一个具体的数的。因此,人们往往就用符号N来表 示这个“假定存在”、而实际并不存在的数。
f (L) = U f (x) x∈ L
例:h(0)=ab, h(1)=ε定义的函数h是一个同态。任何给定由0和1组成的 串,它用ab替换所有的0并把所有的1用空串替换。如0011成为abab.
5.2 RL的封闭性
例 5-4 设∑={0,1},Δ={a,b},f(0)=a,f(1)=b*,则 f(010)=f(0)f(1)f(0)=ab*a f({11,00})=f(11)∪f(00) =f(1)f(1)∪f(0)f(0)=b*b*+aa=b*+aa f(L(0*(0+1)1*))=L(a*(a+b*)(b*)*) =L(a*(a+b*)b*)=L(a*ab*+a*b*b*) =L(a*b*)
且满足 L1 = L(M 1 )和L2 = L(M 2 )
构造
M = (Q1 × Q2 , Σ,δ ,[q1, q2 ], F1 × F2 ) δ ([p1, p2 ], a) = [δ1( p1, a),δ2 ( p2, a)]
对于所有p1 ∈ Q1, p2 ∈ Q2 ,∀a ∈ Σ
易证 : L(M ) = L(M1) I L(M 2 )
3
5.1 RL的泵引理
故, δ(q0,a1a2…ak(ak+1…aj)i aj+1…am)=qm 也就是说, a1a2…ak(ak+1…aj)i aj+1…am∈L(M) u= a1a2…ak, v=ak+1…aj, w= aj+1…am uviw∈L
5.1 RL的泵引理
例 5-1 证明{0n1n|n≥1}不是 RL。 证明:
5.1 RL的泵引理
例 5-2 证明{0n|n为素数}不是 RL。 证明:假设L={0n|n为素数} 是 RL。 取 z=0N+p ∈L , 不妨设v=0k, k≥1 从而有, uviw=0N+p-k-j(0k)i0j
=0N+p+(i-1)k
5
5.1 RL的泵引理
当i=N+p+1时, N+p+(i-1)k=N+p+(N+p+1-1)k
5.1 RL的泵引理
⑸ 与选z时类似,在寻找i时,我们也仅需要找到一个表明 矛盾的“具体”值就可以了(对“所有i”的否定)。
⑹ 一般地,在证明一个语言不是 RL 的时候,我们并不使 用泵引理的第(5)条。
⑺ 事实上,引理所要求的|uv|≤N并不是必须的。这个限制 为我们简化相应的证明提供了良好支撑——扩充了的泵 引理 。
假设L={0n1n|n≥1} 是 RL
z=0N1N 按照泵引理所述
v=0k
k≥1
此时有,
u=0N-k-j
w=0j1N
4
5.1 RL的泵引理
从而有, uviw=0N-k-j(0k)i0j1N=0N+(i-1)k1N
当i=2时,我们有: uv2w=0N+(2-1)k1N = 0N+k1N
注意到k≥1,所以, N+k>N。 这就是说, 0N+k1N∉L 这与泵引理矛盾。所以,L不是 RL。
以及δ 2 (q jk−1 , ak ) = q jk , k = 1,2,...n且q jn ∈ F2
由定义知有:
[ ] [ ] δ ( q , q ik−1
jk −1
, ak ) =
qik , q jk
对于k
= 1,2,...n
[ ] [ ] [ ] 而 qi0 , q j0 为 q1, q2 即M的初态,qin , q jn ∈ F1 × F2
= N+p+(N+p)k = (N+p)(1+k) 注意到k≥1,所以 N+p+(N+p+1-1)k=(N+p)(1+k) 不是素数。故当i=N+p+1时, uvN+p+1w=0(N+p)(1+k) ∉L 这与泵引理矛盾。所以,L不是 RL。
5.1 RL的泵引理
例 5-3 证明{0n1m2n+m|m,n≥1}不是 RL。 证明:假设L={0n1m2n+m|m,n≥1} 是 RL。 取z=0N1N22N 设 v=0k k≥1 从而有,
13
5.2正则集合的封闭性质
定理5.4 正则集合类对代换运算是封闭的
证明:设 R ⊆Σ* 为一正则集合,对每个 a∈Σ
令 Ra ⊆ ∆* 是一正则集合。 f定义 f (a) = Ra ,令正则式r表示正则集合R, 正则式ra表示正则集合Ra 把r中的每个a都替换成ra后,仍为正则式,显然, 替换后得到的正则式表示的恰好是R经过代换后得 到的集合,因此是正则集合。 或者,若R为正则集合,则有DFA M使 L(M ) = R ,
= a*ab* + a*b* = a*b*
5.2正则集合的封闭性质
同态是一种特殊的替换:即 f (a) ={x} x∈∆* ,记同 态为 h: h(a) = x,h 可以有逆同态 h−1(L) = {x h(x) ∈ L}
定理5.5 正则集合类对于同态运算和逆同态运算都是封 闭的。
证:同态是一种特殊的代换,故正则集合对同态运算是
5.2正则集合的封闭性质
Ra为正则集合,则有DFA Ma使 L(M a ) = Ra 中每条标记为a的弧做替换
,对于M
对每个Ma引入一个新的状态fa做终态,原来终态改成非
相关文档
最新文档