句法模式识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 基本思想:将复杂模式分解为若干较简单的子模 式的组合,而子模式又分为可以由更简单的子模 式来描述,最简单的子模式称为模式基元。通过 对模式基元的识别,进而识别子模式,最终识别 该复杂模式。
2021/3/11
2
– 模式描述语言:描述模式结构的语言。包括—模 式基元和对基元的合成操作规则。
– 模式文法:对基元作合成操作以构成模式的规则 。
由上下文有关文法构成的语言称为上下文有关语言, 用L(G1)表示,G1:上下文有关文法
2021/3/11
8
§ 7.1、形式语言基础和文法
例:G = (VN,VT, P, S) VN = {S, B, C} VT = {a, b, c}
P: ① S→aSBC ② CB→BC ③ S→abC ⑤ bC→bc ⑥ cC→cc
10、产生式(再写规则)P:存在于终止符和非终止符间的关系式
。
例: α→β, α∈ VN ,β∈ VN, VT.
11、文法的数学定义:它是一个四元式,由四个参数构成。
2021/3/11 G={VN, VT, P, S}
6
§ 7.1、形式语言基础和文法
二. 短语结构文法
1. 0型文法(无限制)
设文法G = (VN,VT, P, S) VN :非终止符,用大写字母表示 VT: 终止符,用小写字符表示 P:产生式 S:起始符 产生式P:α→β, 其中α∈V+,β∈V* α,β无任何限制
– 多级树描述结构:
景物A
墙壁N L T D
地板M
B X
YZ E
景物: A
2021/3/11
物体B
背景C
三角体D
地板M 墙壁N 长方体E
面L 三角形T 面X 面Y 面Z
3
–结构模式识别系统框图 :
2021/3/11
4
§ 7.1、形式语言基础和文法
• 所谓形式语言是一种抽象语言,它是从人类的自然语言 ,计算机使用的各种语言,数学中的公式语言等等中抽 象概括出来的。形式语言的理论是句法模式识别的基础
L1={ab,aab,abab} 有限语言 L2={anbm|n,m=0,1,2….}无限语言 5、文法:在一种语言中,构成句子所必须遵循的规则的集合, 用G表示。L(G)表示由文法G构成的语言。
2021/3/11
5
§ 7.1、形式语言基础和文法
6、V*:由字母表V中的符号组成的所有句子的集合,包括空句子
λ在内。例: V*={λ,01, 001}
7、 V+:不包括空句子在内的句子集合,即V+=V*-(λ)
8、VT: 终止符,不能再分割的最简基元的集合,用小写字母 表示。 VT={a,b,c}
9、 VN: 非终止符,由基元组成的子模式和句子的集合。用大 写字母表示。VN={A,B,C}
VT, VN的关系: VT∩VN= Φ(空集) VT∪ VN= V(全部字母表)
例:文法G = (VN,VT, P, S) VN = {S, B, C} VT = {a, b}
P: ① S→aB ② S→bA ③ A→a
④ A→aS
⑤ A→bAA ⑥ B→b ⑦ B→bS ⑧B→aBB
2021/3/11
11
§ 7.1、形式语言基础和文法
⑦
①⑥
① aB→abS→abaB→abab
( V+不包括空符号串,V*包括空符号串)
例:0型文法 G = (VN,VT, P, S) VN = {S, A, B} VP = {a, b, c}
P: ① S→aAbc ②Ab→bA ③ Ac→Bbcc ④ bB→Bb ⑤ aB→aaA ⑥ aB→λ(空符号串)
2021/3/11
7
§ 7.1、形式语言基础和文法
a
a
2021/3/11
b b
a
10
§ 7.1、形式语言基础和文法
2 . 2型文法(上下文无关文法)
设文法G = (VN,VT, P, S) 产生式P:A→β 其中A∈VN(且是单个的非终止符)
β∈V+ (可以是终止符,非终止符,不能是空符号串)
对产生式的限制比较严格
由上下文无关文法构成的语言称为上下文无关语言。
一。、基本概念
1、字母表:与所研究的问题有关的符号集合。
例:V1={A,B,C,D},Hale Waihona Puke BaiduV2={a,b,c,d} 2、句子(链):由字母表中的符号所组成的有限长度的符号串。
3、句子(链)的长度:所包含的符号数目。例: |a3b3c3|=9
4、语言:由字母表中的符号组成的句子集合,用L表示。
例:字母表V={a,b}
句法模式识别
• 概述:
– 结构模式识别:从模式的结构关系入手对模式进 行分析是一个十分重要的方法,统计模式识别方 法是不能完成这一任务的,因为它注重的只是模 式的数值特征,孤立地分析每一个模式,仅仅对 其量的特征进行辨别。能够进行结构分析的是句 法模式识别方法,它是由模仿语言学中句法的层 次结构而产生的一种方法。
①
②
③
④
⑥
S→Aa bc→abAc→abBbcc→aBbbcc→ bbcc
此文法可以产生:X=anbn+2cn+2 n≥0
X|n=0=bbcc 由0型文法产生的语言称为0型语言。
2. 1型文法(上下文有关文法)
设文法G = (VN,VT, P, S) 产生式P:α1Aα2→α1βα2
其中A∈VN,β∈V+, α1,α2∈V* |α1Aα2|≤|α1βα2|, 或|A|≤|B|
③
S
④
② abbA→abba
①
⑥
② bA→baS→baaB→baab
③
② babA→baba
例:G = (VN,VT, P, S) VN = {S, T, F} VT = {a, +,*,(,)}
P: ① S→S+T ② S→T
2021/3/11
9
§ 7.1、形式语言基础和文法
①
③
②
④
⑤
⑥
S→aSBC→aabCBC→abbBCC→aabbCC→aabbcC→aabb
cc
∴X=a2b2c2
此文法G可产生的语言:L(G)={anbncn|n=1,2...}
假设基元 a
b
c
语言L(G)可以描述不同的三角型
c
X= abc
cb
X= a2b2c2c
λ1Sλ2→λ1aSBCλ2, bBλ→bbλ
④ bB→bb
对于S→aSBC
∵α1= λ, α2= λ, A = S, B=aSBC,并且|S|<|aSBC| ∴ 符合1型文法规则
对于bB→bb
∵α1= b, α2= λ,A = B, B=b,并且|B| ≤ |b| ∴ 也符合1型文法规则
产生式都符合1型文法的要求
2021/3/11
2
– 模式描述语言:描述模式结构的语言。包括—模 式基元和对基元的合成操作规则。
– 模式文法:对基元作合成操作以构成模式的规则 。
由上下文有关文法构成的语言称为上下文有关语言, 用L(G1)表示,G1:上下文有关文法
2021/3/11
8
§ 7.1、形式语言基础和文法
例:G = (VN,VT, P, S) VN = {S, B, C} VT = {a, b, c}
P: ① S→aSBC ② CB→BC ③ S→abC ⑤ bC→bc ⑥ cC→cc
10、产生式(再写规则)P:存在于终止符和非终止符间的关系式
。
例: α→β, α∈ VN ,β∈ VN, VT.
11、文法的数学定义:它是一个四元式,由四个参数构成。
2021/3/11 G={VN, VT, P, S}
6
§ 7.1、形式语言基础和文法
二. 短语结构文法
1. 0型文法(无限制)
设文法G = (VN,VT, P, S) VN :非终止符,用大写字母表示 VT: 终止符,用小写字符表示 P:产生式 S:起始符 产生式P:α→β, 其中α∈V+,β∈V* α,β无任何限制
– 多级树描述结构:
景物A
墙壁N L T D
地板M
B X
YZ E
景物: A
2021/3/11
物体B
背景C
三角体D
地板M 墙壁N 长方体E
面L 三角形T 面X 面Y 面Z
3
–结构模式识别系统框图 :
2021/3/11
4
§ 7.1、形式语言基础和文法
• 所谓形式语言是一种抽象语言,它是从人类的自然语言 ,计算机使用的各种语言,数学中的公式语言等等中抽 象概括出来的。形式语言的理论是句法模式识别的基础
L1={ab,aab,abab} 有限语言 L2={anbm|n,m=0,1,2….}无限语言 5、文法:在一种语言中,构成句子所必须遵循的规则的集合, 用G表示。L(G)表示由文法G构成的语言。
2021/3/11
5
§ 7.1、形式语言基础和文法
6、V*:由字母表V中的符号组成的所有句子的集合,包括空句子
λ在内。例: V*={λ,01, 001}
7、 V+:不包括空句子在内的句子集合,即V+=V*-(λ)
8、VT: 终止符,不能再分割的最简基元的集合,用小写字母 表示。 VT={a,b,c}
9、 VN: 非终止符,由基元组成的子模式和句子的集合。用大 写字母表示。VN={A,B,C}
VT, VN的关系: VT∩VN= Φ(空集) VT∪ VN= V(全部字母表)
例:文法G = (VN,VT, P, S) VN = {S, B, C} VT = {a, b}
P: ① S→aB ② S→bA ③ A→a
④ A→aS
⑤ A→bAA ⑥ B→b ⑦ B→bS ⑧B→aBB
2021/3/11
11
§ 7.1、形式语言基础和文法
⑦
①⑥
① aB→abS→abaB→abab
( V+不包括空符号串,V*包括空符号串)
例:0型文法 G = (VN,VT, P, S) VN = {S, A, B} VP = {a, b, c}
P: ① S→aAbc ②Ab→bA ③ Ac→Bbcc ④ bB→Bb ⑤ aB→aaA ⑥ aB→λ(空符号串)
2021/3/11
7
§ 7.1、形式语言基础和文法
a
a
2021/3/11
b b
a
10
§ 7.1、形式语言基础和文法
2 . 2型文法(上下文无关文法)
设文法G = (VN,VT, P, S) 产生式P:A→β 其中A∈VN(且是单个的非终止符)
β∈V+ (可以是终止符,非终止符,不能是空符号串)
对产生式的限制比较严格
由上下文无关文法构成的语言称为上下文无关语言。
一。、基本概念
1、字母表:与所研究的问题有关的符号集合。
例:V1={A,B,C,D},Hale Waihona Puke BaiduV2={a,b,c,d} 2、句子(链):由字母表中的符号所组成的有限长度的符号串。
3、句子(链)的长度:所包含的符号数目。例: |a3b3c3|=9
4、语言:由字母表中的符号组成的句子集合,用L表示。
例:字母表V={a,b}
句法模式识别
• 概述:
– 结构模式识别:从模式的结构关系入手对模式进 行分析是一个十分重要的方法,统计模式识别方 法是不能完成这一任务的,因为它注重的只是模 式的数值特征,孤立地分析每一个模式,仅仅对 其量的特征进行辨别。能够进行结构分析的是句 法模式识别方法,它是由模仿语言学中句法的层 次结构而产生的一种方法。
①
②
③
④
⑥
S→Aa bc→abAc→abBbcc→aBbbcc→ bbcc
此文法可以产生:X=anbn+2cn+2 n≥0
X|n=0=bbcc 由0型文法产生的语言称为0型语言。
2. 1型文法(上下文有关文法)
设文法G = (VN,VT, P, S) 产生式P:α1Aα2→α1βα2
其中A∈VN,β∈V+, α1,α2∈V* |α1Aα2|≤|α1βα2|, 或|A|≤|B|
③
S
④
② abbA→abba
①
⑥
② bA→baS→baaB→baab
③
② babA→baba
例:G = (VN,VT, P, S) VN = {S, T, F} VT = {a, +,*,(,)}
P: ① S→S+T ② S→T
2021/3/11
9
§ 7.1、形式语言基础和文法
①
③
②
④
⑤
⑥
S→aSBC→aabCBC→abbBCC→aabbCC→aabbcC→aabb
cc
∴X=a2b2c2
此文法G可产生的语言:L(G)={anbncn|n=1,2...}
假设基元 a
b
c
语言L(G)可以描述不同的三角型
c
X= abc
cb
X= a2b2c2c
λ1Sλ2→λ1aSBCλ2, bBλ→bbλ
④ bB→bb
对于S→aSBC
∵α1= λ, α2= λ, A = S, B=aSBC,并且|S|<|aSBC| ∴ 符合1型文法规则
对于bB→bb
∵α1= b, α2= λ,A = B, B=b,并且|B| ≤ |b| ∴ 也符合1型文法规则
产生式都符合1型文法的要求