(模式识别)第六章结构模式识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基元
anbncn 文法
abc
aabbcc
模式描述
前后文无关型(2型)文法
• P: A→β,其中A∈VN,β∈V+ *注:A只能为单个字符,“AB”不可以 • 由前后文无关型文法构成的语言称为
前后文无关型语言或2型语言。
• 例3: G = (VN,VT, P, S)
– VN = {S, B, C},VT = {a, b} – P: S→aB, S→bA, A→a, A→aS
bC→bc, cC→cc
S →aSBC→aabCBC→abbBCC→aabbCC→aabbcC →aabbcc 由文法G产生的语言L(G)={anbncn|n≥0}
基元
anbncn 文法
abc
aabbcc
模式描述
默认约定
• λ表示不含符号的链,称为空链 • V*表示V中元素组成的所有有限长度的链的集合,
模式的结构化描述
• 字符串描述 • 图形描述 • 树描述
结构化描述之字符串
• 字符串是符号的有序排列,每个符号表示一个 基元
• 符号表示
– T表示可能的符号集 – S表示T中元素组成的所有可能的字符串集 – 符号的个数称为字符串的长度,记|X| – 空字符串记为λ –一个字符串可写成X=a1a2…am ai∈T
• 字符串的运算
– X=a1a2…am, Y=b1b2…bn, 则X+Y=a1a2…amb1b2…bn
– X+ λ= λ+X=X
• 字符串结构描述适合于串联结构
结构化描述之图形
• 图形G是一个有序对G={N,R},N表示分 析集合,R表示边长集合,通俗的说, N表示图中的顶点,R表示联接顶点的 弧
• 设x为一个链,xn表示x重复n次 • |x|表示链的长度,即包含的符号个数例: |a3b3c3|=9
i
G
i
1表示根据文法G,从链
i能推导/派生出
i
。Fra Baidu bibliotek
1
若有:
1
G
2,
2
G
,
3
,
n1
G
n
可写成:
*
1
G
n
在派生的每一步,仅改写最左边的那个非终止符,
称为最左派生
短语结构文法的四种类型
• 根据产生式形式的约束,可分为:
A→bAA, B→b, B→bS, B→aBB
aB →abS →abaB→abab
↓
S
ab
abbA →abba
bA→baS →baaB→baab
↓
ba
babA →baba
正规(3型)文法
• P:A→aB 或A→a,其中A,B∈VN,a∈V T *注:A,B,a都只能为单个字符 • 由正规文法产生的语言成为正规语言或3型
结构化描述之树
• 基元采用曲线段 a,b,c,d
• 从左到右把树的叶子汇 集起来,就构成了一个 字符串,恰好表达了染 色体的边界形状。
• 用符号编码表示为 babcbabdbabcbabd, 表达了这类染色体的一 个句子。
文法介绍
• 短语结构文法 • PDL文法
• 短语结构文法定义为4元式G={VN,VT,P,S}
S →aAbc→abAc →abBbcc →aBbbcc →bbcc L(G)={anbn+2cn+2|n≥0}
前后文有关型(1型)文法
• P:α1Aα2→α1βα2
其中A∈VN,β∈V+, α1,α2∈V* *注:A可以为若干个非终止符,例如“AB”
• 由前后文有关型文法构成的语言称为前后 文有关语言或1型语言
• 每个待识别的样本都可用若干基元按照一 定的文法组合成的句子表示
• 同一类别的样本可用相同的文法描述 • 当表示某个样本的一个句子中的每个基元
都被识别后,通过句法分析可判断出该句 子是否符合某一个类别的文法。
模式基元
• 信号基元 • 图像基元
– 链码和模板 – 曲线段
链码和模板
• Freeman链码和模板可以用来描述图形的边界和 骨架。
– 无约束型(0型)文法 – 前后文有关型(1型)文法 – 前后文无关型(2型)文法 – 正规(3型)文法
• L(G)表示由文法G产生的语言
无约束型(0型)文法
• P:α→β,其中α∈V+,β∈V*,α,β无约束
• 由0型文法产生的语言称为0型语言
• 例2:G = (VN,VT, P, S) – VN = {S, A, B},VT = {a, b, c} – P: S→aAbc, Ab→bA, Ac→Bbcc bB→Bb, aB→aaA, aB→λ
例1:G = (VN,VT, P, S)
– VN = {S, B, C} VT = {a, b, c} – P: S→aSBC, CB→BC,S→abC,bB→bb,
bC→bc, cC→cc
S →aSBC→aabCBC→abbBCC→aabbCC→aabbcC →aabbcc 由文法G产生的语言L(G)={anbncn|n≥0}
第六章 结构模式识别
• 鉴于模式的分层描述与语言构造中句子的分 层构造的相似性,语言的数学模型—形式语 言很自然的被借鉴过来。
• 复杂的模式被分解成若干小的合适的子模式, 称为模式基元
• 基元的组合规则叫文法。
• 根据模式基元和它们的组合规则提供的描述 模式结构的语言叫模式描述语言。
结构模式识别的基本原理
– VN为非终止符号集,VT为终止符号集 VT∩VN= φ,VTUVN=V,整个词汇表
– P是句法产生规则集,如:α→β 表示在字符串中,出现α的地方可由β代替,α和β
是由V中元素组成的链,但α中至少包含一个非终止 符 – S为起始符
• 一个待识别对象用字符串表示,如果该字符 串能由文法G产生,则该对象属于文法G代 表的那类模式
包含λ V+= V*- λ • 非终止符VN用大写字母:S, A, B, C, … • 终止符VT用英文字母表起始部分的小写字母:a,
b, c, … • 终止符组成的字符串用英文字母表中尾部的小写
字母:u, v, w, x, … • 终止符和非终止符混合组成的字符串用希腊字母:
α, β, γ, δ, …
• 在派生的每一步,约定仅改写最左边的那个 非终止符,称为“最左派生”。
• V*表示V中元素组成的所有有限长度的链的 集合,包含λ, V+= V*- λ
例1:G = (VN,VT, P, S)
– VN = {S, B, C} VT = {a, b, c} – P: S→aSBC, CB→BC,S→abC,bB→bb,