第四讲 模糊模式识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013/2/26
25
2013/2/26
26
2013/2/26
27
二、F模式识别原则
模糊模式识别的直接方法
2013/2/26
28
2013/2/26
29
例3 (小麦亲本识别)
小麦的百粒重分布为 F ( x) = e
各类小麦对应的参数如下:
x −a − σ
2
, 小麦的类型及
n
2). 格贴近度
N ( A, B ) = ( A o B ) ∧ ( A ⊗ B ) C
或
2013/2/26
N ( A , B ) = [( A o B ) + ( A ⊗ B ) C ]
19
内外积性质: 性质1 性质2
A ⊕ B = B ⊕ A, A ⊗ B = B ⊗ A.
( A ⊕ B ) c = Ac ⊗ B c ( A ⊗ B ) c = Ac ⊕ B c = ∧ [(1 − A( x)) ∨ (1 − B( x))] = ∧ ( Ac ( x) ∨ B c ( x)) = Ac ⊗ B c x∈X
3
2013/2/26
模式识别的基本方法
一、统计模式识别 二、句法模式识别 三、模糊模式识别 四、人工神经网络法 五、人工智能方法
一、统计模式识别
模式描述方法: 特征向量 模式判定:
r x = ( x1 , x2 ,L, xn )′
模式类用条件概率分布P(X/ωi)表示,m类就有 m个分布,然后判定未知模式属于哪一个分布。
n
n
n
例1: 某农作物在A地生长很好,现准备把它移植到B 地或C地,问B、C两地哪个最适宜? 已知: 论域X={x1,x2,x3},其中,x1气温;x2湿度;x3 土壤。根据评定得到三个模糊集 A=(0.8,0.4,0.6);B=(0.9,0.6,0.3);C=(0.6,0.4,0.5)
计算: N1(A,B)=0.80; N1(A,C)=0.90 或者 N2(A,B)=0.78; N2(A,C)=0.87 从而C地最适宜。
N L ( A, A1 ) = e
= 0.78
N L ( A, A2 ) = 0.44, N L ( A, A3 ) = 0, N L ( A, A4 ) = 0.52, N L ( A, A5 ) = 0.68
根据择近原则,A应为早熟型。
1 b N1(A, B) =1− | Au ( ) −B(u)| du ∫ a b−a
( ) −B(u )) ∑(Au
i=1 i i n 2
1 N ( A , B ) = 1 − 当 p=2 时(Euclidean 贴近度), 2 n
或者
1 N2(A, B) =1− b−a
2 ( ( ) ( )) Au − B u du ∫ a
n
1. 2. 3.
2013/2/26
16
常见的贴近度公式
1.Minkowski 距离表示: Np(A,B)=1−[Mp(A,B)]1/p,其中 p 选取适当的常 数. 1n | Au ( i ) −B(ui )| ; 特别地,当 p=1 时(Haming 贴近度) N1(A, B) =1− n ∑ i=1 或者
OUTLINE
n n n n
一、F集的贴近度 二、F模式识别原则 三、几何图形识别 四、手写文字识别
2013/2/26
15
一、F集的贴近度
n
贴近度是用以表示两个模糊集接近程度的数量指 标,其定义如下: 定义: 映射 N: F(U)×F(U)→[0,1]称为F(U)上的贴 近度,如果满足: N(A,A)=1 N(A,B)=N(B,A) A⊆B⊆C ⇒ N(A,C)≤N(A,B) ∧ N(B,C)
2013/2/26
23
n
例2: 设有四本书A1,A2,A3,A4,考虑它们的以下特性:x1科学 性;x2逻辑性;x3思想性;x4可读性;x5表述明确性。设论 域X={x1,x2,x3,x4,x5}, A1=(1,0.8,0.8,0.7,0.6);A2=(0.7,0.9,0.7,0.7,0.5); A3=(0.6,0.8,0,0.5,0.6);A4=(0.7,0.9,1,0.6,0.6)。 现要在四本书中找出一本,使之比较符合要求: B=(0.9,0.8,0.7,0.7,0.5). 计算: N1(A1,B) =0.94;N1(A2,B) =0.94 ; N1(A3,B) =0.74 ; N1(A4,B) =.84 或者 N2(A1,B)=0.92;N2(A2,B)=0.90 ; N2(A3,B)=0.65 ; N2(A4,B)=0.82 从而,A1最符合要求
理论基础:概率论,数理统计 主要方法:线性、非线性分类、Bayes决策、聚类分析 主要优点: 1)比较成熟 2)能考虑干扰噪声等影响 3)识别模式基元能力强 主要缺点: 1)对结构复杂的模式抽取特征困难 2)不能反映模式的结构特征,难以描述模式的性质 3)难以从整体角度考虑识别问题
二、句法模式识别
2
n
2013/2/26
n
在通常的模式识别中,模式是明确的,似实际中很 多问题模式本身是不明确的,比如,细胞染色体识 别中的等腰三角形、直角三角形等,都不是标准的 等腰三角形和直角三角形,再比如,通过人造地球 卫星所得到的地面图也带有模糊性,所以,把它们 作为模式就要用模糊集合来声示,这样,就有了模 糊模式的模式识别,简称为模糊识别.如何利用计 算机来进行模式识别,这是人工智能的一个重要方 面,显然,用摸糊集理论来进行模式识别,将会大 大促进这方面研究的发展。
四、人工神经网络法
模式描述方法: 以不同活跃度表示的输入节点集(神经元) 模式判定: 是一个非线性动态系统。通过对样本的学习 建立起记忆,然后将未知模式判决为其最接近的 记忆。
理论基础:神经生理学,心理学 主要方法:BP模型、HOP模型、高阶网 主要优点: 可处理一些环境信息十分复杂,背景知识不清楚,推理规则 不明确的问题。允许样本有较大的缺损、畸变。 主要缺点: 模型在不断丰富与完善中,目前能识别的模式类还不够多。
N 2 ( A, B ) =
2 Σ { A ( x k ) ∧ B ( x k )}
k =1
Σ { A ( x k ) + B ( x k )}
k =1 n
=
2∫
+∞
∫
−∞ +∞
( A ( x ) ∧ B ( x )) dx
−∞
( A ( x ) + B ( x )) dx
2013/2/26
18
3. 格贴近度
模式描述方法: 符号串,树,图 模式判定: 是一种语言,用一个文法表示一个类,m类就 有m个文法,然后判定未知模式遵循哪一个文法。
理论基础:形式语言,自动机技术 主要方法:自动机技术、CYK剖析算法、Early算法、转移 图法 主要优点: 1)识别方便,可以从简单的基元开始,由简至繁。 2)能反映模式的结构特征,能描述模式的性质。 3)对图象畸变的抗干扰能力较强。 主要缺点: 当存在干扰及噪声时,抽取特征基元困难,且易失误。
x∈X
类似可得:
A⊗ B ≥ A∨ B
性质4
A ⊕ A = A, A ⊗ A = A A ⊕ A ≤ 0.5, A ⊗ A ≥ 0.5
c c
证明: A ⊕ A = ∨ ( A( x) ∧ A( x ))= ∨ A( x ) = A x∈X
x∈X
A ⊕ A = ∨ ( A( x) ∧ A ( x))
2013/2/26
24
n
例3: 企业的经营管理状况可以由以下指标反映: u1:生产;u2: 销售; u3:材料; u4: 存储; u5: 运输. 因此, 企业状况可以表示 为U={u1,u2,u3,u4,u5}上的模糊集. 现有四种不同类型的企业管理经验,它们分别为: A1=(0.9,0.6,0.5,0.7,0.6); A2=(0.5,0.2,0.9,0.4,0.4); A3=(0.3,0.4,0.8,0.5,0.6); A4=(0.7,0.5,0.4,0.1,0.9). 现有企业B,其状况为B=(0.4,0.9,0.7,0.8,0.5),问该企业应采 取哪种管理措施? 计算: N1(A1,B)=0.76; N1(A2,B)=0.70; N1(A3,B)=0.78; N1(A4,B) =.58 或者 N2(A1,B)=0.72;N2(A2,B)=0.63 ; N2(A3,B)=0.73; N2(A4,B)=.56 从而,A3最符合要求。
三、模糊模式识别
模式描述方法: 模糊集合 A={(µa,a), (µb,b),... (µn,n)} 模式判定: 是一种集合运算。用隶属度将模糊集合划分 为若干子集, m类就有m个子集,然后根据择近原 则分类。
理论基础:模糊数学 主要方法:模糊统计法、二元对比排序法、推理法、模糊 集运算规则、模糊矩阵 主要优点: 由于隶属度函数作为样本与模板间相似程度的度量,故 往往能反映整体的与主体的特征,从而允许样本有相当 程度的干扰与畸变。 主要缺点: 准确合理的隶属度函数往往难以建立,故限制了它的应 用。
类型 早熟A1 矮杆A2 大粒A3 高肥丰产A4 中肥丰产A5
a σ
3.7 0.3
2.Biblioteka Baidu 0.3
2
5.6 0.3
3.9 0.3
3.7 0.2
现有未知小麦A, 其百粒重分布为 :
A( x) = e
x −3.43 − 0.28
, 问A应属何种类型?
解: 选定格近度
NL.
3.43−3.7 2 − 0.28+0.3
五、逻辑推理法(人工智能法)
模式描述方法: 字符串表示的事实 模式判定: 是一种布尔运算。从事实出发运用一系列规 则,推理得到不同结果,m个类就有m个结果。
理论基础:演绎逻辑,布尔代数 主要方法:产生式推理、语义网推理、框架推理 主要优点: 已建立了关于知识表示及组织,目标搜索及匹配的完整体系 。对需要众多规则的推理达到识别目标确认的问题,有很好 的效果。 主要缺点: 当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效 果不好。
c c x∈X
= ∨ ( A( x) ∧ 1 − A( x)) ≤ 0.5
A ⊗ A = A 及A ⊗ Ac ≥ 0.5类似可证.
解释: 对内积A ⊕ B来说, B越靠近A, 值越大;
x∈X
B = A时, 达最大值 A, B = Ac时, 值低于0.5. 对外积A ⊗ B来说, B越靠近A, 值越小; c B = A时, 达最小值 A, B = A 时, 值高于0.5.
第四讲 贴近度与模式识别
2013/2/26
1
n
所谓模式识别,通俗地说,就是巳知某类事物的若干标准 的对象,或模式,现在给出这类事物中的一个具体对象, 如何判定它属于哪一个模式.比如,如何判定一个手写汉 字是一个什么字?这里可把每一个汉字印刷体看成一个模 式.再比如,已知有若于种病的典型症伏,每一个典型症 状都是由某些检查指标所表征,现在有一个患者,如何根 据他的各种检查指标来判定他患的是哪一种病,等等. 模式识别是科学、工程、经济、社会以至生活中经常遇到 并要处理的基本问题.这一问题的数学模式就是在已知各 种标准类型(数学形式化了的类型)的前提下,判断识别 对象属于哪个类型?对象也要数学形式化,有时对象形式 化不能做到完整,或者形式化带有模糊性质,此时识别就 要运用模糊数学方法.
x∈X x∈X
证明: ( A ⊕ B ) c = 1 − ∨ ( A( x) ∧ B ( x))
性质3
A ⊕ B ≤ A ∧ B, A ⊗ B ≥ A ∨ B
x∈X
证明: A ⊕ B = ∨ ( A( x ) ∧ B ( x ))
≤ ∨ A( x) = A
同理
A ⊕ B ≤ B, 故A ⊕ B ≤ A ∧ B.
b
2013/2/26
17
2. 测度贴近度
Σ { A ( x k ) ∧ B ( x k )}
n
N 1 ( A, B ) =
k =1 n k =1
Σ { A( xk ) ∨ B ( xk
n
∫ = )} ∫
+∞
−∞ +∞ −∞
( A ( x ) ∧ B ( x )) dx ( A ( x ) ∨ B ( x )) dx
1). 内积 外积
Ao B = ∨
u ∈U
{ A (u ) ∧ B (u )} = k∨ { A (u k ) ∧ B (u k )} =1
n
A⊗ B = ∧
u ∈U
{ A (u ) ∨ B (u )} = k∧ { A (u k ) ∨ B (u k )} =1
A ⊗ B = ( AC • B C )C