模糊模式识别方法介绍(ppt 51页)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(a)
(b)
• 如果类内和类间指标为用π型隶属度函数计算的 模糊度或熵,则应采用式(a)的定义;
• 而如果类内和类间指标为用s性隶属度函数计算的 模糊度或熵,或者采用π度,则应采用式(b)的 形式。
• 这样定义的指标越小,则该特征对于这两类分类 的性能越好,
• 这些评价指标也只是一些可供选择的指标,必要 时我们也可以针对具体问题的问题定义自己的新 指标。
• 其中
模糊集合
• 定义在空间 X={x}上的隶属度函数就定义了 一个模糊集合A
• 表示为 •或 •
“开水”这一概念的模糊集与确定集
常见的隶属度函数形式
台阶型 三角形 梯形 高斯函数型
模糊集的运算
•并 •交
• 补:
模糊集合的荃本运算示意图
4.3 模糊特征和模糊分类
• 模糊模式识别就是在解决模式识别问题时 引进模糊逻辑的方法或思想
时,μAπ(xi)=0.5。
其它形式的S型函数和π型函数
• 通过选择参数Fe和Fd及参考点Xn就可以实 现S型函数和π型函数
4.4.2 特征的模糊评价
• 通过模糊程度度量建立特征的评价指标的基本思 想是:根据各类已知样本对每一个特征定义某种 合理的隶属度函数,构造相应的模糊集,用它们 的模糊程度作为特征的评价。
模糊模式识别
• 模式识别从一开始就是模糊技术应用研究 的一个活跃领域,一方面,人们针对一些 模糊式识别问题设计了相应的模糊模式识 别系统另一方面,对传统模式识别中的一 些方法,人们用模糊数学对它们进行了很 多改进。这些研究逐渐形成了模糊模式识 别这新的学科分支。
4.2 模糊集的基本知识
• 隶属度函数 :表示一个对象x隶属于集合A 的程度的函数,通常记作μA(X)
• 在这个意义上,模糊度和熵的作用类似于类内离 散度度量。
• 类似地,我们也可以用两类样本的某个特 征在计算两类之间的模糊度和熵,它们越 大,则表明两类分散度越大,越利于分类。 从而可用作指标来衡量这个特征对于分开 这两类的贡献,类似于类间离散度度量。
2 用标准S函数计算模糊度和熵
• 类似地,也可以用标准S型函数来定义隶属 度函数,在此基础上计算第j类第q个特征的 模糊度和熵。
• 1 模糊度 • 一个有n个支持点的模糊集A的模糊度γ(A)反
映了它的模糊程度,是用它与最接近的确定集合 又之间的距离来度量的:
• 其中d(A,Ẵ)是A与Ẵ之间的即离,而Ẵ只包含A 中隶属度大于0.5的支持点。式中的k是为了使 γ(A)的值在0.5到1之间,k的值根据采用的距离度 量不同而不同。
• 采用广义汉明距离,则k=1,这样定义的 γ(A)称作线性模糊度;
模糊数学的几种不同的名称
• 一种叫法是模糊集,它是相对于经典的集合理论 而言的;
• 一种是模糊逻辑,相对于传统的“是或者不是” 的二值逻辑而言;
• 模糊数学则是一种更泛泛的叫法,更倾向于指从 数学角度对模糊集和模糊逻辑的研究;
• 从应用的角度,很多人更习惯于用模糊系统的叫 法,用来指采用了模糊数学的思想和理论的方法 或系统,而其中采用的一些技术往往称作模糊技 术和模糊方法。这些名词本身也具有很大的模糊 性,但其实质都是同样的,因此没有必要追究它 们的严格定义。
• 其中,b>1是一个可以控制聚类结果的模糊程度的 常数。
• 在不同的隶属度定义方法下最小化式Jf的损 失函数,就得到不同的模糊聚类方法。
• 其中最有代表性的是模糊c均值方法,它要 求一个样本对于各个聚类的隶属度之和为1, 即
• 在上述约束下求Jf的极小值,令Jf对mi和μj (xi)的偏导数为。可得必要条件
• 其中,b=(a+c)/2,且在xi=b时隶属度函数 等于0.5
π型函数
• 指“中间高两边低”的函数,可以用S型函 数定义标准π型函数的定义是
• 其中,c=(a+a’)/2是中心点, • 当xi=c时,μAπ(xi)=1; • b=(a+c)/2,b’=(c+a’)/2,且当xi=b或xi=b’
3.π度
• 隶属度函数中常用的形式是所谓S型函数和 π型函数,S型函数和π型函数是两种光滑 的隶属度函数形式。
• 如果隶属度函数是π型函数Gπ(xi) ,则模糊 集A的π度定义为
S型隶属度函数
• S型函数是一种从0到1单调增长的函数,通 常可由a,b,c三个参数确定,Zadeh定义 的标准S型隶属度函数是
4.4 特征的模糊评价
• 特征选择和特征提取中的关键问题之一就 是如何评价所得到的特征,使特征中更好 地反映分类的信息。
• 模糊数学的发展为我们评价特征的性能提 供了新的手段,它们是通过衡量模糊集的 模糊程度来评价采用的特征对于分类的性 能表现,即用这些特征将类别分开的难易 程度
4.4.1 模糊程度的度量 Nhomakorabea.5 模糊聚类方法
• 4.5.1 模糊C均值算法 • 4.5.2 改进的模糊C均值算法
4.5.1 模糊C均值算法
• C均值方法 • 使准则函数
• 最小
模糊C均值方法
• 将问题的有关符号重新规定如下:{xi,i=1,2,…,n} 是n个样本组成的样本集合,c为预定的类别数目, m对i,于i=第1,2j类,…的,c为隶每属个度聚函类数的。中用心隶,属μ度j(函xi)数是定第义i个的样聚本 类损失函数可以写为
• 在这样的定义下,可以计算出对应于第j类第q个 特征的模糊度和熵。
• 如果模糊度和熵越小,则表明该类中这一特征的 取值比较集中,因此有利于分类;
• 反之如果模糊度和熵越大,则表明该类中这一特 征取值比较分散,不利于分类。
• 因此,我们可以用这个模糊度和熵作为衡量这个 特征对于该类分类的贡献的指标,模糊度和熵越 小则特征性能分类越好。
1 of N编码(N分之一编码)
体重的1 of N编码
• 把原来的一个特征变为若干模糊特征的目的在于 使新特征更好地反映问题的本质。
• 在很多清况下,用一个特征(比如体重)参与分 类(比如判断是否患有某种可能导致体重变化的 病),正确分类结果与这个特征之间可能是复杂 的非线性关系.
• 而如果根据有关知识适当地提取模糊特征,虽然 特征数增多了,但却可能使分类结果与特征之间 的关系线胜化,从而大大简化后面分类器的设计 和提高分类器性能。如果我们对所提取的特征与 要研究的分类问题之间的关系有一定的先验认识, 则采用这种方法往往能取得很好的结果
• 设N维特征空间Q中包含m个类别,每个类别分别 有nj,j=1,2,…,m个样本。我们用xqj表示第j类中的 第q维特征(注意与上面表示的不同),而用 (xqj)av, (xqj)max, (xqj)min,表示它的均值、最大值和最 小值。
1 用标准π函数计算模糊度和熵
• 考虑用标准π函数定义隶属度函数来分析第j 类的第q个特征。为此,令
表示一个对象x隶属于集合a的程度的函数通常记作定义在空间xx上的隶属度函数就定义了一个模糊集合a模糊集合开水这一概念的模糊集与确定集常见的隶属度函数形式台阶型三角形梯形高斯函数型模糊集的运算模糊集合的荃本运算示意图43模糊特征和模糊分类模糊模式识别就是在解决模式识别问题时引进模糊逻辑的方法或思想模糊技术在统计模式识别和句法模式识别中均得到了较好的应用识别本章只涉及模糊技术在统计模式识别方面的应用模糊模式识别中的一些有代表险的方法和思想
• 如果训练样本中已知的类别标号就以模糊类的隶 属度函数的形式给出,那么我们就需要对原有的 模式识别方法进行改变,以适应这种模糊类别划 分(如后面将要介绍的模糊k近邻法)。
• 本节介绍的结果的模糊化,专门指训练样本和分 类器仍是确定性的,只是根据后续的需要把最终 的输出分类结果进行模糊化。结果的模糊化并没 有固定的方法,通常需要结合有关知识、根据所 用的分类器进行设计,比如可以根据样本离类别 中心的距离、离分类面的距离或与已知样本之间 的某种相似胜度量、神经网络输出的相对大小等 作为模糊化的依据
4.3.2 结果的模糊化
• 模式识别中的分类就是把样本空间(或样 本集)分成若干个子集,当然,我们可以 用模糊子集的概念代替确定子集,从而得 到模糊的分类结果,或者说使分类结果模 糊化。
• 在模糊化的分类结果中,一个样本将不再属于每 个确定的类别,而是以不同的程度属于各个类别, 这种结果与原来明确的分类结果相比有两个显著 的优点:一是在分类结果中可以反映出分类过程 中的不确定性,有利于用户根据结果进行决策乡 二是如果分类是多级的,即本系统的分类结果将 与其他系统分类结果一起作为下一级分类决策的 依据,则模糊化的分类结果通常更有利于下一级 分类,因为模糊化的分类结果比明确的分类结果 中包含更多的信息
第4章 模糊模式识别方法
4.1 引言
• 1965年,Zadeh提出著名的模糊集理论 • 模糊集理论是对传统集合理论的一种推广,在传统集
合理论中一个元素或者属于一个集合,或者不属于一 个集合. • 而对于模糊集来说,每一个元素都是以一定的程度属 于某个集合,也可以同时以不同的程度属于几个集合。 • 对人们现实生活中大量使用的一些含义确定但又不准 确的语言表述,比如“今天天气很热”、“车速过高, 需要适当踩刹车”等,模糊数学能够较好地表达。因 此,模糊数学被很多人认为是解决很多人工智能问题 尤其是常识性问题的最合适的数学工具.
模糊技术应用
• 将模糊技术应用于各个不同的领域,就产生了一些新的学 科分支
• 和人工神经网络相结合,就产生了所谓模糊神经网络。 • 应用到自动控制中,就产生了模糊控制技术和系统 • 应用到模式识别领域来,自然就是模糊模式识别。 • 从20世纪s0年代以来,在很多传统的控制问题中,模糊控
制技术的应用取得了很好的效果尤其是一些国家在诸如地 铁的模糊控制系统,洗衣机、电饭锅等的模糊控制等方面 取得了成功的应用后,人们再次掀起了研究各种模糊技术 的热潮。
• 这里只给出参数的选择方法:
• 采用S型函数得到的模糊度和熵与用π型函 数时正相反。
• 即当类内模糊度和熵的值大时分类性能好。 当类间模糊度和熵的值小时分类性能好, 它们相当于一种类内距离度量和类距离度 量。
3、π度的计算
• 计算第j类第q个特征的π度可以用下面的参 数:
4 综合评价指标
• 对于第q维特征,若把第j类和第k类的类内 评价指标(如模糊度、熵或π度)分别记为 gqj和gqk,而把两类之间的同种的评价指标 记作gqjk,可以定义下面的指标:
(1)
(2)
算法步骤
• 设定聚类数目C和参数b • 初始化各个聚类中心mi。 • 重复下面的运算,直到各个样本的隶属度值稳定: • ·用当前的聚类中心根据式(1)计算隶属度函数: • ·用当前的隶属度函数按式(2)更新计算各类聚类中心 • 当算法收敛时,就得到了各类的聚类中心和各个样本对
于各类的隶属度值,从而完成了模糊聚类划分。如果需 要,还可以将模糊聚类结果进行去模糊化,即用一定的 规则把模糊聚类划分转化为确定性分类。
4.5.2改进的模糊C均值算法
• 在模糊C均值算法中,由于引入了的归一化条件,
• 在样本集不理想的情况下可能导致结果不好。 • 比如,如果某个野值样本远离各类的聚类中心,
本来它严格属于各类的隶属度都很小,但由于归 一化条件的要求,将会使它对各类都有较大的隶 属度(比如两类倩况下各类的隶属度都是0.5), 这种野值的存在将影响迭代的最终结果。
改进
• 为了克服这种缺陷,人们提出了放松的归 一化条件,使所有样本对各类的隶属度总 和为n,即
• 在这个新的条件下,计算mi的式(1)仍不 变,而式(2)则变成
• 算法步骤与模糊C均值算法相同 ,而隶属 度则改为上式即可
• 显然,用改进的模糊C均值算法得到的隶属 度值可能会大于1,因此并不是通常意义上 的隶属度函数。必要时可以把最终得到的 隶属度函数进行归一化处理,这时已不会 影响聚类结果。如果结果要求进行去模糊 化则可以直接用这里得到的隶属度函数进 行。
• 若采用欧氏距离,则k=2,此时γ(A)称作二 次模糊度
2熵
• 模糊集A的熵定义为
• 其中
模糊度和熵的性质
• (1)如果对所有的xi,i=1,2,…,n,有有 μA(xi)=0或μA(xi)=1,即A为确定集,则γ(A) 和H(A)都取其最小值0,此时模糊程度最 小。
• (2)如果对所有的xi,i=1,2,…,n,有 μA(xi)=0.5,则γ(A)和H(A)都取其最大值1, 此时模糊程度最大。
• 模糊技术在统计模式识别和句法模式识别 中均得到了较好的应用识别
• 本章只涉及模糊技术在统计模式识别方面 的应用、模糊模式识别中的一些有代表险 的方法和思想。
4.3.1模糊化特征
• 模糊特征是指根据一定的模糊化规则(通 常根据具体应用领域的专门知识人为确定 或经过试算确定)把原来的一个或几个特 征变量分成多个模糊变量,使每个模糊变 量表达原特征的某一局部特性,用这些新 的模糊特征代替原来的特征进行模式识别。
(b)
• 如果类内和类间指标为用π型隶属度函数计算的 模糊度或熵,则应采用式(a)的定义;
• 而如果类内和类间指标为用s性隶属度函数计算的 模糊度或熵,或者采用π度,则应采用式(b)的 形式。
• 这样定义的指标越小,则该特征对于这两类分类 的性能越好,
• 这些评价指标也只是一些可供选择的指标,必要 时我们也可以针对具体问题的问题定义自己的新 指标。
• 其中
模糊集合
• 定义在空间 X={x}上的隶属度函数就定义了 一个模糊集合A
• 表示为 •或 •
“开水”这一概念的模糊集与确定集
常见的隶属度函数形式
台阶型 三角形 梯形 高斯函数型
模糊集的运算
•并 •交
• 补:
模糊集合的荃本运算示意图
4.3 模糊特征和模糊分类
• 模糊模式识别就是在解决模式识别问题时 引进模糊逻辑的方法或思想
时,μAπ(xi)=0.5。
其它形式的S型函数和π型函数
• 通过选择参数Fe和Fd及参考点Xn就可以实 现S型函数和π型函数
4.4.2 特征的模糊评价
• 通过模糊程度度量建立特征的评价指标的基本思 想是:根据各类已知样本对每一个特征定义某种 合理的隶属度函数,构造相应的模糊集,用它们 的模糊程度作为特征的评价。
模糊模式识别
• 模式识别从一开始就是模糊技术应用研究 的一个活跃领域,一方面,人们针对一些 模糊式识别问题设计了相应的模糊模式识 别系统另一方面,对传统模式识别中的一 些方法,人们用模糊数学对它们进行了很 多改进。这些研究逐渐形成了模糊模式识 别这新的学科分支。
4.2 模糊集的基本知识
• 隶属度函数 :表示一个对象x隶属于集合A 的程度的函数,通常记作μA(X)
• 在这个意义上,模糊度和熵的作用类似于类内离 散度度量。
• 类似地,我们也可以用两类样本的某个特 征在计算两类之间的模糊度和熵,它们越 大,则表明两类分散度越大,越利于分类。 从而可用作指标来衡量这个特征对于分开 这两类的贡献,类似于类间离散度度量。
2 用标准S函数计算模糊度和熵
• 类似地,也可以用标准S型函数来定义隶属 度函数,在此基础上计算第j类第q个特征的 模糊度和熵。
• 1 模糊度 • 一个有n个支持点的模糊集A的模糊度γ(A)反
映了它的模糊程度,是用它与最接近的确定集合 又之间的距离来度量的:
• 其中d(A,Ẵ)是A与Ẵ之间的即离,而Ẵ只包含A 中隶属度大于0.5的支持点。式中的k是为了使 γ(A)的值在0.5到1之间,k的值根据采用的距离度 量不同而不同。
• 采用广义汉明距离,则k=1,这样定义的 γ(A)称作线性模糊度;
模糊数学的几种不同的名称
• 一种叫法是模糊集,它是相对于经典的集合理论 而言的;
• 一种是模糊逻辑,相对于传统的“是或者不是” 的二值逻辑而言;
• 模糊数学则是一种更泛泛的叫法,更倾向于指从 数学角度对模糊集和模糊逻辑的研究;
• 从应用的角度,很多人更习惯于用模糊系统的叫 法,用来指采用了模糊数学的思想和理论的方法 或系统,而其中采用的一些技术往往称作模糊技 术和模糊方法。这些名词本身也具有很大的模糊 性,但其实质都是同样的,因此没有必要追究它 们的严格定义。
• 其中,b>1是一个可以控制聚类结果的模糊程度的 常数。
• 在不同的隶属度定义方法下最小化式Jf的损 失函数,就得到不同的模糊聚类方法。
• 其中最有代表性的是模糊c均值方法,它要 求一个样本对于各个聚类的隶属度之和为1, 即
• 在上述约束下求Jf的极小值,令Jf对mi和μj (xi)的偏导数为。可得必要条件
• 其中,b=(a+c)/2,且在xi=b时隶属度函数 等于0.5
π型函数
• 指“中间高两边低”的函数,可以用S型函 数定义标准π型函数的定义是
• 其中,c=(a+a’)/2是中心点, • 当xi=c时,μAπ(xi)=1; • b=(a+c)/2,b’=(c+a’)/2,且当xi=b或xi=b’
3.π度
• 隶属度函数中常用的形式是所谓S型函数和 π型函数,S型函数和π型函数是两种光滑 的隶属度函数形式。
• 如果隶属度函数是π型函数Gπ(xi) ,则模糊 集A的π度定义为
S型隶属度函数
• S型函数是一种从0到1单调增长的函数,通 常可由a,b,c三个参数确定,Zadeh定义 的标准S型隶属度函数是
4.4 特征的模糊评价
• 特征选择和特征提取中的关键问题之一就 是如何评价所得到的特征,使特征中更好 地反映分类的信息。
• 模糊数学的发展为我们评价特征的性能提 供了新的手段,它们是通过衡量模糊集的 模糊程度来评价采用的特征对于分类的性 能表现,即用这些特征将类别分开的难易 程度
4.4.1 模糊程度的度量 Nhomakorabea.5 模糊聚类方法
• 4.5.1 模糊C均值算法 • 4.5.2 改进的模糊C均值算法
4.5.1 模糊C均值算法
• C均值方法 • 使准则函数
• 最小
模糊C均值方法
• 将问题的有关符号重新规定如下:{xi,i=1,2,…,n} 是n个样本组成的样本集合,c为预定的类别数目, m对i,于i=第1,2j类,…的,c为隶每属个度聚函类数的。中用心隶,属μ度j(函xi)数是定第义i个的样聚本 类损失函数可以写为
• 在这样的定义下,可以计算出对应于第j类第q个 特征的模糊度和熵。
• 如果模糊度和熵越小,则表明该类中这一特征的 取值比较集中,因此有利于分类;
• 反之如果模糊度和熵越大,则表明该类中这一特 征取值比较分散,不利于分类。
• 因此,我们可以用这个模糊度和熵作为衡量这个 特征对于该类分类的贡献的指标,模糊度和熵越 小则特征性能分类越好。
1 of N编码(N分之一编码)
体重的1 of N编码
• 把原来的一个特征变为若干模糊特征的目的在于 使新特征更好地反映问题的本质。
• 在很多清况下,用一个特征(比如体重)参与分 类(比如判断是否患有某种可能导致体重变化的 病),正确分类结果与这个特征之间可能是复杂 的非线性关系.
• 而如果根据有关知识适当地提取模糊特征,虽然 特征数增多了,但却可能使分类结果与特征之间 的关系线胜化,从而大大简化后面分类器的设计 和提高分类器性能。如果我们对所提取的特征与 要研究的分类问题之间的关系有一定的先验认识, 则采用这种方法往往能取得很好的结果
• 设N维特征空间Q中包含m个类别,每个类别分别 有nj,j=1,2,…,m个样本。我们用xqj表示第j类中的 第q维特征(注意与上面表示的不同),而用 (xqj)av, (xqj)max, (xqj)min,表示它的均值、最大值和最 小值。
1 用标准π函数计算模糊度和熵
• 考虑用标准π函数定义隶属度函数来分析第j 类的第q个特征。为此,令
表示一个对象x隶属于集合a的程度的函数通常记作定义在空间xx上的隶属度函数就定义了一个模糊集合a模糊集合开水这一概念的模糊集与确定集常见的隶属度函数形式台阶型三角形梯形高斯函数型模糊集的运算模糊集合的荃本运算示意图43模糊特征和模糊分类模糊模式识别就是在解决模式识别问题时引进模糊逻辑的方法或思想模糊技术在统计模式识别和句法模式识别中均得到了较好的应用识别本章只涉及模糊技术在统计模式识别方面的应用模糊模式识别中的一些有代表险的方法和思想
• 如果训练样本中已知的类别标号就以模糊类的隶 属度函数的形式给出,那么我们就需要对原有的 模式识别方法进行改变,以适应这种模糊类别划 分(如后面将要介绍的模糊k近邻法)。
• 本节介绍的结果的模糊化,专门指训练样本和分 类器仍是确定性的,只是根据后续的需要把最终 的输出分类结果进行模糊化。结果的模糊化并没 有固定的方法,通常需要结合有关知识、根据所 用的分类器进行设计,比如可以根据样本离类别 中心的距离、离分类面的距离或与已知样本之间 的某种相似胜度量、神经网络输出的相对大小等 作为模糊化的依据
4.3.2 结果的模糊化
• 模式识别中的分类就是把样本空间(或样 本集)分成若干个子集,当然,我们可以 用模糊子集的概念代替确定子集,从而得 到模糊的分类结果,或者说使分类结果模 糊化。
• 在模糊化的分类结果中,一个样本将不再属于每 个确定的类别,而是以不同的程度属于各个类别, 这种结果与原来明确的分类结果相比有两个显著 的优点:一是在分类结果中可以反映出分类过程 中的不确定性,有利于用户根据结果进行决策乡 二是如果分类是多级的,即本系统的分类结果将 与其他系统分类结果一起作为下一级分类决策的 依据,则模糊化的分类结果通常更有利于下一级 分类,因为模糊化的分类结果比明确的分类结果 中包含更多的信息
第4章 模糊模式识别方法
4.1 引言
• 1965年,Zadeh提出著名的模糊集理论 • 模糊集理论是对传统集合理论的一种推广,在传统集
合理论中一个元素或者属于一个集合,或者不属于一 个集合. • 而对于模糊集来说,每一个元素都是以一定的程度属 于某个集合,也可以同时以不同的程度属于几个集合。 • 对人们现实生活中大量使用的一些含义确定但又不准 确的语言表述,比如“今天天气很热”、“车速过高, 需要适当踩刹车”等,模糊数学能够较好地表达。因 此,模糊数学被很多人认为是解决很多人工智能问题 尤其是常识性问题的最合适的数学工具.
模糊技术应用
• 将模糊技术应用于各个不同的领域,就产生了一些新的学 科分支
• 和人工神经网络相结合,就产生了所谓模糊神经网络。 • 应用到自动控制中,就产生了模糊控制技术和系统 • 应用到模式识别领域来,自然就是模糊模式识别。 • 从20世纪s0年代以来,在很多传统的控制问题中,模糊控
制技术的应用取得了很好的效果尤其是一些国家在诸如地 铁的模糊控制系统,洗衣机、电饭锅等的模糊控制等方面 取得了成功的应用后,人们再次掀起了研究各种模糊技术 的热潮。
• 这里只给出参数的选择方法:
• 采用S型函数得到的模糊度和熵与用π型函 数时正相反。
• 即当类内模糊度和熵的值大时分类性能好。 当类间模糊度和熵的值小时分类性能好, 它们相当于一种类内距离度量和类距离度 量。
3、π度的计算
• 计算第j类第q个特征的π度可以用下面的参 数:
4 综合评价指标
• 对于第q维特征,若把第j类和第k类的类内 评价指标(如模糊度、熵或π度)分别记为 gqj和gqk,而把两类之间的同种的评价指标 记作gqjk,可以定义下面的指标:
(1)
(2)
算法步骤
• 设定聚类数目C和参数b • 初始化各个聚类中心mi。 • 重复下面的运算,直到各个样本的隶属度值稳定: • ·用当前的聚类中心根据式(1)计算隶属度函数: • ·用当前的隶属度函数按式(2)更新计算各类聚类中心 • 当算法收敛时,就得到了各类的聚类中心和各个样本对
于各类的隶属度值,从而完成了模糊聚类划分。如果需 要,还可以将模糊聚类结果进行去模糊化,即用一定的 规则把模糊聚类划分转化为确定性分类。
4.5.2改进的模糊C均值算法
• 在模糊C均值算法中,由于引入了的归一化条件,
• 在样本集不理想的情况下可能导致结果不好。 • 比如,如果某个野值样本远离各类的聚类中心,
本来它严格属于各类的隶属度都很小,但由于归 一化条件的要求,将会使它对各类都有较大的隶 属度(比如两类倩况下各类的隶属度都是0.5), 这种野值的存在将影响迭代的最终结果。
改进
• 为了克服这种缺陷,人们提出了放松的归 一化条件,使所有样本对各类的隶属度总 和为n,即
• 在这个新的条件下,计算mi的式(1)仍不 变,而式(2)则变成
• 算法步骤与模糊C均值算法相同 ,而隶属 度则改为上式即可
• 显然,用改进的模糊C均值算法得到的隶属 度值可能会大于1,因此并不是通常意义上 的隶属度函数。必要时可以把最终得到的 隶属度函数进行归一化处理,这时已不会 影响聚类结果。如果结果要求进行去模糊 化则可以直接用这里得到的隶属度函数进 行。
• 若采用欧氏距离,则k=2,此时γ(A)称作二 次模糊度
2熵
• 模糊集A的熵定义为
• 其中
模糊度和熵的性质
• (1)如果对所有的xi,i=1,2,…,n,有有 μA(xi)=0或μA(xi)=1,即A为确定集,则γ(A) 和H(A)都取其最小值0,此时模糊程度最 小。
• (2)如果对所有的xi,i=1,2,…,n,有 μA(xi)=0.5,则γ(A)和H(A)都取其最大值1, 此时模糊程度最大。
• 模糊技术在统计模式识别和句法模式识别 中均得到了较好的应用识别
• 本章只涉及模糊技术在统计模式识别方面 的应用、模糊模式识别中的一些有代表险 的方法和思想。
4.3.1模糊化特征
• 模糊特征是指根据一定的模糊化规则(通 常根据具体应用领域的专门知识人为确定 或经过试算确定)把原来的一个或几个特 征变量分成多个模糊变量,使每个模糊变 量表达原特征的某一局部特性,用这些新 的模糊特征代替原来的特征进行模式识别。