模糊数学基本知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.模糊数学的基础知识
1.模糊集、隶属函数及模糊集的运算。
普通集合A,对,有或。
如果要进一步描述一个人属于年轻人的程度大小时,仅用特征函数就不够了。模糊集理论将普通集合的特征函数的值域推广到[0,1]闭区间内,取值的函数以度量这种程度的大小,这个函数(记为)称为集合的隶属函数。即对于每一个元素,有[0,1]内的一个数与之对应。
(1)模糊子集的定义:射给定论域U,U到[0,1]上的任一映射:
都确定了U上的一个模糊集合,简称为模糊子集。称为元素属于模糊集的隶属度。映射所表示的函数称为隶属函数。
例如:设论域U=[0,100],U上的老年人这个集合就是模糊集合:
若在集合U上定义了一个隶属函数,则称为模糊集。
(2)模糊集合的表示:,称为元素属于模糊集的隶
属度;则模糊集可以表示为:。
或,,
(3)模糊集合的运算:
,,
并集:
,
交集:
,
补集:,
包含:,
2.模糊集的截集
已知U上模糊子集
对,则称为模糊集的-截集;
称为模糊集的-强截集;称为、的置信水平或阀值。
二.模糊数学的基本定理
1.模糊截积:
已知U上模糊子集
对,也是U上模糊集,其隶属函数为:
;
称为为与的模糊截积。
2.分解定理1:已知模糊子集,则
推论1:对
3.分解定理2:已知模糊子集,则
推论2:对
三.模糊关系与模糊聚类
1.模糊关系与模糊关系的合成
(1)模糊关系
普通集合的经典关系,
模糊关系:从U到V 上的一个模糊关系:,表示具有的关系程度,。(满足01)称为U 到V 上的一个模糊关系的模糊矩阵。
(2).设=和=为两个模糊矩阵,令
=,=1,2,…,,=1,2,…,。
则称矩阵=为模糊矩阵与的褶积,记为
=,
其中“”和“”的含义为
显然,两个模糊矩阵的褶积仍为模糊矩阵
2. 模糊等价矩阵及其矩阵
设方阵为以模糊矩阵,若满足
=
则称为模糊等价矩阵。
模糊等价矩阵可以反映模糊分类关系的传递性,即描述诸如“甲像乙,乙像丙,则甲像丙”这样的关系。
设=为一个模糊等价阵,01为一个给定的数,令
则称矩阵为的截阵
例如,
=
为一个模糊等价阵,取0.4<,则
=
若取,则
=
2.模糊聚类:
模糊划分的概念最早由Ruspini提出,利用这一概念人们提出了多种聚类方法,比较典型的有:基于相似性关系和模糊关系的方法(包括聚合法和分裂法),基于模糊等价关系的传递闭包方法、基于模糊图论最大树方法,以及基于数据集的凸分解、动态规划和难以辨识关系等方法. 然而由于上述方法不适用于大数据量情况,难以满足实时性要求高的场合,因此其实际的应用不够广泛,故在该方面的研究也就逐步减少了. 实际中受到普遍欢迎的是基于目标函数的方法,该方法设计简单、解决问题的范围广,最终还可以转化为优化问题而借助经典数学的非线性规划理论求解,并易于计算机实现. 因此,随着计算机的应用和发展,该类方法成为聚类研究的热点.
(1)模糊聚类的基本概念
模糊聚类目标函数的演化
模糊聚类方法
模糊聚类法和一般的聚类方法相似,先将数据进行标准化,计算变量间相似矩阵或样品间的距离矩阵,将其元素压缩到0与1之间形成模糊相似矩阵,进一步改造为模糊等价矩阵,最后取不同的标准,得到不同的截阵,从而就可以得到不同的类。具体步骤如下:
第一步:数据标准化
1.数据矩阵
设论域为被分类的对象,每个对象又由个指标表示其性状:
()
于是得到原始数据矩阵为
2.数据标准化
在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样得到的数据也不一定在区间[0,1]上。因此,这里所说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。
通常需要作如下变换:
(1)平移·标准差变换:
()
其中。
经过变化后,每个变量的均值为0,标准差为1,且消除了量纲的影响。但是,这样得到的还不一定在区间[0,1]上。
(2)平移·级差变换
()
显然有,而且也消除了量纲的影响。
第二步:标定(建立模糊相似矩阵)
设论依照传统的方法确定相似系数,建立模糊相似矩阵,与的相似程度。可根据问题的性质,选取下列公式之一计算
1. 数量积法
其中
显然,若中出现负值,也可采用下面的方法将压缩在[0,1]上
令,则。
当然也可用上述的平移·级差变换。
2.夹角余弦法
=
若将变量的个观测值与变量的相应个观测值看成维空间中的两个向量,正好时这两个向量夹角的余弦。
3.相关系数法
从统计角度看,两个随机变量的相关系数是描述这两个变量关联性(线性关系)强弱的一个很有用的特征数字。因此,用任意两个变量的个观测值对其相关系数的估计可作为两个变量关联性的一种度量,其定义为
=,
其中(=1,2,…,)见(=,=1,2,…, ,)。(1)其实就是=的样本相关矩阵中的各元素。
4.指数相似系数法
,
其中,而
需要注意的是,相关系数法与指数相似系数法中的统计指标的内容是不同的。5.最大最小法
6.算术平均最小法
7.几何平均最小法