基于matlab的模糊聚类分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。



end
fprintf(‘标准化矩阵如下:Y=\n'); disp(Y) end
2.3 标定, 建立模糊相似矩阵

针对上述的标准化矩阵 , 计算各分类对象间的相似程度,
从而建立模糊相似矩阵 R= (rij) n n, 这个过程又称为标定, 计
算标定的方法是很多的, 主要包括三大类方法: (1)相似系数
13
2.1 特征抽取,建立原始数据矩阵
假设待分类对象的集合为 X = { X1, X2, …, Xn },集合中的每
个元素具有 m 个特征,设第 i 个对象 Xi 的第 j ( j = 1, 2,
…, m ) 个特征为 xij,则 Xi 就可以用这 m 个特征的取值来 描述,记 Xi = ( xi1, xi2, …, xim) 于是,得到原始数据矩阵为: x 11
基于Matlab的模糊聚类分析及其应用
《管理数学实验》课程汇报 学号:2120111705 姓名:贾珊
1
Contents
1
预备知识 基于MATLAB的模糊聚 类分析的传递方法 实例应用
2
3
3
1.预备知识

聚类分析和模糊聚类分析 模糊相似矩阵 模糊等价矩阵 模糊矩阵的 - 截矩阵

Matlab程序---biaod2.m
2.4 求传递闭包
所谓聚类方法就是依据模糊矩阵将所研究的对象进行 分类的方法。 对于不同的置信水平 ∈[0, 1] ,可以得到 不同的分类结果,从而形成动态聚类图。常用的方法如 下:
(1) (2) (3)
传递闭包法 布尔矩阵法 直接聚类法
本文基于模糊聚类分析的传递闭包方法进行matlab编程 。
x 21 ... x n1
( i =1,2,…,n )
x 12 x 22 ... xn2 ... ... ... ... x1 m x2m ... x nm
2.2 数据标准化处理

描述事物特征的量纲是各种各样的, 为了便于分析和比
较,从而在计算的过程中消除这种干扰。 因此要对矩阵进
定义五:模糊传递闭包 设 RF ( X X ),称 t(R) 为 R 的传递闭包,如果 t(R) 满 足: (1) 传递性:(t(R))2 t(R) ;
(2) 包容性:R t(R) ;
(3) 最小性:若 R′是 X 上的模糊传递关系,且
R R′ t(R) R′,
即 R 的传递闭包t(R)是包含 R 的最小的传递关系。
模糊传递闭包和等价闭包
4
定义一:(模糊)聚类分析
在科学技术,经济管理中常常需要按一定的标准(相似程 度或亲疏关系)进行分类。对所研究的事物按一定标准进行 分类的数学方法称为聚类分析。 由于科学技术,经济管理中的分类往往具有模糊性,因 此采用模糊聚类方法通常比较符合实际。我们不能明确地回 答 “是” 或 “否”, 而是只能作出 “在某种程度上是” 的回答 ,这就是模糊聚类分析。
• •function [D k] =jjz4(B) •L=unique(B)'; •a=size(B); •D=zeros(a); •for m=length(L):-1:1 • k=L(m); • for i=1:a • for j=1:a • if B(i,j)>=k • D(i,j)=1; • else D(i,j)=0;%求截距阵,当bij≥ 时,bij() =1;当bij< 时, bij() =0 • end • end • end •fprintf(‘当分类系数k=:\n'); •disp(L(m)); •fprintf(‘所得截距阵为:\n'); •disp(D); •end
1 n
xj
xij , s j
i 1
( xij x j )
i 1
n
2
平移 • 极差变换
x ij x ij min{ x ij | 1 i n } max{ x ij | 1 i n } min{ x ij | 1 i n }
Matlab程序---bzh1.m
1 0.5 A 0.2 0 0.5 1 0.1 0.3 0.2 0.1 1 0.8 0 0.3 , 0.8 1 1 1 0 0 1 1 0 1 0 0 1 1 0 1 1 1
A0.3
若 R 是 X 上的模糊等价关系,则其 截关系是经典等价 关系,它们都可将 X 作一个划分,当 从 1 下降到 0 时,就 得到一个划分族,而且由于 > 时, R [x] R [x] ,即 R 给出的分类结果中的每类,是 R 给出的分类结果的子类,所 以 R 给出的分类结果比 R 给出的分类结果更细。随着的 下降, R 给出的分类越来越粗,这样就得到一个动态的聚类 图。 但通常模糊关系,不一定有传递性,因而不是模糊等价关 系,对这种模糊关系直接进行上述分类显然是不合理的。为此 ,我们希望寻求一种方法,能将不是等价的模糊关系进行改造 ,以便分类使用。
显然,R 的等价闭包是包含 R 的最小的等价关系。
重要定理 设 RF ( X X ) 是相似关系 ( 即 R 是自反、对称模糊关 系 ) ,则 e(R) = t(R) , 即模糊相似关系的传递闭包就是它的等价闭包。 在实际问题中建立的模糊关系,多数情况下都是相似 关系,定理给我们提供了一个求相似关系的等价闭包的方法 。当论域为有限集时,此法很简便,即对相似矩阵 R ,求 R2, R4,…, 当 Rk◦Rk = Rk 时,便有 e(R) = t(R) = Rk 。


function Y=bzh1(X) [a,b]=size(X);
C=max(X);
D=min(X); Y=zeros(a,b); for i=1:a for j=1:b Y(i,j)=(X(i,j)-D(j))/(C(j)-D(j)); %平移极差变化进行数据标准化 end
k 1
欧氏距离 切比雪夫距离
d ( xi , x j )
(x
k 1
m
ik
x jk )
2
d (xi, xj ) = ∨{ | xik- xjk | , 1≤k≤m}
20
(3)主观评分法 请有经验的人来分别对 Xi 与 Xj 的相似性打分,设 有 s 个人参加评分,若第 k 个人 (1 k s) 认为 Xi 与 Xj 相似的程度为 aij(k) (在 [0,1] 中),他对自己评分的自 信度也打分,若自信度分值是 bij(k) ,则可以用下式来计 算相似系数:
法; (2)距离法; (3)主观评分法。三类方法各有不同的适用范 围, 不同的问题需要的方法是不一样的。

(1)相似系数法 ----夹角余弦法

rij
m
m
x ik x
2
jk
k 1

x ik
k 1

m
x
2 jk
k 1
相似系数法 ----相关系数法
|x
rij
k 1 m k 1
m
ik
k 1
rik rkj rij ,
n
i , j 1, 2 , , n .
定义四:模糊矩阵的截矩阵 设A = (aij)m×n,对任意的∈[0, 1],称
A= (aij())m×n,
为模糊矩阵A的 - 截矩阵, 其中 当aij≥ 时,aij() =1;当aij< 时,aij() =0. 显然,A的 - 截矩阵为布尔矩阵.
当 X、Y、Z 为有限论域时,即 X = {x1, x2, …, xn}, Y ={ y1, y2, …, ym },Z ={ z1, z2, …, zl },则 Q、R、S (= Q ◦R)均可表示为矩阵形式:
Q = (qij)nm ,
其中
R = (rjk)ml ,
S = (sik)nl
s ik
2.5 求模糊矩阵的截矩阵

依次取 ∈[0, 1] , 截关系 R,R 是经典等价关系,它 诱导出 X 上的一个划分 X/R , 将 X 分成一些等价类。确 定相应的λ截矩阵,则可以将其分类。 随 由大到小,分类由细到粗,形成一个动态的分类图 。

Matlab程序--- jjz4.m
28
3.案例分析
环境单元分类 每个环境单元可以包括空气、水分、土壤、作物等四个
要素。环境单元的污染状况由污染物在四要素中含量的超限
度来描写。 假设有五个单元 x1, x2, x3, x4, x5,它们的污染数据如 下表所示。
rij
1 s

s
a ij
k
b ij
k
k 1
• •function R=biaod2(Y,c) •[a,b]=size(Y); •Z=zeros(a); •R=zeros(a); •for i=1:a • for j=1:a • for k=1:b • Z(i,j)=abs(Y(i,k)-Y(j,k))+Z(i,j); • R(i,j)=1-c*Z(i,j);%绝对值减数法--欧氏距离求模糊相 似矩阵 • end • end •end •fprintf(‘模糊相似矩阵如下:R=\n'); •disp(R) •end
定义三:模糊等价矩阵 若 X ={x1, x2, …, xn} 为有限论域时,X 上的模糊等价 关系R 是一个矩阵(称为模糊等价矩阵),它满足下述 三个条件:
(1) 自反性:rii=1,
i =1, 2, …, n。
(2) 对称性:rij= rji, i,j =1, 2, …, n。
(3) 传递性: R ◦ R R,即
空气52522水分53534土壤34245作物25311x1x2x3x4x5原始矩阵xx5532234555232341其动态分类如图347所示1x1x3x4x5x208060504动态聚类图ybzh1x标准化矩阵如下y10000100000333302500000666710000100001000000500000066670005000100000rbiaod2y01模糊相似距离矩阵如下r10000069170941707417075830691710000068330900008167094170683310000068330700007417090000683310000091670758308167070000916710000bcd3r模糊相似矩阵r的传递闭包如下tr10000075830941707583075830758310000075830900009000094170758310000075830758307583090000758310000091670758309000075830916710000jjz4b当分类系数是k1所得截矩阵为1000001000001000001000001当分类系数是k09250所得截矩阵为1010010010100001当分类系数是k09417所得截矩阵为1010001000101000001000001当分类系数是k09167所得截矩阵为1010001000101000001100011当分类系数是k09000所得截矩阵为1010001011101000101101011当分类系数是k07583所得截矩阵为111111111111111111111111142
行标准化处理, 这可以有各种类型的方法, 如平移-标准差 变换和平移-标准差变换,从而可以把矩阵尽量转化为标 准化矩阵。
2.2 数据标准化处理(续)
平移 • 标准差变换
x ij
其中
x ij x j sj
1 n
n
( i 1, 2 ,..., n , j 1, 2 ,..., m )
定义二:模糊相似矩阵 若模糊关系 R 是 X 上各元素之间的模糊关系,且满足: (1) 自反性:R( x , x ) = 1; (2) 对称性:R( x , y ) = R( y , x ) ; 则称模糊关系 R 是 X 上的一个模糊相似关系. 当论域X = {x1, x2, …, xn}为有限时,X 上的一个模糊相似 关系 R 就是模糊相似矩阵,即R满足: (1) 自反性:I ≤R ( rii =1 ); (2) 对称性:RT = R ( rij = rji ).
xi | | x jk x j |
2
( xik xi )
xi
( x jk x j )
k 1
m
2
其中,
m
1
m
x ik , x j
k 1
m
1
m
x jk
k 1
19
(2)距离法
rij = 1 – c d (xi, xj )
其中c为适当选取的参数.
m
海明距离
d ( xi , x j ) | xik x jk |
定义六:模糊等价闭包
设 RF ( X X ),称 e(R) 为 R 的等价闭包,若 e(R) 满 足下述条件:
(1) 等价性:e(R) 是 X 上的模糊等价关系。 (2) 包容性:R e(R)。 (3) 最小性:若 R’ 是 X 上的模糊等价关系,且
R R’ e(R) R’ 。
S 称为模糊矩阵 Q 与 R 的乘积。
在当论域为有限集时,传递闭包法很简便,即对相 似矩阵 R ,求 R2, R4,…, 当 Rk◦Rk = Rk 时,便有 e(R ) = t ( R ) = R k 。
24
y Y
( q ij r jk ) .
Байду номын сангаас

Matlab程序---cd3.m
•function B=cd3(R) •a=size(R); •B=zeros(a); •flag=0; •while flag==0 •for i= 1: a • for j= 1: a • for k=1:a • B( i , j ) = max(min( R( i , k) , R( k, j) ) , B( i , j ) ) ;%R与R内 积,先取小再取大 • end • end •end •if B==R • flag=1; •else • R=B;%循环计算R传递闭包 •end •end
相关文档
最新文档