关于重金属传播采用模糊聚类分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于重金属传播采用模糊聚类分析方法
聚类分析是将事物根据一定的特征,并按某种特定要求或规律分类的方法。由于聚类分析的对象必定是尚未分类的群体,而且现实的分类问题往往带有模糊性,对带有模糊特征的事物进行聚类分析,分类过程中不是仅仅考虑事物之间有无关系,而是考虑事物之间关系的深浅程度,显然用模糊数学的方法处理更为自然,因此称为模糊聚类分析。
一、模糊聚类分析的一般步骤
1、第一步:数据标准化[9]
(1) 数据矩阵
设论域12{,,,}n U x x x = 为被分类对象,每个对象又有m 个指标表示其性状,即
12{,,,}i i i im x x x x = (1,2,,i n = , 于是,得到原始数据矩阵为
11
121
2122
2
1
2
m m n n nm x x x
x x x x x x ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭
。 其中nm x 表示第n 个分类对象的第m 个指标的原始数据。
(2) 数据标准化
在实际问题中,不同的数据一般有不同的量纲,为了使不同的量纲也能进行比较,通常需要对数据做适当的变换。但是,即使这样,得到的数据也不一定在区间[0,1]上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。通常有以下几种变换: ① 平移·标准差变换
i k k
ik
k x x x s -'= (1,2,,;
1,2,i n k m ==
其中 1
1
n
k i k i x x n
==
∑, 2
1
1
()n
k ik
k i s x x n
==
-∑。
经过变换后,每个变量的均值为0,标准差为1,且消除了量纲的影响。但
是,再用得到的ik
x '还不一定在区间[0,1]上。 ② 平移·极差变换
111m i n {
}
m a x {}m i n {}
i k i k
i n
ik
ik
ik
i n
i n
x x x x x ≤≤≤≤≤≤''-''=''-,(1,2,,)k m =
显然有01ik
x ''≤≤,而且也消除了量纲的影响。 ③ 对数变换
lg ik ik x x '= (1,2,,;
1,2,i n k m ==
取对数以缩小变量间的数量级。
2、第二步:标定(建立模糊相似矩阵)
设论域12{,,,}n U x x x = ,12{,,,}i i i im x x x x = ,依照传统聚类方法确定相似系数,建立模糊相似矩阵,i x 与j x 的相似程度(,)ij i j r R x x =。确定(,)ij i j r R x x =的方法主要借用传统聚类的相似系数法、距离法以及其他方法。具体用什么方法,可根据问题的性质,选取下列公式之一计算。
(1) 相似系数法
① 夹角余弦法
122
1
1
m
ik
jk
k ij m
m
ik
jk
k k x
x r x
x
====
∑∑∑
。
② 最大最小法
11
()
()
m
ik
jk k ij m
ik
jk k x
x r x
x ==∧=
∨∑∑。
③ 算术平均最小法
11
2()
()
m
ik jk k ij m
ik
jk k x x r x
x ==∧=
+∑∑。
④ 几何平均最小法
11
2()m
i k j k
k ij m
ik jk
k x x
r x x ==∧=
∑∑
。
以上3种方法中要求0ij x >,否则也要做适当变换。 ⑤ 数量积法
1
1,
,1
,
,
m
ij ik jk k i j r x x i j M ==⎧⎪=⎨≠⎪⎩
∑
,
其中 1
m a x ()m
i k j k
i j
k M x x ≠==∑
。
⑥ 相关系数法
12
2
1
1
()()
m
ik i jk j
k ij m
m
ik
i jk
j k k x x x x r x
x x
x ===--=
--∑
∑∑
,
其中 1
1
m
i i k
k x x m
==
∑,1
1
m
j jk
k x x m
==
∑。
⑦ 指数相似系数法
2
2
1()
13exp[]4m
ik jk ij k k
x x r m s =-=-∑ , 其中 2
1
1
()n
k ik
ik i s x x n
==
-∑,
而 1
1
n
k i k
i x x n
==
∑ (1,2,,)k m = 。
(2) 距离法