三角模糊数多维标度分析及其应用_张菊花
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2 l m l m l u l u l l 2ù ê (a - a ) - (b - b ) + (a - a ) - (b - b ) + (a - b ) ú ρ1(a͂ b͂ ) = é ; ë û
第二步: 令 B = (bij ) ,使
bij = aij - a ˉi × - a ˉ ×j - a ˉ× × ;
n
n
n
n
bm ( λ) bu ( λ)] 为
[
] [
]
12
(al - bl )2 + (a m - bm)2 + (au - bu)2 ρ 2 (a͂ b͂ ) = ; 3 S (a͂ b͂ ) = 1 |al - bl | + |a m - bm| + |au - bu| 。 容 易 验 证 ρ1 和 3 ρ 2 都是距离, S 是相似度. 显然 S (a͂ b͂ ) 越大, 则 a͂ b͂ 相似 程度越大. 特别地, 当 S (a͂ b͂ ) = 1 时, 有 a͂ = b͂ , 即三角模糊
理论新探
三角模糊数多维标度分析及其应用
张菊花,魏立力
(宁夏大学 数学计算机学院,银川 750021) 摘 要: 多维标度法(MDS)是一种利用客体间的相似性去揭示其空间关系的统计分析方法。文章将经典的 MDS 扩展到了数据为三角模糊数的情形. 首先对多维标度理论、 三角模糊数的理论进行了概括; 其次依据三角 模糊数的两个距离和一个相似度, 构建了模糊数多维标度分析模型; 最后, 利用所得方法对我国中部省份计算 机拥有率、 计算机的联网率进行了分析。 关键词: 多维标度; 三角模糊数; 三角模糊数的距离; 距离阵 中图分类号: O212.4 文献标识码: A 文章编号: 1002-6487 (2014) 18-0028-04
D 是欧氏的从而存在构图, 但如果构图点 xi 的维数太高,
其中 dij 称为第 i 个点与第 j 个点间的距离. 有了一个距离阵 D = (dij ) , 多维标度法的目的就是要 确定 k 并且在 k 维空间 Rk 中求 n 个点 x1 × × × x n , 使得这
n 个点的欧氏距离与距离阵中的相应值在某种意义下尽
仍然不实用, 因为失去了直观意义而不便解释。这时一般 不求构图 X 而求低维的拟合构图 X̂ 。所以在上述两种 情形下都需要寻求拟合构图。 在定理 1 中, 由获得 X 的途径式给我们一个启示, 可 仿造这个途径来给出距离阵的拟合构造点, 基于这种思想 得到的拟合构造点称为多维标度法的古典解。下面给出
(
)
x1 × × × x n 即为欲求古典解。
数 a͂ b͂ 相等.其中距离 ρ1 来自文献[3], 距离 ρ 2 和相似度 S 来自文献[4]。
表1 指标评语 很差 差 中下 中 中上 好 很好 表2 上海 武汉 长沙 合肥 郑州 太原 南昌 评价集结值 (0.52,0.68,0.88) (0.38,0.56,0.76) (0.36,0.52,0.72) (0.36,0.52,0.72) (0.30,0.48,0.66) (0.32,0.46,0.64) (0.28,0.44,0.58) 程度语言与其对应的三角模糊数 评价模糊数 (0,0,0.1) (0,0.1,0.3) (0.1,0.3,0.5) (0.3,0.5,0.7) (0.5,0.7,0.9) (0.7,0.9,1) (0,9,1,1)
μ a͂ ( x) 为: ì0 x < al ; ï l - a al £ x £ a m ; ï ïx ï a m - al μ a͂ ( x) = í u ï a - x a m £ x £ au ; ï au - a m ï ï x > au î0 则 称 a͂ 为 三 角 模 糊 数, 记 作 a͂ = (al a m au) . 其 中 al a m au 是实数, 且 al £ a m £ au .当 al = a m = au 时, a͂ 为一
(1) D′ = D (2) dij ³ 0 dii = 0 "i j = 1 × × × n.
阵形式 X = ( x1 × × × x n ) . 则称 X 为 D 的一个多维标度解.
′
在多维标度法中, 形象的称 X 为距离阵 D 的一个拟合构 图, 由这 n 个点之间的欧氏距离构成的距离阵称为 D 的 拟合距离阵。所谓拟合构图, 其意义是有了这 n 个点的坐 ̑̂ 和原始 标, 可以在 Rk 中画出图来, 使得它们的距离阵 D 的 n 个客体的距离阵 D 接近, 并可以给出原始 n 个客体 ̂̑ = D , 则称 X 为 关系一个有意义的解释。特别地, 如果 D
定理 1 设 D 是 n ´ n 距离阵,
,
则 D 是欧氏型的, 当且仅当 B ³ 0 。 证明见文献[2]。 从上面定理的充分性证明, 给出了如何从 D 构造 X 的办法, 即 D ® A ® B ® X . 当距离阵 D 是欧氏的时候, 定理 1 给出了求 D 的构 图 X 的方法. 当 D 不是欧氏的情形, 由上面的定理, 显然 不存在 D 的构图, 这时只能寻求 D 的拟合构图。为了和 构图 X 加以区别, 拟合构图用 X̂ 来记。在实际中, 即使
dij = (cii + c jj - 2cij ) , 由 相 似 系 数 阵 的 定 义 有 cii + c jj - 2cij ³ 0 , 故 dij 的 定 义 有 意 义, 显 见 dii = 0 及 dij = d ji , 故 D 为距离阵。故当已知 n 个客体之间的相似
12
系数阵时, 我们可以先转化为距离阵, 再依据求古典解的 步骤求它的拟合构图。 2 三角模糊数及运算 定义 4 若实数域 R 上的一个模糊数 a͂ , 其隶属函数
D 的一个构图。
定义 2 一个距离阵 D = (dij ) 称作欧氏型的, 若存在某 个正整数 p 及 p 维空间的 n 个点 x1 × × × x n , 使得
2 dij = ( xi - x j )′ ( xi - x j ) i j = 1 × × × n. ′ B = HAH H = I n - 1 n1 n1 n 2 A = (aij ) aij = - 1 2 d ij
设按某种要求求得的 n 个点为 x1 × × × x n , 并写成矩 0 引言 多维标度分析, 又称多维量表法, 是多元分析技术的 新分支, 是主成分分析和因素分析的一个自然延伸, 它是 检验观察数据是否能反映研究者提出的结构关系的一种 理想方法。这一方法将高维空间中点际之间距离压缩到 低维空间, 并以图形的形式直观呈现研究变量之间的相似 性或差异性关系, 达到简化数据、 揭示数据潜在规律的目 的。 本文在多维标度分析法的基础上将普通的多维标度 分析扩展到三角模糊数多维标度分析。并依据给出的三 角模糊数距离和相似度用三角模糊数多维标度法对中部 地区电子政务基础设施状况进行分析, 通过空间感知图来 揭示各个省份电子政务基础设施状况的空间关系。 1 多维标度的相关概念 我们这里研究的距离不限于通常的欧氏距离. 首先对 距离的意义加以拓广, 给出如下的距离阵定义[1, 2]。 定义 1 一个 n ´ n 阶矩阵 D = (dij ) 称为距离阵, 如果满 足如下两个条件:
理论新探
求古典解的步骤: 第一步: 由距离阵 D = (dij ) 构造
2 A = (aij ) = (- 1 2 d ij ) ;
加法运算: a͂ + b͂ = [al + bl a m + bm au + bu] ; 乘法运算: a͂ b͂ = [al bl a m bm au bu] ; 数乘运算: λa͂ = [ λal λa m λau] 。 上述运算实际上是由模糊集的扩张原理得到的。 下面我们考虑两个常见的三角模糊数的距离和一个 相似度。 设 a͂ = [al ( λ) a m ( λ) au ( λ)] b͂ = [bl ( λ) 任意两个三角模糊数。定义
统计与决策201 4 年第 18 期·总第 414 期
个精确实数。 定 义 5 ( 三 角 模 糊 数 的 运 算) 设 有 两 个 三 角 模 糊 数 a͂ = [al a m au] b͂ = [bl bm bu] ,和一个实数 λ 。定义如下运 算:
Байду номын сангаас29
理论新探
æ 0 ö ç ÷ 0 ç 0.127 ÷ ç ÷ 0 ç 0.160 0.035 ÷ R2 = ç ÷ 0 0 ç 0.160 0.035 ÷ ç ÷ 0 ç 0.214 0.087 0.054 0.054 ÷ ç ÷ 0 ç 0.221 0.097 0.062 0.062 0.020 ÷ è 0.262 0.138 0.104 0.104 0.053 0.043 0 ø æ 1 ö ç 0.87 ÷ 1 ç ÷ ç ÷ 1 ç 0.84 0.97 ÷ R3 = ç ÷ 1 1 ç 0.84 0.79 ÷ ç ÷ 1 ç 0.79 0.91 0.95 0.95 ÷ ç ÷ 1 ç 0.78 0.91 0.94 0.94 0.99 ÷ è 0.74 0.87 0.90 0.90 0.95 0.96 1 ø 下面对中部省份电子政务的基础设施状况的三角模
其中 a ˉ i × = 1 å aij a ˉ ×j = 1 å aij a ˉ × × = 12 å å aij . n j=1 n i=1 n i=1 j=1 第三步: 求 B 的特征根 λ1 ³ λ 2 ³ × × × ³ λ n , 若无负特征 根, 表明 B ³ 0 , 从而 D 是欧氏型的;若有负特征根, D 一 定不是欧氏型的。依据 λ + × × × +λk φ= 1 ³φ | λ1 | + × × × +| λn | 0 来确定最小的 k 值,但必要求 λ1 ³ × × × ³ λ k > 0 ,其中 φ0 为预先给定的阈值 (即变差贡献比例) 。 ̂ 第四步: 令 X = x(1) × × × x(k) , 则 X̂ 的 行 向 量
3 三角模糊数多维标度模型及实例分析 下面我们依据古典多维标度的思想, 以文献[5]中的中 部省份电子政务的基础设施状况(计算机拥有率, 计算机 的联网率)为例, 利用上述定义的三角模糊数距离和相似 度, 基于多维标度法的思想用 SPSS 软件进行分析。 对中部省份电子政务的基础设施状况的评价以程度 语言构建评语集, 并将评语集转化为三角模糊数(见表 1), 然后集结各位专家的评价值(见表 2)。 由上面给出的距离知中部省份电子政务的基础设施 状况的三角模糊数的距离阵和相似距离阵为: æ 0 ö ç ÷ 0 ç 0.296 ÷ ç 0.358 0.066 ÷ 0 ç ÷ R1 = ç ÷ 0 0 ç 0.358 0.066 ÷ ç ÷ 0 ç 0.492 0.197 0.136 0.136 ÷ ç ÷ 0.484 0.194 0.128 0.128 0.045 0 ç ÷ è 0.591 0.298 0.234 0.234 0.104 0.110 0 ø
在有些问题中,已知的是 n 个样品之间的相似系数 矩阵 C , 而不是距离阵 D . 定义 3 一个 n ´ n 阶矩阵 C = (cij ) 称为相似系数阵,如
[2]
果满足如下两个条件:
(1) C ′ = C (2) Cij £ Cii i j = 1 × × × n.
其中 Cij 称为第 i 个点与第 j 个点间的相似系数。 由于相似系数和距离之间有一定的联系,我们可以从 相 似 阵 C 来 产 生 一 个 距 离 阵 D = (dij ) , 其 中
量接近。在实际中, 为了使求得的结果易于解释, 通常取
k = 1 2 3 。
作者简介: 张菊花(1988-), 女, 宁夏人, 硕士研究生, 研究方向: 多元统计分析。 魏立力 (通讯作者) (1965-) , 男, 甘肃人, 博士, 教授, 研究方向: 人力智能与统计。 28
统计与决策201 4 年第 18 期·总第 414 期
第二步: 令 B = (bij ) ,使
bij = aij - a ˉi × - a ˉ ×j - a ˉ× × ;
n
n
n
n
bm ( λ) bu ( λ)] 为
[
] [
]
12
(al - bl )2 + (a m - bm)2 + (au - bu)2 ρ 2 (a͂ b͂ ) = ; 3 S (a͂ b͂ ) = 1 |al - bl | + |a m - bm| + |au - bu| 。 容 易 验 证 ρ1 和 3 ρ 2 都是距离, S 是相似度. 显然 S (a͂ b͂ ) 越大, 则 a͂ b͂ 相似 程度越大. 特别地, 当 S (a͂ b͂ ) = 1 时, 有 a͂ = b͂ , 即三角模糊
理论新探
三角模糊数多维标度分析及其应用
张菊花,魏立力
(宁夏大学 数学计算机学院,银川 750021) 摘 要: 多维标度法(MDS)是一种利用客体间的相似性去揭示其空间关系的统计分析方法。文章将经典的 MDS 扩展到了数据为三角模糊数的情形. 首先对多维标度理论、 三角模糊数的理论进行了概括; 其次依据三角 模糊数的两个距离和一个相似度, 构建了模糊数多维标度分析模型; 最后, 利用所得方法对我国中部省份计算 机拥有率、 计算机的联网率进行了分析。 关键词: 多维标度; 三角模糊数; 三角模糊数的距离; 距离阵 中图分类号: O212.4 文献标识码: A 文章编号: 1002-6487 (2014) 18-0028-04
D 是欧氏的从而存在构图, 但如果构图点 xi 的维数太高,
其中 dij 称为第 i 个点与第 j 个点间的距离. 有了一个距离阵 D = (dij ) , 多维标度法的目的就是要 确定 k 并且在 k 维空间 Rk 中求 n 个点 x1 × × × x n , 使得这
n 个点的欧氏距离与距离阵中的相应值在某种意义下尽
仍然不实用, 因为失去了直观意义而不便解释。这时一般 不求构图 X 而求低维的拟合构图 X̂ 。所以在上述两种 情形下都需要寻求拟合构图。 在定理 1 中, 由获得 X 的途径式给我们一个启示, 可 仿造这个途径来给出距离阵的拟合构造点, 基于这种思想 得到的拟合构造点称为多维标度法的古典解。下面给出
(
)
x1 × × × x n 即为欲求古典解。
数 a͂ b͂ 相等.其中距离 ρ1 来自文献[3], 距离 ρ 2 和相似度 S 来自文献[4]。
表1 指标评语 很差 差 中下 中 中上 好 很好 表2 上海 武汉 长沙 合肥 郑州 太原 南昌 评价集结值 (0.52,0.68,0.88) (0.38,0.56,0.76) (0.36,0.52,0.72) (0.36,0.52,0.72) (0.30,0.48,0.66) (0.32,0.46,0.64) (0.28,0.44,0.58) 程度语言与其对应的三角模糊数 评价模糊数 (0,0,0.1) (0,0.1,0.3) (0.1,0.3,0.5) (0.3,0.5,0.7) (0.5,0.7,0.9) (0.7,0.9,1) (0,9,1,1)
μ a͂ ( x) 为: ì0 x < al ; ï l - a al £ x £ a m ; ï ïx ï a m - al μ a͂ ( x) = í u ï a - x a m £ x £ au ; ï au - a m ï ï x > au î0 则 称 a͂ 为 三 角 模 糊 数, 记 作 a͂ = (al a m au) . 其 中 al a m au 是实数, 且 al £ a m £ au .当 al = a m = au 时, a͂ 为一
(1) D′ = D (2) dij ³ 0 dii = 0 "i j = 1 × × × n.
阵形式 X = ( x1 × × × x n ) . 则称 X 为 D 的一个多维标度解.
′
在多维标度法中, 形象的称 X 为距离阵 D 的一个拟合构 图, 由这 n 个点之间的欧氏距离构成的距离阵称为 D 的 拟合距离阵。所谓拟合构图, 其意义是有了这 n 个点的坐 ̑̂ 和原始 标, 可以在 Rk 中画出图来, 使得它们的距离阵 D 的 n 个客体的距离阵 D 接近, 并可以给出原始 n 个客体 ̂̑ = D , 则称 X 为 关系一个有意义的解释。特别地, 如果 D
定理 1 设 D 是 n ´ n 距离阵,
,
则 D 是欧氏型的, 当且仅当 B ³ 0 。 证明见文献[2]。 从上面定理的充分性证明, 给出了如何从 D 构造 X 的办法, 即 D ® A ® B ® X . 当距离阵 D 是欧氏的时候, 定理 1 给出了求 D 的构 图 X 的方法. 当 D 不是欧氏的情形, 由上面的定理, 显然 不存在 D 的构图, 这时只能寻求 D 的拟合构图。为了和 构图 X 加以区别, 拟合构图用 X̂ 来记。在实际中, 即使
dij = (cii + c jj - 2cij ) , 由 相 似 系 数 阵 的 定 义 有 cii + c jj - 2cij ³ 0 , 故 dij 的 定 义 有 意 义, 显 见 dii = 0 及 dij = d ji , 故 D 为距离阵。故当已知 n 个客体之间的相似
12
系数阵时, 我们可以先转化为距离阵, 再依据求古典解的 步骤求它的拟合构图。 2 三角模糊数及运算 定义 4 若实数域 R 上的一个模糊数 a͂ , 其隶属函数
D 的一个构图。
定义 2 一个距离阵 D = (dij ) 称作欧氏型的, 若存在某 个正整数 p 及 p 维空间的 n 个点 x1 × × × x n , 使得
2 dij = ( xi - x j )′ ( xi - x j ) i j = 1 × × × n. ′ B = HAH H = I n - 1 n1 n1 n 2 A = (aij ) aij = - 1 2 d ij
设按某种要求求得的 n 个点为 x1 × × × x n , 并写成矩 0 引言 多维标度分析, 又称多维量表法, 是多元分析技术的 新分支, 是主成分分析和因素分析的一个自然延伸, 它是 检验观察数据是否能反映研究者提出的结构关系的一种 理想方法。这一方法将高维空间中点际之间距离压缩到 低维空间, 并以图形的形式直观呈现研究变量之间的相似 性或差异性关系, 达到简化数据、 揭示数据潜在规律的目 的。 本文在多维标度分析法的基础上将普通的多维标度 分析扩展到三角模糊数多维标度分析。并依据给出的三 角模糊数距离和相似度用三角模糊数多维标度法对中部 地区电子政务基础设施状况进行分析, 通过空间感知图来 揭示各个省份电子政务基础设施状况的空间关系。 1 多维标度的相关概念 我们这里研究的距离不限于通常的欧氏距离. 首先对 距离的意义加以拓广, 给出如下的距离阵定义[1, 2]。 定义 1 一个 n ´ n 阶矩阵 D = (dij ) 称为距离阵, 如果满 足如下两个条件:
理论新探
求古典解的步骤: 第一步: 由距离阵 D = (dij ) 构造
2 A = (aij ) = (- 1 2 d ij ) ;
加法运算: a͂ + b͂ = [al + bl a m + bm au + bu] ; 乘法运算: a͂ b͂ = [al bl a m bm au bu] ; 数乘运算: λa͂ = [ λal λa m λau] 。 上述运算实际上是由模糊集的扩张原理得到的。 下面我们考虑两个常见的三角模糊数的距离和一个 相似度。 设 a͂ = [al ( λ) a m ( λ) au ( λ)] b͂ = [bl ( λ) 任意两个三角模糊数。定义
统计与决策201 4 年第 18 期·总第 414 期
个精确实数。 定 义 5 ( 三 角 模 糊 数 的 运 算) 设 有 两 个 三 角 模 糊 数 a͂ = [al a m au] b͂ = [bl bm bu] ,和一个实数 λ 。定义如下运 算:
Байду номын сангаас29
理论新探
æ 0 ö ç ÷ 0 ç 0.127 ÷ ç ÷ 0 ç 0.160 0.035 ÷ R2 = ç ÷ 0 0 ç 0.160 0.035 ÷ ç ÷ 0 ç 0.214 0.087 0.054 0.054 ÷ ç ÷ 0 ç 0.221 0.097 0.062 0.062 0.020 ÷ è 0.262 0.138 0.104 0.104 0.053 0.043 0 ø æ 1 ö ç 0.87 ÷ 1 ç ÷ ç ÷ 1 ç 0.84 0.97 ÷ R3 = ç ÷ 1 1 ç 0.84 0.79 ÷ ç ÷ 1 ç 0.79 0.91 0.95 0.95 ÷ ç ÷ 1 ç 0.78 0.91 0.94 0.94 0.99 ÷ è 0.74 0.87 0.90 0.90 0.95 0.96 1 ø 下面对中部省份电子政务的基础设施状况的三角模
其中 a ˉ i × = 1 å aij a ˉ ×j = 1 å aij a ˉ × × = 12 å å aij . n j=1 n i=1 n i=1 j=1 第三步: 求 B 的特征根 λ1 ³ λ 2 ³ × × × ³ λ n , 若无负特征 根, 表明 B ³ 0 , 从而 D 是欧氏型的;若有负特征根, D 一 定不是欧氏型的。依据 λ + × × × +λk φ= 1 ³φ | λ1 | + × × × +| λn | 0 来确定最小的 k 值,但必要求 λ1 ³ × × × ³ λ k > 0 ,其中 φ0 为预先给定的阈值 (即变差贡献比例) 。 ̂ 第四步: 令 X = x(1) × × × x(k) , 则 X̂ 的 行 向 量
3 三角模糊数多维标度模型及实例分析 下面我们依据古典多维标度的思想, 以文献[5]中的中 部省份电子政务的基础设施状况(计算机拥有率, 计算机 的联网率)为例, 利用上述定义的三角模糊数距离和相似 度, 基于多维标度法的思想用 SPSS 软件进行分析。 对中部省份电子政务的基础设施状况的评价以程度 语言构建评语集, 并将评语集转化为三角模糊数(见表 1), 然后集结各位专家的评价值(见表 2)。 由上面给出的距离知中部省份电子政务的基础设施 状况的三角模糊数的距离阵和相似距离阵为: æ 0 ö ç ÷ 0 ç 0.296 ÷ ç 0.358 0.066 ÷ 0 ç ÷ R1 = ç ÷ 0 0 ç 0.358 0.066 ÷ ç ÷ 0 ç 0.492 0.197 0.136 0.136 ÷ ç ÷ 0.484 0.194 0.128 0.128 0.045 0 ç ÷ è 0.591 0.298 0.234 0.234 0.104 0.110 0 ø
在有些问题中,已知的是 n 个样品之间的相似系数 矩阵 C , 而不是距离阵 D . 定义 3 一个 n ´ n 阶矩阵 C = (cij ) 称为相似系数阵,如
[2]
果满足如下两个条件:
(1) C ′ = C (2) Cij £ Cii i j = 1 × × × n.
其中 Cij 称为第 i 个点与第 j 个点间的相似系数。 由于相似系数和距离之间有一定的联系,我们可以从 相 似 阵 C 来 产 生 一 个 距 离 阵 D = (dij ) , 其 中
量接近。在实际中, 为了使求得的结果易于解释, 通常取
k = 1 2 3 。
作者简介: 张菊花(1988-), 女, 宁夏人, 硕士研究生, 研究方向: 多元统计分析。 魏立力 (通讯作者) (1965-) , 男, 甘肃人, 博士, 教授, 研究方向: 人力智能与统计。 28
统计与决策201 4 年第 18 期·总第 414 期