用非线性化的方法对主成分分析法的改进

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

使它们 与 4 个 主 分 量 的 分 变 量 的 线 性 组 合尽可能相似 ( 在最小二乘意义上) , 其 中 4 可比变量个数小得多。这样会使前 4 个分量 的 总 方 差 ( 前 4 个主分量的协方 差的迹) 最大化。在每一次迭代中 , 92: 算法进行带有最优化标度的经典主分量 分析。 当所有变量是有序的选择等级时, 这些 它对应于 H;44>@@ 的 9J+,KL 分析。 迭代可用 2M5M5N;=O 和 :;BNC??C 提出的 方法进行初始化,他们分别独立提出了 相同的对名义变量和区间测量尺度变量 的迭代算法。然后用 L(H2P, 过程对变 换 后 的 2)* 数 据 进 行 主 成 分 分 析 , 就 可 以看到第一主成分的贡献率大幅提高。 二、利用非线性化方法对同类产品 评价等级标准的分析 本例是 7# 个参评者对 7# 种同类产 品的评价等级, 评价结果见表 6 。这些等 级标度在 Q 至 R 上, Q 意味着最不可能 选择这种产品,而 R 认为最有可能选择 这种产品。其中表 7 是对原数据做的传 统主成分分析结果,可见各主成分之间 差异度不大,第一主成分贡献率不尽如 人意, 表 S 则 是 经 过 +,-./0(1 处 理 后 的结果,处理后的各主成分之间差异度 拉大, 而且累计贡献率有显著提高。 经过 非线性化处理后, 主成分更加突出。 处理 前直至第七个主成分,累计贡献率达到
片面追求高速度、 高产值, 盲 目 上 项 目 , 的系统性,把对象放在系统形式中加以
表$
传统主成分分析法的处理结果
法与加权评估法在机理和结论上不相同
, -)*$+. -)-(#, -)/,,/ -)(/-( -)-%$-).-.#
# 特征值 ()*%+, 贡献率 -)%-.累计贡献率 -)%-.-
67T
统计与决策
!"#"$
知识丛林 0123124567826
!"" # 年 第 $ 期(总 第 %$& 期 )
投资项目评估 中的系统方法
!李

在现代市场经济中,资源配置问题 是以市场为主导解决的。 然而, 理论和实 践表明,由于存在外部性,市场并非万 能, 单纯市场调节存在种种缺陷, 导致资 源不能有效配置。 因此, 有必要发挥政府 的积极作用, 来辅助市场机制, 有效地配 置资源。政府在这方面的主要作用之一 就是对投资项目进行评估,即从整个社 会经济范围的角度来评估整个投资项 目, 以做出正确决策。在我国, 长期以来 铺摊子, 重复投资, 重复建设, 而忽略了 从战略、 整体上合理地配置资源, 造成我 国投资效益低下,在近年内甚至还呈现 下降趋势,严重阻碍了我国经济的健康 发展。探索并总结出一套适合我国国情 的项目评估方法成为我国投资管理的当 务之急。 投资项目的评估,不是仅仅限于项 目本身的财物分析,而是从整个社会经 济范围的角度来评估, 涉及方面很多, 尤 其是像我国这样的大国,其社会经济系 统是多要素、多层次、多目标的复杂系 统, 以往那种处理单因素、 静态系统的传 统方法对此无能为力,这就使得系统方 法在项目评估中,成为一个不可缺少的 手段。 一、 系统方法概述 所谓系统方法,就是按照事物本身 考察的方法, 即从系统的观点出发, 着重 从系统与要素、 要素与要素、 系统与环境 之间相互联系、 相互作用、 相互制约的关 系中, 综合地、 精确地考察对象, 以达到 最佳地处理问题的一种方法。它要求人 们把对象和过程视为一个相互联系、 相 互作用的整体,并且尽可能将整体做形 式化的处理。 系统方法一般可以分为两个方面, 一是运用系统科学基本原理和规律来分 析认识事物的一般方法,它为人们的思 维提供某种规则、 程序, 我们可称其为系 统方法; 二是诸如系统工程、 系统预测等 用以处理系统问题的系统分析技术, 是 系统科学原理用于社会实践活动所产生 的一系列可供操作的程序、 规则和方法, 我们可称其为系统技术。两个方面是紧 密联系的, 前者是后者的出发点和依据, 后者是前者的具体实施,二者都在项目 评估中具有重要的应用价值。 系统观的思维方式,其优越性就是 要把研究对象理解为一个从周围环境中 划分出来的整体, 同时, 它作为整体又与 环境相互作用、 相互影响, 整体包括许多 从属的子系统, 它们在整体中相互联系、 相互制约。在运用系统方法研究和解决 问题时, 为了有效地利用系统科学成果,
其中最常用的
9>FC@ 7 9>FC@ S 是 92: 方 法 , 9>FC@ V 它 建 立 在 主 分 9>FC@ # 9>FC@ W 量模型上, 试 9>FC@ T 图 使 协 方 差 阵 9>FC@ " 的 前 4 个 特 征 9>FC@ R 值 的 总 和 最 大 9>FC@ 6Q 9>FC@ 66 化 。 用 这 种 方 9>FC@ 67 法 变 化 变 量 , 9>FC@ 6S QQ#67QQV7SV#6QVSQQS#6#WR" VQ#SSQ#"6V6W6WVS#VVTVTTR# WQ7TVQQT7S676SV##V#WW"W#" 7Q7VQQWT6#Q76VVS#SQWV"W## #QQT6RTTQ#Q766Q6"#QW#T### 7#V#T#RTW##############VT ##V"WV"777#WVWVWV"T#""##V 6#V"#VWV#T""RT#VWV7V#T"WV VRT#WV76W#T"RVV#V7666W#"W V#V67V"TT"V#V76#V#"TRWV#W T#"WVVWT"WTWT"WT""W"TT"RV "VVV6VV#766W#W"TWT"W"TT6R 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 9>FC@ 6# 6W 6T 6" 6R 7Q 76 77 7S 7V 7# WV#WV6WV"RT"RV#WSW6#S76#R S76S#VRTRV#V76S#VWV"TRV#W #W"WTWR""RW#V#WT"W"W"TW"W T"TW7#SW"RV7#VW"W"TWT"TRT 6T#W"WT"R"TW"WRT"R"#VT##W TT"T"TW"TWTW"6V#W#T"W"RV# V#T"#"TT#TW"T#T##W"WWRVWW VS#VS#WR6V#V#W#WTWTWWT7VR V7SV"WT"T"W#TV#"TTW"RT"R" 6V#T"W"W"TW"TRTRT"RTRT"RT #"S"SV#STR7#S#SV"RRT#"66#
就 必 然 存 在 着 起 支 配 作 用 的 共 同 因 素 , 量的个数较多时,第一主成分的贡献率
+,-./0(1 过程提供了三 种 方 法 来
变 换 一 组 变 量 , 分 别 是 92: ( 9;)*<=<
2>?;@ A;4*;5BC ) 方 法 , 9D: ( 9*5*<=<
"TUT$& 而 处 理 后 仅 前 两 个 主 成 分 就 已 经
!"#"$
知识丛林 XY-’Y-HP.D1-.
!""# 年 第 $ 期(总 第 %$& 期 )
用非线性化பைடு நூலகம்方法
对 主成分分析法的改进
!卢艳超
张彩庆
在 用 统 计 方 法 研 究 多 变 量 问 题 时 , 非线性主成分分析,从而提高主成分的 变量太多会增大计算量和增加分析问题 的复杂性,人们自然希望在进行定量分 析的过程中涉及的变量较少而得到的信 息量较多,主成分分析是解决这一问题 的理想工具。因为分析具体问题所涉及 的众多变量之间既然有一定的相关性, 根据这一点,通过对原始变量相关矩阵 内部结构关系的研究,找出影响具体问 题的几个综合指标,使综合指标为原来 变量的线性综合,综合指标不仅保留了 原始变量的主要信息,彼此之间又不相 关,又比原始变量具有某些更优越的性 质,使得在研究复杂的经济问题时容易 抓住主要矛盾。 然而,主成分分析的实施效果与评 价指标间的相关程度高低成正比。评价 指标间相关程度越高,主成分分析的效 果就越好。 当指标之间相关性不大时, 每 一个主成分所提取的原始指标的信息通 常很少, 这时, 为了满足累计方差贡献率 就有可能选 不低于某一阈值 !比如 "#$%, 取较多的主成分,此时的主成分分析的 降 维 作 用 不 明 显& 这 是 传 统 主 成 分 分 析 的一个不足之处。它的另一个不足之处 是它只能处理“ 线性” 问题, 只是一种“ 线 性” 降维技术。一方面, 对原始数据进行 标准化处理后,协方差矩阵就变成相关 系数矩阵,这是上述主成分分析的出发 点。然而, 相关系数只能反映指标间“ 线 性” 相关程度。在现实生活中, 指标间的 关系也有呈非线性关系的,如果这时一 定要用“ 线性” 关系去反映, 会得到不正 确的结论。 另一方面, 主成分是原始指标 的线性组合。然而有时主成分与原始指 标之间也有呈非线性关系,此时简单地 进行线性处理就有可能导致对现实关系 反映上的偏差。 基于以上分析, 有必要对 传统的主成分分析加以改进。 为此, 本文 通过构造关于原始变量的非线性综合评 价函数, 利 用 ’(’ 软 件 对 指 标 数 据 进 行 贡献率,利用较少的变量得到较多的信 息 量& 并 应 用 该 方 法 来 实 现 对 产 品 等 级 标准的评价,最后考虑结合专家调查法 对该方法进一步的完善。 一、 主成分分析方法的改进 当原始变量之间相关性不强,或变 往往不尽人意, 因此, 在这种情况下, 只 要综合评价函数是原始变量的线性函 数, 其贡献率就不够理想, 为此, 考虑构 造关于原始变量的非线性综合评价函 数, 利 用 ’(’ 软 件 对 指 标 数 据 进 行 非 线 性主成分分析。 针对主成分分析的非线性化处理方 法各异,该方法的基本思想是把每一个 观 察 变 量 )* 通 过 +,-./0(1 语 句 变 成 一 个 新 的 变 量 2)* 再 对 2)* 做 主 成 分 分 析, 记 其 主 成 分 为 34*56&34*57& … 每 个 主 成分 34*5 都 是 2)* 的 线 性 组 合 , 且 不 同 主成分之间也不相关, 在这里, 主要问题 是从 8* 变为 2)* 是一个非线性变化。但 是这个非线性变化不能用一个数学表达 式来表达, 也正因为如此, 非线性主成分 分析方法主要用于解析数据,揭示数据 中存在的信息。
DC5C4;@*ECF :;4*;5BC ) 方 法 和 9(: 达 到 了 "VU#6$! 前 几 个 主 成 分 已 用 粗 体 ( 9;)*<=< 表 6 参评者对产品的打分结果 参评者打分 !7# 人 % 产品编号 参评者打分 !7# 人 % (AC4;GC H>4I 产品编号 9>FC@ 6 "QQTRRQVR67VQ#Q"RT6QRS"QR 9>FC@ 6V "RT#WV6W6STRT#VW#V#WV"R#V 方法。 4C@;?*>5)
标 示 !" 结 果 显 而 易 见 " 处 理 前 后 对 比 的 效 果图如图 # 所示。 综上, 对比处理前后的相关指标( 见 以 及 对 比 效 果 图 & 图 #! 可 以 看 到 , 表 $"% ) 当主成分贡献率不尽如人意时,采用非 线性化处理来提高主成分的贡献率, 不 失为一种有效的方法。
序号
$ $)++-# -)#,--)(,.#
% #).#+% -)#$,, -)*-*,
( #)(#+. -)-.(( -),-##
+ #)%##$ -)-/,( -),//+
* -),-#+ -)-(*/ -)/%+%
的地方。 为了解决这个问题,可采用一种修 正算法,将专家调查法与主成分分析法 结合起来。首先对原始数据进行标准化 处理, 然后利用专家调查法, 根据各指标 的重要程度, 分别赋予权数, 并且得到一 个新数据表,由于在系统评估中较为重 要的变量被赋予较大的权数, 因此, 指标 的变差被相应拉长。 在分析时, 这些指标 就会得到更多的重视。对这张新的数据 表进行非线性化处理,效果自然会更贴 近实际需求。 针对主成分不突出的情况,通过非
相关文档
最新文档