浅谈统计综合评价中主成分分析法的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

③ 在主成分分析将原始变量变换
为成分的过程中 , 同时形成了反 映成分和指标包含信息量的权 数 , 以计算综合评价值 , 这比人为 地确定权数 , 工作量少些 , 也有助 于保证客观地反映样本间的现实 关系。 此外 , 随着电子计算机技术 的 发 展 , SAS、 SPSS等 商 品 化 统 计 分析软件的推广与应用 , 使得主 成分分析在各类综合评价实践中 的广泛应用成为现实。
GONGZUOYANJ IU
等功能于一身 , 是世界著名的统 计分析软件之一。 因此 , 我们可以 利用 SPSS中的主成分分析模块进 行评价。 具体做法是 : 将参评指标的 数据导入软件后 , 在分析模块上 选择主成分法进行分析。在矩阵 方差最大旋转” 它 旋转方面 , 取“ 。 是一种正交旋转方法。它使每个 因子上的具有最高载荷的变量数 最小 , 可以简化对因子的解释。 其 余的都可按系统默认值确定。最 后我们用第一主成分的特征向量 与原始指标值的线性加权的值得 出综合值 , 并根据其分值对企业 由高到低进行排序。 总之 , 综合评价的过程实际 上是理论与实践相结合的过程。 没有经济理论和统计专业知识的 而主 支持 , 是体现不出科学性的。 成分分析在综合评价中的应用可 避免许多人为因素 , 使评价结果 更为科学。 此外 , 由于计算机的普 及和计算软件的发展 , 使得进行 主成分分析已变成一件逐渐普遍 和十分容易的事情了。
通过数学计算可将p个原始指标的总方差分解为p个不相关的综合指标的方差之和方差达到最大贡献率最大第二个综合指标y的方差次大以此类推一般前面几个综合指标yp即可包含总方差中绝大部分也就是说主成分分析可以使原始指标的大部分方差集中于少数几个主成分综合指标上通过对这几个主成分的分析来实现对总体的综合评价
工作研究
工作研究
于可以消除评价指标间的相关影 响 , 因而在指标选择上相对容易 些。但主成分分析法确定评价指 标的原则是宁多勿少 , 尽可能地 全面。主成分分析可以保留原始 评价指标的大部分信息。如果指 标选择不够全面 , 就会先天不足 , 再好的分析方法也会失去效用。
p) 即可包含总方差中大部分 ,
也就是说 , 主成分分析可以使原 始指标的大部分方差“ 集中” 于少 数几个主成分 (综合指标 )上 , 通过 对这几个主成分的分析来实现对 总体的综合评价。 采用主成分分析法进行综 2、 合评价的原因 第一 , 主成分分析的降维处 理技术能较好地解决多指标评价 的要求。 第二 , 主成分分析进行多 指标综合评价时的权数处理与其 他方法相比有很大的区别。主成 分分析在进行多指标综合评价 时 , 权数是从信息量和系统效应 角度来确定的。 在数理统计中 , 信 息量通常是用离差平方和或方差 来表示的。主成分分析计算综合 评价时用的是信息量权数。信息 量权数是从指标所含区分样本的 信息量多少来确定重要程度的。 而指标估价权数是根据评价者对 指标自身重要程度的估价而确定 信息量权数是 的 , 可以人为调整。 伴随数学变换过程生成的 , 不能 人为调整。 用主成分分析法进行多指 3、 标综合评价的几个优点
X3 … , Xp , 用来对 n 个单位进行评
主成分分析 价 , 则共有np个数据。 的目的是要将这些原始指标组合 成新的相互独立的综合指标: y1, y2,
y3 … , yp , 这些综合指标表现为原
始指标的线性函数 :
y1=l11X1+l12X2+…+l1pXp, y2=l21X1+l22X2+…+l2pXp
Y1=l11X1+l12X2+…l1pXp Y2=l21X1+l22X2+…+l2pXp
………………………
Yp=lp1X1+lp2X2+…+lppXp
第五 , 解释各主成分的意义 , 并将各单位的原始数据代入方程 中计算综合评价值进行分析比 较。 在多指标综合评价中 , 一般需 取第一个主成分 y1 作为全面反映 各指标状况的综合指标 , 因为它 综合原始指标信息的能力最强。 然后 , 根据这个综合指标值进行 各参评单位的比较评价。 随着现代科技的发展 , 主成 分分析采用 SPSS统计分析软件中 的主成分分析模块进行综合评 价。 它 SPSS是社会科学统计软件。 集数据整理、 分析过程、 结果输出
3. 评价指标。评价指标体系是 从
多个视角和层次反映特定评价客 体数量规模与数量水平的。它是 一个“ 具体—抽象—具体” 的辩证
46
! "##$%&’! ($)"*)&+’*+, $, - (’’. /0 0 11 0 2’’ 7 5 /2
GONGZUOYANJ IU
逻辑思维过程 , 是人们对现象总 体数量特征的认识逐步深化、 求 精、 完善、 系统化的过程。 4. 权重 系数。 相对于某种评价目的来说 , 评价指标相对重要性是不同的。 权重系数确定的合理与否 , 关系 到综合评价结果的可信程度。 5. 综合评价模型。所谓多指标综合 评价 , 就是指通过一定的数学模 型将多个评价指标值“ 合成” 为一 个整体性的综合评价值。 二、 主成分分析法 主成分分析法的思路及数 1、 学解释 主成分分析的基本思路即: 在设计指标体系时尽可能多的选 择指标 , 然后用一种方法将这些 指标的特点综合而成少数几个新 的指标 , 这几个新指标既能够尽 可能多地反映原来的指标的信 息 , 而且彼此间又差异显著。 如果 从数学上对主成分分析进行解 释, 即为: 设有p个原始指标: X1, X2, 达到最大 (贡献率最大 ), 第二个综 合指标y2的方差次大 , 以此类推 , 一般前面几个综合指标y1、 y2、 yr(r<
GONGZUOYANJ IU
浅谈统计综合评价中 主成分分析法的应用
■ 延长油田股份公司油田开发工程处
聂馥霖 一、 综合评价方法 综合评价的概念和分类 1、 近年来 , 随着统计分析活动 的广泛开展 , 评价对象也越来越 复杂 , 简单评价方法的局限性也 越来越明显。 因此 , 通过对实践活 动的总结 , 逐步形成了一系列运 用多个指标对多个单位进行评价 其基 的方法 , 简称综合评价方法。 本思想是将多个指标转化成为一 个能够反映综合情况的指标来进 行评价。 常见的综合评价方法一般指 不涉及模糊数学、多元统计分析 等其他学科的综合评价方法, 也 是目前在实际中应用较为广泛的 方法。常规综合评价通常包括两 个方面 : 第一 , 各评价指标无量纲 化的方法 , 也是将评价指标的实 际值转化为评价值或称单项得分 的计算方法。常见的消除量纲的 方法有相对化处理法、函数化处 理法和标准化处理法。 第二 , 由单 项评价值计算综合评价值的方 法。由单项评价值计算综合评价 值时一般采用加权算术平均法, 所以 , 各种常规综合评价方法的 区别主要在于单项评价值的计算 方法不同。 在实际中应用较多、 较 为成熟的有指数法、改进的功效 系数法、 最优值距离法。 现代综合评价方法包括主成 分分析法、 数据包络分析法、 模糊 主成 评价法等。 (1)主成分分析法。 分分析是多元统计分析的一个分 支。是将其分量相关的原随机向 量 , 借助于一个正交变换 , 转化成 其分量不相关的新随机向量, 并 以方差作为信息量的测度 , 对新 随机向量进行降维处理 , 再通过 构造适当的价值函数 , 进一步做 它 系统转化。 (2)数据包络分析法。 是创建人以其名字命名的 DEA模 型—C R模型。 DEA法不仅可对同 一类型各决策单元的相对有效性 做出评价与排序 , 而且还可进一 步 分 析 各 决 策 单 元 非 DE 有 效 的 原因及其改进方向 , 从而为决策 者提供重要的管理决策信息。 (3) 模糊评价法。模糊评价法奠基于 模糊数学。它不仅可对评价对象 按综合分值的大小进行评价和排 序 , 而且还可根据模糊评价集上 的值按最大隶属度原则去评定对 象的等级。 综合评价的特点和评价要素 2、

与简单评价比较 , 综合评价 的特点表现为 : (1) 评价过程不是 一个指标一个指标顺次完成的, 而是通过一些特殊的方法将多个 指标的评价同时完成的。 (2)在综 合评价过程中 , 一般要根据指标 的重要性进行加权处理。 (3)评价 结果不再是具有具体含义的统计 指标 , 而是以指数或分值表示参 评单位“ 综合状况” 的排序。 构成综合评价的要素主要 有 : 1. 评价者。评价者可以是某个 人或某团体。 评价目的的给定、 评 价指标的建立、 评价模型的选择、 权重系数的确定都与评价者有 关。 因此 , 评价者在评价过程的作 用是不可轻视的。2. 被评价对象。 随着综合评价技术理论的开展与 实践活动 , 评价的领域也从最初 的各行各业经济统计综合评价拓 展到后来的技术水平、 生活质量、 小康水平、 社会发展、 环境质量、 竞争能力、 综合国力、 绩效考评等 方面。 这些都能构成被评价对象。
……………………………
① 消除了评价指标间的相关
影响。 另外 , 主成分分析用于多指 标综合评价是对彼此独立的分量 进行合成 , 正适于采用加权线性 相合成方法 , 不必在合成方法选 择上多做工作。 ② 减少了指标选 择的工作量。在主成分分析中由
①α (k)≥85% 准则 (α (k)即前 k
个主成分保留原观测变量信息的 比重 )。根据国内外用主成分分析 进行多指标综合评价的实践来 看 , α (k)>85% 通常可以保证样本 准则。 先计算 排序的稳定。 ②λ g>λ 的均值 λ 特征根λ 然后将之与 λ g, g
Yp=lp1X1+lp2X2…lppXp
通过数学计算可将p个 原 始 指 标 的 总 方 差 分 解 为p个 不 相 关 的综合指标的方差之和 λ 1 +λ 2+ … 并使第一个综合指标 y1 方差 +λ p,
!"#$%&’()* 2 0 *+ 0 7 ,-. .5
47
工作研究
比较 , 选取 λ 的前 k 个成分作为 g>λ 主成分。由标准化数据的相关矩 阵 R 求得的 λ =1, 因此只要取 λ g>1 的前k 个主成分即可。 ③选取第一 主成分用于综合评价。主成分分 析法作为数据降维方法, 其每一 个主成分均有特定经济含义, 可 以用于揭示原始样本中的基本 性质。第一主成分说明了原始数 据变动的总规模, 而其余各主成 分则说明样本内部的各方面的 特征。 主成分分析法的具体步骤 5、 第一 , 确立反映综合评价的 指标体系 , 列出指标数据矩阵 X。 在建立评价体系时 , 应从评价目 的出发初步建立起一个既有定性 的也有定量的指标体系。 第 二 , 规 范 指 标 值 , 计 算 X的 协方差矩阵 S。在评价体系中 , 我 们一定会碰到因指标单位的不同 而存在着不可公度性的问题, 这 就为比较综合评价指标带来不 便。为了消除指标间不同量纲的 影响 , 一般需先对原始数据进行 标准化处理 (变换后的标准化协 方差矩阵 恰 好 是 原 始 数 据 X的 相 关矩阵 , 因此 , 计算协方差矩阵可 简化为计算相关矩阵 )。在主成分 分析中对数据的标准化通常采用 的是“ 标准化法” , 即将原始数据 处理成均值为 0、方差为 1 的归一 化分析数据。 第三 , 计算协方差矩阵S(或 R) 的特征值 λ 和特征向量 L(即指标 X 的系数)。 第四 , 计算贡献率和累计贡 献率 , 据以确定主成分的个数 , 建 立主成分方程。 每个主成分yk的贡 献率等于它的特征值 λ 除以原始 k 指标个数 p , 累计贡献率等于各主 成分贡献率顺序相加 , 根据一定 的选择标准 , 如果前 r 个主成分的 累 计 贡 献 率 大 于 或 等 于 80% , 则 可选定这 r 个主成分 , 根据特征向 量建立这r 个主成分的线性方程 :

48
! "##$%&’! ($)"*)&+’*+, $, - (’’. /0 0 11 0 2’’ 7 5 /2
4、确定主成分个数 的 判 定
原则 一般来说 , 成分个数等于原 始变量的个数 , 如果原始变量个 数较多 , 进行综合评价就比较麻 烦。所以利用主成分分析对样本 排序时 , 总是希望选取个数较少 的主成分 , 同时还要使损失的信 息量尽可能地少。 在实践中比较通行的确定主 成分个数方法的原则有以下几种 :
相关文档
最新文档