如何有效利用主成分分析进行综合评价

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何有效利用主成分分析进行综合评价

摘要由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。

关键词主成分分析,综合评价,均值化

1引言

1.1研究的背景和意义

随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况,并需要就综合各方面的因素进行综合评价。

评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。

主成分分析能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。

所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控。

综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫切性。

1.2主成分分析的发展史

主成分分析,首先是由英国的皮尔生(Kar卜Pearson)对非随机变量引入的,而后美国的数理统计学家赫特林(Harold.Hotelling)在1933年将此方法推广到随机向量的情形团。主成分分析的降维思想从一开始就很好地为综合评价提供了有力的理论和技术支持。

20世纪80~90年代,是现代科学评价在我国向纵深发展的年代,人们对包括主成分综合评价在内的评价理论、方法和应用开展了多方面的、卓有成效的研究,主要表现为:常规评价方法在国民经济、生产控制和社会生活中的广泛应用;多种评价方法的组合研究,综合应用及比较;新评价方法的研究和应用;评价方法的深入研究,如:评价属性集的设计、标准化变换、评价模型选择等等。

1.3主成分做综合评价的研究现状

目前国内外关于综合评价的方法很多,在根据各指标间相关关系或各指标值的变异程度来确定权重系数的方法中,主成分分析法是应用尤为广泛。在使用该方法的早期,大多都是按照传统的主成分分析法做综合评价的步骤来计算综合得分来对样品排序,即利用主成分F1,F2,…,Fm 做线性组合,并以每个主成分Fi 的方差贡献率αi 作为权重系数来构造一个综合评价函数:

Y =α1F1 +α2F2 +…+αm F m

然而,随着传统主成分分析方法在综合评价中的进一步应用,人们发现此方法时经不起实践检验的。在实际应用中,经常发现运用此方法所得结果的解释往往与实际情况不符。举了一个简单的例子,假定高考中考试科目有四门:数学(x1)、语文(x2)、外语(x3)和物理(x4),满分都是相同的150分。考生的四门考试成绩必须综合成一个综合评价函数,一般取为总分i

x i ∑=41。但从统计学的角度来看,可能取为*41i x i ∑=更为合理,这里xi*是xi 的标准化数值(x1* 、x2* 、x3* 、x4*有相同的均值和标准差)。如果我们使用传统的主成分分析法,根据上述综合评价函数F 的得分来对学生进行排名,那就酿成大错了。

就此,一些学者提出了一些改进的方法,其中具有代表性的方法有:Yan(1998)提出,当第一主成分的方差比较大时,即贡献率较大时,用它做综合评价指标。如果觉得用一个主成分解释的方差不够大时,综合反映X1 ,X 2 ,…,Xp 信息的能力不够,而用多个主成分构造综合评价函数又不合适时,可以像因子分析那样对主成分进行旋转。Hou(2006)也提出,当用第一主成分进行综合评价达不到理想结果时,可用分组主成分评价法。即先用因子分析法将p 个变量分成k 组,然后分别对各组变量进行主成分分析,只取每组的一主成分,求出各组第一主成分的得分Cj(j=1,2,…,k)以因子旋转后各因子的放差贡献率为权重∑==k j j

j

Wj 1λλ建立综合评价函数:∑==k j WjCj z 1。最后根据各评价样本综合得分y 来对样品进行排序。但其可行性也受到了一些学者的质疑【4】。由此可见,主成分综合评价法是一片有待进一步深耕细作的热土。

2关于主成分分析基本知识

2.1主成分分析

设要进行主成分分析的原指标有p 个,记作x 1 ,x2 ,…,x p 。现有n 个样品,相应的观测值为x ik , i =1,2,…,n,而k =1,2,…,p 。

作标准化变换后,将Xk 变换为Xk*,即

Sk Xk

-Xk Xk*=,k =1,2,…,m. 式中,Xk 及Sk 分别是xk 的均值及标准差,x k*的均值为0、标准差为1.

主成分分析的原理是:

根据各样品原指标的观测值x ik 或标准化变换后的观测值x ik*求出系数

a ik (k=1,2,…,p,j=1,2,…,m ,m

建立用标准化变换后的指标x k*表示综合指标Fj 的方程

*xk akj Fj k ∑=,也可建立用原指标Xk 表示综合指标Fj 的方程*xk akj Fj k ∑=。

对系数a ik 由下列原则决定:

(1)各个综合指标Fj 彼此独立或不相关;

(2)各个综合指标Fj 所反映的各个样品的总信息等于原来p 个指标Xk*所反映的各个样品的总信息,即p 个Fj 的方差λj 之和等于p 个Xk*的方差之和,也就是

P

j j =∑λ且λ1≥λ 2 … ≥λP 。

称上述彼此独立或不相关又不损失或损失很少原有信息的各个综合指标。yj 为原指标 的主成分.其中,第一综合指标F1的方差最大,吸收原来p 个指标的总信息最多,称第一主成分;第二综合指标F2的方差次之,吸收原来p 个指标的总信息次之,称为第二主成分;同理,F3 F 4…Fp 分别称为第三主成分、第四主成分……第p 主成分。【9】

2.2 主成分分析能否旋转

2.2.1 主成分分析与因子分析的联系与区别

相当数量的应用文章对主成分分析与因子分析不加严格区分,因而对分析结果的解释非常模糊。文献【1】认为主成分分析与因子分析两者之间有联系,但也存在着明显的区别。

从联系上看,主成分分析和因子分析都是将多个相关变量(指标)转化为少数几个不相关变量的一种多元统计分析方法。其目的是使在高维空间中研究样本分布规律的问题,通过降维得到简化,并尽量保留原变量的信息量。两者都有消除相关、降维的功能。

主成分分析是通过变量变换把注意力集中到具有最大变差的那些主成分上,而视变量不

相关文档
最新文档