多元主成分分析论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.37929
0.14766
0.14227
0.15495
总资产
0.28856
0.92085
-0.02194
-0.03204
0.15899
股东权益
0.29300
0.91987
0.00240
-0.02989
0.11839
投资收益
0.06676
0.10680
0.01514
-0.00757
1960 年 Renyi 对熵的定义进行了补充,他指出对数的底数也可以用 e 10 或 其它实数。
2.熵值法的原理 熵是无序的量度,它可以解释为接触随机事件的不肯定性所需要的信息量。 当一个事件的随机性越强,它们相对应的熵值就越大;反之,若一个事件为必然 事件,则其熵值为 0。根据熵值的特性,我们可以通过计算熵值来判断一个事件 的随即性及无序程度,也可以用熵值来判断某个指标的离散程度。一般而言,指 标的离散程度越强,熵值就越大;反之,熵值就越小。 在利用多个指标对事物进行综合评价时,对某个指标,若各个个体的值没有 太大的区别,则该指标在综合分析中所起的作用不大;反之,若对某个指标而言, 各个个体的值有很大的波动,即该指标在综合分析中有很重要的影响,所以可以 利用熵值作为确定指标权数的一个依据。 3.熵值法的步骤 设有 n 个个体,p 个指标,则 Xij 为第 i 个个体的第 j 个指标的指标值, (I=1,。。。n,;j=1,。。。p,)。 (1) 计算第 j 项指标下第 i 个个体的址在此指标中所占的比重;
表 10-3 各因子对对方差的解释
因子 贡献
因子 1 5.080806
因子 2 2.090139
因子 3 1.053703
因子 4 0.745954
因子 5 0.665303
由特征向量可以看到因子 1 作为第一主成分,主要反映了主营业务收入`主 营利润`利润总额`税后利润,总资产,股东权益的状况。而对其他几个指标的信 息的反映不是很明显。因子 2 作为第二主成分主要反映了每股收益,每股权益和 净资产收益率的状况,第三主成分反映的是投资收益,第四主成分和第五主成分
分别进行综合评价、,判断其优劣。用只成分分析法进行分析,步骤如下 (1) 计算出这 p 个指标的协方差阵或相关系数矩阵 A。 (2) 计算出矩阵 A 的特征根 及相应的特征向量 ,此时可得到新指标 Z1,。。。Zp,且 Zj= j,其中,X=(X1,。。。,Xp),j=1,。。。。p,X(i I=1,。。。 p)为第 i 个原始指标向量。 (3) 选择主成分 Y1,。。。Yk。对于新指标 Z1,。。。Zp 不必全部选取,可根 据它们对原指标的信息的反映程度来确定新指标的个数,这可用贡献率 和累计贡献率来衡量。第 K 个新指标的贡献率为:
2.综合序数法的步骤 (1) 先分别对不同方法的计算结果求出相应的序列。假设有两中方法,设用
这两种方法进行评价得到的结果序列为 X1,X2。 (2) 计算这两个序列的相关系数 r12,具体计算时根据实际情况选则不同的
相关系数公式。 (3) 将 X1,X2 用某中方法转换为可直接相加的序列 Y1,Y2。 (4) 将 Y1 与 Y2 相加得 Z1,对 Z1 进行分析,得到最终的综合分析结果
(Xi1,。。。,Xip),Xij 为第 I 个个体的第 j 个原指标的值,Sij 为第 i 个个体的第 j 个只成分的因子得分,I=1,。。。,n;j=1,。。。,p, j 为第 j 个特征值对应的特征向量。 (5) 取各主成分对原来指标的信息的反映程度作为权数,计算所有主成分的 综合得分 Si:
其中,dj 为第 j 个主成分的权数;Si 为第 i 个个体的综合得分 (6) 根据这 n 个个体的综合得分 S1,。。。Sn,对它们进行比较 分析 评价。
(三)熵值法 1.熵的定义
根据香农的信息模型,熵的定义如下: 设一个实验有 n 个结局 X=X(i I=1,。。。n),出现结局 X=Xi 的概率 P(X=Xi) =Pi,则实验的熵或随即变量的熵可定义为
2.求相关系数矩阵 A 及其特征根 对标准化后的数据求 10 个指标的相关系数矩阵,在对这个相关系数矩阵求 特征根,结果参见表 10-1。 表 10-1 相关系数矩阵的特征值及个因子的贡献率
因子 1
2
3
4
5
6
7
8
9
10
特征 5.080 2.090 1.053 0.746 0.665 0.158 0.133 0.062 0.007 0.002
因子 4 0.5818 -0.06556 -0.09663 -0.09466 0.11638 0.13609 -0.17014 0.03879 -0.50943 0.63082
因子 5 0.18211 -0.29550 -0.28686 -0.28095 0.30140 0.30316 -0.04642 0..05324 0.43402 0.07978
1.000 0
观察个特征根的累计贡献率,可以发现:当取 K= 4 时,及取 4 个主成分时, 累计贡献率 〉85%,但由于因子 5 的累计贡献率与因子 4 的累计贡献率有较大 差距,说明因子 5 在对原来信息的反映中也占有相当的比重,为了更充分的反映 原指标的信息,本案例选取了 5 个主成分,即 K=5。
若一共选取了 L 个新指标,则这 L 个新指标的累计贡献率为
在选择主成分时,一般取累计贡献率>=85%即可。 在具体操作时,先观察新指标 Z1 的贡献率,若贡献率>=85%,则取 Z1 作为 主成分即可。该主成分为原来 p 个指标的线形组合。它已从粉地反映了原指标的 信息。若 Z1 的贡献率<85%,则考虑再选入第二个新指标 Z2 作为主成分,观察 这两个主成分的累计贡献率是否已经超过 85%,若超过了,则取 Z1 和 Z2 作为 主成分,若仍低于 85%。则继续,直到选出所有的主成分的累计贡献率朝过 85% 为止,设共选出 K 个主成分。 (4) 主成分选定后,可计算各主成分的因子得分 Sij,Sij=Xi* j,其中 Xi=
在上述各种方法中,比重评分法主要是利用主观判断的方法,分析所得到的 评价结果缺乏客观性。在一定程度上影响了计算结果的科学性 准确性。主成分 分析发是通过在多个指标中寻找之成分,用住成分来充分反映原来的信息,并通 过因子得分来确定权数,降 维作用较明显,且所得的结果客观性强,但有时用此方法得到的主成分对原指标 的信息的反映较分散,即个主成分无明显的实际意义。熵值法主要是从数据间的 差异出发,在分析过程中通过熵值法确定各指数的权数,对所有指标进行加权, 从而得到综合评价的结果。熵值法具有一定的客观性和科学性,但这种方法不能 很好的地反映相关指标间的关系。综合序数法是主成分分析法和熵值法的结果的 综合,但在综合的过程中还是使用了主观定权的办法,使结果仍带有主观性。另 外,在使用综合序数法时受到一定的条件约束。
每股收益
0.47554
每股权益 净资产收益

0.31290 0.26679
因子 2 -0.27041 0.08512 0.05743 0.08160 -0.46431 -0.44558 -0.13721 0.82209 0.65596 0.67879
因子 3 -0.22285 -0.23816 0.02402 0.03062 0.07512 0.03897 0.94683 0.05195 -0.05252 0.19157
因子 1
因子 2
因子 3
因子 4
因子 5
主营业务收 入
0.48757
0.79794
0.00356
0.08177
-0.1233
主营利润
0.90265
0.36529
0.11023
0.12792
-0.11404
利润总额
0.88746
0.38937
0.12942
0.12812
0.15168
税后利润
0.88587
根据上述分析认为该进后的主成分分析法是最佳方法。
三 具体解决问题的方法 (一) 主成分分析法
1.数据标准化 由于个指标带有不同的量纲,不利于综合比较。在分析时可先将数据标准化, 以消除量纲的影响,公式如下:
其中,Xij 为第 i 个上市公司的第 j 项指标的指标值;Xj 为第 j 项指标下所有 上市公司该指标值的平均值; 为所有上市公司第 j 项指标的指标值的标准差。
1. 求相关系数矩阵 A 的特征向量 观察前 5 个因子对应的特征向量,结果参见表 10-2 表 10-3
表 10-2 旋转前的特征向量
主营业务收 入
主营利润
因子 1 0.85849 0.91332
利润总额
0.94861
税后利润
0.94766
总资产
0.79523
股东权益
0.79778
投资收益
0.21844
通过对以上方法的优缺点的分析,决定采用主成分分析法,尽管它有自己的缺 点,但考虑到主成分分析法为因子分析法的一个特例。在因子分析法中,当各公 共因子对原指标反映不明显时,可以采用因子旋转的方法,使得公共因子的贡献 较分散,即第一公共因子明显代表一部分变量,第二公共因子明显的代表另一部 分变量……这样的处理使各公共因子有明显的实际含义有利于分析。所以在对主 成分分析的方法中,可以考虑将因子旋转的方法引入,一般是采用最大方差法进 行旋转。
对原指标的信息的反映不是很明显。根据以上情况我们认为:这五个主成分对原 指标信息的反映不是很清晰,且各主成分对原指标的反映也不够分散,无明显侧 重性,使得各主成分缺乏明显的实际意义,故考虑进行改进。
2. 主成分分析法的改进(因子旋转) 用最大方差法进行因子旋转,旋转后的特征向量状况参见表 10-4、表 10-5 观察旋转后的特征向量可以发现:各主成分对原指标的反映有明显的侧重性。其

9
1
7
0
3
9
0
1
5
6
贡献 率
0.5Fra Baidu bibliotek8 1
0.209 0
0.105 4
0.074 6
0.665
0.015 9
0.013 3
0.006 2
0.000 7
0.000 3
累计 贡献 率
0.058 1
0.717 1
0.822 5
0.897 1
0.963 6
0.979 5
0.992 8
0.999 0
0.999 7
案例 10 上市公司综合评价分析
一、教学目的 通过对本案例的介绍,使学生了解多指标综合评价问题的处理方法,掌握主 成分分析,因子分析,熵值分析和综合序数法的基本概念几基本原理,并能熟练 运用这些方法解决实际问题。
二 解决问题的思路 在对上市公司进行综合分析的过程中可以采用下述方法: (一) 比重评分法 比重评分法最初是由亚历山大·沃尔提出的。沃尔选择了7种财务比率:流 动比率、净资产/负债,资产/固定资产,销售成本/存货,销售额/应收账款,销 售额/固定资产,销售额/净资产,并分别规定了他们在综合评价中所占的比重, 总和为 100。然后确定标准比率,并将实际的比率之与其相比较,评出每项指标 的得分,最后利用个指标的比重作为权数求出最终的综合得分。 我国财政部也于 1995 年公布了一套企业经济效益评价指标体协,该体系提出 了 10 个指标,分别设定个指标的比重,该体系与未标体系的计算方法类似,均 为根据给定的比重计算综合评分。 (二) 主成分分析法 1 .主成分分析法 主成分分析法为多元统计分析的一种方法,它是因子分析的特例,适用于解 决多指标的综合评价问题。主成分分析法主要是通过寻找一些新的数量较少的指 标来代替原来较多的指标,这些新的指标均为原指标的线性组合,使得新指标不 但能充分体现原指标的信息,而且起到了降维的作用。另外,由于主成分分析法 确定的革新指标为彼此不相关的,这有利于对被评价对象的分析。并且,由于主 成分分析法自身的特点,在计算过程中能相应的求出各新指标对原来信息的反映 程度,可以用这个反应程度作为权数对事物进行综合评定,这解决了主观赋权的 问题,使权数的确定具有客观性,科学性。 2.主成分分析法步骤 设有 n 个个体,对每个个体均列出了 p 个指标的数值,现要求对这 n 个个体
(2) 计算第 j 项指标的熵值:
(3) 以熵值为权数计算各项指标的综合得分:
(4) 根据综合得分进行综合分析 评价
(四)综合序数法 1.综合序数法的原理
在对多个指标的问题进行分析时,可以运用各种不同的方法,若各方法得到 的结果彼此一致,有较强的相关性,可将不同方法的结果综合考虑,并对不同的 方法用加权求和的方法求出最终结果。
相关文档
最新文档