因子分析及其在股票研究中的应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

失较少，但3个变量，信息丢失较为严重，因此，本次应提取的总体效果并不理
想。
表4：
Z 资产总计 Z 主营业务收入 Z 营业利润 Z 利润总额 Z 净利润 Z 每股收益 Z 每股净资产 Z 净资产收益率
公因子方差初始 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Bartlett 的球形度检验
近似卡方
.710 1081.747
df
28
Sig.
.000
由表 2 可知：巴特利特球度检验统计量的观测值为 1081.747，相应Ｐ值接近 0。如果
显著水平α为 0.05，由于概率 P 值小于显著水平α,则应拒绝原假设，认为相关系数矩阵
与单位阵有显著差异。同时，KMO 的值为 0.710，根据 Kaiser 给出的 KMO 度量标准可
1.000
.046
Z 净资产收益率
.249
.179
.389
.396
.409
.747
.046
1.000
表 1 是原有变量的相关系数矩阵。可以看到：大部分的相关系数都比较高，各变量呈较强的线性关系，能够从中提取公共因子，适合进行因子分析。
表 2：
KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量。
1.814
22.679
3
.980
12.247
93.198
.980
12.247
93.198
1.308
16.349
4
.386
4.826
98.024
5
.101
1.269
99.292
6
.043
.535
99.828
7
.010
.130
99.958
8
.003
.042
100.000
提取方法：主成份分析。
第一组（第二列——第四列）数据描述了因子分析初始解的情况。可以看到：第
Z 利润总额
Z 净利润 Z 每股收益
Z 每股净资产
Z 净资产收益率
相 Z 资产总计
1.000
.784
.898
.910
.879
.385
.073
.249
Z 主营业务收入
.784
1.000
.688
.701
.708
.394
.234
.179
Z 营业利润
.898
.688
1.000
.994
.987
.603
.193
提取方法：主成份分析。
表5：
解释的总方差
初始特征值
提取平方和载入
旋转平方和载入
成份
合计
方差的 %
累积 %
合计
方差的 %
累积 %
合计
方差的 %
1
5.105
63.808
63.808
5.105
63.808
63.808
4.334
54.170
2
1.371
17.143
80.951
1.371
17.143
80.951
相差很大，而且单位也不尽相同，因此为使因子分析能够均等的对待每一个指标，需对各指标进行标准化处理，即令
ᵏ和 s 分别是指标的样本均值和样本标准差。是经过标准化处理后的指标。的协
方差矩阵就是的相关系数矩阵，因此我们将从样本相关矩阵进行因子分析。经过标准化后交通银行、光大银行、平安银行等这三只银行股的标准化指标值都大于其它数据很多，故删去。 4. 考察原有变量是否适合进行因子分析
6. 因子的命名解释这里采用方差极大法对因子载荷矩阵实行正交旋转以使因子具有命名解释性。指定按第一个因子降序的顺序输出旋转后的因子载荷，并绘制旋转后的因子载荷图。
表 7：
旋转成份矩阵a
成份
1
2
Z资产总计 Z主营业务收入 Z营业利润 Z利润总额 Z净利润 Z每股收益 Z每股净资产 Z净资产收益率
提取
.939 .726 .955 .968 .960 .969 .985 .955
重新指定提取特征值的标准，指定提取3个因子。分析结果如表4所示。表4是指定3个特征值下的变量共同度数据。由第二列数据可知：此时所有变量的共同度均高，各个变量的信息丢失都较少，因此，本次因子提取的总体效果较理想。
1.000
.939
1.000
.670
1.000
.954
1.000
.967
1.000
.960
1.000
.966
1.000
.450
1.000
.571
提取方法：主成份分析。
表3显示了所有的变量共同度数据，第一列数据是因子分析初始解下的变量共同
度，它表明，如果对原有8变量采用主分分析方法，提取所有特征值（8个），那
由表 7 可知：资产总计、主营业务收入、营业利润、利润总额、净利润在第一个因子上有较高的载荷，第一个因子主要解释了这几个变量，可解释为规模经济；每股收益、净资产收益率在第二个因子上有较高的载荷，第二个因子主要解释了这两个变量，可解释为盈利能力。每股净资产收益在第三因子的载荷较高，可解释为公司的真实价值。与旋转前相比因子含义都比较清楚了。表 8：
成份矩阵 a
成份
1
2
3
Z 资产总计 Z 主营业务收入 Z 营业利润 Z 利润总额 Z 净利润 Z 每股收益 Z 每股净资产 Z 净资产收益率
.888
-.388
.007
.775
-.262
.237
.964
-.156
-.034
.972
-.151
-.028
.974
-.109
-.012
.733
.655
-.048
关键词：spss 因子分析股票财Βιβλιοθήκη Baidu报表
一、引言改革开放以来，越来越多的人们富起来了。随着中国经济的飞速发展，股票市场也越
来越成熟。中国股票市场受到许多中国投资者以及外国投资者的青睐。同时，股票市场也将成为我国保险基金和养老保险基金等基金的重要投资保值增值渠道。对于稳健型的投资者主要的目的就是规避风险因子对股票的公正客观的评价就显得十分重要。上个世纪中叶以来，西方现代财务理论中产生的许多股票定价理论和方法。如 MM 理论 CAPM 理论 OPM 理论和 DCF 现金流量折现法等。但这些方法在实际操作中都有一定的局限性，在国内目前实际采用较多的评价方法都是主观赋权法。主观赋权法的一个共同特点就是将评价指标体系中的各财务指标的权重依据主观或经验事先设定好这样就难免给评价结果带来一定的主观性尤其是当，综合评价指标数目比较多，各级别对综合评价值的重要性不一区分并且各级别之间相关性较大的情况时，主观赋权法的效果往往欠佳。因此本文就试图提出一种根据各指标实际观察值所提供的信息量的大小来确定各指标赋权的大小——因子分析法。在多元统计分析中，因子分析是一种很有效的降维和信息浓缩技术。首先选择这些公司财务指标中的一些重要量化指标，包括资产总额、主营业务收入、营业利润、利润总额、净利润、每股收益、每股净资产、净资产收益率。然后使用 spss 软件对 108 家上市公司财务指标进行因子分析。并将 8 个指标归结为 3 个因子，每个因子都含有特定的含义，然后根据每只股票 2 个因子的得分对股票作综合评价。
.964 .829 .926 .930 .915 .358 .086 .146
.089 -.015
.301 .303 .323 .763 .069 .965
提取方法 :主成份。旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 4 次迭代后收敛。
3 -.033 .196 .088 .098 .136 .508 .986 -.041
总方差的12.247（即0.980/8*100%），累计方差贡献率为93，198%。其余数据含
义类似。在初始解中由于提取了8个因子因此原有变量的总方差均被解释，累计
方差贡献率为100%。表4中的第二列也说明了这点。第二组（第五列——第七列）数据描述了因子解的情况。可以看到：由于提取 3 个因子，3 个因子共解释了原有变量总方差的 93.198%。总体上，原有变量的信息丢失较少，因子分析效果较理想。第三组（第八列——第十列）数据描述了最终因子解的情况。可见，因子旋转后，总的累计方差贡献率没有改变，也就是没有影响原有变量的共同度，但却重新分
么原有变量的所有方差都可以被解释，变量的共同度均为1（原有变量标准化后
的方差为1）。事实上，因子个数小于原有变量的个数才是因子分析的目标，所
以不可提取全部特征值。第二列数据是按指定提取条件（这里是特征值大于1）
提取特征值时的共同度，可以看到，资产总计、营业利润、利润总额、净利润、
每股收益等变量的绝大部分信息（大于94%）可被因子解释，这些变量的信息丢
因子分析及其在股票研究中的应用
秦生焱
（四川民族学院数学系 1243 班）
摘要：本文应用 spss 软件对随机搜集的 108 家上市公司 2014 年财务报表中的 8 个
财务指标进行了因子分析，并将这 8 个指标归结为 2 个因子，每个因子都有特定的含义。最后根据每只股票 3 个因子的得分情况对该股票做出综合评价。
首先考察收集到的原有变量之间是否存在一定的线性关系，是否适合采用因子分析提取因子。这里，利用变量的相关系数矩阵、反影像相关矩阵、巴特利特球度检验和 KMO 检验方法进行分析。利用 spss 的因子分析对原始数据进行考察，分析结果如表 1、表 2 所示
表1：
相关矩阵
Z 主营业务收
Z 资产总计
入
Z 营业利润
.316
.592
.731
.507
.560
-.620
提取方法 :主成份。 a. 已提取了 3 个成份。
表 6 显示了因子载荷矩阵，是因子分析的核心内容。根据该表可以写出本文的因子分析模型：资产总计=0.888f1-0.388f2+0.007f3 主营业务收入=0.775f1-0.262f2+0.237f3 营业利润=0.964f1-0.156f2-0.034f3 利润总额=0.972f2-0.151f2-0.028f3 净利润=0.974f1-0.109f2-0.012f3 每股收益=0.733f1+0.655f2-0.048f3 每股净资产=0.316f1+0.592f2+0.731f3 净资产收益率=0.507f1+0.560f2-0.620f3 由表 6 可知：8 个变量在第一个因子上的载荷都很高，意味着它们与第一个因子的相关程度高，第一个因子很重要；第二个因子原有变量的相关性都不太大，它对原有变量的解释作用有限；而在第三个因子上的载荷大多数都较小，故它们与第三个因子的相关性都较小，第三个因子对原有因子的解释作用不显著。并且这三个因子的实际含义比较含糊。
一个因子的特征值为5.105，解释原有8个变量总方差的63.808%（即
5.105/8*100%），累计方差贡献率为63.808%；第二个因子的特征值是1.371，解
释原有8个变量总方差的17.143%（即1.371/8*100%）,累计方差贡献率为80.951%
［（5.105+1.371）/8*100%］。第三个因子的特征值为0.980，解释原有8个变量
二、实证分析 1. 选定指标根据上市公司财务报表及其公司特点，挑选了以下指标作为因子分析的起点：资产总额、主营业务收入、营业利润、利润总额、净利润、每股收益、每股净资产、净资产收益率。 2. 选取样本笔者随机选取了沪深两市 108 只股票作为样本，主要数据都是根据这些上市公司 2014 年所公布的财务报表所得。在进行因子分析之前首先对数据进行异常值处理，凡是净资产收益率小于 0 的都删去，凡是营业利润小于 0 的也都删去。于是对 108 只股票进行筛选过后只剩下 81 只符合要求。 3. 指标的预处理由于笔者选择的指标都是正指标，故可以不对指标进行正向化处理。由于各指标的大小
.389
Z 利润总额
.910
.701
.994
1.000
.992
.612
.204
.396
Z 净利润
.879
.708
.987
.992
1.000
.644
.235
.409
Z 每股收益
.385
.394
.603
.612
.644
1.000
.565
.747
Z 每股净资产
.073
.234
.193
.204
.235
.565
配了各个因子解释原有变量的方差，改变了各因子的方差贡献，使得因子更易于解释。图 1：
累积 % 54.170 76.849 93.198
在图 1 中，横坐标为因子数目，纵坐标为特征值，可以看到第一个因子的特征值很高，对原有变量的贡献最大；第四个以后的因子特征值都较小，对解释原有变量的贡献很小，已经成为可被忽略的“高山脚下的碎石”，因此提取 3 个因子是合适的。表 6：
知原有变量适合进行因子分析。
5. 提取因子先进行尝试性分析：根据原有变量的相关系数矩阵，采用主成分分析法提取因子并选取大于 1 的特征值。分析结果如表 3 所示表 3：
公因子方差
初始
提取
Z 资产总计 Z 主营业务收入 Z 营业利润 Z 利润总额 Z 净利润 Z 每股收益 Z 每股净资产 Z 净资产收益率