多元统计分析方法在证券投资中的应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词:证券投资;聚类分析;因子分析
1.引言 中国证券业在自二十世纪九十年代至今的十几个年头中正在不 断迅速发展壮大,随着我国市场经济建设的高速发展,人们的金融意 识和投资意识日益增强,越来越多的投资者把眼光投向了证券市场。 但是我们也应该认识到由于起步较晚,中国证券业在发展中也暴露了 不少问题。我国证券市场投机现象比较严重,投资者往往只关注对于 股票的短期投资,而忽略了股票的长期投资,而面对上千种股票如果 没有理性的投资态度,投资者将难以取得成功。若想成为一个成功的 投资者,在股市投资中赢取丰厚的投资回报,就得认真研究上市公司 的历史、业绩和发展前景,详细分析上市公司的财务状况,找出真正具 有投资价值的股票,进行长期投资。上市公司对外披露的财务指标中 往往隐含很多能具体反映出公司在某年度财务状况的信息,但如果仅 仅是笼统的、盲目的去查看这些繁杂的财务指标,一般很难从中发现 更多对投资者做出投资决策有帮助的信息。故本文将多元统计分析的 方法应用到上市公司财务数据的分析中。通过透视企业的财务状况, 使投资者做出合理的投资决策;而且各上市公司也可以根据自己的财 务分析情况,找出问题所在,弥补自身不足,修正自己公司的经营模式。 2.样本及指标选取 笔者选取 20 家房地产行业的上市公司,根据 2006 年 3 季度报表 中的信息及数据,选择每股收益、投资收益、净利润等 8 项具有重要参 考价值的财务指标,利用 SAS 经济统计软件进行了聚类分析和因子 分析,试图将上市公司进行分类,为股票的分析和选择提供依据(原始 数据略)。 3.对数据进行统计分析 3.1.聚类分析 聚类分析又称群分析,是一种研究分类问题的多 元统计方法。其基本目标是发现样品(或变量)的自然分组方法,从而辨 认在某些特征上相似的事物,并把事物就这些特征划分成若干类,使 在同一类的事物具有高度的共性,而不同类的事物具有高度的相异 性。 我们采用聚类分析中采用离差平方和法聚类,离差平方和法是由 Ward 提出来的,又称 Ward 法。其基本思想是:首先将每个样本各自当 作一类,根据样本之间的相似程度合并类,并计算新类与其它类之间 的距离,再选择相近者并类,每合并一次减少一类,继续这一过程,直 到所有样本都并成一类为止。 我们对上市公司的财务数据进行分析,得到了聚类谱系图(见图 1):
表 3 聚类分析和因子分析结果
家密集出台的房地产调控政策,公司对正在开发和销售的房产项目逐
序号
聚类分类
因子 1
因子 2
因子 3
一进行了认真分析和研判,适时调整了项目定位、开发节奏和销售策
略,最大限度地降低政策对公司的不利影响。同时,公司通过对长期亏
1
1
- 0.09326
- 0.58035
3.772068
4
3
- 0.39919
- 0.24332
0.443212
企业的成长能力和投资效率较低。其中深长城和保利地产的效益较
5
3
2.226946
0.029709
- 0.29817
高,但成长性不足,业绩进一步增长的空间不大,这两个上市公司对于
6
3
0.345924
- 0.44802
- 0.47212
短期介入的投资者来说会有较高的回报但不宜长期持有。而这一类中
损的海南科力等公司的转让和长期挂帐款项的清理,进一步清理了不
2
2
- 0.67592
0.710361
0.672649
良资产,夯实了资产质量。第二类公司虽然每股收益不高,但是由于其
3
3
- 0.55178
- 0.13204
- 0.74469
成长性好,未来发展的预期较高,是市场中的潜力股。
(3)聚类分析中的第三类,在第二和第三主成分上多为负值,说明
- 0.31859
究[J].统计研究.200(0 9):44- 49.
[4]何光汉.证券投资与证券管理[M].武汉:华中理工大学出版社.1996. (2)在聚类分析的第二类,在第二个主成分上的得分较高,对应的
财务指标为:主营利润增长率和净利润增长率。在企业成长的过程中,
作者简介:彭文洁,湖北武汉人,女,华中师范大学数学与统计学
3.2.因子分析 因子分析是将具有错综复杂关系的变量综合为数 量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根 据不同因子对变量进行分类的一种统计方法。因子分析的基本方法 是:通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量 的少数几个随机变量去描述多个变量之间的相关关系。在这里,这少 数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大 小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量 相关性较低。对表一数据进行因子分析得到原始数据标准化矩阵的均 值、方差及相关系数矩阵求出该矩阵的 8 个特征根的大小、贡献率及 累积贡献率,结果见表 1。选择特征值大于 1 的三个主成分称为新的 公因子,简称因子,其累积贡献率已达到 85.52%,说明通过数据变换 之后, 这 8 个特征根所反映出来的信息量占全部信息量的 85.52%,因 此可以把原来的 20 个变量综合为这三个因子,计算其原变量对因子 的载荷,并且正交旋转后得到因子的载荷阵,结果见表 2。
18
2
0.864091
1.496964
- 0.3339 [2]方开泰. 实用多元统计分析 [M]. 上海华东师范大学出版社.
19
3
- 0.76444
- 1.31087
- 0.65454
1989.215- 342.
[3]徐国祥,檀向球,胡穗华.上市公司经营业绩综合评价及其实证研
20
3
0.201817
- 0.43498
此顶管测量控制工作应是顶管施工的重点。施工时应该进行三维动态 洪》2006.3.第 2 期.
表 1 标准化矩阵的特征值贡献率
特征值
贡献率
累积贡献率
1
3.47442548
0.4343
0.4343
2
1.93688724
0.2421
0.6764
3
1.43018455
0.1788
0.8552
4
0.43937027
0.0549
0.9101
5
0.38862079
0.0486
0.9587
6
0.19124654
2007 年 第 16 期
(1)从企业的投资效率上看,它包括净资产收益率和流通股本,在 评价指标,没有效益的产值增加和没有效益的规模扩张都是不应该肯
这个因子上,万科居第一位,得分为 3.772068,面对房地产业普遍粗放 定的。在第二类公司中,如万业企业,公司实现 主 营 业 务 利 润
型发展的局面,一些目光长远的房地产公司从去年开始着手进行战略 19,048.97 万元,同比增加 210.66%,净利润与去年同期相比,上升了
- 0.19659
4
0.94163
- 0.01318
- 0.15265
5
0.28750
0.35748
0.79895
6
- 0.06870
- 0.16507
0.91450
7
0.01922
0.92720
0.10851
8
- 0.12127
0.87938
- 0.05781
图 1 聚类谱系图
从表 2 中可以发现,第一个特征向量即第一个主成分与四个指标 的相关系数都很大,说明第一个主成分所反映的内容与企业的利润有 关, 因此,称其为“效益因子”.此外,第二个主成分与主营利润增长率和 净利润增长率有关,主成分反映了企业的成长能力,称为“成长能力因 子”。第三个主成分和净资产收益率和流通股本有关,反映了企业的投 资效率,称为“投资效率因子”。
科技信息
○高校讲台○
SCIENCE INFORMATION
2007 年 第 16 期
多元统计分析方法在证券投资中的应用
彭文洁 (华中师范大学数学与统计学学院 湖北 武汉 430079)
摘要:选取 8 项财务指标,对沪深 20 家房地产行业的上市公司的财务数据进行了统计分析研究,首先用聚类方法将上市公司进行分类,再 用因子分析方法将公司的财务指标综合为效益因子、成长能力因子和投资效率因子,得到了对上市公司的定量评价。这两种方法为指导证券投 资提供了一种思路。
在主成分分析的基础上,将正交因子解转置与变量相关系数阵的 逆矩阵相乘,得到原始变量线性组合的系数,进而得到因子得分模型, 各因子的得分及其按照聚类分析得到的分类结果见表 3。
3.3.分析结果 经过聚类分析和因子分析我们可以发现以下现象:
173
科技信息
○高校讲台○
SCIENCE INFORMATION
的多数企业的效益上略为盈利或亏损,表现出的经营业绩和财务状况
7
3
0.061392
- 0.63358
0.619741
不佳,发展情况一般。
8
3
- 0.56337
0.308102
0.562482
4.结束语
9
3
- 0.25319
0.042138
- 0.38936
本文将聚类分析法和因子分析法这两种多元统计方法应用到证
我们不能再只追求产值与规模,应将经营效益的增长情况作为重要的 学院 2005 级研究生。研究方向:概率论与数理统计。
● ●
(上接第 119 页)L—— —管道的计算顶进长度,m;
控制。所以说,通过各种手段加强顶管测量控制工作有利于市政工程
f—— —顶进时,管道表面与其周围土层之间的摩擦系数。
的发展。
0.786461
- 0.56939
效的途径。科
15
3
- 0.45996
- 0.41627
- 0.44677
16
3
3.044954
0.132904
0.071338
参考文献
[1]邓秀勤.聚类分析在股票市场板块分析中的应用[J].数理统计与管
17
3
- 0.19334
- 0.68198
- 0.8512
理.1999.18(5):1- 4.
调整:从单纯重视规模和速度向效益型方向转变,万科在这方面作出 50%以上。这些数据在行业内是很可观的。近期印尼三林集团已经完
了有益的尝试。从 2006 年开始,公司进入高速效益增长,摈弃始于 成了对万业企业母公司的全面收购,上市公司集中了母公司最优质的
2003 年的量大于质的高速增长。2006 年,万科投资 200 多亿元用于全 资产。公司在上海楼市未启动的 2002 年投资 28.7 亿元兴建上海最大
故的工序。为防止管线出现偏斜,应采取工具管调零,在工具管下的井 到抛砖引玉的作用。科
壁上加设支撑,若发现下跌立即用主顶油缸进行纠偏,工具管出洞前
●
预先设定一个初始角弥补下跌等措施。
参考文献
(3)顶管测量控制。顶管施工发生方向偏移是时常发生的问题,因 [1]王峰《. 顶管技术在泵站出水管道施工中的应用》《. 城市道桥与防
券投资分析中作了研究和探讨。聚类分析方法可以按财务指标将上市
10
2
- 0.77943
3.275596
0.058592
公司进行总体分类,但却不能定量的反应类与类之间的差异,而因子
11
3
- 0.49506
- 0.52069
- 0.35066
分析方法则可以通过计算主因子得分对实现上市公司的定量评价和
12
3
(2)顶管出洞。顶管出洞是顶管作业中一个很值得注意的问题,顶
总之,顶管设计在市政工程中起到重大的作用,然而完善和提高
管出洞,即顶管机和第一节管子从工作井中破出洞口封门进入土中。 我国顶管设计和施工技术,使之综合施工技术达到国际水平,是一项
开始正常顶管前的过程,是顶管技术中的关键工序,也是容易发生事 长久而艰巨的任务。上面我只是从几个方面作了一些探讨,希望能起
国土地战略储备,聚焦五个重点城市,上海、深圳、广州、北京、天津。企 的江景豪宅区“中远两湾城”。近年上海楼盘价格暴涨,预计三期的净
业的经营业绩骄人,成为了国内房地产业的排头兵,为市场中的绩优 利润将达到 5.675 亿元左右,公司还拥有中远老西门项目 95%的权
股。
益,这两个项目就将带来 10 亿元左右的丰厚利润。另外针对上半年国
- 0.36507
- 0.74524
- 0.5925
全面测度。利用两种方法进行综合分析,可研究股票的内在价值,全面
13
3
- 0.39451
- 0.6349
- 0.17818
反映上市公司的成长性和盈利能力,有利于缩小投资范围,确定投资
价值,降低投资风险。本文wenku.baidu.com分析方法对指导证券投资提供了一条有
14
2
- 0.75662
0.0239
0.9826
7
0.11662290
0.0146
0.9972
8
0.02264222
0.0028
1.0000
表 2 正交旋转后的因子载荷
第一主成分
第二主成分
第三主成分
1
0.91467
0.07433
0.35312
2
0.92492
- 0.11784
- 0.05253
3
- 0.81932
0.04698
1.引言 中国证券业在自二十世纪九十年代至今的十几个年头中正在不 断迅速发展壮大,随着我国市场经济建设的高速发展,人们的金融意 识和投资意识日益增强,越来越多的投资者把眼光投向了证券市场。 但是我们也应该认识到由于起步较晚,中国证券业在发展中也暴露了 不少问题。我国证券市场投机现象比较严重,投资者往往只关注对于 股票的短期投资,而忽略了股票的长期投资,而面对上千种股票如果 没有理性的投资态度,投资者将难以取得成功。若想成为一个成功的 投资者,在股市投资中赢取丰厚的投资回报,就得认真研究上市公司 的历史、业绩和发展前景,详细分析上市公司的财务状况,找出真正具 有投资价值的股票,进行长期投资。上市公司对外披露的财务指标中 往往隐含很多能具体反映出公司在某年度财务状况的信息,但如果仅 仅是笼统的、盲目的去查看这些繁杂的财务指标,一般很难从中发现 更多对投资者做出投资决策有帮助的信息。故本文将多元统计分析的 方法应用到上市公司财务数据的分析中。通过透视企业的财务状况, 使投资者做出合理的投资决策;而且各上市公司也可以根据自己的财 务分析情况,找出问题所在,弥补自身不足,修正自己公司的经营模式。 2.样本及指标选取 笔者选取 20 家房地产行业的上市公司,根据 2006 年 3 季度报表 中的信息及数据,选择每股收益、投资收益、净利润等 8 项具有重要参 考价值的财务指标,利用 SAS 经济统计软件进行了聚类分析和因子 分析,试图将上市公司进行分类,为股票的分析和选择提供依据(原始 数据略)。 3.对数据进行统计分析 3.1.聚类分析 聚类分析又称群分析,是一种研究分类问题的多 元统计方法。其基本目标是发现样品(或变量)的自然分组方法,从而辨 认在某些特征上相似的事物,并把事物就这些特征划分成若干类,使 在同一类的事物具有高度的共性,而不同类的事物具有高度的相异 性。 我们采用聚类分析中采用离差平方和法聚类,离差平方和法是由 Ward 提出来的,又称 Ward 法。其基本思想是:首先将每个样本各自当 作一类,根据样本之间的相似程度合并类,并计算新类与其它类之间 的距离,再选择相近者并类,每合并一次减少一类,继续这一过程,直 到所有样本都并成一类为止。 我们对上市公司的财务数据进行分析,得到了聚类谱系图(见图 1):
表 3 聚类分析和因子分析结果
家密集出台的房地产调控政策,公司对正在开发和销售的房产项目逐
序号
聚类分类
因子 1
因子 2
因子 3
一进行了认真分析和研判,适时调整了项目定位、开发节奏和销售策
略,最大限度地降低政策对公司的不利影响。同时,公司通过对长期亏
1
1
- 0.09326
- 0.58035
3.772068
4
3
- 0.39919
- 0.24332
0.443212
企业的成长能力和投资效率较低。其中深长城和保利地产的效益较
5
3
2.226946
0.029709
- 0.29817
高,但成长性不足,业绩进一步增长的空间不大,这两个上市公司对于
6
3
0.345924
- 0.44802
- 0.47212
短期介入的投资者来说会有较高的回报但不宜长期持有。而这一类中
损的海南科力等公司的转让和长期挂帐款项的清理,进一步清理了不
2
2
- 0.67592
0.710361
0.672649
良资产,夯实了资产质量。第二类公司虽然每股收益不高,但是由于其
3
3
- 0.55178
- 0.13204
- 0.74469
成长性好,未来发展的预期较高,是市场中的潜力股。
(3)聚类分析中的第三类,在第二和第三主成分上多为负值,说明
- 0.31859
究[J].统计研究.200(0 9):44- 49.
[4]何光汉.证券投资与证券管理[M].武汉:华中理工大学出版社.1996. (2)在聚类分析的第二类,在第二个主成分上的得分较高,对应的
财务指标为:主营利润增长率和净利润增长率。在企业成长的过程中,
作者简介:彭文洁,湖北武汉人,女,华中师范大学数学与统计学
3.2.因子分析 因子分析是将具有错综复杂关系的变量综合为数 量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根 据不同因子对变量进行分类的一种统计方法。因子分析的基本方法 是:通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量 的少数几个随机变量去描述多个变量之间的相关关系。在这里,这少 数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大 小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量 相关性较低。对表一数据进行因子分析得到原始数据标准化矩阵的均 值、方差及相关系数矩阵求出该矩阵的 8 个特征根的大小、贡献率及 累积贡献率,结果见表 1。选择特征值大于 1 的三个主成分称为新的 公因子,简称因子,其累积贡献率已达到 85.52%,说明通过数据变换 之后, 这 8 个特征根所反映出来的信息量占全部信息量的 85.52%,因 此可以把原来的 20 个变量综合为这三个因子,计算其原变量对因子 的载荷,并且正交旋转后得到因子的载荷阵,结果见表 2。
18
2
0.864091
1.496964
- 0.3339 [2]方开泰. 实用多元统计分析 [M]. 上海华东师范大学出版社.
19
3
- 0.76444
- 1.31087
- 0.65454
1989.215- 342.
[3]徐国祥,檀向球,胡穗华.上市公司经营业绩综合评价及其实证研
20
3
0.201817
- 0.43498
此顶管测量控制工作应是顶管施工的重点。施工时应该进行三维动态 洪》2006.3.第 2 期.
表 1 标准化矩阵的特征值贡献率
特征值
贡献率
累积贡献率
1
3.47442548
0.4343
0.4343
2
1.93688724
0.2421
0.6764
3
1.43018455
0.1788
0.8552
4
0.43937027
0.0549
0.9101
5
0.38862079
0.0486
0.9587
6
0.19124654
2007 年 第 16 期
(1)从企业的投资效率上看,它包括净资产收益率和流通股本,在 评价指标,没有效益的产值增加和没有效益的规模扩张都是不应该肯
这个因子上,万科居第一位,得分为 3.772068,面对房地产业普遍粗放 定的。在第二类公司中,如万业企业,公司实现 主 营 业 务 利 润
型发展的局面,一些目光长远的房地产公司从去年开始着手进行战略 19,048.97 万元,同比增加 210.66%,净利润与去年同期相比,上升了
- 0.19659
4
0.94163
- 0.01318
- 0.15265
5
0.28750
0.35748
0.79895
6
- 0.06870
- 0.16507
0.91450
7
0.01922
0.92720
0.10851
8
- 0.12127
0.87938
- 0.05781
图 1 聚类谱系图
从表 2 中可以发现,第一个特征向量即第一个主成分与四个指标 的相关系数都很大,说明第一个主成分所反映的内容与企业的利润有 关, 因此,称其为“效益因子”.此外,第二个主成分与主营利润增长率和 净利润增长率有关,主成分反映了企业的成长能力,称为“成长能力因 子”。第三个主成分和净资产收益率和流通股本有关,反映了企业的投 资效率,称为“投资效率因子”。
科技信息
○高校讲台○
SCIENCE INFORMATION
2007 年 第 16 期
多元统计分析方法在证券投资中的应用
彭文洁 (华中师范大学数学与统计学学院 湖北 武汉 430079)
摘要:选取 8 项财务指标,对沪深 20 家房地产行业的上市公司的财务数据进行了统计分析研究,首先用聚类方法将上市公司进行分类,再 用因子分析方法将公司的财务指标综合为效益因子、成长能力因子和投资效率因子,得到了对上市公司的定量评价。这两种方法为指导证券投 资提供了一种思路。
在主成分分析的基础上,将正交因子解转置与变量相关系数阵的 逆矩阵相乘,得到原始变量线性组合的系数,进而得到因子得分模型, 各因子的得分及其按照聚类分析得到的分类结果见表 3。
3.3.分析结果 经过聚类分析和因子分析我们可以发现以下现象:
173
科技信息
○高校讲台○
SCIENCE INFORMATION
的多数企业的效益上略为盈利或亏损,表现出的经营业绩和财务状况
7
3
0.061392
- 0.63358
0.619741
不佳,发展情况一般。
8
3
- 0.56337
0.308102
0.562482
4.结束语
9
3
- 0.25319
0.042138
- 0.38936
本文将聚类分析法和因子分析法这两种多元统计方法应用到证
我们不能再只追求产值与规模,应将经营效益的增长情况作为重要的 学院 2005 级研究生。研究方向:概率论与数理统计。
● ●
(上接第 119 页)L—— —管道的计算顶进长度,m;
控制。所以说,通过各种手段加强顶管测量控制工作有利于市政工程
f—— —顶进时,管道表面与其周围土层之间的摩擦系数。
的发展。
0.786461
- 0.56939
效的途径。科
15
3
- 0.45996
- 0.41627
- 0.44677
16
3
3.044954
0.132904
0.071338
参考文献
[1]邓秀勤.聚类分析在股票市场板块分析中的应用[J].数理统计与管
17
3
- 0.19334
- 0.68198
- 0.8512
理.1999.18(5):1- 4.
调整:从单纯重视规模和速度向效益型方向转变,万科在这方面作出 50%以上。这些数据在行业内是很可观的。近期印尼三林集团已经完
了有益的尝试。从 2006 年开始,公司进入高速效益增长,摈弃始于 成了对万业企业母公司的全面收购,上市公司集中了母公司最优质的
2003 年的量大于质的高速增长。2006 年,万科投资 200 多亿元用于全 资产。公司在上海楼市未启动的 2002 年投资 28.7 亿元兴建上海最大
故的工序。为防止管线出现偏斜,应采取工具管调零,在工具管下的井 到抛砖引玉的作用。科
壁上加设支撑,若发现下跌立即用主顶油缸进行纠偏,工具管出洞前
●
预先设定一个初始角弥补下跌等措施。
参考文献
(3)顶管测量控制。顶管施工发生方向偏移是时常发生的问题,因 [1]王峰《. 顶管技术在泵站出水管道施工中的应用》《. 城市道桥与防
券投资分析中作了研究和探讨。聚类分析方法可以按财务指标将上市
10
2
- 0.77943
3.275596
0.058592
公司进行总体分类,但却不能定量的反应类与类之间的差异,而因子
11
3
- 0.49506
- 0.52069
- 0.35066
分析方法则可以通过计算主因子得分对实现上市公司的定量评价和
12
3
(2)顶管出洞。顶管出洞是顶管作业中一个很值得注意的问题,顶
总之,顶管设计在市政工程中起到重大的作用,然而完善和提高
管出洞,即顶管机和第一节管子从工作井中破出洞口封门进入土中。 我国顶管设计和施工技术,使之综合施工技术达到国际水平,是一项
开始正常顶管前的过程,是顶管技术中的关键工序,也是容易发生事 长久而艰巨的任务。上面我只是从几个方面作了一些探讨,希望能起
国土地战略储备,聚焦五个重点城市,上海、深圳、广州、北京、天津。企 的江景豪宅区“中远两湾城”。近年上海楼盘价格暴涨,预计三期的净
业的经营业绩骄人,成为了国内房地产业的排头兵,为市场中的绩优 利润将达到 5.675 亿元左右,公司还拥有中远老西门项目 95%的权
股。
益,这两个项目就将带来 10 亿元左右的丰厚利润。另外针对上半年国
- 0.36507
- 0.74524
- 0.5925
全面测度。利用两种方法进行综合分析,可研究股票的内在价值,全面
13
3
- 0.39451
- 0.6349
- 0.17818
反映上市公司的成长性和盈利能力,有利于缩小投资范围,确定投资
价值,降低投资风险。本文wenku.baidu.com分析方法对指导证券投资提供了一条有
14
2
- 0.75662
0.0239
0.9826
7
0.11662290
0.0146
0.9972
8
0.02264222
0.0028
1.0000
表 2 正交旋转后的因子载荷
第一主成分
第二主成分
第三主成分
1
0.91467
0.07433
0.35312
2
0.92492
- 0.11784
- 0.05253
3
- 0.81932
0.04698