15个上市公司主要财务指标
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题目:下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法分别对这些公司进行聚类,并对结果进行比较分析。
解:令净资产收益率为X1,每股净利润X2,总资产周转率为X3,资产负债率为X4,流动负债比率为X5,每股净资产为X6,净利润增长率为X7,总资产增长率为X8,用spss对公司聚类分析的步骤如下:
a)系统聚类法:
1. 在SPSS窗口中选择Analyze宀Classify宀Hierachical Cluster,调出系统聚类分析主界面,并将变量X8-X1移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
图5.1糸统分析迭王界面
2•点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。我们选择Agglomeration schedule 与Cluster Membership 中的Range of solution 2-4,如图5.2 所示,点击Continue按钮,返回主界面。(其中,Agglomeration schedule表示在结果中给出聚类过
程表,显示系统聚类的详细步骤;Proximity matrix表示输出各个体之间的距离矩阵;Cluster Membership表示在结果中输出一个表,表中显示每个个体被分配到的类别,Range of solution 2-4即将所有个体分为2至4类。)
3.点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。选中Dendrogram复选框
和Icicle栏中的None单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。单击Continue按钮,返回主界面。
蠹Hinrarchicdl ClLrst»r Analyte 应d
Singh1
CanCTi
图5.2 Statistics子对话框图5.3 Plots子对话框
4•点击Method 按钮,设置系统聚类的方法选项。 Cluster Method 下拉列表用于指定 聚类的
方法,这里选择 Between-group inkage (组间平均数连接距离); Measure 栏 用于选择对距
离和相似性的测度方法,选择 Squared Euclidean distanee (欧氏距离);单击 Continue 按钮, 返
回主界面。
S HlfrjrchkilClwrtff Arulysit : bffthod
图5.4 Method 子对话框 图5.5 Save 子对话框
5•点击Save 按钮,指定保存在数据文件中的用于表明聚类结果的新变量。 None 表示不保
存任何新变量;Single solution 表示生成一个分类变量,在其后的矩形框中输入要分成的类
数;Range of solutions 表示生成多个分类变量。这里我们选择
Range of solutions ,并在后面
的两个矩形框中分别输入 2和4,即生成三个新的分类变量,分别表明将样品分为 2类、3
类和4类时的聚类结果,如图5.5。点击Continue ,返回主界面。 6•点击0K 按钮,运行系统聚类过程。
聚类结果分析:
下面的群集成员表给出了把公司分为 2类,3类,4类时各个样本所属类别的情况,另外, 从右边的树形图也可以直观地看到,
若将15个公司分为2类,则13独自为一类,其余的为
一类;若分为3类,则公司8分离出来,自成一类。以此类推。
表 5.1各样品所属类别表
Cluster Membership
Case 4 Clusters
3 Clusters
2 Clusters
1 1 1 1
2 1 1 1
3 1 1 1
4 1 1 1
5 2 1 1
6 1 1 1 7
1
1
1
Ortm* Ctficql
〔3」
rli 6
二 qpngegp
to ()^1 r«ngc-
* * * * * * * * * * * * * * * * * * * H i E R A R C H I C A L c L U S T E R
*******************
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num + ---------- + -------- +-------- + -------- + -------- +
61
9T
2T
12T
4T
10T
1T
7T
14T
3T
15-4
11T
5__ 1
8
13
图5.6聚类树形图
b ) K 均值法:
1.在SPSS 窗口中选择 Analyze f Classify f K-Means Cluster ,调出K 均值聚类分析主界 面,
并将变量 X1-X8移入 Variables 框中。在 Method 框中选择Iterate classify ,即使用 K-means 算法不
断计算新的类中心,并替换旧的类中心(若选择 Classify only ,则根据初始类中心进
行聚类,在聚类过程中不改变类中心) 。在Number of Cluster 后面的矩形框中输入想要把样
品聚成的类数,这里我们输入
3,即将15个公司分为3类。
(Centers 按钮,则用于设置
迭代的初始类中心。如果不手工设置,则系统会自动设置初始类中心,
这里我们不作设置。)
E 5 - K 均值聚类分析王界面
2. 点击Iterate 按钮,对迭代参数进行设置。
Maximum Iterations 参数框用于设定 K-means
算法迭代的最大次数,输入 10,Convergence Criterion 参数框用于设定算法的收敛判据,输
入0,只要在迭代的过程中先满足了其中的参数,则迭代过程就停止。单击
Continue ,返回
主界面。 3.
点击Save 按钮,设置保存在数据文件中的表明聚类结果的新变量。
我们将两个复 选框都
选中,其中Cluster membership 选项用于建立一个代表聚类结果的变量,默
认变量名为
qcl_1 ; Distanee from cluster center 选项建立一个新变量,代表各观测量与其所属类中心的欧
氏距
图 5,8 Iterate 对话框
:Iterate
翳5.9 Save 子对话框
图5.10 OptioiK 子对话框