聚类分析实验报告.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
聚类分析实验报告
姓名:学号:班级:
一:实验目的
1.了解聚类分析的基本原理及在spss中的实现过程。
2.通过对指标进行聚类,体会降维的处理过程。
3.通过不同性质指标对样本进行聚类,体会归类的思想。
二:实验原理
聚类分析是根据事物本身的特性来定量研究分类问题的一种多元统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是根据一批根据一批样品的多个观察指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用某种聚类法,将所有的样品(或变量)分别聚合到不同的类中。
三:实验过程
本实验是通过对上市公司分析所得。由基本经济知识知道评价一个上市公司的业绩主要从以下四个方面:盈利能力,偿债能力,成长能力,经营能力。所以我分别从这四个方面共选取了19个指标来对上市公司的业绩进行评价。具体数据请见EXCEL。
由上面的分析我们知道评定一个上市公司业绩的指标有四类,但我们看EXCEL可知,每一类下面有4-5个指标,每类指标有较强相关性,存在多重共线性和维数过高而不易分析得影响。所以首先采用系统聚类法对每类指标进行聚类,再采用比较复相关系数得出每类最具代表的指标,达到降维的目的。(注:以下对指标分析均采用主间连接法,度量标准为person相关性)
以下是实验截图:
(1):对盈利能力指标
从上表分析我们可将盈利能力的4个指标分为两类,即“毛利率”为一类,“销售净利率”、“成本费用利润率”和“资产净利润”为一类。所以“毛利率”为一类,另外再对“销售净利润”、“成本费用利润率”和“资产净利润”分别作对另3个指标的复相关系数,结果如下:
①、以“销售净利润”为因变量,其余为自变量得:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .980a.960 .957 .20721755
a. 预测变量: (常量), Zscore: 资产净利率(%), Zscore: 毛利率(%), Zscore: 成本费用利润率(%)。
②、以“成本费用利润率”为因变量,其余为自变量得:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .978a.957 .953 .21603919
a. 预测变量: (常量), Zscore: 销售净利率(%), Zscore: 毛利率(%), Zscore: 资产净利率(%)。
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .686a.470 .428 .75625071
a. 预测变量: (常量), Zscore: 成本费用利润率(%), Zscore:
毛利率(%), Zscore: 销售净利率(%)。
综上比较复相关系数R得,当以“销售净利润”为因变量时,R最大,所以最终选取“销售净利润”和“毛利率”代表盈利能力。
(2):对偿债能力指标的聚类
从上表分析我们可将偿债能力的5个指标分为两类,即“资产负债率”和“产权比率”为一类,“流动比率”、“速动比率”和“现金流动负债比”为一类。然后同上法作复相关系数,结果如下:
①、以“资产负债率”为因变量,其余为自变量得:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .934a.873 .859 .37572750
a. 预测变量: (常量), Zscore(现金流动负债比), Zscore(流动比率(倍)), Zscore: 产权比率(%), Zscore(速动比率(倍))。
②、以“产权比率”为因变量,其余为自变量得:
模型汇总
综上比较复相关系数R得,在①和②中选择“资产负债率”,在③④⑤中选择“速动比率”,即最终选取“资产负债率”和“速动比率”代表偿债能力。
(3):对成长能力指标的聚类
从上表分析我们可将成长能力的5个指标分为两类,即“经营性现金流增长率”单独为一类,“营业收入增长率”、“总资产增长率”、“净利润增长率”和“股东权益增长率”为一类。然后同上法作复相关系数,结果如下:
①、以“营业收入增长率”为因变量,其余为自变量得:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .583a.340 .269 .85494489
a. 预测变量: (常量), Zscore: 经营性现金流增长率(%), Zscore: 净利润增长率(%), Zscore: 股东权益增长率(%), Zscore: 总资产增长率(%)。
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .712a.507 .453 .73933653
综上比较复相关系数R得,在①②③④中选择“总资产增长率”,即最终选取“经营性现金流增长率”和“总资产增长率”代表成长能力的指标。
(4):对运营能力指标的聚类
从上表分析我们可将营运能力的5个指标分为两类,即“应收账款周转率”单独为一类,“总资产周转率”、“股东权益周转率”、“固定资产周转率”和“存货周转率”为一类。然后同上法作复相关系数,结果如下:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .861a.74
2 .714 .53466578
a. 预测变量: (常量), Zscore(固定资产周转率(次)), Zscore(存货周转率(次)), Zscore(应收账款周转率(次)), Zscore(股东权益周转率(次))。
②、以“股东权益周转率”为因变量,其余为自变量得:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .851a.725 .695 .55205260
a. 预测变量: (常量), Zscore(总资产周转率(次)), Zscore(应收账款周转率(次)), Zscore(存货周转率(次)), Zscore(固定资产周转率(次))。
③、以“固定资产周转率”为因变量,其余为自变量得: