多元统计分析实例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析实例

院系:商学院

学号:

姓名:

多元统计分析实例

本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对收集的数据进行比较分析对31个省市自治区进行分类.选取了6个指标农业产值,林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.

数据如下表:

一.聚类法

设定4个群聚,采用了系统聚类法.下表为spss分析之后的结果.

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+

内蒙 5 -+

吉林 7 -+

云南 25 -+-+

江西 14 -+ +-+

陕西 27 -+-+ |

新疆 31 -+ +-+

安徽 12 -+-+ | |

广西 20 -+ +-+ +-------+

辽宁 6 ---+ | |

浙江 11 -+-----+ |

福建 13 -+ |

重庆 22 -+ +---------------------------------+ 贵州 24 -+ | | 山西 4 -+---+ | | 甘肃 28 -+ | | | 北京 1 -+ | | | 青海 29 -+ +---------+ | 天津 2 -+ | | 上海 9 -+ | | 宁夏 30 -+---+ | 西藏 26 -+ | 海南 21 -+ | 河北 3 ---+-----+ | 四川 23 ---+ | | 黑龙江 8 -+-+ +-------------+ | 湖南 18 -+ +---+ | | | 湖北 17 -+-+ +-+ +-------------------------+ 广东 19 -+ | |

江苏 10 -------+ |

山东 15 -----------+-----------+

河南 16 -----------+

群集成员

案例 4 群集

1:北京 1

2:天津 1

3:河北 1

4:山西 1

5:内蒙 2

6:辽宁 1

7:吉林 2

8:黑龙江 2

9:上海 1

10:江苏 1

11:浙江 1

12:安徽 1

13:福建 1

14:江西 1

15:山东 3

16:河南 1

17:湖北 1

18:湖南 1

19:广东 1

20:广西 1

21:海南 1

22:重庆 1

23:四川 1

24:贵州 1

25:云南 1

26:西藏 4

27:陕西 1

28:甘肃 1

29:青海 1

30:宁夏 1

31:新疆 2

从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平,

农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因为,西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较少.

三.判别法

6

54321,,,,,X X X X X X 分别代表农业产值,林业产值.牧业总产值,渔业总产

值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.

分析案例处理摘要

未加权案例

N

百分比

有效

31 100.0

排除的

缺失或越界组代码 0 .0 至少一个缺失判别变量 0 .0 缺失或越界组代码还有至少一个缺失判别变量 0

.0

合计

0 .0 合计 31 100.0

实验结果分析:

从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明显的差异.

由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大,不过仍说明接受原假设,各指标族群间差异较大.

从表中可以知道,检验结果 p值>0.05,此时,说明协方差矩阵相等,可以进行bayes检验.

Fisher 分析法

协方差矩阵的均等性的箱式检验

典型判别式函数摘要

由表中看出,函数1,2的特征值达到0.911,0.822 比较大,对判别的贡献大..

由表中可知,3个Fisher 判别函数分别为:

643236

22621037.003.001.0009.0975.0489.0002.0269.2626.0003.0928.2X X X X y X X y X X y +++--=-++-=++-=

农村居民家庭拥有生产性固定资产原值 对判别 数据所属群体无用.

该表是原始变量与典型变量(标准化的典型判别函数)的相关系数,相关系数的绝对值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关

由上表可知各类别重心的位置,通过计算观测值与各重心的距离,距离最小的即为该观测值的分类.

贝叶斯分析法

相关文档
最新文档