多元统计分析实例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析实例
院系:商学院
学号:
姓名:
多元统计分析实例
本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对收集的数据进行比较分析对31个省市自治区进行分类.选取了6个指标农业产值,林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.
数据如下表:
一.聚类法
设定4个群聚,采用了系统聚类法.下表为spss分析之后的结果.
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
内蒙 5 -+
吉林 7 -+
云南 25 -+-+
江西 14 -+ +-+
陕西 27 -+-+ |
新疆 31 -+ +-+
安徽 12 -+-+ | |
广西 20 -+ +-+ +-------+
辽宁 6 ---+ | |
浙江 11 -+-----+ |
福建 13 -+ |
重庆 22 -+ +---------------------------------+ 贵州 24 -+ | | 山西 4 -+---+ | | 甘肃 28 -+ | | | 北京 1 -+ | | | 青海 29 -+ +---------+ | 天津 2 -+ | | 上海 9 -+ | | 宁夏 30 -+---+ | 西藏 26 -+ | 海南 21 -+ | 河北 3 ---+-----+ | 四川 23 ---+ | | 黑龙江 8 -+-+ +-------------+ | 湖南 18 -+ +---+ | | | 湖北 17 -+-+ +-+ +-------------------------+ 广东 19 -+ | |
江苏 10 -------+ |
山东 15 -----------+-----------+
河南 16 -----------+
群集成员
案例 4 群集
1:北京 1
2:天津 1
3:河北 1
4:山西 1
5:内蒙 2
6:辽宁 1
7:吉林 2
8:黑龙江 2
9:上海 1
10:江苏 1
11:浙江 1
12:安徽 1
13:福建 1
14:江西 1
15:山东 3
16:河南 1
17:湖北 1
18:湖南 1
19:广东 1
20:广西 1
21:海南 1
22:重庆 1
23:四川 1
24:贵州 1
25:云南 1
26:西藏 4
27:陕西 1
28:甘肃 1
29:青海 1
30:宁夏 1
31:新疆 2
从SPSS分析结果可以得到,内蒙,吉林,黑龙江,新疆为第2族群,这一族群的特点是农业收入可能不高,但是农民的固定资产,和耕地面积非常高,农民的富余程度或者机械化程度较高;山东是第3族群,这一族群中六个指标都处于较高水平,
农林牧渔四项收入都处于较高水平而且农民富余;西藏处于第4族群,这是因为,西藏人员较少,自然条件恶劣,可使用耕地少,但是,由于国家的扶持,农民的固定资产较多,农民相对而言比较富足;大多数省份属于第1族群,这一族群的特点在于六项指标都没有较为突出的一项,或者农林牧渔收入的本来就少,或者是农民的虽然比较辛苦,总体的农业收入较高,但是农民的收入水平比较低,固定资产较少.
三.判别法
6
54321,,,,,X X X X X X 分别代表农业产值,林业产值.牧业总产值,渔业总产
值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积.
分析案例处理摘要
未加权案例
N
百分比
有效
31 100.0
排除的
缺失或越界组代码 0 .0 至少一个缺失判别变量 0 .0 缺失或越界组代码还有至少一个缺失判别变量 0
.0
合计
0 .0 合计 31 100.0
实验结果分析:
从表上可以看出,组均值之间差值很大.各个分组,在6项指标上均值有较明显的差异.
由表中可以知道,13456指标之间的sig值较小,2指标sig值有0.561较大,不过仍说明接受原假设,各指标族群间差异较大.
从表中可以知道,检验结果 p值>0.05,此时,说明协方差矩阵相等,可以进行bayes检验.
Fisher 分析法
协方差矩阵的均等性的箱式检验
典型判别式函数摘要
由表中看出,函数1,2的特征值达到0.911,0.822 比较大,对判别的贡献大..
由表中可知,3个Fisher 判别函数分别为:
643236
22621037.003.001.0009.0975.0489.0002.0269.2626.0003.0928.2X X X X y X X y X X y +++--=-++-=++-=
农村居民家庭拥有生产性固定资产原值 对判别 数据所属群体无用.
该表是原始变量与典型变量(标准化的典型判别函数)的相关系数,相关系数的绝对值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关
由上表可知各类别重心的位置,通过计算观测值与各重心的距离,距离最小的即为该观测值的分类.
贝叶斯分析法