多元统计分析论文1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U
浙江财经学院东方学院《多元统计分析》课程论文
论文题目:2011年我国农村居民生活消费分析
学生姓名徐妙学期2013年第二学期分院信息专业统计
班级10统计1班学号1020430112
教师彭武珍成绩
2013年6月17日
2011年我国农村居民生活消费分析
摘要:改革开放以来,我国广大地区农村居民生活水平普遍有所提高,价值观念也发生了许多变化,但是,他们的消费水平与城镇居民相比仍然偏低。本文综合了因子分析与聚类分析,先进行因子分析, 再用因子分析的结果进行聚类分析,本文较多运用了31个省份的因子得分,计算出单因子情况下31个省份的得分和31个省份在八项消费产生的3个因子上的综合得分, 再把该得分作为31个省份的属性, 采用离差平方和(ward)方法进行聚类, 最后将城市分为四层,对整体进行综合评价和说明。
关键词:因子分析;聚类分析;综合评价
1引言
当前我国农村居民的消费结构主要是偏重物质生活消费,精神生活消费的比例较低。商品消费主要集中于食品、居住以及日常生活物质消费等方面。而交通通讯、文教娱乐用品及服务等精神生活消费品消费比例较小。旅游休闲、家用汽车、耐用消费品等消费在绝大多数农村地区还处于未开发状态。因此,笔者就我国农村居民生活消费结构进行因子分析和聚类分析,以期对农村居民生活消费的问题作一研究,并以此寻求合理的解决思路。
2因子分析
2.1因子分析统计思想
因子分析模型是主成分分析的推广。它也是利用降维德思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。其基本思想是根据相关性大小把原始变量分组,使得同组内的变量间相关性较高,而不同组的变量的相关性则较低。因子分析不仅可以用来研究变量之间的相关关系,还可以用来研究样品之间的相关关系。
2.2因子的确定
利用2011年各地区农村居民家庭平均每人生活消费支出资料(见附表一,摘自《中国统计年鉴(2012)》),做因子相关性分析得:
表1 相关矩阵表
食品衣着居住家庭设备及用
品文教娱乐交通通信医疗保健其他
相关食品 1.000 .760 .796 .831 .839 .923 .786 .919 衣着.760 1.000 .789 .778 .848 .883 .845 .793
居住.796 .789 1.000 .888 .814 .843 .846 .846
家庭设备及用
品
.831 .778 .888 1.000 .840 .855 .811 .825 文教娱乐.839 .848 .814 .840 1.000 .896 .883 .892
交通通信.923 .883 .843 .855 .896 1.000 .874 .879
医疗保健.786 .845 .846 .811 .883 .874 1.000 .862
其他.919 .793 .846 .825 .892 .879 .862 1.000 Sig.(单侧)食品.000 .000 .000 .000 .000 .000 .000 衣着.000 .000 .000 .000 .000 .000 .000
居住.000 .000 .000 .000 .000 .000 .000
家庭设备及用
品
.000 .000 .000 .000 .000 .000 .000
文教娱乐.000 .000 .000 .000 .000 .000 .000 交通通信.000 .000 .000 .000 .000 .000 .000 医疗保健.000 .000 .000 .000 .000 .000 .000 其他.000 .000 .000 .000 .000 .000 .000
由上面的结果可知,原始变量之间有较强的相关性,进行因子分析是合适的。因子相关相关矩阵反映我国农村居民消费结构的各指标之间存在较高的相关性,
而变量间存在较为明显的相关关系是应用因子分析提取主因子,并以此为依据构
造评价体系的基础。因此存在可以采用因子分析进行分析的可能。
2.3因子分析过程
共同度描述的是变量Xi(i=1,2,…,m)对m个因子的依赖程度,也就是用m
个因子描述变量的有效性。本文用因子分析法,选取特征值r>0.2的变量作为
主因子并计算其共同度。
表2 公因子方差分析表
初始提取
食品 1.000 .850
衣着 1.000 .810
居住 1.000 .841
1.000 .842
家庭设备及用
品
文教娱乐 1.000 .890
交通通信 1.000 .926
医疗保健 1.000 .863
其他 1.000 .891
提取方法:主成份分析。
由表可以看出,主因子对每个变量指标有很强的解释力。
表3解释的方差分析表
成份
初始特征值提取平方和载入
合计方差的% 累积% 合计方差的% 累积%
1 6.914 86.420 86.420 6.914 86.420 86.420
2 .301 3.769 90.189
3 .27
4 3.42
5 93.614
4 .182 2.27
5 95.889
5 .133 1.667 97.556
6 .100 1.250 98.806
7 .071 .890 99.696
8 .024 .304 100.000
提取方法:主成份分析。
累计方差贡献率达到93.61%,说明主因子对变量能够起到较好的概括作用,其中第一主因子起到了尤其重要的作用,其旋转后的方差贡献率达到86.42%。
因子载荷矩阵的元素ai代表了变量Xi与因子Fi线性联系的紧密程度,而第j列的因子载荷量a1,a2,…,ai,则说明了第j个因子Fi与各变量的联系程度,在实际中,常常根据该列载荷中绝对值较大的载荷所对应的变量来说明这个因子的意义。
表4进行因子旋转分析表