关于2010年全国各地区人均收入与支出水平的spss数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Spss 统计数据分析期末作业
一、数据的简单处理
在数据文件建立好后,通常还需要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。首先,为了便于数据的浏览,快捷的找到数据的最大值和最小值,同时,快捷的发现数据的异常值,先将数据按照降序重新进行排列;其次,为了粗略的把握数据的分布,实现数据的离散化处理和对数据进行频数分析,和对数据进行频数分析,利用spss软件中的分组功能对数据进行简单的分组。由于变量值较多,分组适应采用组据分组的方式,具体步骤如下:
1、确定组数: k=1+ln(n)/ln2=1+ln31/ln2=6
2、确定组距:组距=(最大值-最小值)/组数=(10044.91-2088.48)/6=1326.0717
通过一个复合条形图,可以很明确的发现我国农村居民生活水平存在很大的地区差异,地区发展很不平衡,从图中的生活消费支出和人均收入来看,北京,上海,浙江这些省市农村消费水平最高,人均收入也是最高的,各省市的农村居民消费水平差异较大,大多数省份农村居民人均消费集中在3500元左右。
一、线性回归分析
农民人均生活消费支出Y与农民人均收入X的一元线性回归分析变量选择说明:被解释变量即自变量:农民人均生活消费支出Y,解释变量即因变量:农民人均收入X
1. 相关分析表,由模型汇总中看到复相关系数为0.922,决定相关系数0.930,说
输入/移去的变量a
模型输入的变量移去的变量方法
1 生活消费支出合
计. 步进(准则:
F-to-enter 的概率 <= .050,
F-to-remove 的概率 >= .100)。
a. 因变量: 人均纯收入
华东交通大学10市场营销一班郭亲龙20100410080127
2.方差分析表,F=340.450,P=0.000<0.05,表明回归方程高度显著,即农民人均
收入对消费有高度影响。
3. 回归系数的显著性检表,常数项的P=0.00<0.05,说明存在显著性差异,故应该得出现在回归方程中,回归方程为:Y=948.338+0.96X
二、单样本的T检验
由表3-2可知,分组后,全国31个省市的农村家庭居民平均每人生活消费支出合计,大约有21个城市都集中在第一组,数额主要2088.48——3951.17元之间,因此可推断,全国农村家庭居民平均每人生活消费支出的平均数应该在4000元——6000元之间,假设为4500元,
由于该问题涉及的是单个总体,且要进行总体均值检验,同时农村家庭居民平均每人消费的总体可近似认为服从正态分布,因此,应采用单样本t检验来分析推断全国农村家庭居民人均消费的平均值是否为4500元。分析结果如下:
检测
表2-1
表2-2
由表2-1可知31个省市的农村居民人均消费支出的平均值为4087.2623元,标准差为1949.53570元,均值标准误差为350.14695元。表2-2中,第二列是t统计量的观测值为-1.179;
第三列式自由度为30(即n-1=31-1);第四列是t统计量的观测值的双尾概率P-值;第五列为样本均值与检验值的差,即t统计量的分子部分,它除以表2-1中的均值标准误差后得到t统计量的观测值;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(-1127.8332,302.3577),由此计算出总体均值的95%的置信区间为(3372.1668,4802.3577)元。
该问题应采用双尾检验,因此比较a/2和p/2,是比较a和p。如果a给0.05,由于p大于a,此应接受原假设,认为全国农村家庭平均每人生活消费支出的平均数与4500元无显著差异。
华东交通大学10市场营销一班郭亲龙20100410080127
三、统计的基础分析——频数分析
利用spss先前已经对数据做好的分组,通过频数分析,可以进一步了解分组后的消费支出合计取值的状况,进而准确的把握数据的分布特征。分析结果如下:
统计量
fz
N 有效31
缺失0
表3-1
表3-2
已知,全国31个省市按照消费合计总共被分成了6组,从表3-2中可以得出:第6组的省市最多,共有21个,所占比率为67.7%;第5组有6个,所占比率为19.4%;第二组有2个,所占比率为6.5%,而剩下的组都只有1个省市,所占比率均为3.2%。由于在表格中不存在缺失值,因此频数分布表中的百分比和有效百分比相同。从此次分析中可以看出,我国农村家庭居民人均消费的总体水平比较集中,大约在2000元-4000元之间,还有少数省市的消费水平处在中等阶段,而只有上海、北京、浙江等一些经济较发达的地区的农村家庭居民人均消费达到了8000元以上。也就是说,我国农村家庭消费总水平还处在比较低的阶段。
四、非参数检验—多配比样本分参数检验
数据中我国农村家庭居民人均消费包括食品、衣着、居住、家庭设备、交通及通讯、文教娱乐、医疗保健、和其他8个指标,为了比较清楚的了解这8项指标对我国农村居民人均消费总
华东交通大学10市场营销一班郭亲龙20100410080127
体的影响,以及其大概的消费动向,可以利用多配比样本的非参数检验对各个指标进行检验。检验结果如下:
Friedman 检验
秩
秩均值
食品7.97 衣着 3.00 居住7.03 家庭设备及服务 2.55 交通和通讯 5.65 文教娱乐、用品及服务
4.45
医疗保健 4.29
其他商品及服务 1.06
Friedman检验统计量的观测值为194.559,相应的概率P-值为0。如果显著性水平a为0.05,由于概率P-值小于显著性水平a,因此应拒绝原假设,认为不同消费形式下的消费额数据的分布存在显著差异,其中食品消费占得比重最多。也就是说,在8项指标中,食品消费指标对我国农村居民人均消费总额的影响最大,其次是居住条件。