关于2010年全国各地区人均收入与支出水平的spss数据分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Spss 统计数据分析期末作业

一、数据的简单处理

在数据文件建立好后,通常还需要对待分析的数据进行必要的预加工处理,这是数据分析过程中不可缺少的一个关键环节。首先,为了便于数据的浏览,快捷的找到数据的最大值和最小值,同时,快捷的发现数据的异常值,先将数据按照降序重新进行排列;其次,为了粗略的把握数据的分布,实现数据的离散化处理和对数据进行频数分析,和对数据进行频数分析,利用spss软件中的分组功能对数据进行简单的分组。由于变量值较多,分组适应采用组据分组的方式,具体步骤如下:

1、确定组数: k=1+ln(n)/ln2=1+ln31/ln2=6

2、确定组距:组距=(最大值-最小值)/组数=(10044.91-2088.48)/6=1326.0717

通过一个复合条形图,可以很明确的发现我国农村居民生活水平存在很大的地区差异,地区发展很不平衡,从图中的生活消费支出和人均收入来看,北京,上海,浙江这些省市农村消费水平最高,人均收入也是最高的,各省市的农村居民消费水平差异较大,大多数省份农村居民人均消费集中在3500元左右。

一、线性回归分析

农民人均生活消费支出Y与农民人均收入X的一元线性回归分析变量选择说明:被解释变量即自变量:农民人均生活消费支出Y,解释变量即因变量:农民人均收入X

1. 相关分析表,由模型汇总中看到复相关系数为0.922,决定相关系数0.930,说

输入/移去的变量a

模型输入的变量移去的变量方法

1 生活消费支出合

计. 步进(准则:

F-to-enter 的概率 <= .050,

F-to-remove 的概率 >= .100)。

a. 因变量: 人均纯收入

华东交通大学10市场营销一班郭亲龙20100410080127

2.方差分析表,F=340.450,P=0.000<0.05,表明回归方程高度显著,即农民人均

收入对消费有高度影响。

3. 回归系数的显著性检表,常数项的P=0.00<0.05,说明存在显著性差异,故应该得出现在回归方程中,回归方程为:Y=948.338+0.96X

二、单样本的T检验

由表3-2可知,分组后,全国31个省市的农村家庭居民平均每人生活消费支出合计,大约有21个城市都集中在第一组,数额主要2088.48——3951.17元之间,因此可推断,全国农村家庭居民平均每人生活消费支出的平均数应该在4000元——6000元之间,假设为4500元,

由于该问题涉及的是单个总体,且要进行总体均值检验,同时农村家庭居民平均每人消费的总体可近似认为服从正态分布,因此,应采用单样本t检验来分析推断全国农村家庭居民人均消费的平均值是否为4500元。分析结果如下:

检测

表2-1

表2-2

由表2-1可知31个省市的农村居民人均消费支出的平均值为4087.2623元,标准差为1949.53570元,均值标准误差为350.14695元。表2-2中,第二列是t统计量的观测值为-1.179;

第三列式自由度为30(即n-1=31-1);第四列是t统计量的观测值的双尾概率P-值;第五列为样本均值与检验值的差,即t统计量的分子部分,它除以表2-1中的均值标准误差后得到t统计量的观测值;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(-1127.8332,302.3577),由此计算出总体均值的95%的置信区间为(3372.1668,4802.3577)元。

该问题应采用双尾检验,因此比较a/2和p/2,是比较a和p。如果a给0.05,由于p大于a,此应接受原假设,认为全国农村家庭平均每人生活消费支出的平均数与4500元无显著差异。

华东交通大学10市场营销一班郭亲龙20100410080127

三、统计的基础分析——频数分析

利用spss先前已经对数据做好的分组,通过频数分析,可以进一步了解分组后的消费支出合计取值的状况,进而准确的把握数据的分布特征。分析结果如下:

统计量

fz

N 有效31

缺失0

表3-1

表3-2

已知,全国31个省市按照消费合计总共被分成了6组,从表3-2中可以得出:第6组的省市最多,共有21个,所占比率为67.7%;第5组有6个,所占比率为19.4%;第二组有2个,所占比率为6.5%,而剩下的组都只有1个省市,所占比率均为3.2%。由于在表格中不存在缺失值,因此频数分布表中的百分比和有效百分比相同。从此次分析中可以看出,我国农村家庭居民人均消费的总体水平比较集中,大约在2000元-4000元之间,还有少数省市的消费水平处在中等阶段,而只有上海、北京、浙江等一些经济较发达的地区的农村家庭居民人均消费达到了8000元以上。也就是说,我国农村家庭消费总水平还处在比较低的阶段。

四、非参数检验—多配比样本分参数检验

数据中我国农村家庭居民人均消费包括食品、衣着、居住、家庭设备、交通及通讯、文教娱乐、医疗保健、和其他8个指标,为了比较清楚的了解这8项指标对我国农村居民人均消费总

华东交通大学10市场营销一班郭亲龙20100410080127

体的影响,以及其大概的消费动向,可以利用多配比样本的非参数检验对各个指标进行检验。检验结果如下:

Friedman 检验

秩均值

食品7.97 衣着 3.00 居住7.03 家庭设备及服务 2.55 交通和通讯 5.65 文教娱乐、用品及服务

4.45

医疗保健 4.29

其他商品及服务 1.06

Friedman检验统计量的观测值为194.559,相应的概率P-值为0。如果显著性水平a为0.05,由于概率P-值小于显著性水平a,因此应拒绝原假设,认为不同消费形式下的消费额数据的分布存在显著差异,其中食品消费占得比重最多。也就是说,在8项指标中,食品消费指标对我国农村居民人均消费总额的影响最大,其次是居住条件。

相关文档
最新文档