数据的基本统计与非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
北京建筑大学理学院信息与计算科学专业实验报告
课程名称《数据分析》实验名称数据的基本统计与非参数检验实验地点基C-423 日期 2016 . 3 .17
姓名班级学号指导教师成绩
【实验目的】
(1)熟悉数据的基本统计与非参数检验分析方法;
(2)熟悉撰写数据分析报告的方法;
(3)熟悉常用的数据分析软件SPSS。
【实验要求】
根据各个题目的具体要求,完成实验报告
【实验内容】
根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别对数据的“家庭收入”、“现住面积”,进行数据的基本统计量分析,撰写相应的分析报告;
根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别分析不同学历对家庭收入、现住面积是否有显着影响,撰写相应的分析报告。
根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析家
庭收入与10000元是否有显着差异,撰写相应的分析报告。
根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析婚姻状况对家现住面积是否有显着影响,撰写相应的分析报告。
根据附件“减肥茶数据”给出的相关数据,请选用恰当的分析方法,分析该减肥茶对减肥是否有显着影响,撰写相应的分析报告。
【分析报告】
1.
表一家庭收入和现住面积的基本描述统
计量
家庭收入现住面
积
N有效29932993缺失00均值
均值的标准误.47349中值
众数
标准差
方差
偏度.910偏度的标准误.045.045峰度
峰度的标准误.089.089
百分位数25 50 75
表一说明,
家庭收入方面:
被调查者中家庭收入的均值为元,中值为15000元,普遍收入为10000元;
家庭收入的标准差和方差都相对较大,所以,各家庭收入之间有明显的差异;
偏度大于零,说明右偏;峰度大于零,说明数据呈尖峰分布;
由家庭收入的四分位数可知,25%的家庭,收入在10000以下,有50%的家庭,收入在15000以下,有75%的家庭,收入在20000以下;
现住面积方面:
表二:学历与现住面积的交叉表
被调查者中现住面积的均值为平方米,中值为60平方米,普遍面积为60平方米;
现住面积的标准差和方差都相对较大,所以,各家庭现住面积之间有明显的差异;
偏度近似等于零,说明现住面积数据对称分布;峰度大于零,说明现住面积数据为尖峰分布;
由现住面积的四分位数可知,25%的家庭,现住面积为45平方米以下,有50%的家庭,现住面积在60平方米以下,有75%的家庭,现住面积在80平方米以下。
图一:家庭收入直方图
该图表明,家庭收入分布存在一定的右偏。
图二:现住面积直方图
该图形象的展示了现住面积的数据分布比标准正态分布更陡峭。
new
总计
文化程度
初中及以下 计数 796 8 1 0
805
预期计数
文化程度 内的 %
%
% % % % %
new 内的 % %
% % % % %
占总计的百分
比 %
% % % % %
残差
标准残差
.6
高中(中专) 计数 1240
17 1 0 0 1258
预期计数
文化程度 内
的 %
%
% % % % %
new 内的 %
%
% % % % %
占总计的百分
%%%%%%
比
残差
标准残差.6
大学(专、本科)计数83251544896
预期计数
文化程度内
%%%%%%
的 %
new 内的 %%%%%%%
占总计的百分
%%%%%%
比
残差
标准残差
研究生及以上计数29310134
预期计数.9.1.0.1
文化程度内
%%%%%%
的 %
new 内的 %%%%%%%
占总计的百分
%%%%%%
比
残差.9.0.9
标准残差
总计计数2897798452993
预期计数
文化程度内
%%%%%%
的 %
new 内的 %%%%%%%
占总计的百分
%%%%%%
比
图三:学历与家庭收入直方图
表二表明:
首先,在所调查的2993个样本中,805个样本为初中及以下学历,1258为高中(中专)学历,896为大学(专,本科)学历,34为研究生及以上学历,分别占总
样本的%,42%,%,和%,可见高中学历居多;收入为0~5w,
5w~10w,10w~15w,15w~20w,20w~25w的样本量分别为2897,79,8,4,5,各占样本
的%,%,%,%,%,收入在0~5w的占较大比例。
其次,对不同学历进行分析。在初中及以下学历中,%的家庭收入在5万以下,1%的家庭收入在5w~10w之间;在高中学历中%的家庭收入在5万以下,%的家庭收入在5w~10w之间;在大学学历中%的家庭收入在5万以下,%的在5w~10w之间;在研究生及以上学历中%的家庭收入在5万以下,%的家庭收入在5w~10w,%的家庭收入在10w~15w之间。
最后,对家庭收入进行分析。在家庭收入为5w(2897)以下的样本中,学历为研究生及以上学历的最少,为29;其他家庭收入中,大学学历的占大多数。由此可以得出,学历与家庭收入有一定的联系。但是,样本中的各学历的样本量存在一定的悬殊。
这些结论从图中可以直观的展现出来。
表三:不同学历的家庭收入的一致性检验结果
数值df 渐近显着性(2 端)
皮尔森
(Pearson) 卡方
12.000概似比12.000线性对线性关联1.000有效观察值个数2993