spss期末论文正稿

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于住房状况调查的SPSS统计数据分析

一、数据介绍

数据来源于统计分析方法与SPSS的应用(第二版)案例数据住房情况调查.分析的数据为2993个样本的住房状况.其中包含21个变量.分别为编码、所在区(A、B、C、D、E)、性别(男、女)、年龄、文化程度(初中及以下、高中、大学、研究生及以上)、从业状况(行政事业单位、国营企业、私营企业、大专院校科研单位、失业、其他)婚姻(已婚、否)、常住人口、户口状况(本地户口、外地户口)、家庭收入、现住面积、人均面积、房屋产权、住房满意(满意、不满意)、未来三年(不买、购买)、计划面积、计划户型、购买类型、地理位置、购房价位、是否贷款(自筹、申请贷款)。通过运用SPSS统计软件.对变量进行频数分析、样本T检验、相关分析等以了解2993个样本的住房状况并分析变量的分布特点及相互间的关系。

二、频数分析

频数分析能够了解变量取值的状况.便于把握数据的分布特征。

(一)分析被调查家庭中户主文化程度与从业情况。

频率表

条形图:

由上表可以得到以下分析结论:

首先.本次调查的总家庭为2993户.户主的文化程度是:人数最多的是高中.其次是大学和初中以下.人数大致相当.人数最少的是研究生及以上。

其次.本次被调查家庭户主从业情况是:人数最多的是国营企业、其次是行政事业单位和私营企业人数大致相当.人数最少的是大专院校科研单位。

三、单样本T检验:

(一)提出原假设

假设H0:总体均值与检验值之间不存在显著差异

(二)选择检验统计量

(三)计算检验统计量观测值和概率p值

(四)给定显著性水平α.并作出决策

检验被调查样本中的现住面积是否大于80平方米

原假设H0:现住面积平均值等于80平方米

对居民现住面积进行单样本T检验

结论:

由上表可知.在调查的2993个样本中.现有面积的平均值为62.7241平方米.标准差为25.90383.单样本T检验中t统计量的双尾概率P值为0.47349.比例中体均值的95%置信区间为(1.7957,3.6525)。如果显著性水平α为0.05.因为T检验的结果的概率小于等于α.拒绝原假设.所以.在5%的显著性水平下.现住面积不是80平方米。

两独立样本T 检验:

两独立样本T检验有两个检验:F检验和T检验

首先.进行的是方差齐性F检验.即检验两个总体的方差是否相等.原假设H0:两总体方差无显著性差异该检验首先计算每个个案与所属组均值之差并取绝对值.然后对其进行单因素方差分析。

如果F检验的P≤α.则拒绝F检验的H0.认为方差不齐性;其次看Unequal行的t检验概率。首先.如果F检验的P >α.则不能拒绝F检验的H0.认为方差齐性;其次看equal行的t检验概率。不管是方差相等时的T检验结果还是方差不相等时的T检验结果.解释都是一样的.如果T检验的P≤α.则拒绝t检验的H0.认为两总体均值有显著差异;如果T检验的P>α.则不拒绝t检验的H0。

分析本市户口与外地户口家庭人均住房面积的平均值是否存在显著性差异。该问题中.由于本市户口人均住房面积和外地户口人均住房面积可以看成两个总体.且住房面积可近似认为服从正态分布.样本数据的获取的独立抽样的.因此可以用两独立样本T检验的方法进行。

原假设H0:本地户口和外地户口的家庭人均住房面积的平均值无显著性差异

结论:

由上表可知.当显著性水平α为5%时.F检验的P小于显著性水平α.所以拒绝原假设.两总体方差相等.两总体方差不相等.看第二行.由于T检验的P为0.1%小于显著性水平α.所以拒绝原假设.得出结论本地户口和外地户口的家庭人均住房面积的平均值有显著性差异。四、相关分析:

相关分析是分析客观事物之间关系的数量分析法.明确客观事物之间有怎样的关系对理解和运用相关分析是极其重要的。函数关系是指两事物之间的一种一一对应的关系.即当一个变量X取一定值时.另一个变量函数Y可以根据确定的函数取一定的值。另一种普遍存在的关系是统计关系。统计关系是指两事物之间的一种非一一对应的关系.即当一个变量X取一定值时.另一个变量Y无法根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。

(一)简单散点图

简单散点图是表示一对变量间统计关系的散点图

指定某个变量为散点图的纵轴变量

指定某个变量为散点图的横轴变量

分析家庭收入与现住面积之间的关系

家庭收入与现住面积的散点图

由散点图可以看出.家庭收入与现住面积之间存在弱相关性.散点图虽然能直观地展现变量之间的统计关系.但不精确。

(二)计算相关系数

相关系数的特点:

相关系数以数值的方式精确地反映了两个变量间线性相关的强弱程度。

(1)首先.计算样本相关系数r

利用样本数据计算样本相关系数。样本相关系数反映了两变量间线性相关程度的强弱。

相关系数r的取值在-1 ~+1之间.r>0表示两变量存在正的线性相关关系;r<0表示两变量存在负的线性相关关系;r=1表示两变量存在完全正相关关系;r=-1表示两变量存在完全负相关关系;r=0表示两变量不存在线性相关关系。| r | >0.8表示两变量之间具有较强的线性相关关系;| r | <0.3表示两变量之间的线性相关关系较弱。

(2)其次.对样本来自的两总体是否存在显著的线性关系进行推断。

①提出原假设.即两总体无显著线性关系.存在零相关。

②选择检验统计量。

③计算检验统计量的观测值和对应的概率值P-值

④决策

通过绘制散点图得知家庭收入与现住面积之间存在一定的正的弱相关关系.为更准确地

反映两者之间线性关系的强弱.采用计算相关系数的方法。

原假设H0:家庭收入与现住面积零相关

结论:由上表可知.家庭收入与现住面积之间的简单相关系数为0.292.说明两者之间存在正的弱相关性.其相关系数检验的概率P-值近似为0。因此.当显著性水平α为0.05或0.01时.应拒绝原假设。

附表:

以下是对促销人员进行培训前后的促销数据:

试分析该培训是否产生了显著效果。

原假设:培训后业务人员的促销数据没有明显的线性变化

成对样本相关系数

相关文档
最新文档