《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计分析与SPSS的应用(第五版)》(薛薇)
课后练习答案
第4章SPSS基本统计分析
1、利用第 2 章第7 题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。
分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。
Statistics
户口所在职业年龄
地
N Valid 282 282 282
Missing 0 0 0
户口所在地
Frequency Percent Valid Cumulative
Percent Percent
中心城市200 70.9 70.9 70.9
Valid 边远郊区82 29.1 29.1 100.0 Total 282 100.0 100.0
职业
Frequency Percent Valid Cumulative
Percent Percent 国家机关24 8.5 8.5 8.5
商业服务业54 19.1 19.1 27.7
文教卫生18 6.4 6.4 34.0
公交建筑业15 5.3 5.3 39.4 Valid 经营性公司18 6.4 6.4 45.7 学校15 5.3 5.3 51.1
一般农户35 12.4 12.4 63.5
种粮棉专业
户
4 1.4 1.4 64.9
种果菜专业
10 3.5 3.5 68.4
户
工商运专业
34 12.1 12.1 80.5
户
退役人员17 6.0 6.0 86.5
金融机构35 12.4 12.4 98.9
现役军人 3 1.1 1.1 100.0
Total 282 100.0 100.0
年龄
Frequency Percent Valid Cumulative
Percent Percent
20 岁以下 4 1.4 1.4 1.4
20~35 岁146 51.8 51.8 53.2 Valid 35~50 岁91 32.3 32.3 85.5
50 岁以上41 14.5 14.5 100.0
Total 282 100.0 100.0
分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一
般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分
布表中的百分比相同。
2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款
金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行
对比分析。
分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最
大值、范围、偏度、峰度、按变量列表,点击继续——确定。
分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.9,峰度系数为33.656,偏度系数为 5.234。与标准正态分布曲线进行对比,由峰度
系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,
此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。
分析:由表中可以看出,中心城市有200人,边远郊区为82人。两部分样本存取款金额均
呈右偏尖峰分布,且边远郊区更明显。
3、利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,
找到存款金额“与众不同”的样本,并说明理由。
分析——描述统计——描述,选择存款金额到变量中。对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝
对值大于3的都是“与众不同”的样本。
理由:标准化值反映的是样本值与样本均值的差是几个标准差单位。如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果
标准化值小于0,则表示该样本值小于样本均值。如果标准化值的绝对值大于3,则可认为是异常值。
4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。
分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式
条形图”。点击单元格——选择观测值、期望、行、列、合计。点击统计量——选择卡方。点击继续。确定
利用列联分析实现。首先编制列联表,然后进行卡方检验。以户口和收入的列联分析为例:
表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。若显著性水平设为0.05,由于0.001<0.05,拒绝原假设,表明户口地与收入水平不独立。
5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的。利用多选项分析被调查者本次存
款的最主要目的是什么。
答:第2章第7题资料的多选项问题是按照分类法拆分的。目的是为了把多选项问题的分析转化为对多个
问题的分析,即对多个SPSS变量的分析。
多选项分类法;
存款的最主要目的是正常生活零用
6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,
对600户家庭进行了调查并进行了列联分析,如下表:
1)补充表中第一行和第四行空缺的计算结果。