SPSS期末大作业-完整版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1题:基本统计分析1
分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。
1、基本思路:
(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。
(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。
操作步骤:
(1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。
存取款金额1
频率百分比有效百分比累积百分比
有效1.00 82 34.6 34.6 34.6
2.00 76 32.1 32.1 66.7
3.00 10
4.2 4.2 70.9
4.00 22 9.3 9.3 80.2
5.00 47 19.8 19.8 100.0 合计237 100.0 100.0
(2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。
(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。
统计量
存(取)款金额
20岁以下N
有效
1 缺失0
百分位数25 50.00 50 50.00 75 50.00
20~35岁
N
有效131
缺失0 百分位数
25 500.00
50 1000.00
75 5000.00
35~50岁
N
有效73
缺失0 百分位数
25 500.00
50 1000.00
75 4500.00
50岁以上
N
有效32
缺失0 百分位数
25 525.00
50 1000.00
75 2000.00
结果及结果描述:
频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。
统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)
元,年龄在20~35岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在35~50岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。可见,20~35,35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。
2、基本思路:
本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。
操作步骤:
(1)【分析→描述统计→交叉表】,选择“户口”到【行】框中,选择“物价趋势”
到【列】框中;并选中【显示复式条形图】
(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】
各框→继续;
(3)单击【统计量】,选中【卡方】框→继续;
结果及其结果分析:
户口* 物价趋势交叉制表
物价趋势合计
上升稳定下降
户口
城镇户口
计数21 131 18 170
期望的计数20.1 122.7 27.3 170.0
户口中的 % 12.4% 77.1% 10.6% 100.0%
物价趋势中的 % 75.0% 76.6% 47.4% 71.7%
总数的 % 8.9% 55.3% 7.6% 71.7% 农村户口
计数7 40 20 67
期望的计数7.9 48.3 10.7 67.0
户口中的 % 10.4% 59.7% 29.9% 100.0%
物价趋势中的 % 25.0% 23.4% 52.6% 28.3%
总数的 % 3.0% 16.9% 8.4% 28.3% 合计
计数28 171 38 237
期望的计数28.0 171.0 38.0 237.0
户口中的 % 11.8% 72.2% 16.0% 100.0%
物价趋势中的 % 100.0% 100.0% 100.0% 100.0%
总数的 % 11.8% 72.2% 16.0% 100.0%
卡方检验
上面交叉列联表表明,
I 共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,
28.3%;认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的11.8%,72.2%,16.0%。
II 对不同户口的人群进行分析:城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;
III 对物价趋势不同态度的人群分析:认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低于总比例;
总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。
从所得卡方检验结果来看,概率p值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。
3 、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏度。
3、基本思路
本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一
次存款金额的均值、中位数、方差和偏度。