应用统计学上机

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

应用统计学上机
工商管理学院
《应用统计学》
实验作业
班级
学号
姓名
上课教师
2017年11月
实验二建立数据文件
1.建立一个数据文件记录试录入以下数据，并按要求进行变量定义。

数据：
学号姓
名
性
别
生日
身
高
（c
m）
体
重
（k
g）
英语
（总
分
100
分）
数学
（总
分
100
分）
生活
费
（$人
民币）
200 201 刘
一
迪
男1982.
01.12
156
.42
47.
54
75 79 345.0
200 202 许
兆
辉
男1982.
06.05
155
.73
37.
83
78 76 435.0
200 203 王
鸿
屿
男1982.
05.17
144
.6
38.
66
65 88 643.5
200江男1982.16141.79 82 235.5
204 飞08.31 .5 68 0
200 205 袁
翼
鹏
男1982.
09.17
161
.3
43.
36
82 77 867.0
200 206 段
燕
女1982.
12.21
158 47.
35
81 74
200 207 安
剑
萍
女1982.
10.18
161
.5
47.
44
77 69 1233.
00
200 208 赵
冬
莉
女1982.
07.06
162
.76
47.
87
67 73 767.8
200 209 叶
敏
女1982.
06.01
164
.3
33.
85
64 77 553.9
200 210 毛
云
华
女1982.
09.12
144 33.
84
70 80 343.0
200 211 孙
世
伟
男1981.
10.13
157
.9
49.
23
84 85 453.8
200 212 杨
维
男1981.
12.6
176
.1
54.
54
85 80 843.0
清
200 213 欧
阳
飞
男1981.
11.21
168
.5
50.
67
79 79 657.4
200 214 贺
以
礼
男1981.
09.28
164
.5
44.
56
75 80 1863.
90
200 215 张
放
男1981.
12.08
153 58.
87
76 69 462.2
200 216 陆
晓
蓝
女1981.
10.07
164
.7
44.
14
80 83 476.8
200 217 吴
挽
君
女1981.
09.09
160
.5
53.
34
79 82
200 218 李
利
女1981.
09.14
147 36.
46
75 97 452.8
200 219 韩
琴
女1981.
10.15
153
.2
30.
17
90 75 244.7
200 220 黄
捷
蕾
女1981.
12.02
157
.9
40.
45
71 80 253.0
要求：将录入结果截图粘贴在作业题目答案处（变量视图和数据视图）。

（1）变量名同表格名，以“（）”内的内容作为变量标签。

对性别（Sex）设值标签“男=0；女=1”。

（2）正确设定变量类型。

其中学号设为数值型；日期型统一用“mm/dd/yyyy“型号；生活费用货币型。

（3）变量值宽统一为10，身高与体重、生活费的小数位2，其余为0。

答案：1准备工作。

打开SPAA
2选择变量视图，依次录入学号，姓名，性别等。

2.对大学生创业问题设计一份调查问卷。

要求格式正确，题目类型包括开放题、封闭题（单选、多选都有）、半封闭题三种类型，题目个数10-15个。

答案：
3.用第2题得到的调查问卷进行模拟调查（10份），并将得到的结果录入到SPSS中，（1）将录入结果保存为xxx.sav文件，并将录入结果截图粘贴在作业题目答案处（变量视图和数据视图）。

答案：
实验三数据的整理
1. 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异，从该地区的两个村庄各选5块田地，分别种植两个品种小麦，使用相同的田间管理，收获后，测得各个地块生产的小麦的千粒重（g）数据资料如表3-1所示。

表3-1 某地区小麦种植
甲村乙村
id 中麦
9号豫展
1号
id 中麦
9号
豫展1
号
1 2 3 4 5 43.11
42.15
37.59
38.23
40.19
48.91
45.63
41.59
44.23
37.43
6
7
8
9
10
43.87
36.71
43.59
40.83
42.51
44.75
45.67
43.15
46.71
39.55
要求：分别按照“小麦品种”和“村”对小麦的千粒重（g）进行分类汇总，试定义有关变量，并建立数据文件，完成分类汇总工作。

步骤：1.准备工作。

打开3-1文件，通过文件--打开，将文件放入打开窗口。

2.选择数据---分类汇总。

3.打开分类汇总窗口，将小麦品种放入分组变量对话框中，将千粒重放入变量摘要对话框
中。

4.选择函数选项，在函数对话框中选择均值选项
5.选择继续--确定，得出结果。

以此方式得出村对小麦千粒重的分类汇总。

2.某地20家企业的情况如表3-2所示。

表3-2 企业年产值与年工资总额
编号部门所有制类型年产值（万元）职工人数（人）年工资总额（万元）
1 2 3 4 5 6 7 8 9
10
11
12
13
14
15
16
17
18
19
20
工业
交通
商业
交通
工业
工业
邮电通讯
商业
交通
工业
工业
交通
工业
工业
商业
邮电通讯
工业
工业
商业
交通
国有
国有
集体
个体
集体
国有
国有
个体
个体
国有
集体
个体
国有
集体
股份制
国有
国有
股份制
国有
国有
2805.58
1265.40
256.50
26.88
560.00
800.50
2580.98
125.45
590.60
950.00
1556.00
950.00
335.00
2455.08
1780.58
2500.00
775.00
3305.00
498.08
965.58
1235
605
105
20
223
568
890
65
148
325
485
354
105
680
646
485
354
1015
202
246
812.63
435.60
68.58
14.00
156.07
256.74
854.40
65.16
130.24
268.13
394.20
257.90
82.43
639.20
471.25
486.98
272.58
912.00
139.20
159.95
要求：根据上述资料建立数据文件，并完成下列统计整理工作，并回答有关问题：
（1）调用排序命令对企业按部门、年产值的主次顺序进行排序。

步骤：1准备工作。

打开3-2文件，通过文件--打开，将文件放入文件打开窗口。

2.选择数据--排序个案。

3.打开排序个案对话框，将部门和年产值放
入排序依据对话框中。

4.在排列顺序中选择降序。

5.选择确定按钮，得出结果。

（2）调用分类汇总命令分别按部门和所有制类型对年产值等指标进行分类汇总，并统计单位个数，分别以“将汇总变量添加到活动数据集”和“创建只包含汇总变量的新数据集”保存结果。

答案：1.选择数据--分类汇总。

2.在分类汇总对话框中，将部门放入分组变量中，将年产值放入变量摘要中。

3.在保存对话框中，选择将汇总变量添加到活动数据集选项。

4.选择确定，得出结果。

1.选择数据--分类汇总。

2.在分类汇总对话框，将所有制形式放入分组变量对话框中，将年产值放入变量摘要对话框中。

3.在函数选项中，选择均值均值选项。

4.在保存对话框中，选择创建只包含汇总变量的新数据，将名称命名为所有制形式。

5.选择确定选项，得出结果。

3. 根据习题2的数据文件进行“选择个案”实验练习，并回答下列问题：
（1）选择随机抽样方法，抽取约30%的个案作为样本，将此执行两次，所得到的样本是否相同?
步骤：1.选择数据--排序个案
2.打开排序个案对话框，选择随机个案样
本，在样本尺寸中选择大约，填入
30.
3.选择继续--确定，得出结果。

4.重复此方式，得出结果。

分析：得出结果不同。

（2）选择满足职工人数300人以上的个案；
步骤：1选择数据--选择个案
2.在选择个案对话框中，选择如果条件满足
选项。

3.在选择个案对话框中，输入职工人数
（人） >300
4.选择继续--确定，得出结果。

（3）选择观测值在5至15之间的样本。

答案：1.选择数据--选择个案-选择基于时间或个案全距。

2.在选择个案范围对话框中，将观测值设置为5 15.
3.选择继续--确定，得出结果。

实验四描述性统计分析和统计报告概述
1. 根据数据4-1.sav，对某高班学生的体重做描述性分析，并对结果做简单的分析。

步骤：1准备工作。

打开4-1文件，通过文件--打开将文件放入打开窗口。

2.选择分析--描述统计--描述。

3.在描述分析的对话框中，将体重放入变量对话框中。

4.选择统计量选项，勾选标准差，方差，均值等。

5.点击确定，得出结果。

2.根据数据4-2.sav，分析不同性别演员获得奥斯卡的年龄差异性。

步骤：1准备工作。

打开4-2文件，通过文件--打开将文件放入打开窗口。

选择分析--描述统计---描述。

3.在打开描述对话框中，将男演员和女演
员的年龄选入变量对话框。

4.选择选项，在选项对话框中，选择均值，
偏值等。

5.选择确定，得出结果。

分析：男演员获得奥斯卡奖的最小年龄为31岁，最大为76岁，女演员获得奥斯卡奖最小年龄为21岁，最大年龄沃日80岁，男演员获得奥斯卡奖的平均年龄大于女演员，且男演员获得奥斯卡的年龄差要小于女演员。

3. 根据数据4-3.sav，进行下列统计和分析。

（1）对机械厂各部门职工人数进行频数分析，并绘制饼图；
步骤：1准备工作。

打开文件4-3通过文件--打开将文件放入打开窗口。

2.选择分析--描述统计--频率。

3.在频率对话框中将车间部门放入变量对话框中。

4.选择统计量对话框，选择均值，偏值等选项。

5.在图表选项中，选择饼图。

6.选择确定，得出结果。

统计量
车间部门
N 有效429
缺失0
均值 2.78
中值 2.00
标准差 2.186
偏度.787
偏度的标准误.118
百分位数25 1.00
50 2.00
75 4.00
分析:从图中所知，在机器加工产的工人所
占比例最多，在汽车队的工人最少。

（2）先将职工月平均工资按[200，300]，[301，400]，[401，500]，[501，550]分为四等，再运用频数分析方法对各工资等级中职工总人数统计。

步骤：1选择数据--选择个案。

2.在选择个案对话框中，选择如果，在弹出选择个案的对话框中，打入wage >= 200& wage <= 300
3.选择确定。

4.选择分析---描述统计--频率，将wage >= 200& wage <= 300放入变量对话框中。

5.选择确定，得出结果。

6.依次方式得出。

wage >= 200 & wage <= 300 (FILTER)
频率百分比有效百分比累积百分比
有效Selected 148 100.0 100.0 100.0
wage >= 301 & wage <= 400 (FILTER)
频率百分比有效百分比累积百分比
有效Selected 172 100.0 100.0 100.0
wage >= 401 & wage <= 500 (FILTER)
频率百分比有效百分比累积百分比
有效Selected 94 100.0 100.0 100.0
wage >= 501 & wage <= 550 (FILTER)
频率百分比有效百分比累积百分比
有效Selected 13 100.0 100.0 100.0
4.某研究者对某化工厂工人的工龄、性别、年龄和月工资情况进行了调查，见数据4-4.sav，试以被调查工人的工龄和性别为分组变量，对工人的月工资情况进行观测量概述。

步骤：1.分析--报告---个案汇总
2.在个案汇总的对话框中，将工龄和性别放入分组变量对话框中，将月工资放入变量对话
框中。

3.在统计量中选择均值作为单元格统计量。

4.选择选项对话框，将选项标题设置为分类汇总。

案例处理摘要
案例
已包含已排除总计
N 百分比N 百分比N 百分比
106 100.0% 0 .0% 106 100.0%
月工资 * 工龄 * 性
别
个案汇总
月工资
工龄性别N 均值
1 男23 773.57
女53 763.62
总计76 766.63
2 男 6 958.33
女24 891.67
总计30 905.00
总计男29 811.79
女77 803.53
总计106 805.79
实验五单一样本t检验
1.某品牌洗衣粉生产过程中的设计重量为500克，低于这一重量被认为是不合格产品。

随机抽取了10袋洗衣粉，经过测量的洗衣粉重量
数据。

假定总体服从正态分布，显著性水平为0.05，检验该样本结果能否表示该生产过程运作正常？(基本数据见5-1.sav，洗衣粉重量) 步骤：1.准备工作。

打开文件5-1，通过文件---打开将文件放入打开窗口。

2.分析---比较均值---单样本T检验
3.在检验对话框中，将重量放入检验对话框中。

4.将检验值设置为
500.
5.选择选项按钮，将置信区间设置为95.
6.选择确定，得出结果。

单个样本统计量
N 均值标准差均值的标准误
重量10 500.70 6.183 1.955
单个样本检验
检验值 = 500
t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限
重量.358 9 .729 .700 -3.72 5.12
分析：洗衣粉的平均重量为500.7克，标准差为6.183，所得t值为0.358，样本均值和检验值差为0.729>0.05,则不能拒绝原假设，不存在显著差异。

,
2．我国2011年城镇单位就业人员年平均工资为41047.1元，浙江省11座城市城镇单位就业人员年平均工资如数据4-3.sav所示，假定总体服从正态分布，显著性水平为0.05，检验浙江城镇单位就业人员年平均工资和全国年平均工资水平是否有显著性差异(基本数据见5-2.sav )。

步骤：1准备工作。

打开5-1文件，通过文件--打开将文件放入打开窗口。

2.选择分析---比较均值--单样本T检验。

3.打开单样本T检验，将平均工资放入检验变量对话框中，在选项中将置信区间设置为95.
4.将检验值设置为41047.1
5.选择继续---确定，得出答案。

单个样本统计量
N 均值标准差均值的标准误
平均工资11 46137.73 5169.869 1558.774
单个样本检验
检验值 = 0
t df Sig.(双侧) 均值差值差分的 95% 置信区间
下限上限
平均工资29.599 10 .000 46137.727 42664.56 49610.89
分析：浙江省内城镇平均工资为46137.73，得t值为29.599，样本均值和检验值的差为
0.00<0.05,则拒绝原假设，存在明显差异。

3.某班学生的高考数学成绩见数据5-3.sav，试对其做独立样本T检验，以研究该班学生不通性别学生之间成绩有误明显差别。

步骤：1准备工作。

打开文件5-3，通过文件-打开将文件放入打开窗口。

2.选择分析--比较均值--独立样本T检验。

3.在打开独立样本T检验对画框中，将高考数学成绩放入检验变量对话框中，将性别放入分组变量对话框中，选择定义组，将性别定义成 1
2.
4.选择确定按钮。

5.在选项中，选择均值，标准差等等。

组统计量
性别N 均值标准差均值的标准误
高考数学成绩男16 126.88 11.454 2.863
女16 119.88 9.018 2.254
分析：高考数学成绩，男生平均分为126.88，女生为119.88，得出t值为1.921，所对应的p 值为0.064,>0.05,则不能拒绝原假设，男女高考数学成绩不存在显著差异。

在假设方差不存在的情况下，所得p值为0.065>0.05,不能拒绝原假设，男女高考数学成绩不存在显著差异。

4为研究一种减肥药品的效果，将抽取了20名试验者进行试验，服用该产品一个疗程前后的体重，试用配对样本t检验的方法判断该药物能否引起实验者体重的明显变化。

数据见5-4.sav。

步骤：1准备工作。

打开文件5-3，通过文
件-打开将文件放入打开窗口。

2.选择分析--比较均值--配对样本T检验。

3.在配对样本对话框中，将服药前后的体重分别放入对话框中。

4.选择确定，得出结果。

成对样本统计量
均值N 标准差均值的标准误
对 1 服药前体重74.540 20 9.2440 2.0670
服药后体重74.000 20 6.9309 1.5498
分析：服药前的平均体重为74.54，服药后的体重为74，相对应的样本均值和检测值的差为0.00<0.05,则拒绝原假设，存在明显差异。

实验六统计抽样与参数估计
1. 背景资料：有几位大学生组成的调查组，为了解他们所在地区居民的收入情况，作为匡算某种商品需求量的依据之一，从该地区230万居民中随机抽取了500人进行调查，取得有关收入数据如表6-1所示。

表6-1 样本数据
单位：万元
3.1 2 1.8 8 2.1 3 2.1 1 3.2
4.0
2.6
1.3
5
1.8
2.9
2.1
5
2.6
1.8
1.9
1.8
2.6
7
2.8
8
1.9
5
1.4
9
2.4
2.8
9
2.4
2
2.9
1.5
4
1.1
6.2
2
3.5
8
4.3
3
2.8
7
1.6
3.6
2
2.1
1
2.5
7
2.8
4
2.1
4.0
4
2.9
2
2.1
3
2.6
1
3.5
5.2
1
4.2
3
2.1
6
3.4
4
2.9
6.1
2
4.3
8
3.2
2
3.6
8
3.8
3.2
5
3.3
3
2.3
3
3.2
4
2.6
4.2
4
2.5
4
2.3
2
2.2
2
3.4
3.55
4.80
2.67
4.21
3.67
4.30
5.90
5.69
2.76
1 0.9 0 1.6 7 2.4 5 3.5 0 2.8 7 1.6 6 1.8 9 2.5 0 3.
2 6 2.
3 6 1.7 6 0.6 8 0.8 8 0.7 5 2.
4 4 2.
5 0 3.2 0 1.
6 0 1.3 0 2.1 0 2.1 5 2.80
2.2
2.3
1.5
1.1
0.9
1.5
2.6
2.3
2.4
1.1
5
0.7
2.7
1.3
1.2
1.5
2.6
2.5
2.5
1.1
5
2.1
3
2.5
1.9
0.9
5
0.7
5
1.4
8
1.6
2.5
2.3
2.6
2.5
5
2.4
5
1.6
5
1.8
2.6
6
2.3
5
2.4
4
1.8
8
3.2
5
3.8
5
1.3
5
2.1
5
2.6
1.9
2.6
5
2.6
6
1.7
8
2.7
5
3.3
5
3.4
1.5
2.8
2.4
1.9
2.6
6
2.7
1.6
6
2.2
2
2.9
3.5
2.7
7
3.4
2
2.7
5
1.8
9
1.4
5
3.1
2
3.3
1
2.6
2.8
3.2
3.3
3
4.1
1
4.0
2.6
8
1.8
2.3
5
2.2
1.5
3.8
2.4
2.3
3.9
4.1
5.9
3.5
5
4.2
2
2.8
3
1.2
5
1.8
8
2.4
4
2.5
7
2.8
3
2.9
1
1.7
1
1.4
1
2.8
6
3.9
6
3.1
1
4.0
5
2.6
6
2.1
1.6
6
2.3
1
2.9
7
2.9
5
1.1
2.2
2
1.2
2
3.1
3
3.4
1
2.5
2
2.4
2.8
2.6
9
2.1
5
1.7
6
1.5
5
2.9
9
3.5
6
3.2
2
3.1
1.5
6
2.0
1
3.0
4
2.2
2.8
7
3.4
4
2.1
1
2.5
4
3.4
4
2.1
3.6
5
3.2
1
2.8
3
3.1
6
1.9
2
2.9
3
3.8
2
3.5
1
2.8
7
2.4
9
1.6
6
2.6
3.0
3
2.5
9
2.3
3
1.0
9
0.6
8
1.2
2
0.6
9
3.2
6
3.2
1
3.8
8
2.5
6
4.3
9
3.6
5
3.9
4
3.7
1
2.1
7
3.7
7
2.4
6
2.7
6
3.5
7
3.4
7
3.7
1
3.0
4
2.7
4
2.3
4
3.2
3
1.6
9
2.1
8
2.4
6
3.3
3
3.8
7
3.2
5
3.1
7
3.2
2
3.4
1
2.7
7
2.0
9
3.0
7
1.4
5
3.2
2
1.5
4
3.4
1
3.7
6
2.4
5
2.9
7
2.9
3
2.5
6
2.1
2
3.4
2
3.6
1
3.1
4
3.1
5
3.2
3
3.2
2
2.4
4
2.7
2
2.7
9
3.0
9
1.8
8
3.4
4
3.0
7
3.5
4
2.8
2.5
8
3.9
3.4
3.2
1
2.4
2
2.8
5
3.5
9
3.2
1
2.7
7
2.3
8
2.8
6
2.4
7
3.2
1
3.2
4
3.4
4
3.6
6
2.1
1
2.0
9
5.3
1
2.6
5
3.5
1
3.8
3.4
2.6
1.9
2.5
7
3.1
2
3.3
3
2.7
6
2.5
8
2.6
5
1.5
7
4.4
4
3.8
9
3.7
6
4.2
1
5.7
2.84
2.38
3.78
3.65
3.90
4.85
5.12
5.09
3.44
3.12
3.32
3.99
4.78
4.32
4.12
4.44
4.00
5.12
5.35
3.66
3.19
3.76
3.66
3.34
4.09
5.80
3.61
3.06
3.44
要求：
（1）利用SPSS 统计软件，在95%概率保证下，估计该地区全部居民人均收入置信区间。

步骤：1准备工作。

2，分析---描述统计--探索。

3，打开探索对话框，将收入放入因变量对话框中。

0 2.50 3.10 0.60 1.10 2.10 2.61 1.46 0.92 4.20 3.65 1.32 3.39 0 1.40 0.75 0.85 1.70 1.60 2.40 2.10 3.10 2.69 3.34 3.88 2.66 6 2.49 4.10 2.58 1.98 1.25 3.12 2.11 3.00 4.32 5.80 1.55 2.18 3 2.69 1.58 2.58 1.86 2.85 3.55 3.19 3.78 3.77 2.99 2.08 3.03 8 2.31 0.84 1.60 0.90 3.88 3.21 2.86 2.30 3.10 2.90 3.40 4.18 4 2.87 1.66 3.44 3.16 2.77 2.37 2.14 2.09 5.20 3.21 3.66 2.95
2 2.16 2.88 2.09 3.07 2.17 3.04 2.09 1.08 2.74 3.6
3 3.45
4 2.68 2.10 3.81 3.26 4.3
5 5.11 3.99 2.18 2.69 2.25 3.37 2 3.09 2.99 2.79 2.48 3.24 1.7
6 3.21 2.45 3.45 1.54 1.2
7 0 3.10 3.40 3.54 1.67 0.96 4.11 4.21 3.56 3.1
8 3.11 2.81 4 2.12 2.76 2.88 2.45 3.45 3.17 2.51 2.78 2.33 4.12 3.43 2 3.8
9 3.90 3.56 3.11 3.28 1.80 3.54 3.21 3.51 2.02 4.09
5.选择统计量，把置信区间设置为95
6.选择绘制，在绘制对话框中选择箱图和直方图。

选择确定，得出结果。

案例处理摘要
案例
有效缺失合计
N 百分比N 百分比N 百分比
收入500 100.0% 0 .0% 500 100.0%
描述
统计量标准误
收入均值 2.8115 .04428
均值的 95% 置信区间下限 2.7245
上限 2.8985
5% 修整均值 2.7862
中值 2.7950
方差.980
标准差.99011
极小值.60
极大值 6.22
范围 5.62
四分位距 1.27
偏度.374 .109
峰度.651 .218
分析：从表中可以看出，居民人均收入为 2.8115，所在的置信区间为2.7245--2.8985，所对应的方差为0.98.，居民人均收入差异大。

（2）如果估计的误差不超过1.2万元，在
同样的置信度下应该抽取多少人进行调查。

P=0.95 1-p=0.05 n=1.96*1.96*0.95*0.05/(0.05*0.05)=
2.背景资料：近期有多家超市接到顾客投诉，反映国内某品牌直饮净水器的使用寿命太短。

国家规定该规格直饮净水器的平均使用寿命
不低于1200升。

为了检验该产品的质量，超市
随机抽取100件该品牌直饮净水器进行使用寿
命的测试，测得结果如表6-2所示。

表6-2 样本数据
单位：升
1112 1131 1132 1220 1086 1141 1266 1259 1220 1220 1187 1275 1250 1210 1249 1244 1244 1236 1210 1209 1210 1240 1245 1230 1265 1217 1269 1210 1280 1204
803 1270 1300 1319 1256 1215 1156 1201 1250 1237 1196 1220 1240 1183 1202 1182 1170 1284 1249 1206 1197 1229 1249 1297 1260 1170 1182 1189 1180 1216 1131 1094 1139 1078 1156 1199 1160 1109 1137 1219 1191 1195 1198 1195 1199 1140 1147 1210 1220 1209 1170 1172 1253 1181 1192 1231 1190 1198 1204 1201
990 1106 1116 1230 1225 1160 1193 1200 1209 1194
要求：
（1）利用SPSS统计软件，对该直饮净水器的平均使用寿命（出水量）进行区间估计，要求推断的把握程度为95%。

（2）结合直方图或正态分布图及箱线图对顾客提出的意见加以分析说明。

步骤：1.准备工作打开文件6-2，通过文件--打开将文件放入文件窗口。

2.选择分析-描述统计-探索。

2.打开探索对话框，将使用，寿命放入因变量框中。

3.择统计量，在描述性选项下将置信区间设置为95.
4.选择绘制，在绘制对话框中选择箱图和直
方图。

5.选择确定，得出结果。

3. 某高校有100老师，随机抽取20名进行教学情况调查，试用SPSS随机化过程实现抽样。

取样规定：取随机数字较大的20名老师。

步骤：1准备工作。

3.选择转换--随机数字生成器。

4.在随机数字生成器中选择设置活动生成器--设置起点--将固定值设置为今天日期。

5.选择转换--计算变量
6.在计算变量对话框中，打入随机数，在数字表达式中选择URRNIFORM(0,1).选择确定，产生随机数。

7.将随机数进行个案排秩，将随机数放入变量框中。

8.选择确定，产生R随机数
9.对R随机数进行排序个案--做降序处理。

实验七相关与回归分析
1.一家汽车销售商的经理认为，汽车的销量与投入的广告费用有着密切的关系。

为研究他们之间的关系，这位经理搜集了过去10年的数据，见表7-1。

表7-1 2001～2010年汽车销量与广告费用资料
年份序号汽车销售量（辆）广告费用（万元）
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
1
2
3
4
5
6
7
8
9
10
1100
1250
1280
1360
1480
1500
1720
1800
1890
2100
385
420
406
490
525
602
651
735
721
840
要求：
（1）你认为汽车销量与广告费相关吗？
步骤：1准备工作。

2.选择图形---图表创建程序
3.选择散点图，将散点图放入作图框中，将
汽车销量放在Y轴，将广告费用放在X轴。

4.选择确定，得出结果。

分析：从图所知，汽车销量和广告费用呈现
一定的正相关关系，广告费用投入越多，汽
车销量越好。

（2）根据散点图判断，你认为汽车销量与广告费是数目关系？
步骤：1选择分析---相关--双变量
2打开双变量对话框后，将汽车销售量和广
告费放入变量对话框中。

4.选择选项，勾选均值和标准差。

5.选择确定，得出结果。

描述性统计量
均值标准差N
汽车销售量（辆）1548.00 319.437 10
广告费用（万元）577.50 157.054 10
相关性
汽车销售量（辆）广告费用（万元）
汽车销售量（辆）Pearson 相关性 1 .984**
显著性（双侧）.000
N 10 10
广告费用（万元）Pearson 相关性.984** 1
显著性（双侧）.000
N 10 10
**. 在 .01 水平（双侧）上显著相关。

分析：描述性输出。

所选样本变量为10个，汽车平均销售量为1548，标准差为
319.437，广告费用的投入平均值为577.5，想对应的标准差为157.054。