张小山《社会统计学与SPSS应用》课后答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 随机现象与基础概率
练习题:
1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率:
(1) 三张K ; (2) 三张黑桃;
(3) 一张黑桃、一张梅花和一张方块; (4) 至少有两张花色相同; (5) 至少一个K 。
解:(1)三张K 。
设:1A =“第一张为K ” 2A =“第二张为K ” 3A =“第三张为K ”
则()()()()123121312//P A A A P A P A A P A A A ==432525150⨯⨯=
1
5525
若题目改为有回置地抽取三张,则答案为
()123P A A A =
444525252⨯⨯
1
2197
=
(2)三张黑桃。
设:1A =“第一张为黑桃” 2A =“第二张为黑桃” 3A =“第三张为黑桃”
则()()()()123121312//P A A A P A P A A P A A A ==
131211525150⨯⨯=
11
850
(3)一张黑桃、一张梅花和一张方块。
设:1A =“第一张为黑桃”
2A =“第二张为梅花” 3A =“第三张为方块”
则 ()()()()123121312//P A A A P A P A A P A A A ==
131313
525150
⨯⨯=0.017 注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102
(4)至少有两张花色相同。
设:1A =“第一张为任意花色”
2A =“第二张的花色与第一张不同”
3A =“第三张的花色与第一、二张不同”
则()1P A =
5252=1 ()21/P A A =5213521--=39
51 312(/)P A A A =5226522--=26
50
()
123P A A A =1-123()P A A A =3926115150⎛⎫
-⨯⨯ ⎪⎝⎭
=0.602
(5)至少一个K 。
设:1A =第一张不为K
2A =第二张不为K 3A =第三张不为K
则()1P A =
52452- ()21/P A A =51452- 312(/)P A A A =504
52
- ()
123P A A A =1-123()P A A A =4847461525150⎛⎫
-⨯⨯ ⎪⎝⎭
=0.217
2.某地区3/10的婚姻以离婚而告终。
问下面两种情况的概率各是多少: (1)某对新婚夫妇白头偕老,永不离异; (2)两对在集体婚礼上结婚的夫妻最终都离婚了。
解:(1)某对新婚夫妇白头偕老,永不离异。
()1()P A P A =-=3
110
-
=0.7 (2)两对在集体婚礼上结婚的夫妻最终都离婚了。
()()()P AB P A P B ==
33
1010
⨯=0.09
3.某班级有45%的学生喜欢打羽毛球,80%学生喜欢打乒乓球;两种运动都喜欢的学生有30%。
现从该班随机抽取一名学生,求以下事件的概率: (1)只喜欢打羽毛球; (2)至少喜欢以上一种运动; (3)只喜欢以上一种运动; (4)以上两种运动都不喜欢。
解: 设:A =“喜欢打羽毛球” B =“喜欢打乒乓球”
()0.45P A = ()0.8P B = ()0.3P AB =
(1)只喜欢打羽毛球:
()()0.450.30.15P A P AB -=-=
(2)至少喜欢以上一种运动:
()P A B +=()()()P A P B P AB +-=0.450.80.3+-=0.95 (3)只喜欢以上一种运动:
()()()P A B P AB P AB +--=0.450.80.30.3+--0.65= (4)以上两种运动都不喜欢:
()P A B +=1()P A B -+=1(0.450.80.3)-+-0.05=
4.拥有40%命中率的篮球手投球5次,他获得如下结果的概率是多少: (1)恰好两次命中。
(2)少于两次命中
解: 设:
(0)0.6
(1)0.4
P X q P X p ======
(1)恰好两次命中。
22525C p q -=2
50.40.40.60.60.6C ⨯⨯⨯⨯⨯0.346=
(2)少于两次命中
11515C p q -00505C p q -+=
150.40.60.60.60.6C 0.60.60.60.60.6⨯⨯⨯⨯⨯+⨯⨯⨯⨯0.337=
5. 求在某一天相遇的前5个人中,至少有3个人是星期一出生的概率。
解:设:
6
(0)71
(1)7P X q P X p ===
===
335344545555555C p q C p q C p q ---++
3455551116611116111110.023777777777777777
C C C =⨯⨯⨯⨯⨯+⨯⨯⨯⨯⨯+⨯⨯⨯⨯⨯=
6. 投掷5颗骰子,恰好获得4个面相同的概率是多少?
解:设:
1
(0)65
(1)6P X q P X p ======
445456C p q -⨯=
4511115
666666
C ⨯⨯⨯⨯⨯⨯=0.019 第四章 数据的组织与展示
练习题:
1.有240个贫困家庭接受调查,被问及对政府的廉租房政策是否满意,有180个家庭
表示不满意,40个家庭表示满意,20个家庭不置可否,请计算表示满意的家庭占被
调查家庭的比例和百分比?
解:比例:
40
0.1667240
=
百分比:
0.1667×100%=16.67%
2.某中学初三数学教研室在课程改革后对初三(一)班的数学成绩做了分析,45名学生的成绩由好到差分为A 、B 、C 与D 四种,统计结果如下表所示:
(1)上表的数据属于什么类型的数据?
(2)请用SPSS 绘制上表的频数分布表,然后再绘制一个饼形图或条形图。
解:(1)定序数据; (2)频数分布表:
成绩 频数
A 15
B 17
C 11 D
2
饼形图:
A A
B
C B C A C
D B B B B A A A C A A C B B C C A A A A C A C A C A B B B
B
B
B
C
B
B
D
B
条形图:
3.某镇福利院有老人50名,截止2009年9月,其存款数目如下表所示:
18000 3100 6200 5100 920 6000 2500 4850 2450 8500 9300 6000 3100 4600 3500 2950 4500 1200 3400 1400 1900 2800 5700 2900 4000 650 3150 2200 6100 3500 4100 800 850 6100 650 270 4100 4700 300 6050 10850 980 550 4250 8000 12100 8400 1650 400 2150
(1)根据上表的数据将上面数据分为4组,组距为5000元。
(2)根据分组绘制频数分布表,并且计算出累积频数和累积百分比。
解:
(1)组距为5000元,分成的4组分别为0-5000元、5001-10000元、10001-15000元和15001-20000元。
(2
存款数目分组频数百分比(%)累积频数累积百分比(%)
0-5000元35 70.0 35 70.0
5001-10000元12 24.0 47 94.0
10001-15000元 2 4.0 49 98.0
15001-20000元 1 2.0 50 100.0
总计50 100.0
4.根据武汉市初中生日常行为状况调查的数据(data9),绘制饼状图说明武汉市初中生中独生子女和非独生子女(a4)的分布状况。
解:《武汉市初中生日常行为状况调查问卷》:
A4 你是独生子女吗 1)是 2)不是
SPSS操作步骤的如下:
○1打开数据data9,点击Graphs→Pie,弹出一个窗口,如图4-1(练习)所示。
图4-1(练习) Pie Charts 对话框
○2点击Define按钮,出现如图4-2(练习)所示的对话框,将变量“是否独生子女(a4)”
放
在Define Slices by一栏中,选择N of cases选项。
图4-2(练习) Define Pie对话框
○3点击OK按钮,提交运行,可以得到独生子女和非独生子女分布状况的饼状图,如图4-3(练
习)所示。
不是
是
Missing
图4-3(练习)独生子女和非独生子女的频数分布图(饼图)
5.根据武汉市初中生日常行为状况调查的数据(data9),绘制武汉市初中生家庭总
体经济状况(a11)的累积频数图。
解:《武汉市初中生日常行为状况调查问卷》:
A11 你觉得你家庭的总体经济状况属于
1)非常困难 2)比较困难 3)一般 4)比较富裕 5)非常富裕
SPSS操作的步骤如下:
○1依次点击Graphs→Bar,弹出一个窗口,如图4-4(练习)所示。
图4-4(练习) Bar Charts 窗口
○2选择Simple,点击Define按钮,弹出一个如图4-5(练习)所示的对话框。
将变量“家庭
的总体经济状况(a11)”放在Category Axis 栏中,选择Cum N of cases 选项。
图4-5(练习) Define Simple Bar 对话框
○
3点击OK 按钮,提交运行,SPSS 输入如图4-6(练习)所示的结果。
你
觉得你家庭的总体经济状况属于
非常富裕
比较富裕
一般
比较困难
非常困难
Missing
C u m u l a t i v e F r e q u e n c y
600
500
400
300
200
100
图4-6(练习) 初中生家庭总体经济状况累积类频数分布图
6.根据武汉市初中生日常行为状况调查的数据(data9),将节假日初中生与父母聊
天的时间(c11)以半个小时为组距进行分组,并绘制新生成的分组的直方图。
解:《武汉市初中生日常行为状况调查问卷》
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)
节假日:
9)和父母聊天_______小时
SPSS的操作步骤如下:
○1依次点击Transform→Recode→Into Different Variables,弹出一个窗口,如图4-7(练习)所示。
将变量“节假日初中生与父母聊天的时间(c11b9)”放置在Numeiric Variable →Output栏中,分组之后生成的新变量命名为“c11b9fz”,标签Label命名为“节假日与父母聊天时间分组”。
图4-7(练习) Recode Into Same Variables对话框
○2单击Old and New values按钮出现如图4-8(练习)所示的对话框,进行分组区间的设置。
“0-0.5小时”是一组,“0.5-1”小时是一组,“1-1.5”小时是一组,“1.5-2”小时是一组,“2个小时以上”是一组。
图4-8(练习) Old and New values对话框
○3点击Continue按钮,返回到如图4-7(练习)所示的对话框。
点击OK按钮,完成新变量“节假日与父母聊天时间分组(c11b9fz)”的设置。
○4依次点击Analyze→Graphs→Histogram,出现如图4-9(练习)所示的对话框,将新生成的变量“节假日与父母聊天时间分组(c11b9fz)”放在Variable(s)栏中。
图4-9(练习) Histogram 对话框 ○
5点击OK 按钮,提交运行,输出如图4-10(练习)所示的结果。
图4-10(练习) 初中生节假日与父母聊天时间分组的直方图
节假日与父母聊天时间分组
5.0
4.0
3.0
2.0
1.0
300
200
100
Std. Dev = 1.31 Mea n = 2.0
N = 526.00
上表中,“1.0”指示的是“0-0.5小时”,“2.0”指示的是“0.50-1小时”,“3.0”指示的是“1-1.5小时”,“4.0”指示的是“1.5-2小时”,“5.0”指示的是“2个小时以上”。
从上表可以看到各个分组的频数及其相对应的百分比。
第五章 集中趋势与离散趋势
练习题:
1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为: (单位:千克)
12 10 15 8 2 6 14 12 10 12 10 10 11 10 5 10 16 (1)计算体重下降重量的中位数、众数和均值。
(2)计算体重下降重量的全距和四分位差。
(3)计算体重下降重量的方差和标准差。
解:
(1)○1中位数:
对上面的数据进行从小到大的排序:
M d 的位置=2
=9,数列中从左到右第9个是10,即M d =10。
○2众数:
绘制各个数的频数分布表:
“10”的频数是6,大于其他数据的频数,因此众数M O =“10” ○3均值:
18.1016
521
=+⋯++=
=
∑=n
n
x
X n
i i
(2)○1全距:R =max(x i )-min(x i )=16-2=14 ○2四分位差:
根据题意,首先求出Q 1和Q 3的位置: Q 1的位置=
41+n =4
1
17+=4.5,则Q 1=8+0.5×(10-8)=9 Q 3的位置=4)1(3+n =4
)
117(3+⨯=13.5,则Q 3=12+0.5×(12-12)=12
Q= Q 3- Q 1=12-9=3
(3)○1方差:
2
2
1
222
()
1
(210.18)(510.18)(1610.18) 171
=12.404
n
i
i x x S n =-=
--+--=-∑+?+
○2
标准差: 3.52S ==
2.下表是武汉市一家公司60名员工的省(市)籍的频数分布:
省(市)籍
频数(个)
湖北 28 河南 12 湖南 6 四川 6 浙江 5 安徽
3
(1)根据上表找出众值。
(2)根据上表计算出异众比率。
解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数M O =“湖北” (2)异众比率的计算公式为: mo
r n f V n
-=
( n 代表总频数,mo f 代表众数的频数) 其中n=60,mo f =28,则: 6028
0.5360
r V -==
3.某个高校男生体重的平均值为58千克,标准差为6千克,女生体重的平均值 为48千克,标准差为5千克。
请计算男生体重和女生体重的离散系数,比较男
生和女生的体重差异的程度。
解:计算离散系数的公式:
%100⨯=
X
S
CV 男生体重的离散系数:
%34.10%10058
6
=⨯=
CV 女生体重的离散系数:
%42.10%10048
5
=⨯=
CV 男生体重的离散系数为10.34%,女生体重的离散系数为10.42%,男生体重的差异程度比女生要稍微小一些。
4.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)
企业数 200——299 19 300——399 30 400——499 42 500——599 18 600——699 11 合计
120
(1)计算120家企业利润额的中位数和四分位差。
(2)计算120家企业利润额的均值和标准差。
解:
(1) ○1 中位数M d 的位置=
5.602
1
12021=+=+n ,M d 位于“400—499”组, L=399.5,U =499.5,cf (m-1)=49,f m =42,n =120,代入公式得
)(2)1(L U f cf n L M m m d --+=-=120
492399.5(499.5399.5)425.6942
-+⨯-=
职工收入的中位数为425.69元。
○2336.17)5.2995.399(301941205.299)(4111111=-⨯-+=--+=L U f cf n L Q 497.12)5.3995.499(42
49
412035.399)(43333333=--⨯+=--+=L U f cf n L Q 四分位差31497.12336.17160.95Q Q Q =-=-= (2)○1均值:
1
199.5299.5299.5399.5399.5499.5499.5599.5599.5699.5
1930421811
22222120
51140 =
120 =426.17
k
i i
i M
f
X n
=+++++⨯+⨯+⨯+⨯+⨯=
=
∑ ○
2标准差: 48
.116119
67
.1614666112011
)17.4265.649(18)17.4265.549(42)17.4265.449(30)17.4265.349(19)17.4265.249(1
)(222221
2==
-⨯-+⨯-+⨯-+⨯-+⨯-=
--=
∑=n f
x M
s n
i i
5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS 统计被调查的初中生平时一天做作业时间(c11)的众数、中位数和四分位差。
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”) 平时(非节假日): 1)做作业_______小时 SPSS 操作步骤如下:
○
1依次点击Analyze →Descriptive Statistics →frequencies ,打开如图5-1(练习)所示的对话框。
将变量“平时一天做作业时间(c11a1)”,放置在Variables 栏中。
图5-1(练习) Frequencies 对话框
○
2单击图5-1(练习)中Frequencies 对话框中下方的Statistics (统计量)按钮,打开如图5-2(练习)所示的对话框。
选择Quartiles (四分位数)选项,Median (中位数)选项和Mode (众数)选项。
点击Continue 按钮,返回到上一级对话框。
图5-2(练习) Frequencies :Statistics 统计分析对话框 ○
3点击OK 按钮,SPSS 将输出如表5-1(练习)所示的结果。
表5-1 平时初中生一天做作业时间的中位数、众值和四分位差
从上表可以看出,平时初中生一天做作业时间的中位数是2.5小时,众数是2小时,四分位差是1(即3.000-2.000)个小时。
N Valid 517
Missing
9
Median 2.500
Mode 2.0
Percentile s
25
2.000
50 2.500
75 3.000
6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分别统计初中生月零花钱的均值和标准差,并进一步解释统计结果。
解:《武汉市初中生日常行为状况调查问卷》:
F1 你每个月的零用钱大致为___________元。
SPSS操作的步骤如下:
○1依次点击Analyze→Descriptive Statistics→frequencies,打开如图5-3(练习)所示的对话框。
将变量“每个月的零花钱(f1)”,放置在Variables栏中。
图5-3(练习) Frequencies对话框
○2单击图5-3(练习)Frequencies对话框中下方的Statistics(统计量)按钮,打开如图
5-4(练习)所示的对话框。
选择Mean(均值)选项和Std.deviation(标准差)选项。
点击Continue按钮,返回到如图5-3(练习)所示的对话框。
图5-4(练习) Frequencies:Statistics统计分析对话框
○3点击OK按钮,SPSS将输出如表5-2(练习)所示的结果。
表5-2(练习) 初中生月零用钱的均值和标准差
从表5-2(练习)可以看出,“初中生月零用钱”的均值为109.80元,标准差为114.2元。
第六章 正态分布
练习题:
1.一个正态分布2(120,30)N 中,有300个变量值在130至150之间,求有多少 变量值在130至145之间。
解:该题目的求解分为以下4个步骤:
○
1130至150之间的300个变量值占总体的变量值的个数的比例: 130120150120
(
)()
3030 (0.33 1.00) 0.34130.1293 =0.2120a b P Z P Z P Z μμ
σσ----<<
=<<=<<=- ○2总体的变量值的个数为:
300
1415.0914150.2120
=≈
○
3130至145之间的变量值的个数占总体变量值个数的比例: 130120145120
(
)()
3030
(0.330.83) 0.29670.1293 =0.1674a b P Z P Z P Z μμ
σσ----<<
=<<=<<=-
○
4总体中130至145之间的变量值的个数: 14150.1674=236.871237⨯≈
2.已知一个正态分布的标准差为6.0,随机抽取一个变量值超过45.0的概率是0.02,求:
(1)该分布的均值;
(2)某一变量值,使95%的变量值都比它大。
解:设该正态分布为2
(,)N μσ,则其均值为μ,标准差为6.0。
(1)随机抽取一个变量值超过45.0的概率是0.02,即:
45(
)0.026
P Z μ
-<<+∞= 即:45(0)0.486P Z μ
-<<=
查标准正态分布表可知:
456
μ
-=2.05 可得:32.7μ= (2)设该变量值为a ,则:
32.7
()0.956
a P Z -<<+∞= 即:32.7
(0)(0)0.956a P Z Z -<<+<<+∞=
即:32.7
(0)0.50000.956a P Z -<<+=
即:32.7
(0)0.456
a P Z -<<=
也即:32.7
(0)0.456
a P Z -<<-=
查标准正态分布表可得:32.7
1.646
a --=
可得:22.86a =
3. 对某大学的学生进行调查发现,平均缺课天数为3.5,标准差为1.2。
假设 该大学的缺课情况服从正态分布,求: (1)一名学生缺课3.5到5天的概率; (2)一名学生缺课5天及以上的概率; (3)三名学生都缺课5天及以上的概率。
解:该总体服从的正态分布为2
(3.5,1.2)N
(1) 3.5 3.55 3.5
()(0 1.25)0.39440.0000.39441.2 1.2
P Z P Z --<<=<<=-= (2)
5 3.5
(
)(1.25)1.2
0.5000(0 1.25) 0.50000.3944 =0.1056P Z P Z P Z -≤<+∞=≤<+∞=-<≤=- (3)0.10560.10560.1056=0.0012⨯⨯
4.某社区10000名居民的体重服从正态分布,均值为80千克,标准差为12千克。
求:
(1)有多少人的体重在80千克至93千克之间; (2)有多少人的体重在90千克至105千克之间; (3)有多少人的体重在70千克至105千克之间; (4)有多少人的体重低于68千克。
解:该社区10000名居民的体重服从的正态分布为2
(80,12)N 。
(1)○1体重在80千克至93千克之间居民占该社区全部居民人数的比例:
80809380
(
)1212(0 1.08)=0.3599P Z P Z --<<=<< ○2体重在80千克至93千克之间的居民的人数:
100000.35993599⨯=
(2)○1体重在90千克至105千克之间居民占该社区全部居民人数的比例:
908010580
(
)1212(0.83 2.08)
(0 2.08)(00.83)0.4812-0.2967=0.1845P Z P Z P Z P Z --<<=<<=<<-<<= ○2体重在80千克至93千克之间的居民的人数:
100000.18451845⨯= (3)○1体重在70千克至105千克之间居民占该社区全部居民人数的比例:
708010580
(
)1212(0.83 2.08)(0.830)(0 2.08)(00.83)(0 2.08)0.4812+0.2967=0.7779
P Z P Z P Z P Z P Z P Z --<<=-<<=-<<+<<=<<+<<= ○2体重在70千克至105千克之间的居民的人数: 100000.77797779⨯= (4)○1低于68千克的居民占该社区全部居民人数的比例:
6880
()12
(1)(1)
(0)(01)0.50000.3413=0.1587
P Z P Z P Z P Z P Z --∞<<=-∞<<-=<<+∞=<<+∞-<<=-
○2低于68千克的居民的人数: 100000.15871587⨯=
5.若入学考试中各个考生的总分数服从正态分布2(400,100)N ,总共有2000人参加考试,问欲进入被录取的前300名内,其总分至少应该有多少?
解:○1被录取的前300名的考生人数占总参考人数的比例: 300
0.15002000
P =
= ○2假设分数至少为a 时才能进入前300名,则:
400
(
)0.1500100
a P Z -<<+∞= 即:400
(0)(0)0.1500100
a P Z P Z -<<+∞-<<
= 即:400
0.5(0)0.1500100a P Z --<<
= 即:400
(0)0.50.15000.3500100
a P Z -<<
=-= 可得:400
1.04100
a -=
a
可得:504
6.根据武汉市初中生日常行为状况调查的数据(data9),绘制初中生节假日做作业时间的P-P图,判断该变量是否服从正态分布?
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填写具体时间,没有则填“0”)
节假日:1)做作业_______小时
SPSS操作步骤如下:
○1选择Graphs中的P-P Plots,弹出如图6-1(练习)所示的对话框。
图6-1(练习) P-P Plots对话框
○2将要分析的变量“节假日做作业的时间(c11b1)”放置在Variables栏中,如图6-1(练习)所示,在Test Distritution框中设定Normal(正态分布)。
○3点击OK按钮,就可以输出如图6-2(练习)所示的P-P图。
E x p e c t e d C u m P r o b
(a ) (b )
图6-2(练习) 节假日做作业时间的P-P 图
上图中的(a )、(b )两图分别是P-P 图和去势P-P 图,图(a )中的横轴和纵轴分别是实际累积概率和理论累积概率,如果研究数据呈正态分布,则图中数据点应当与理论直线(对角线)基本重合,可以看出“节假日做作业的时间”的实际分布基本上与理论直线分布相差比较小。
(b )去势P-P 图反映的是按正态分布计算的理论值与实际值之差的分布情况,如果研究数据呈现正态分布,则数据点将均匀地分布在y=0这条直线上下两边。
图(b )数据点比较均匀地分布在y=0这条直线上下两边,其残差绝对值不超过0.05,因此可以判断中生节假日做作业时间基本上服从正态分布。
第七章 参数估计
练习题:
1. 假设一个总体有3、6、9、12、15共5个元素,抽取样本容量为2的样本,绘制总
体分布与样本均值的抽样分布,并比较两个分布的异同?
解:○1总体分布:
总体中5个元素3、6、9、12和15在总体中都各自仅仅出现一次,其分布为均匀分布,如下图所示:
均匀分布
○2若重复抽取(抽取后放回)样本容量为2的样本,则可以抽取的样本有52=25个,样本以及样本的均值如下表所示:
根据上表可以绘制出25个样本均值的相对频数分布,如下图所示:
样本均值的抽样分布
2. 某报刊为了对某市交通的便利情况进行调查,在全市随机抽取了56名市民,调
查其每天上下班大约在公交车上花费的时间,下表是56名市民做出的回答:(单位:分钟)
80 80 68 48 60 50 110 50 85 95 75 70 210 60 50 60 200 70 40 35 120 90 60 80 70 80 190 45 60 120 100 40 78 50 80 50 30 55 80 110 50 70 90 40 60 30 60 60 70 60 60
80
50
60
80
120
(1)请计算这56名市民上下班在公交车上花费的时间的平均数x 和标准差S 。
(2)求该市市民上下班在公交车上花费的平均时间的置信区间,置信度为95%。
解:(1)均值:1
8080684224
75.435656
n
i
i X
x n
=+++==
==∑…+120
标准差:
=37.11
S ==
=
(2)大样本单总体均值的区间估计:
在1α-的置信度下,总体均值μ
的置信区间为2
2
x Z x Z α
α
⎛⎫
-+ ⎝
, 该题目中:=0.05α,75.43x =,=37.11σ,0.052
2
==1.96 Z Z α,56n =
则:2
1.969.72Z α
==
可得:2
75.439.7265.71x Z α
-=-=
2
75.439.7285.15x Z α
+=+=
可得总体均值μ的置信区间为()65.71,85.15。
3.某大学为了了解本校学生每天上网的时间,在全校6000名学生中随机抽取了20
名学生进行调查,得到下面的数据:(单位:小时)
2.5 3 4 2 1.6 2.5 4 2 3 1 2.8
3.5
6
2
4
1
2
3.8
1
5
(1)请计算这20学生每天上网的时间的平均数x 和方差S 。
(2)求该校20名学生每天上网的平均时间的置信区间,置信度为99%。
解:(1)均值:1
2.53456.7
2.842020
n
i
i X
x n
=+++==
==∑…+5
标准差:
=1.35
s ==
=
(2)小样本单总体均值的区间估计:
在1α-的置信度下,总体均值μ
的置信区间为2
2
x t x t α
α⎛⎫-+ ⎝
,该题 目中:=0.05α, 2.84x =,s=1.35,0.052
2
2.093t t α==(自由度为19),20n =
则:2
2.0930.63t α
==
可得:2
2.840.63 2.21x t α
-=-=
2
2.840.63
3.47x t α
+=+= 可得总体均值μ的置信区间为()2.21,3.47。
4.中华人民共和国建国60周年阅兵式通过电视和网络直播传递到了世界的每一个
角落,阅兵式结束的当天下午,某国的中文报纸随机抽取了200名华人对之进行电话调查,结果显示有180名华人对阅兵式印象深刻,请计算该国对于阅兵式印象深刻的华侨的比例的置信区间,置信度为95%。
解:大样本单总体比例的区间估计:
样本中对阅兵式印象深刻的华侨占200名华人的比例:180
=
0.9200
p = 在置信度为1α-下P
的置信区间为//(p Z p Z αα-+,本题目中:0.05α=,0.052
2
==1.96 Z Z α,0.9p =,200n =
则:/ 1.960.0416Z α==
可得:/0.90.04160.8584p Z α-=-=
/0.90.04160.9416p Z α+=+= 可得总体比例P 的置信区间为()85.84%,94.16%。
5.某购物中心准备在甲乙两个城区选出一个建立一个新的购物中心,策划人员分别在甲城区随机抽取了200名居民,在乙城区随机抽取了240名居民,对其月消费额度进行了调查,下表是调查的结果:(单位:元)
来自甲城区的样本
来自乙城区的样本
1n =200 2n =240 1x =720 2x =640 1s =120
2s =88
(1)求12μμ-的95%的置信区间。
(2)求12μμ-的99%的置信区间。
解:(1)大样本两总体均值差的区间估计:
在置信度为1α-下两总体均值差12μμ-的置信区间为
(
)(
)12/12/x x Z x x Z αα⎛---+ ⎝
1272064080x x -=-=,1n =200,2n =240,1s =120,2s =88,0.05/2 1.96Z =
/ 1.9620.01Z α== 可得:(
)12/8020.0159.99x x Z α--=-=
(
)12/8020.01100.01x x Z α-+=+= 可得12μμ-的95%的置信区间为(59.99,100.01)。
(2)0.01/2 2.58Z =
/ 2.5826.34Z α== 可得:(
)12/8026.3453.66x x Z α--=-= (
)12/8026.34106.34x x Z α-+=+= 可得12μμ-的99%的置信区间为(53.66,106.34)。
6.在旅游开发过程中将旅游地社区居民的意见考虑进来已经是一种比较通行的做
法,某地要新开发一个旅游项目,在附近的甲社区随机抽取60名居民,在乙社区随
机抽取了64名居民,调查其是否同意该旅游项目开工建设,表示同意开工建设的居
民的百分比如下表所示:
来自甲社区的样本
来自乙社区的样本
1n =60 2n =64 1p =86%
2p =72%
(1)构造12P P -的90%的置信区间。
(2)构造12P P -的95%的置信区间。
解:(1)在置信度为1α-下两总体比例差12P P -的置信区间为:
(
)(
)12/12/p p Z p p Z αα⎛---+ ⎝
该题目中:120.14p p -=,1n =60,2n =64,/2 1.65Z α=
/ 1.650.1185Z α==
可得:(
)12/0.140.1185=0.0215p p Z α--=-
(
)12/0.140.1185=0.2585p p Z α-+=+ 12P P -的90%的置信区间为(0.0215,0.2585)。
(2)/2 1.96Z α=
/ 1.960.1407Z α==
可得:(
)12/0.140.1407=-0.0007p p Z α--=-
(
)12/0.140.1407=0.2807p p Z α-+=+ 12P P -的95%的置信区间为(-0.0007,0.2807)。
7.现今有大量的中小学生参加各种培优项目,某教育研究机构在某中学初二年
级
中随机抽取了30名学生,上一学期参加过培优的有12名学生,没有参加过培优
的
有18名学生,这两类学生期末考试各科的平均成绩如下:
(1)请计算1x 、2x 、1s 与2s 并填入上表。
(2)求12μμ-的95%的置信区间。
解:(1)1
19078
1034
86.171212
n
i
i x
x n
=++=
=
==∑
…+82
1
280871485
82.501818
n
i
i x
x n
=++=
=
==∑…+87
1
5.36
S ==
=
2 8.51
S ==
=
(2)小样本总体均值差12
μμ-的区间估计,21σ≠2
2σ且1n ≠2n : 在置信度为1α-下两总体均值差12μμ-的置信区间为:
()()1212x x x x ⎛
---+ ⎝
其中t 分布的自由度df :
()
()
2
22
12122
2
221
12
212//1
1
S S n n df S
n S
n n n ⎛⎫
+ ⎪⎝⎭
=
+
--
该题目中,1286.1782.50 3.67x x -=-=
()
()
()
()
2
22
12122
2
221
12
2122
222
2
22//1
1
5.368.511218 =
5.36/128.51/18121
181
41.178
=
1.473 =27.96
28
S S n n df S
n S n n n ⎛⎫
+ ⎪⎝⎭
=
+
--⎛⎫
+ ⎪⎝
⎭+
--≈
则在自由度为28,置信度为10.05-时0.052
2
2.048t t α==,
可得:
2.048 2.048 5.19=== 可得:(
)12 3.67 5.19-1.52x x --=-= (
)12 3.67 5.198.86x x -+=+= 可得12μμ-的95%的置信区间为(-1.52,8.86)。
8.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武
汉市初中生平时一天睡觉时间(C11)的置信区间?
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填
写具体时间,没有则填“0”)
平时(非节假日):8)睡觉_______小时
SPSS 的操作步骤如下:
○
1选择“Aanalyze → Descriptive Statistics → Explore ”,打开如图7-1(练习)所
示的对话框。
图7-1(练习) Explore的对话框
○2将变量“初中生平时一天睡觉时间(c11a8)”放在Dependent List栏中,Display选项中选择Both。
○3点击Statitics按钮,出现如图7-2(练习)所示的对话框。
设置置信水平为95%,点击Continue按钮,返回到上一级对话框。
图7-2(练习) Explore:Statistics分析对话框
○4点击OK按钮,输出如表7-1(练习)所示的结果。
表7-1(练习)变量描述表
从表7-1(练习)可以看出,初中生平时每天睡觉的平均时间为7.772小时,我们有95%的
把握认为初中生平时每天平均睡觉时间在7.626-7.918小时之间。
9.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武
汉市不与父母双亲住在一起(A7)的初中生的比例的置信区间?
解:《武汉市初中生日常行为状况调查问卷》:
A7 你的居住情形是
1)与父母亲住在一起 2)仅与其他亲戚住 3)只与父亲住在一起
4)只与母亲住在一起 5)单独居住 6)和父母及其他亲戚一起居住
SPSS的操作步骤如下:
○1《武汉市初中生日常行为状况调查问卷》“A7你的居住情形”这个题目有1)到6)六
个选项,其中只有1)和6)是与父母亲双亲住在一起,其余的2)到5)都不是与双亲住在一起。
○2将变量“居住情形(a7)”进行变换,生成新变量“是否与父母双亲住在一起(a7fz)”,
其中1)与父母双亲住在一起,2)不与父母双亲住在一起。
该步骤的操作步骤如下:
A. 依次点击Transform→Recode→Into Different Variables,打开如图7-3(练
习)所示的对话框。
图7-3(练习) Transform对话框
B.再将“你的居住情形(a7)”这个变量放置在Numeric Vavriable→output对
话框中,如图7-3(练习)所示,并在Output Variable框中给要生成的新变量命名为“a7fz”,点击Change按钮后,新变量名字将出现在Numeric Vavriable→output中,Label是新变量的标签,将之标示为“是否与父母双亲住在一起”。
C.点击如图7-3(练习)的Old and New Values按钮,得到如图7-4(练习)
所示的对话框,将“你的居住情形(a7)”这个变量转换成两种类别。
Old Value 选项Value中输入1,在New Value一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;同样Old Value选项Value中输入6,在New Value 一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;Old Value 选项的Range栏的through左侧框中输入2,through右侧框中输入5,在New Value一栏Value中输入1,再点击Add按钮,也使之出现在Old→New栏中。
图7-4(练习) Old and New Values对话框
D.点击Continue按钮,返回到上一级对话框,再点击图7-3(练习)中的OK按钮,完成设置。
则生成新变量“是否与父母双亲住在一起(a7fz)”,该变量在SPSS数据中有0和1两个取值,其中“与父母双亲住在一起”取值为0,“不与父母双亲住在一起”取值为1。
则变量“是否与父母双亲住在一起(a7fz)”
的平均值就是“不与父母双亲住在一起的初中生”的比例。
○3选择“Aanalyze → Descriptive Statistics→ Explore”,打开如图7-5(练习)所示的对话框。
图7-5(练习) Explore的对话框
○4将变量“是否与父母双亲住在一起(a7fz)”放在Dependent List栏中,Display选项中选择Both。
○5点击Statitics按钮,出现如图7-6(练习)所示的对话框。
设置置信水平为95%,点击Continue按钮,返回到上一级对话框。
图7-6(练习) Explore:Statistics分析对话框
○6点击OK按钮,输出如表7-2(练习)所示的结果。
表7-2(练习)变量描述表
从上表可以看出,有12.06%的初中生没有与父母双亲住在一起,我们有95%的把握认为没有与父母双亲住在一起的初中生的比例在9.21%—14.90%之间。
第八章 单总体假设检验
练习题:
1. 某市去年进行的调查显示该市市民上下班花费的平均时间为75.45分钟。
今年 有两条地铁线路开通,今年某报社在全市随机抽取了60名市民对其上下班时间进行调查,调查结果如下表所示:(单位:分钟)
60 60 56 48 48 70 80 70 55 70 75 65 120 60 54 54 20 50 60 60 90 58 36 80 60 68 90 58 64 64 80 40 45 58 54 50 40 58 70 58 50 48 62
64 55 36 80 40 48
66 58
58
50
38
68
100
80
90
88
65
(1)请计算这60名市民今年每天上下班在公交车上花费的时间的平均数x 和标准差S 。
(2)请陈述研究假设1H 和虚无假设0H 。
(3)若显著性水平为0.05,能否认为该市市民上下班变得更加便利了。
解: (1) x 60+60+
+88+65
3700
=
= 61.6760
60
=
, 17.10S ==
==
(2)研究假设1H :75.45μ<
虚无假设0H :75.45μ≥ (3)采用Z 检验:,
=
=
=-6.24x Z ,
假设方向明确,采用一端(左)检定,显著性水平为0.05时,否定域 1.65Z ≤-,检验统计值(Z=-6.24<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,也就是说在0.05的显著性水平上,该市居民上下班变得更加便利了。
2.某大学去年的调查显示,该校学生每周体育锻炼平均时间为5.2个小时,今 年在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单 位:小时)
5.5 4 3 3 3.5 2.5 5 9 6 4 4
2
8
12
7
6
8
9
2
4
(1)请计算这20学生每天体育锻炼时间的平均数和标准差S 。
(2)请陈述研究假设1H 和虚无假设0H 。
(3)若显著性水平为0.05,能否认为该校学生体育锻炼的时间有所增加?
解:(1) 5.5426107.5
5.38220
x +
+++=
==
=;
2.72S ==
==
(2)研究假设1H : 5.2μ>
虚无假设0H : 5.2μ≤ (
3)采用小样本t 检验:
df
=20-1=19
0.288x x t SE μ-=
=== 假设方向明确,采用一端(右端)检验,显著性水平为0.05时否定域为 1.729t ≥,
检验统计值(t =0.028<1.729)没有落在否定域中,因此不能否定虚无假设,即在0.05的显著性水平下,不能认为该校学生体育锻炼的时间有所增加。
3.2007年某市抽烟的成年人的比例为41%,今年在该市随机调查了500名成年 人,发现抽烟的有180名,若显著性水平为0.05,能否认为该市抽烟的成年人的 比例有所下降?
解:研究假设1H :41%P <
虚无假设0H :41%P ≥ 样本中抽烟的成年人的比例:
180
36%500
p =
= 采用Z 检验:
2.27p P
Z SE
-=
==
=-
假设方向明确,采用一端(左)检验,显著性水平为0.05时,否定域 1.65Z ≤-,统计检验值(Z =-2.27<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,该市抽烟的成年人的比例有所下降。
(注:本题原来的解答过程有误)
4.某产粮大县去年的小麦亩产是400千克,今年小麦播种采用了新的品种,该 县农业部门在夏粮收获后,随机抽取了120亩进行调查,调查发现平均亩产为 420千克,标准差为30千克,能否认为新品种的产量比老品种有所增加?(显 著性水平为0.05)
解: 研究假设1H :400μ>,
虚无假设0H :400μ≤. 采用Z 检验:
=
=
=7.303x Z
假设方向明确,采用一端(右)检定,显著性水平为0.05时否定域 1.65Z ≥,检验统。