统计学(第三版课后习题答案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。
30~35
35~40
40~45
45~50
4
6
15
9
6
10.0
15.0
37.5
22.5
15.0
合计
40
100.0
直方图(略)。
2.4(1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
按使用寿命分组(小时)
灯泡个数(只)
频率(%)
650~660
2
2
660~670
5
5
670~680
6
6
680~690
5.3(2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4(7.1,12.9)。
5.5(7.18,11.57)。
5.6(18.11%,27.89%);(17.17%,22.835)。
5.7(1)(51.37%,76.63%);(2)36。
5.8(1.86,17.74);(0.19,19.41)。
8
9
9
70
0
0
1
1
2
2
3
4
5
6
6
6
7
7
8
8
8
9
71
0
0
2
2
3
3
5
6
7
7
8
8
9
72
0
1
2
2
5
6
7
8
9
9
73
3
5
6
74
1
4
7
2.5(1)属于数值型数据。
(2)分组结果如下:
分组
天数(天)
-25~-20
6
-20~-15
8
-15~-10
10
-10~-5
13
-5~0
12
0~5
4
5~10
7
合计
60
(3)直方图(略)。
6.6 =3.11,拒绝 。
6.7 =1.93,不拒绝 。
6.8 =7.48,拒绝 。
6.9 =206.22,拒绝 。
6.10 =-5.145,拒绝 。
6.11 =1.36,不拒绝 。
6.12 =-4.05,拒绝 。
6.13 =8.28,拒绝 。
6.14(1)检验结果如下:
t-检验:双样本等方差假设
变量1
变量2
平均
100.7
109.9
方差
24.11578947
33.35789474
观测值
20
20
合并方差
28.73684211
假设平均差
0
df
38
t Stat
P(X>20)=1-P(X≤20)=1-0.99842=0.00158
(3)支付保险金额的均值=50000×E(X)
=50000×20000×0.0005(元)=50(万元)
支付保险金额的标准差=50000×σ(X)
=50000×(20000×0.0005×0.9995)1/2=158074(元)
3.10(1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ=np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。
7.5
合计
40
100.0
—
—
—பைடு நூலகம்
—
(2)某管理局下属40个企分组表
按销售收入分组(万元)
企业数(个)
频率(%)
先进企业
良好企业
一般企业
落后企业
11
11
9
9
27.5
27.5
22.5
22.5
合计
40
100.0
2.3频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)
频数(天)
频率(%)
25~30
于是
3.3设A表示“合格”,B表示“优秀”。由于B=AB,于是
=0.8×0.15=0.12
3.4设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
(2)成年组身高的离散系数: ;
幼儿组身高的离散系数: ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.15下表给出了一些主要描述统计量,请读者自己分析。
方法A
方法B
方法C
平均
165.6
平均
128.73
平均
125.53
中位数
165
中位数
129
中位数
126
众数
8
7
6655200
8
123345
6
6
632220
9
011456
6
0
10
000
3
(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.8箱线图如下:(特征请读者自己分析)
2.9(1) =274.1(万元);Me=272.5;QL=260.25;QU=291.25。
3.5设A=活到55岁,B=活到70岁。所求概率为:
3.6这是一个计算后验概率的问题。
设A=优质率达95%, =优质率为80%,B=试验所生产的5件全部优质。
P(A)=0.4,P( )=0.6,P(B|A)=0.955,P(B| )=0.85,所求概率为:
决策者会倾向于采用新的生产管理流程。
3.7令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:
(1)
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
(2)
3.8据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:
xi
0
1
2
3
P(X=xi)
0.216
0.432
0.288
0.064
期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
3.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率 。
考虑逆事件 “任取一个零件为正品”,表示通过三道工序都合格。据题意,有:
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
5
14
26
33
37
40
12.5
35.0
65.0
82.5
92.5
100.0
40
35
26
14
7
3
100.0
87.5
65.0
35.0
17.5
5.9(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。
5.10(1) , ;(2)1.75±4.27。
5.11(1)10%±6.98%;(2)10%±8.32%。
5.12(4.06,14.35)。
5.1348。
5.14139。
5.1557。
(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,
即有X~N(10,9.995)。相应的概率为:
P(X≤10.5)=0.51995,P(X≤20.5)=0.853262。
5.16769。
第
6.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为: , 。
6.2 =“某一品种的小鸡因为同类相残而导致的死亡率”, , 。
6.3 , 。
6.4(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
4.10 a. 0.015 b. 0.0026 c. 0.1587
4.11. a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. a. 0.05 b. 1 c. 0.000625
第
5.1(1) 。(2)E=1.55。
5.2(1) 。(2)E=4.2。(3)(115.8,124.2)。
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1(取整数)
(2)
=1-0.9011=0.0989
第
4.1 a. 20, 2 b.近似正态c. -2.25 d. 1.50
4.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
4.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
6.5(1)检验统计量 ,在大样本情形下近似服从标准正态分布;
(2)如果 ,就拒绝 ;
(3)检验统计量 =2.94>1.645,所以应该拒绝 。
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
10
730~740
3
3
740~750
3
3
合计
100
100
直方图(略)。
(3)茎叶图如下:
65
1
8
66
1
4
5
6
8
67
1
3
4
6
7
9
68
1
1
2
3
3
3
4
5
5
5
8
8
9
9
69
0
0
1
1
1
1
2
2
2
3
3
4
4
5
5
6
6
6
7
7
8
8
8
2.6(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7(1)茎叶图如下:
A班
树茎
B班
数据个数
树叶
树叶
数据个数
0
3
59
2
1
4
4
0448
4
2
97
5
122456677789
12
11
97665332110
6
011234688
9
23
98877766555554443332100
7
00113449
Hah
1
2.1(1)属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
家庭数(频率)
频率%
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计
100
100
(3)条形图(略)
2.2(1)频数分布表如下:
40个企业按产品销售收入分组表
按销售收入分组
(万元)
企业数
(个)
频率
(%)
3.11(1) =0.04779
合格率为1-0.04779=0.95221或95.221%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
即: ,K/30≥1.64485,故K≥49.3456。
3.12设X=同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
164
众数
128
众数
126
标准偏差
2.13
标准偏差
1.75
标准偏差
2.77
极差
8
极差
7
极差
12
最小值
162
最小值
125
最小值
116
最大值
170
最大值
132
最大值
128
2.16(1)方差或标准差;(2)商业类股票;(3)(略)。
2.17(略)。
第
3.1设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师
3.9设被保险人死亡数=X,X~B(20000,0.0005)。
(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:
(2) (万元)。
2.10(1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2.11 =426.67(万元); (万元)。
2.12(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2)男生: =27.27(磅), (磅);
女生: =22.73(磅), (磅);
(3)68%;
(4)95%。
2.14(1)离散系数,因为它消除了不同组数据水平高地的影响。
4.4 a. 101, 99 b. 1 c.不必
4.5趋向正态
4.6. a.正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
4.7. a. 406, 1.68,正态分布b. 0.001 c.是,因为小概率出现了
4.8. a.增加b.减少
4.9. a.正态b.约等于0 c.不正常d.正态, 0.06
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。
30~35
35~40
40~45
45~50
4
6
15
9
6
10.0
15.0
37.5
22.5
15.0
合计
40
100.0
直方图(略)。
2.4(1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
按使用寿命分组(小时)
灯泡个数(只)
频率(%)
650~660
2
2
660~670
5
5
670~680
6
6
680~690
5.3(2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4(7.1,12.9)。
5.5(7.18,11.57)。
5.6(18.11%,27.89%);(17.17%,22.835)。
5.7(1)(51.37%,76.63%);(2)36。
5.8(1.86,17.74);(0.19,19.41)。
8
9
9
70
0
0
1
1
2
2
3
4
5
6
6
6
7
7
8
8
8
9
71
0
0
2
2
3
3
5
6
7
7
8
8
9
72
0
1
2
2
5
6
7
8
9
9
73
3
5
6
74
1
4
7
2.5(1)属于数值型数据。
(2)分组结果如下:
分组
天数(天)
-25~-20
6
-20~-15
8
-15~-10
10
-10~-5
13
-5~0
12
0~5
4
5~10
7
合计
60
(3)直方图(略)。
6.6 =3.11,拒绝 。
6.7 =1.93,不拒绝 。
6.8 =7.48,拒绝 。
6.9 =206.22,拒绝 。
6.10 =-5.145,拒绝 。
6.11 =1.36,不拒绝 。
6.12 =-4.05,拒绝 。
6.13 =8.28,拒绝 。
6.14(1)检验结果如下:
t-检验:双样本等方差假设
变量1
变量2
平均
100.7
109.9
方差
24.11578947
33.35789474
观测值
20
20
合并方差
28.73684211
假设平均差
0
df
38
t Stat
P(X>20)=1-P(X≤20)=1-0.99842=0.00158
(3)支付保险金额的均值=50000×E(X)
=50000×20000×0.0005(元)=50(万元)
支付保险金额的标准差=50000×σ(X)
=50000×(20000×0.0005×0.9995)1/2=158074(元)
3.10(1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ=np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。
7.5
合计
40
100.0
—
—
—பைடு நூலகம்
—
(2)某管理局下属40个企分组表
按销售收入分组(万元)
企业数(个)
频率(%)
先进企业
良好企业
一般企业
落后企业
11
11
9
9
27.5
27.5
22.5
22.5
合计
40
100.0
2.3频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)
频数(天)
频率(%)
25~30
于是
3.3设A表示“合格”,B表示“优秀”。由于B=AB,于是
=0.8×0.15=0.12
3.4设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。
=0.8×1+0.2×0.5=0.9
脱靶的概率=1-0.9=0.1
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1
(2)成年组身高的离散系数: ;
幼儿组身高的离散系数: ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.15下表给出了一些主要描述统计量,请读者自己分析。
方法A
方法B
方法C
平均
165.6
平均
128.73
平均
125.53
中位数
165
中位数
129
中位数
126
众数
8
7
6655200
8
123345
6
6
632220
9
011456
6
0
10
000
3
(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.8箱线图如下:(特征请读者自己分析)
2.9(1) =274.1(万元);Me=272.5;QL=260.25;QU=291.25。
3.5设A=活到55岁,B=活到70岁。所求概率为:
3.6这是一个计算后验概率的问题。
设A=优质率达95%, =优质率为80%,B=试验所生产的5件全部优质。
P(A)=0.4,P( )=0.6,P(B|A)=0.955,P(B| )=0.85,所求概率为:
决策者会倾向于采用新的生产管理流程。
3.7令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30,P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:
(1)
=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
(2)
3.8据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:
xi
0
1
2
3
P(X=xi)
0.216
0.432
0.288
0.064
期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次)
(1)P(A)=4/12=1/3
(2)P(B)=4/12=1/3
(3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
3.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率 。
考虑逆事件 “任取一个零件为正品”,表示通过三道工序都合格。据题意,有:
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
5
14
26
33
37
40
12.5
35.0
65.0
82.5
92.5
100.0
40
35
26
14
7
3
100.0
87.5
65.0
35.0
17.5
5.9(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。
5.10(1) , ;(2)1.75±4.27。
5.11(1)10%±6.98%;(2)10%±8.32%。
5.12(4.06,14.35)。
5.1348。
5.14139。
5.1557。
(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,
即有X~N(10,9.995)。相应的概率为:
P(X≤10.5)=0.51995,P(X≤20.5)=0.853262。
5.16769。
第
6.1研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为: , 。
6.2 =“某一品种的小鸡因为同类相残而导致的死亡率”, , 。
6.3 , 。
6.4(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
4.10 a. 0.015 b. 0.0026 c. 0.1587
4.11. a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. a. 0.05 b. 1 c. 0.000625
第
5.1(1) 。(2)E=1.55。
5.2(1) 。(2)E=4.2。(3)(115.8,124.2)。
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1(取整数)
(2)
=1-0.9011=0.0989
第
4.1 a. 20, 2 b.近似正态c. -2.25 d. 1.50
4.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
4.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
6.5(1)检验统计量 ,在大样本情形下近似服从标准正态分布;
(2)如果 ,就拒绝 ;
(3)检验统计量 =2.94>1.645,所以应该拒绝 。
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
10
730~740
3
3
740~750
3
3
合计
100
100
直方图(略)。
(3)茎叶图如下:
65
1
8
66
1
4
5
6
8
67
1
3
4
6
7
9
68
1
1
2
3
3
3
4
5
5
5
8
8
9
9
69
0
0
1
1
1
1
2
2
2
3
3
4
4
5
5
6
6
6
7
7
8
8
8
2.6(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7(1)茎叶图如下:
A班
树茎
B班
数据个数
树叶
树叶
数据个数
0
3
59
2
1
4
4
0448
4
2
97
5
122456677789
12
11
97665332110
6
011234688
9
23
98877766555554443332100
7
00113449
Hah
1
2.1(1)属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
家庭数(频率)
频率%
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计
100
100
(3)条形图(略)
2.2(1)频数分布表如下:
40个企业按产品销售收入分组表
按销售收入分组
(万元)
企业数
(个)
频率
(%)
3.11(1) =0.04779
合格率为1-0.04779=0.95221或95.221%。
(2)设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
即: ,K/30≥1.64485,故K≥49.3456。
3.12设X=同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
164
众数
128
众数
126
标准偏差
2.13
标准偏差
1.75
标准偏差
2.77
极差
8
极差
7
极差
12
最小值
162
最小值
125
最小值
116
最大值
170
最大值
132
最大值
128
2.16(1)方差或标准差;(2)商业类股票;(3)(略)。
2.17(略)。
第
3.1设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师
3.9设被保险人死亡数=X,X~B(20000,0.0005)。
(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为:
(2) (万元)。
2.10(1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2.11 =426.67(万元); (万元)。
2.12(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2)男生: =27.27(磅), (磅);
女生: =22.73(磅), (磅);
(3)68%;
(4)95%。
2.14(1)离散系数,因为它消除了不同组数据水平高地的影响。
4.4 a. 101, 99 b. 1 c.不必
4.5趋向正态
4.6. a.正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
4.7. a. 406, 1.68,正态分布b. 0.001 c.是,因为小概率出现了
4.8. a.增加b.减少
4.9. a.正态b.约等于0 c.不正常d.正态, 0.06