大学统计学第七章练习题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7章 参数估计
练习题
7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少?
解:⑴已知25,40,5===x n σ
样本均值的抽样标准差79.04
10
40
5≈=
=
=
n
x σ
σ ⑵已知5=σ,40=n ,25=x ,4
10
=
x σ,%951=-α 96.1025.02
==∴Z Z α
边际误差55.14
10
*
96.12
≈==n
Z E σ
α
7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1) 假定总体标准差为15元,求样本均值的抽样标准误差;
(2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置信区间。
解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249
15==
=n
X σ
σ
(2).已知2/αz =1.96
所以边际误差=2/αz *
=n
s 1.96*49
15=4.2
(3)置信区间:)(2.124,8.11596.149
151202
=*±
=±n
s Z x α
7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。
96.12
=∂Z
144.16741100
85414*
96.12
==⋅
∂n
Z σ
856.87818144.16741104560.
2
=-=-∂n
Z x σ
144.121301144.16741104560.
2
=+=+∂n
Z x σ
置信区间:(87818.856,121301.144)
7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。
(1) 构建μ的90%的置信区间。
(2) 构建μ的95%的置信区间。
(3) 构建μ的99%的置信区间。
解;由题意知100=n , 81=x ,12=s .
(1)置信水平为%901=-α,则645.12
=αZ .
由公式n
s z x ⨯
±2
α974.181100
12645.181±=⨯
±=
即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12
=αz
由公式得n
s z x ⨯
±2
α=81352.281100
12
96.1±=⨯
± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352
(3)置信水平为%991=-α,则576.22
=αZ .
由公式±x n
s z ⨯
2
α=096.381100
12576.281±=⨯
±=
即81 3.1±
则的的%99μ置信区间为
7.5 利用下面的信息,构建总体均值的置信区间。
(1)25=x ,5.3=σ,60=n ,置信水平为95%。
(2)6.119=x ,89.23=s ,75=n ,置信水平为98%。
(3)419.3=x ,974.0=s ,32=n ,置信水平为90%。
⑴,60,5.3,25===n X σ置信水平为95% 解:,96.12
=αZ
89.060
5.39
6.12
=⨯
=n
Z σ
α
置信下限:-X 11.2489.0252
=-=n
Z σ
α
置信上限:+X 89.2589.0252
=+=n
Z σ
α
),置信区间为(89.2511.24∴
⑵。
,置信水平为,%9875n 89.23s ,6.119===X 解:33.22
=αZ
43.675
89.2333.22
=⨯
=n
s Z α
置信下限:-X 17.11343.66.1192
=-=n s Z α
置信上限:+X 03.12643.66.1192
=+=n
s Z α
),置信区间为(03.12617.113∴
⑶x
=3.419,s=0.974,n=32,置信水平为90%
根据t=0.1,查t 分布表可得645.1)31(05.0=Z .283.0)(2/=∂n
s Z
所以该总体的置信区间为
x ±2/∂Z (
)n
s =3.419±0.283
即3.419±0.283=(3.136 ,3.702) 所以该总体的置信区间为3.136~3.702.
7.6 利用下面的信息,构建总体均值μ的置信区间。
(1) 总体服从正态分布,且已知500=σ,15=n ,8900=x ,置信水平为95%。
(2) 总体不服从正态分布,且已知500=σ,35=n ,8900=x ,置信水平为95%。
(3) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为
90%。
(4) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为
99%。
(1)解:已知500=σ,15=n ,8900=x ,1-95=α%,96.12
=αz
)9153,8647(15
50096.189002
=⨯
±=±n
z x σ
α
所以总体均值μ的置信区间为(8647,9153)
(2)解:已知500=σ,35=n ,8900=x ,1-95=α%,96.12
=αz
)9066,8734(35
50096.189002
=⨯
±=±n
z x σ
α
所以总体均值μ的置信区间为(8734,9066)
(3)解:已知35=n ,8900=x ,s=500,由于总体方差未知,但为大样本,可用样本方差来代替总体方差
∵置信水平1—α=90% ∴645.12
=αz
∴置信区间为)9039,8761(35
500645.1812
=⨯
±=±n
s z x α
所以总体均值μ的置信区间为(8761,9039)
(4)解:已知35=n ,8900=x ,500=s ,由于总体方差未知,但为
大样本,可用样本方差来代替总体方差
置信水平1—α=99% ∴58.22
=αz
∴置信区间为)9118,8682(35
50058.289002
=⨯
±=±n
s z x α
所以总体均值μ的置信区间为(8682,9118)
7.7 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到的数据见Book7.7(单位:h )。
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
解:已知:3167.3=x 6093.1=s n=36 1.当置信水平为90%时,645.12
=∂z ,
4532.03167.336
6093.1645
.13167.32
±=±=±∂
n
s z x
所以置信区间为(2.88,3.76)
2.当置信水平为95%时,96.12
=∂z ,
所以置信区间为(2.80,
3.84)
3.当置信水平为99%时,58.22
=∂z ,
7305.03167.336
6093.158
.23167.32
±=±=±∂
n
s z x
所以置信区间为(2.63,4.01)
7.8 从一个正态总体中随机抽取样本量为8的样本,各样本值见Book7.8。
求总体均值95%的置信区间。
已知:总体服从正态分布,但σ未知,n=8为小样本,05.0=α,365.2)18(2
05.0=-t
5445
.03167.336
6093.196
.13167.32
±=±=±∂
n
s z x
根据样本数据计算得:46.3,10==s x 总体均值μ的95%的置信区间为: 89.2108
46.3365.2102
±=⨯
±=±n
s t x α
,即
(7.11,12.89)。
7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km )数据见Book7.9。
求职工上班从家里到单位平均距离95%的置信区间。
已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,131.2)116(2/05.0=-t 根据样本数据计算可得:375.9=x ,s=4.113 从家里到单位平均距离得95%的置信区间为:
191
.2375.914
113.4131.2375.92
/±=⨯
±=±n
s t x α,
即(7.18,11.57)。
7.10 从一批零件中随机抽取36个,测得其平均长度为149.5cm ,标准差为1.93cm 。
(1) 试确定该种零件平均长度95%的置信区间。
(2) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。
解:已知,103=σn=36, x =149.5,置信水平为1-α=95%,查标准正态分布表得
2/αZ =1.96.
根据公式得: x ±2
/αZ n
σ=149.5±1.9636103⨯
即149.5±1.9636
103⨯
=(148.9,150.1)
答:该零件平均长度95%的置信区间为148.9~150.1
(3) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。
答:中心极限定理论证。
如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。
在现实生活中,一个
随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存在的。
样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。
7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g 。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g )见Book7.11。
已知食品重量服从正态分布,要求:
(1) 确定该种食品平均重量的95%的置信区间。
(2) 如果规定食品重量低于100g 属于不合格,确定该批食品合格率的95%的置信区间。
(1)已知:总体服从正态分布,但σ未知。
n=50为大样本。
α=0.05,2/05.0Z =1.96 根据样本计算可知 X =101.32 s=1.63 该种食品平均重量的95%的置信区间为
45.032.10150/63.1*96.132.101/2/±=±=Z ±X n s α
即(100.87,101.77)
(2)由样本数据可知,样本合格率:9.050/45==p 。
该批食品合格率的95%的置信区间为: 2
/αZ ±p n p p )1(-=0.950
)
9.01(9.096.1-±=0.9±0.08,即(0.82,0.98) 答:该批食品合格率的95%的置信区间为:(0.82,0.98)
7.12 假设总体服从正态分布,利用Book7.12的数据构建总体均值μ的99%的置信区间。
根据样本数据计算的样本均值和标准差如下;
x =16.13 σ=0.8706 E= Z 2
α
n
σ=2.58*58706.0=0.45
置信区间为x ±E 所以置信区间为(15.68,16.58)
7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18 名员工,得到他们每周加班的时间数据见Book7.13(单位:h )。
假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区
间。
解:已知x =13.56 =σ7.80 1.0=α n=18 E=2
αZ *n σ
置信区间=[x -2
αZ n σ
, x +2
αZ n σ
]
所以置信区间=[13.56-1.645*(7.80/18), 13.56+1.645*(7.80/18)] =[10.36, 16.76]
7.14 利用下面的样本数据构建总体比例π的置信区间。
(1)44=n ,51.0=p ,置信水平为99%。
(2)300=n ,82.0=p ,置信水平为95%。
(3)1150=n ,48.0=p ,置信水平为90%。
(1)44=n ,51.0=p ,置信水平为99%。
解:由题意,已知n=44, 置信水平a=99%, Z 2/a =2.58 又检验统计量为: P ±Z
n
p p )
1(-,故代入数值计算得, P ±Z n
p p )
1(-=(0.316,0.704), 总体比例π的置信区间为(0.316,0.704)
(2)300=n ,82.0=p ,置信水平为95%。
解:由题意,已知n=300, 置信水平a=95%, Z 2/a =1.96 又检验统计量为: P ±Z
n
p p )
1(-,故代入数值计算得, P ±Z n
p p )
1(-=(0.777,0.863), 总体比例π的置信区间为(0.777,0.863)
(3)1150=n ,48.0=p ,置信水平为90%。
解:由题意,已知n=1150, 置信水平a=90%, Z 2/a =1.645 又检验统计量为: P ±Z
n
p p )
1(-,故代入数值计算得, P ±Z n
p p )
1(-=(0.456,0.504), 总体比例π的置信区间为(0.456,0.504)
7.15 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。
其中拥有该品牌电视机的家庭占23%。
求总体比例的置信区间,置信水平分别为90%和95%。
解:由题意可知n=200,p=0.23
(1)当置信水平为1-α=90%时,Z 2/α=1.645 所以=-±n p p z p )1(2
/α200
)
23.01(23.0645.123.0-⨯±=0.23±0.04895 即0.23±0.04895=(0.1811,0.2789), (2)当置信水平为1-α=95%时,Z 2/α=1.96
所
以
=-±n p p z p )1(2
/α200
)23.01(23.096.123.0-⨯±=0.23±0.05832 即0.23±0.05832=(0.1717,0.28835);
答:在居民户中拥有该品牌电视机的家庭在置信水平为90%的置信区间为(18.11%,27.89%),在置信水平为95%的置信区间为(17.17%,28.835%)
7.16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。
他假设所有顾客月存款额的标准差为1000元,要求估计误差在200元以内,应选取多大的样本?
解:已知
1000=σ,E=1000,%991=-α,58.22/=αz
由公式2
2
2/2*E z n σα=可知n=(2.58*2.58*1000*1000)/(200*200)=167
答:置信水平为99%,应取167个样本。
7.17 要估计总体比例π,计算下列个体所需的样本容量。
(1)02.0=E ,40.0=π,置信水平为96%。
(2)04.0=E ,π未知,置信水平为95%。
(3)05.0=E ,55.0=π,置信水平为90%。
(1)解:已知02.0=E , ,40.0=π, 2/αZ =2.05 由
22
2//)1(E -Z =ππαn 得
2
2
02.0)4.01(40.005.2÷-⨯=n =2522 答:个体所需的样本容量为2522。
(2)解:已知04.0=E , 2/αZ =1.96
由
22
2//)1(E -Z =ππαn 得
=÷⨯=22204.05.096.1n 601
答:个体所需的样本容量为601。
(3)解:已知05.0=E , 55.0=π, 2/αZ =1.645
由
22
2//)1(E -Z =ππαn 得
2205.045.055.0645.1÷⨯⨯=n =268
答:个体所需的样本容量为268。
7.18 某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1) 求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。
(2) 如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查? (1)已知:n=50 96.12
=αZ
根据抽样结果计算的样本比例为P=32/50=60%
根据(7.8)式得:
50
%)
641%(64)1(96
.1%64--±=±
n
P P P
即 %)63.76%,37.51(%63.12%64=± 答:置信区间为(51.37%,76.63%)
(2)已知%80=π %10=E 96.12
=αZ
则有:621.0)
8.01(8.0*96.1)1(*2
2222≈-=E -=
ππαZ n 答:应抽取62户进行调查
7.19 根据下面的样本结果,计算总体标准差σ的90%的置信区间。
(1)21=x ,2=s ,50=n 。
(2)3.1=x ,02.0=s ,15=n 。
(3)167=x ,31=s ,22=n 。
解:已知%901=-α,95.02
1,05.02
%,
10=-
==α
α
α 1) 查表知67)1(22
=-n αχ,34)1(2
2
1=--n αχ
由公式
22
12
2
2
2
2
)1()1(α
α
χσχ--≤
≤-s n s n
得34
2*)150(672*)150(2
2-≤
≤-σ,解得(1.72,2.40) 2) 查表知6848.23)1(2
2=-n αχ,57063.6)1(22
1=--
n α
χ
由公式
22
12
2
2
2
2
)1()1(α
α
χ
σχ-
-≤
≤-s n s n
得57063
.602.0*)115(6848.2302.0*)115(2
2-≤
≤-σ,解得(0.015,0.029) 3) 查表知6705.32)1(2
2=-n αχ,5913.11)1(22
1=--
n α
χ
由公式
22
12
2
2
2
2
)1()1(α
α
χ
σχ-
-≤
≤-s n s n
得5913
.1131*)122(6705.3231*)122(2
2-≤
≤-σ,解得(24.85,41.73)
7.20 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。
为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取了10名顾客,他们在办理业务时所等待的时间(单位:min )见Book7.20。
(1) 构建第一种排队方式等待时间标准差的95%的置信区间。
(2) 构建第二种排队方式等待时间标准差的95%的置信区间。
(3) 根据(1)和(2)的结果,你认为哪种排队方式更好?
7.21 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:
来自总体1的样本
来自总体2的样本
141=n 72=n 2.531=x 4.432=x
8.9621=s
0.10222=s
(1) 求21μμ-的90%的置信区间。
(2) 求21μμ-的95%的置信区间。
(3) 求21μμ-的99%的置信区间。
7.22 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下
表:
来自总体1的样本
来自总体2的样本
251=x 232=x
1621=s
2022=s
(1) 设10021==n n ,求21μμ-95%的置信区间。
(2) 设1021==n n ,2
22
1σσ=,求21μμ-的95%的置信区间。
(3) 设1021==n n ,2
22
1σσ≠,求21μμ-的95%的置信区间。
(4) 设20,1021==n n ,2
22
1σσ=,求21μμ-的95%的置信区间。
(5) 设20,1021==n n ,2
22
1σσ≠,求21μμ-的95%的置信区间。
7.23 Book7.23是由4对观察值组成的随机样本。
(1) 计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。
(2) 设1μ和2μ分别为总体A 和总体B 的均值,构造21μμμ-=d 的95%的置信区间。
7.24 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信
心测试,得到的自信心测试分数见Book7.24。
构建两种方法平均自信心得分之差
21μμμ-=d 的95%的置信区间。
7.25 从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比例为%401=p ,来自总体2的样本比例为%302=p 。
(1) 构造21ππ-的90%的置信区间。
(2) 构造21ππ-的95%的置信区间。
7.26 生产工序的方差是工序质量的一个重要度量。
当方差较大时,需要对工序进
行改进以减小方差。
两部机器生产的袋茶重量(单位:g )的数据见Book7.26。
构造两个总体方差比2
22
1σ的95%的置信区间。
7.27 根据以往的生产数据,某种产品的废品率为2%。
如果要求95%的置信区间,若要求边际误差不超过4%,应抽取多大的样本?
解:已知P=2% E=4% 当置信区间1-α为95%时
2
αZ =
n
p p )1(-∆P n=
2
22
)
1(p
p p ∆
-⨯Z α
1-α=0.95 2
αZ =025.0Z =1.96
N=
222
)
1(p
p p ∆-⨯Z α=2
204.098
.002.096.1⨯⨯=47.06
答:所以应取样本数48。
7.28 某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本?
解:已知120=σ,20=E ,当05.0=a 时,96.12/05.0=z 。
应抽取的样本量为:13920120*96.1)(2
2
22222/≈==
E z n σα
7.29 假定两个总体的标准差分别为121=σ,152=σ,若要求误差范围不超过5,
相应的置信水平为95%,假定21n n =,估计两个总体均值之差21μμ-时所需的样本量为多大。
7.30 假定21n n =,边际误差05.0=E ,相应的置信水平为95%,估计两个总体比例之差为21ππ-时所需的样本量为多大。