统计学期末复习资料_计算题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

五、计算题(要求写出公式、列出计算步骤) 1. 某产品资料如下:
要求按以下三种方法计算产品的平均收购价格:
(1) 不加权的平均数;(2)加权算术平均数;(3)调和平均数 解:不加权05.13
9
.005.12.1=++=x (元/斤)
加权02.14000
300020004000
9.0300005.120002.1=++⨯+⨯+⨯=
=
∑∑f
xf x (元/斤)
加权调和02.19
.0360005.131502.1240036000315024001=++++==
∑∑m x
m x (元/斤)
2. 某公司所属三个企业生产同种产品,2004年实际产量、计划完成情况及产品优质品率资料如下:
要求计算:
(1)该公司产量计划完成百分比; (2)该公司的实际优质品率。

解:1)以实际产值为m,完成计划百分比为x,该公司产量计划完成百分比:
%
95.9320
.532500
8
.02501.11502.1100250150100==
++++=
=∑∑x m m x
2)以实际优质品率为x,以实际产量为f,该公司的实际优质品率:
%
8.96500
484
25015010098.025096.015095.0100==++⨯+⨯+⨯=
=
∑∑f
xf
x
3. 某企业有50名工人,其月产值(万元)如下:
要求:
(1)根据上述资料将50名工人按产值分7组编制组距为10万元的等组距数列;(2)按上述分组编制向上累计的累计频数和累计频率数列;
(3)并以第三组为例说明累计频数和累计频率的含义。

解:
(1)根据上述资料将50名工人按产值分7组编制组距为10万元的等组距数列;
(2)按上述分组编制向上累计的累计频数和累计频率数列;
(3)并以第三组为例说明累计频数和累计频率的含义。

第三组数据说明在50名工人中,月产值在105以下的有30人,占总数的60%
4. 南宁化工厂2008年现有生产工人600人。

现用不重复抽样抽出40人调查其年产值(万元)如下:
(1)将40个工人按产值分组,编制组距为10万元的等组距数列,并列出向上累计频数和累计频率。

(2)计算算术平均数、中位数和众数,说明工人总产值的分布特征。

解: (1)
(2)算术平均数x=∑xf/∑f=110+260+525+850+855+525+345/40=3470/40=86.75 中位数:
202
f
f =∑∑
=40为偶数,
,对应的产值分组为80~90。

-1180, 13, 10, 10
2013
2
801087
10
m m m e m
L S f i f
S M L i f -====--=+
⋅=+⋅=∑
众数:
-11-1-1180, 7, 10, 9, 10-10-7
801087.5
(-)(-)(10-7)(10-9)
m m m m m o m m m m L f f f i f f M L i f f f f ++======+
⨯=+⨯=++ e o x M M <<,工人总产值的分布为左偏分布。

5. 有甲乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为9.6件,乙组工人日产量资料如下:
(1)计算乙组平均每个工人的日产量和标准差;
(2)比较甲、乙两生产小组哪个组的日产量差异程度大? 解:(1)
(件)
乙50291002950100
13
45343538251515f
xf X .==
⨯+⨯+⨯+⨯=
=
∑∑
()(件)
乙9981008075
f
f
x x 2
.==
-=σ∑∑
(2)
267.0366
.9==
=
X
V σ

305.05.29986
.8==
=
X
V σ

因为0.305>0.267,
故乙组工人的日产量差异程度更大。

6. 某班分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩75,•标准差为11.5,乙小组成绩资料如下:
要求:(1)计算乙小组平均成绩: (2)比较两个小组平均成绩的代表性。

解:各组组中值分别为:55,65,75,85,95
16
.734
194025104
9519407525651055=++++⨯+⨯+⨯+⨯+⨯=
=
∑∑f
xf
x
93.94
194025104)16.7395(1)16.7385(40)16.7375(25)16.7365(10)16.7355()
(222222
=++++⨯-+-⨯-+⨯-+⨯-+⨯-=
-=
∑∑f
f
x x σ


乙甲V V x V x V σσσσσσ
>=====
=%57.1316.7393.9%33.15755
.11
因此乙小组的成绩更具有代表性。

7. 某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%。

25岁以下青年在小学、初中、高中以上文化程度各组中的比例分别为20%,50%,70%。

从该厂随机抽取一名职工,发现其年龄不到25岁,问他具有小学、初中、高中以上文化程度的概率各为多少?
解:设职工文化程度小学为事件A ,职工文化程度初中事件B ,职工文化程度高中为事件C ,职工年龄25岁以下为事件D 。

P (A )=0.1, P(B)=0.5,P (C )=0.4 P(D ︱A)=0.2,P (D ︱B )=0.5,P (D ︱C )=0.7
()()
2()55
()()()()()()
P A P D A P A D P A P D A P B P D B P C P D C =
=
++ 同理()()
()()()()()()()
P B P D B P B D P A P D A P B P D B P C P D C =
++= 5/11
()()
()()()()()()()
P C P D C P C D P A P D A P B P D B P C P D C =++=28/55
8. 设X ~N(5,32),求以下概率 (1) P(X ≤10) ; (2) P(2<X <10) 解: (1) X Z μ
σ
-=
5105(10)3
35 1.67(1.67)0.9525
3X P X P X P Φ--⎛⎫≤=≤ ⎪
⎝⎭-⎛⎫=≤== ⎪⎝⎭
255105(210)3
3351 1.673(1.67)(1)0.7938
X P X P X P ΦΦ---⎛⎫
<<=<< ⎪
⎝⎭-⎛⎫
=-<< ⎪
⎝⎭
=--=
9. 虽然航班时刻和费用是商务旅行者在选择航班时的重要考虑因素,但《今日美国》的一项调查发现,商务旅行者把航空公司的常旅客优惠计划列为重要因素。

在一个n=1993名商务旅行者的样本中,有618人把常客优惠计划作为首要因素。

(1)总体中认为常客优惠是首要因素的商务旅行者所占比例的点估计是多少?(百分号上取整数)
(2)建立总体比例的95%置信区间估计。

(百分号上取整数) 解:(1)点估计为样本比例p=618/1993=31%
(2)np=1993×0.31=618>5,n(1-p)= 1993×(1-0.31)=1375>5,总体是大样本 比例P 的抽样分布服从正态分布。

α=0.05,查表得1/2
0.975 1.96Z
Z α-==
12
0.310.310.02[0.29,0.33]
p Z α-±=±=±=,总体比例的95%置信区间为[29%,33%]
10. 某地区对居民用于某类消费品的年支出数额进行了一次抽样调查。

抽取了400户居民,调查得到的平均每户支出数额为350元,标准差为47元,支出额在600元以上的只有40户。

试以95%的置信度估计:(1)平均每户支出额的区间;(2)支出额在600元以上的户数所占比例的区间。

解:
(1)n=400,为大样本,x标准化后的分布服从标准正态分布。

350,47,1-95%0.05,
x sα
====查表得
1/21.96
Z
α
-
=
1
2
350 1.96
350 4.606
[345.494,354.606]
x Z
α
-
±⋅=±⨯

=
平均每户支出额的区间345.494354.606
(2))n=400,p = 40/400 =10% ,np=400×0.1=40>5,n(1-p)= 40×(1-0.1)=360>5,总体是大样本,比例P的抽样分布服从正态分布。

0.05
α=,查表得
2
0.975
1
1.96
Z Z
α
-
==,
根据公式得:
1
2
10% 1.96
10% 2.94%
[7.06%,12.94%]
p Z
α
-
±=±⨯

=
95%置信水平下,支出额在600元以上的户数所占比例的区间总为7.06%~12.94%。

11. 某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。

采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%?
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设允许误差Δ=0.08)
解:(1) n=50,p = 32/50 =64% ,np=50×0.64=32>5,n(1-p)= 50×(1-0.64)=18>5,总体是大样本,比例P的抽样分布服从正态分布。

0.05
α=,查表得
2
0.975
1
1.96
Z Z
α
-
==,
根据公式得:
12
64% 1.9664%13.3%
[50.7%,77.3%]
p Z
α-
±⋅
=±⨯=±=
95%置信水平下总体中赞成该项改革的户数比例的置信区间为50.7%~77.3%。

(2)P=80%,20.9751 1.96Z Z α-==,Δ=0.08
()()()
2
2
12
2
2
1 1.96
0.80.2
96.04970.08p p n α-Z -⨯⨯=
==≈∆
应抽取97户进行调查。

12.为了检验某英语辅导班的效果,从某学校随机抽取50名学生参加该辅导班,在辅导班开始前和结束后分别进行一次难度相当的综合考试。

令X 为参加辅导班之后与参加辅导班前英语成绩的差,且服从正态分布,其样本均值为 2.95,标准差为5.8,试在0.05α=的显著性水平下,检验该辅导班是否有效果。

解:根据题意提出假设,0100H H μμ≤>:,: n=50,为大样本,检验统计量Z 服从正态分布。

0.05α=,查表得10.95 1.65Z
Z α
-==
单侧检验统计量为:13.55 1.65X Z Z α-=
=
=>=
所以,拒绝原假设,即说明该辅导班有效。

13.南京财经大学经济学院调查所属两个专业三年级学生每天参加晨练情况。

调查结果如下:甲专业调查了60人,18人参加晨练。

乙专业调查了40人,13人参加晨练。

根据以上调查结果能否就认为甲乙两个专业参加晨练的人数比例一样?(0.05α=)
解:(1)提出假设:01011000H H ππππ-=-≠:,:
(2)检验统计量
p p z --=
(3)计算临界值:
211220.9751n 60,p 18/600.3,n 40,p 13/400.325,0.05,Z Z 1.96α-======α===查表得
(4)计算检验统计量值:
0.30.3250
0.264
p p z --=
--=
=-
(5)决策:
21Z 0.264Z 1.96α-=〈= ,接受H 0。

即没有证据表明甲乙两专业
参加晨练的人数比例不一样。

14. 某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。

已知灯泡使用寿命服从正态分布,标准差为200小时。

在总体中随机抽取100只灯泡,测得样本均值为960小时。

请问: (1)若显著性水平为0.05,批发商是否应该购买这批灯泡? (2)若显著性水平为0.01,批发商是否应该购买这批灯泡? 解:一、(1)提出假设:0110001000H H μμ≥<
:,: (2)检验统计量X Z =
(3)计算临界值:10.950.05,Z Z 1.645-αα===查表得
(4)计算检验统计量值:
960,200, n=100, 2X X Z μσ-===
=
=-
(5)决策:12 1.645Z Z α-=-=-< - ,拒绝H 0 二、10.990.01,Z Z 2.33-αα===查表得 12 2.33Z Z α-=-=-< -,不能拒绝H 0
15. 一种原料来自三个不同的地区,原料质量被分成三个不同等级。

从这批原料中随机抽取500件进行检验,结果如下表所示,
a.要求检验各个地区和原料质量之间是否存在依赖关系?(0.05α=)
b.分别计算ϕ相关系数,C 系数,V 相关系数,并分析相关程度?。

一级 二级 三级 合计 甲地区 52 64 24 140 乙地区 60 59 52 171 丙地区 50 65 74 189 合计
162
188
150
500
解:a.(1)提出假设:
0H :地区和原料等级之间是独立的(不存在依赖关系)
1H :地区和原料等级之间不独立 (存在依赖关系) (2)计算期望值,检验统计量:
22
0(), e e e
f f RT CT RT CT f n n n n f χ-⨯=⨯⨯==∑
2
2
0()19.82e e
f f f χ-==∑
(3)计算临界值:
2χ的自由度为(R-1)×(C-1)=(3-1)×(3-1)=4
α=0.05,查表知:2
0.05(4)9.488χ=
(4)决策:
219.82χ=>2
0.05
(4)9.488χ=,故拒绝H 0,接受H 1 ,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响。

b.
0.1990.1950.141
C V ϕ=
=
=====
=
=
结论:三个系数均不高,表明产地和原料等级之间的相关程度不高。

相关文档
最新文档