高三数学-5.总体分布的估计 精品
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.总体分布的估计
学习指导
本节主要学习总体分布的估计,频率分布及总体特征数的估计.本节要求: 1.了解总体的分布、总体分布的估计———样本频率分布的概念及意义. 2.能根据样本数据画出频率分布表与频率分布直方图,并据此估计总体分布。
3.会计算样本均值与样本方差(标准差),并用它们分别估计总体期望与方差(标准差). 一、例题
1.(1)某厂生产的产品可分为一等品、二等品、等外品三类.设
ξ
=1产品是一等品2产品是二等品3产品是等外品
⎧⎪⎨⎪⎩
,
抽查检验的记录为一等品96个,二等品195个,等外品9个、估计产品中的一等品率、二等品率、等外品率,并画出频率分布条形图.
(2)如果已知产品的一等品率、二等品率、等外品率分别是32%,65%,3%.设η的定义与ξ相同,求η的概率分布及其条形图,将这个图形与频率分布条形图进行比较。
解:(1)一等品率的估计
196ˆ(1)32%
300
p
P ξ====;二等品率的估计
2195ˆ(2)65%
300
p
P ξ====;等外品率的估计39ˆ(3)3%
300
p
P ξ===
=;频率分布
条形图如右。
(2)η的分布列为:
η的概率分布条形图与(1)中的图形相同。
2.为了解某地儿童生长发育情况,抽查了100
名 3岁女童的身高(cm ),已按数据的大小排列如下:
84.4 84.5 85.2 85.7 86.2 86.4 86.9 87.1 87.3 87.6 87.9 88.2 88.4 88.4 88.5 88.7 89.0 89.0 89.1 89.2 89.3 89.3 89.4 89.8 90.0 90.l 90.2 90.3 90.4 90.6 90.7 90.8 91.1 91.1 91.1 91.4 91.7 91.7 91.7 91.8 91.9 92.1 92.5 92.5 92.7 92.7 92.8 92.8 92.9 92.9 93.0 93.1 93.2 93.2 93.4 93.5 93.6 93.6 93.6 93.8 93.9 94.0 94.3 94.3 94.4 94.4 94.4 94.5 94.6 94.7 94.8 94.9 95.0 95.1 95.1 95.1 95.5 95.6 95.6 96.0 96.2 96.3 96.4 96.5 96.8 97.0 97.2 97.3 97.3 97.9 98.3 98.4 98.7 99.2 99.3 99.4 99.5 100.7 100.9 101.5
(l )列出样本数据的频率分布表;(2)画出频率分布直方图;(3)利用频率直方图,估计身高在第4第5两个组的概率;(4)估计身高不小于90cm
%x
65
332
1
的概率;(5)利用频率分布表估计身高的平均值.
解:(1)样本数据的极差(最大值与最小值之差)为R=101.5-84.4=17.1,将组距定为2,第1小组起点取为84,则组数为8,样本的频率分布表为
(2)频率分布直方图见上图. (3)身高在第4第5两个小组内的概率的估计为其频率为0.17+0.20=0.37. (4)身高不小于90cm 的频率为第3至第9组内的频率之和0.76,即身高不小于 90cm 概率的估计值为0.76. (5)身高的均值的估计为1(8548771013)
100
x
=
⨯+⨯+
+⨯=92.86.
3.某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上,每隔 1小时抽一包产品,称其重量是否合格,分别记录.抽查数据如下: 甲车间:118,101,99,98,118、98,99 乙车间:110,118,94,95,118,89,98
问:(1)这种抽样是何种抽样方法?(2)估计甲、乙两车间包装重量的均值与方差,并说哪个均值的代表性好?哪个车间包装重量较稳定? 解:(1)根据系统抽样方法的定义可知这是系统抽样方法. (2)先计算甲
1(10210199)100
7
x =
++
+=,乙
1(11010598)100
7
x =
+++=;
2
2
2
甲1[(102100)(99100)] 3.42867s =-++-=,
22
2
2
甲
乙1[(110100)(98100)]56
7
s s =
-+
+-=
这说明甲车间包装重量比乙车间稳定,甲车间的均值100的代表强. 二、练习题
1.在频率分布直方围中,各个小长方形的面积表示(B )
(A )落在相应各组的数据的频数 (B )相应各组的频率 (C )该样本所分成的组数 (D )该样本的样本容量 提示:由直方图的概念知应选(B ). 2.可用于总体数学期望μ的估计是(A ) (A )样本均值11n
i
i x x n
==
∑
(B )样本极差R=max (x 1,…,x n )-min (x 1,…,x n )
(C )样本方差2
2
1
()
n
i i s
x x ==
-∑
(D )样本平均差1
1||n
i i A D
x x n
==
-∑
提示:后三个选项都表示了样本的波动程度,不能用于总体数学期望的估计. 3.以下可以描述总体稳定性的统计量是(C )
(A )样本均值x (B )样本中位数(C )样本方差s 2(D )样本最大值S (n ) 提示:选项(A ),(B )从不同角度描述了数据的集中位置,(D )不能表示样本的波动程度.
4.在已分组的数据中,每组的频数是指 落入该组的数据的个数 ,每组的频率是 指落入该组数据个数与数据总数的比值 。
5.某电视栏目收视情况的调查结果为:抽查100户,有30户收看此栏目,则此栏目的收视率的估计是 30% 。
提示:收视情况的总体服从参数为p (收视率)的0—1分布,数学期望为p ,用样本均值x 估计它.
6
x = 0.5(分钟) ,病人等待时间标准差的估计值s = 5.34(分钟) 。
提示:x =1(2.547.5822.51)
20
⨯+⨯+
+⨯=9.5(分钟);
s 2=
2
2
2
1[(2.59.5)4(7.59.5)8(22.59.5)]28.5
20
-⨯+-⨯++-=, ∴ s =5.34
(分钟).
7.假定下述数据是甲、乙百个供货商的交货天数。
甲:10,9,10,10,11,11,9,11,10,10;乙:8,10,14,7,10,11,10,8,15,12.估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性.
解:甲
110
x =
(10+9+……+10)=10.1,乙
110
x =
(8+10+……+12)=10.5,
2
甲110
s =
(118+92+……+118)-10.12=0.49,
2
乙110
s =
(82+118+……+122)-
10.52=6.18
从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此是较具一致性与可靠性的厂商.
8.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数
分布估计该校毕业生起始月薪低于2000元的概率;(4)估计起始月薪的数学期望.
解(1)样本的频率分布表为
(2)频率分布直方图如右图: (3)起始月薪低于2000元频率为 0.18+0.11+……+0.18=0.94,故起始月薪低于 2000元的概率的估计是0.94. (4)起始月新的数学期望的估计是1(13.5714.51120.56)
100
x
=
⨯+⨯+
+⨯=
16.48(百元). 三、思考题
试证:(1)(x 1-x )+(x 2-x )+……+(x n -x )=0; (2) 对于任意实数c ,s 2≤s c 2,这里s 2
=2
1
1
()
n
i i x x n
=-∑
, s c 2
=2
1
1
()
n
i i x c n
=-∑
证(1)(x 1-x )+(x 2-x )+……+(x n -x )=(x 1+x 2+……+x n )-n x =0
(2)s c 2
=2
1
1
()
n
i i x c n
=-∑
=2
22
111
1
()[()2()()()]
n
n
i i
i i x x x c x x x x x c x c n
n
==-+-=
-+--+-∑
∑
=
2
2
1
1
1[()2()()()]n
n i i i i x x x c x x n x c n
==-+--+-∑∑
=s 2
+0+(x -c )2≥s 2
. 四、备用题
1.设一组数据的方差是s 2,将这组数据的每个数据都乘以10,所得到的一组新数据的方差是(D )
(A ) 0.1s 2 (B )s 2 (C )10s 2 (D )100s 2 提示:设原数据组为x 1,x 2,……,x n ,方差为S 2
=2
1
1
()
n
i i x c n
=-∑
,
x
=1
1
n
i
i x n
=∑
,
新数据组为10x 1,10x 2,……,10x n ,
方差2
2
11(10)
n
i i s x a ==-∑
,其中a =1
1
1010n
i
i x x
n
==∑.
故2
2
2
2
1
1
1
1
1
(1010)100()100n
n
i i
i i s x x x
x s
n
n
===
-=
-=∑∑.
2.为了检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50升,化验
升水中平均含有大肠杆菌 1 个/升,估计全部消毒过的自来水中平均每升水的大肠杆菌的含量为 1 个.
3.将n 个数x 1,x 2,……,x n 分成两组,第1组数为x 1,x 2,……,x k ,第2组数为x k +1,x k +2,……,x n ,两组数据的均值与方差分别记为x 1,x 2与s 12,s 22.试用x 1,x 2与s 12,s 22表示n 个数据的均值x 与方差s 2.
解:x =121[()]k x n k x n
+-,
s 2=2
2
2
121211[()()()]
k x n k s k n k x x n
n
+-+
--.。