2017年高中数学专题突破练3数据的数字特征用样本估计总体新人教A版必修320170727411
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题3 数据的数字特征 用样本估计总体
1.中心位置特征:众数、中位数、平均数. 2.标准差、方差
标准差是样本数据到平均数的一种平均距离,一般用s 表示. 其计算公式为
s =
1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2
].
3.样本数据x 1,x 2,…,x n 的标准差的算法
(1)算出样本数据的平均数x ;(2)算出每个样本数据与样本数据平均数的差:x i -x (i =1,2,…,n );(3)算出(2)中x i -x (i =1,2,…,n )的平方;(4)算出(3)中n 个平方数的平均数,即为样本方差;(5)算出(4)中平均数的算术平方根,即为样本标准差. 4.方差
从数学的角度考虑,人们有时用标准差的平方s 2
(即方差)来代替标准差,作为测量样本数据分散程度的工具:
s 2=1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2].
例1 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:
(1)完成频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?
变式训练1 在某次法律知识竞赛中,将来自不同学校的学生的成绩绘制成如图所示的频率分布直方图.已知成绩在60~70的学生有40人,则成绩在70~90的有______人.
例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是( )
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲<x乙;乙比甲成绩稳定
D.x甲<x乙;甲比乙成绩稳定
变式训练2 为选拔运动员参加比赛,测得7名选手的身高(单位:cm),其茎叶图分布为:
记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数字记为x,那么x 的值为( )
A.5 B.6 C.7 D.8
例3 甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸(单位:mm)分别为:
甲:10.2 10.1 10.9 8.9 9.9 10.3 9.7 10
9.9 10.1
乙:10.3 10.4 9.6 9.9 10.1 10 9.8 9.7
10.2 10
分别计算上面两个样本的平均数与标准差.如果图纸上的设计尺寸为10 mm,从计算结果看,用哪台机床加工这种零件较合适.
变式训练3 某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
求全班的平均成绩和标准差.
A级
1.现从80件产品中随机抽出10件进行质量检验,下面说法正确的是( )
A .80件产品是总体
B .10件产品是样本
C .样本容量是80
D .样本容量是10
2.期中考试以后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M ∶N 的值为( ) A.4041 B .1 C.41
40
D .2 3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3;根据样本的频率分布估计,大于或等于31.5的数据约占( ) A.211 B.13 C.12 D.23
4.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的1
4,且样本容量为160,则中间一组的频数为( )
A .32
B .0.2
C .40
D .0.25
5.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 6.若6个数的标准差为2,平均数为1,则此六数的平方和为________.
7.一组数据的方差为s 2
,将这组数据中的每个数据都扩大2倍,所得一组新数据的方差为________.
B 级
8.根据甲、乙两名篮球运动员某赛季9场比赛得分的茎叶图,可知( )
A.甲运动员的成绩好,乙运动员发挥稳定 B .乙运动员的成绩好,甲运动员发挥稳定 C .甲运动员的成绩好,且发挥更稳定 D .乙运动员的成绩好,且发挥更稳定
9.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5
小时的人数是( )
A.56 B.60 C.120 D.140
10.将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=______.
11.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两班的最高成绩分别是______,______.从图中看,________班的平均成绩较高.
12.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
13.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102,101,99,98,103,98,99;
乙:110,115,90,85,75,115,110.
(1)这种抽样方法是哪一种?
(2)将两组数据用茎叶图表示;
(3)将两组数据进行比较,说明哪个车间产品较稳定.
14.甲乙两位同学进行投篮比赛,每人玩5局.每局在指定线外投篮,若第一次不进,再投第二次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮次数.当6投不
进,该局也结束,记为“×”.当第一次投进得6分,第二次投进得5分,第三次投进得4分,依此类推.第6次不投进,得0分.两人投篮情况如下:
请通过计算,判断哪个投篮的水平高?
专题3 数据的数字特征 用样本估计总体
典型例题
例1 解 (1)频率分布表如下:
频率分布直方图如图所示.
(2)纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.3+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=59%. 变式训练1 25
解析 60~70的频率为0.04×10=0.4,设容量为x ,则40
x
=0.4,所以x =100,所以70~
90之间的人数为100×(0.015+0.01)×10=25.
例2 C [从茎叶图可知,甲五次成绩中一次茎为8,一次茎为9,而乙五次成绩中,茎8和茎9各两次,故可知x 甲<x 乙,乙比甲成绩稳定.]
变式训练2 D [由茎叶图可知10+11+0+3+x +8+9
7
=7,解得x =8.]
例 3 解 x -
甲=
1
10
(10.2+10.1+10.9+8.9+9.9+10.3+9.7+10+9.9+10.1)=10(mm).x -
乙=
1
10
(10.3+10.4+9.6+9.9+10.1+10+9.8+9.7+10.2+10)=10(mm).s 甲
=
110
(10.2-10)2+(10.1-10)2+…+(10.1-10)2 =0.228=0.477(mm).
s 乙=
110
(10.3-10)2+(10.4-10)2+…+(10-10)2 =0.06=0.245(mm).
∵x -
甲=x -
乙=10,s 甲>s 乙,∴乙比甲稳定,用乙较合适.
变式训练3 解 设第一组20名学生的成绩为x i (i =1,2,…,20),第二组20名学生的成绩为y i (i =1,2,…,20),依题意有:
x -
=120(x 1+x 2+…+x 20)=90,y -
=1
20
(y 1+y 2+…+y 20)=80,
故全班平均成绩为:
z -
=140
(x 1+x 2+…+x 20+y 1+y 2+…+y 20)
=1
40
(90×20+80×20)=85; 又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 2
1=120
(x 21+x 22+…
+x 220
-20x -
2
),
s 22
=120(y 21+y 22+…+y 2
20-20y -
2),
(此处,x -
=90,y -
=80),又设全班40名学生的标准差为s ,平均成绩为x -
(x -
=85),
故有s 2
=140
(x 21+x 22+…+x 220+y 21+y 22+…+y 220-40z -
2
)
=140
(20s 21+20s 22+20x -2+20y -2-40z -
2) =12(62+42+902+802-2×852
)=51. 所以s =51. 强化提高
1.D [本题考查的对象是80件产品的质量,故总体是80件产品的质量;个体是1件产品的质量;样本是所抽取的10件产品的质量,故样本容量是10.故选D.] 2.B [∵N =40M +M
41
=M ,∴M ∶N =1.]
3.B [根据所给的数据的分组和各组的频数知道,大于或等于31.5的数据有[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3,可以得到共有12+7+3=22,∵本组数据共有
66个,
∴大于或等于31.5的数据约占2266=1
3
,故选B.]
4.A [频率等于长方形的面积,所有长方形的面积和等于1,设中间长方形的面积等于S ,则S =14(1-S ),S =15,设中间一组的频数为x ,则x 160=1
5,得x =32.]
5.0.1
解析 x -
=4.7+4.8+5.1+5.4+5.55=5.1,则方差s 2=15
[(4.7-5.1)2+(4.8-5.1)2
+(5.1
-5.1)2+(5.4-5.1)2+(5.5-5.1)2
]=0.1. 6.30 解析 由s = 16
[(x 1-x -)2+(x 2-x -)2+…+(x 6-x -
)2] =
16
(x 21+x 22+…+x 26)-x -
2
, 即2=
16
(x 21+x 22+…+x 2
6)-1, 得x 2
1+x 2
2+…+x 6
2=30. 7.4s 2
解析 根据题意可得,因为方差公式
s 2
=(x 1-x -
)2
+(x 2-x -
)2
+…+(x n -x -
)2
n
,
所以,s 2
=(2x 1-2x -
)2
+(2x 2-2x -
)2
+…+(2x n -2x -
)2
n
=4s 2.
8.C [由茎叶图可知,甲运动员的得分大部分集中在14~18分之间,而乙运动员的得分相对比较散且在低分区的较多,故甲篮球运动员比赛得分更稳定,甲运动员的成绩好.] 9.D [设所求人数为N ,则N =2.5×(0.16+0.08+0.04)×200=140,故选D.] 10.60
解析 由已知,得2+3+42+3+4+6+4+1×n =27,即920×n =27,解得n =60.
11.96 92 乙
解析 由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在(60,80)内,乙班的成绩集中在(70,90)内,故乙班的平均成绩较高. 12.1,1,3,3
解析 假设这组数据按从小到大的顺序排列为x 1,x 2,x 3,x 4,
则⎩⎪⎨⎪⎧x 1
+x 2
+x 3
+x
4
4
=2,x 2
+x 3
2=2,
∴⎩
⎪⎨⎪⎧x 1+x 4=4,x 2+x 3=4, 又s =
14
×[(x 1-2)2+(x 2-2)2+…+(x 4-2)2
] =12(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2 =122[(x 1-2)2+(x 2-2)2
]=1, ∴(x 1-2)2
+(x 2-2)2
=2, 同理可求得(x 3-2)2
+(x 4-2)2
=2,
由x 1,x 2,x 3,x 4均为正整数,且(x 1,x 2),(x 3,x 4)均为圆(x -2)2
+(y -2)2
=2上的点, 分析知x 1,x 2,x 3,x 4应为1,1,3,3.
13.解 (1)根据系统抽样的定义可知,每隔30分钟抽取一包产品,抽取的时间间隔相同,满足系统抽样的定义, ∴这种抽样方法是系统抽样. (2)将两组数据用茎叶图表示如图:
(3)甲的平均数为1
7(102+101+99+98+103+98+99)=100.
乙的平均数为1
7
(110+115+90+85+75+115+110)=100.
由茎叶图中的数据可知甲的成绩主要集中在90和100附近,乙的成绩比较分散,∴甲比乙稳定.
14.解 依题意,甲乙得分情况如下表:
因为甲得分平均数=2.6,乙得分平均数=2.6,甲得分的标准差≈1.96,乙得分的标准差≈2.24,所以,甲得分平均数=乙得分平均数,甲得分的标准差<乙得分的标准差,故甲投篮的水平高.
11。