北师大版数学高一必修3优化练习1.5用样本估计总体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§5 用样本估计总体
5.1 估计总体的分布
5分钟训练 (预习类训练,可用于课前)
1.在用样本频率估计总体分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
答案:C
2.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的范围为( )
A.5.5—7.5
B.7.5—9.5
C.9.5—11.5
D.11.5—13.5
答案:D
解析:只要列出频率分布表,依次对照就可以找到答案,频率分布表如下:
分组 频数 频率
5.5—7.5 2 0.1
7.5—9.5 6 0.3
9.5—11.5 8 0.4
11.5—13.5 4 0.2
合计 20 1.0
从表中可以看出频率为0.2的范围是11.5—13.5.
3.(2007山东潍坊一模,理15)某地教育部门为了了解学生在数学答卷中的有关信息,从上次考试的10 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如下图).则这10 000人中数学成绩在[140,150]段的约是___________人.
答案:800
解析:频率=0.008×10=0.08,
∴约有10 000×0.08=800人.
10分钟训练 (强化类训练,可用于课中)
1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )
A.36%
B.72%
C.90%
D.25%
答案:C
解析:用样本估计总体时,用样本的合格率代替总体的合格率.而样本合格率为40
36×100%=90%. 2.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在(2 700,3 000)的频
率为( )
A.0.001
B.0.1
C.0.2
D.0.3
答案:D
解析:由图可知组距
频率=0.001,∴频率=0.001×300=0.3. 3.一个容量为20的样本数据,分组后组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50], 5;(50,60],4;(60,70],2.则样本在区间(-∞,50]上的频率是( )
A.5%
B.25%
C.50%
D.70%
答案:D
解析:样本在(-100,50]上的频数为2+3+4+5=14,故在(-100,50]上的频率为14÷20=70%.
4.(2007天津高考,文11)从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:
分组 [90,100) [100,110) [110,120) [120,130) [130,140) [140,150) 频数
1 2 3 10 3 1 则这堆苹果中,质量不小于120克的苹果数约占苹果总数的___________%.
答案:70
解析:本题主要考查统计知识,质量不小于120克的频数为14,所以频率为
2014=70%. 5.一个容量为100的样本,数据的分组和各组的一些相关信息如下:
分组 频数
频率 [12,15) 6
[15,18)
0.08 [18,21)
[21,24) 21
[24,27)
0.18 [27,30) 16
[30,33)
0.10 [33,36) 5
合计 100
1.00 (1)完成上表中每一行的空格;
(2)画出频率分布直方图;
(3)根据频率分布直方图,总体中小于21的样本数据大约占多大的百分比?
解:(1)补全后的表格为:
分组 频数
频率 [12,15) 6
0.06
[15,18) 8 0.08
[18,21) 16 0.16
[21,24) 21 0.21
[24,27) 18 0.18
[27,30) 16 0.16
[30,33) 10 0.10
[33,36) 5 0.05
合计100 1.00
(2)频率分布直方图为:
(3)由频率分布直方图中可以看出,总体中小于21的样本数据大约占30%.
30分钟训练(巩固类训练,可用于课后)
1.在频率分布直方图中,各个小长方形的面积表示()
A.落在相应各组的数据的频数
B.相应各组的频率
C.该样本所分成的组数
D.该样本的样本容量
答案:B
解析:由直方图的概念知:频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.
2.一个容量为35的样本数据,分组后,组距与频数如下:[5,10)5个;[10,15)12个;[15,20)7个;[20,25)5个;[25,30)4个;[30,35)2个.则样本在区间[20,+∞)上的频率为()
A.20%
B.69%
C.31%
D.27%
答案:C
解析:
352
4
5+
+
=0.3143,∴选C.
3.一个容量为32的样本,已知某组样本的频率为0.125,则该样本的频数为()
A.2
B.4
C.6
D.8
答案:B
4.(2007山东高考,8)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y 分别为()
A.0.9,35
B.0.9,45
C.0.1,35
D.0.1,45
答案:A
解析:由直方图知x=0.34+0.36+0.18+0.02=0.9,即x=0.9.
50
y =0.36+0.34=0.7,∴y=35.故选A. 5.有一个容量为50的样本数据分组,各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.根据频率分布,估计小于30的数据的频率可能是( )
A.80%
B.95%
C.97%
D.90%
答案:D
解析:根据所给数据可知小于30的数据个数为3+8+9+11+10=41,而在[27.5,30.5)之间的为6个,如果[27.5,30.5)之内没有小于30的,则小于30的频率为
5041=82%,如果[27.5,30.5)之内的数据全部小于30,则小于30的数据个数为47,频率为50
47=94%,所以,估计小于30的数据频率应在82%到94%之间,可以判断可能的频率结果应该为D 项.
6.容量为100的样本数据,按从小到大的顺序分为8组,但是记录时不小心把第3组数据和第8组数据的部分信息丢失,记录如下:
组号 1 2 3 4 5 6 7 8 频数 10 13 14 15 13 12 频率 0.10 0.13 0.14 0.15 0.13 0.12 0.09 则根据上表可知,第3组的频率是____________,第8组的频数是____________.
答案:0.14 9
解析:根据第8组的频数0.09可计算出第8组的频数是9,根据总的频率之和为1,可以得出第3组的频率是1-0.10-0.13-0.14-0.15-0.13-0.12-0.09=0.14.
7.(2006全国高考卷Ⅱ,16)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出____________人.
答案:25
解析:在[2 500,3 000)月收入段应抽出=0005.020004.00003.00002.00001.00005.0⨯++++ ×100=25(人).
8.有一容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15)7,[-15,-10)11,[-10,-5)15,[-5,0)40,[0,5)49,[5,10)41,[10,15)20,[15,20)17.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和折线图;
(3)求样本数据不足0的频率.
解:(1)频率分布表如下:
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.200
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.100
[15,20) 17 0.085
合计 200 1.000
(2)频率分布直方图和折线图如下:
(3)样本数据不足0的频率为:0.035+0.055+0.075+0.200=0.365.
5.2 估计总体的数字特征
5分钟训练 (预习类训练,可用于课前)
1.在统计中,样本的标准差可以近似地反映( )
A.平均状态
B.波动大小
C.分布规律
D.最大值和最小值
答案:B
解析:由定义知,数据的标准差反映数据的波动大小.
2.下列数字特征一定是数据组中数据的是( )
A.众数
B.中位数
C.标准差
D.平均数
答案:A
解析:根据各数字特征的意义可知唯有众数一定是原数据中的数.
3.下列叙述不正确的是( ) A.样本均值可以近似地描述总体的平均水平
B.极差描述了一个样本数据变化的幅度
C.样本标准差描述了一组样本数据围绕样本均值波动的大小
D.一个班级的数学成绩的方差越大说明成绩越稳定
答案:D
解析:方差越大,说明成绩越不稳定,所以D 项错.
4.(2006湖南高考,文12)某高校有甲、乙两个数学建模兴趣班,其中甲班40人,乙班50人,现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是___________分.
答案:85
解析:由题意知,所求平均成绩为:50
4081509040+⨯+⨯=85分. 10分钟训练 (强化类训练,可用于课中)
1.与总体单位不一致的是( )
A.s 2
B.s
C.x
D.三个都不一致 答案:A
解析:方差的单位是原始数据单位的平方,所以与总体单位不一致.
2.有一个数据为50的样本,数据分组以及各组的频数如下,[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,3
3.5),
4.估计小于30的数据大约占( )
A.10%
B.92%
C.5%
D.30%
答案:B
解析:样本容量为50,小于30的约有:3+8+9+11+10+5=46,所以,频率≈50
46=0.92=92%. 3.一组观察值为4、3、5、6出现的次数分别为3、2、4、2,则样本均值为( )
A.4.55
B.4.5
C.12.5
D.1.64
答案:A
解析:11
50242326452334=+++⨯+⨯+⨯+⨯=x ≈4.55. 4.设有n 个样本数据x 1、x 2、…、x n ,其标准差为s x ,另有n 个样本数据y 1、y 2、…、y n ,且y k =3x k +5(k=1,2,…,n),其中标准差为s y ,则下列关系正确的是( )
A.s y =3s x +5
B.s y =3s x
C.s y =x s 3
D.s y =x s 3+5
答案:B
解析:设x 1、x 2、…、x n 的平均数为x ,y 1、y 2、y 3、…、y n 的平均数为y ,则y =n
n x x x n x x x n y y y n n n 5)(3535353212121++++=++++++=+++ =3x +5
∴s y 2=[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2]÷n =n
x x x x x x n ])()()[(922221-++-+- =9s x 2
∴s y =3s x .
5.在一次数据测量中,计算出18个数据的样本均值为50,但是后来发现其中一个数据是86被误记为68,那么这18个数据的正确的样本均值应该是____________.
答案:51
解析:根据条件易知,实际18个数据的总和应该是:50×18+(86-68)=918,根据平均数的计算方法可得这组数据实际的均值应该是18
918=51. 6.在某次考试中,要对甲、乙两同学的学习成绩进行比较,甲同学的平均分甲x =76,方差2甲s =4,乙同学的平均分乙x =77,方差2乙s =10,则___________同学平均成绩好,___________同学各科发展均衡.
答案:乙 甲
解析:∵甲乙x x >,s 2甲<s 2乙, ∴乙甲s s <.
∴乙同学平均成绩好,甲同学各科发展均衡.
7.从一批棉花中抽取9根棉花的纤维,长度如下:(单位:mm)
82,202,352,321,25,293,86,206,115.
求样本均值、样本方差和样本标准差.
解:样本均值91=
x (82+202+352+321+25+293+86+206+115)=186.9(mm) 样本方差s 2≈9
1[(82-186.9)2+(202-186.9)2+…+(115-186.9)2]≈12 184.1. 样本标准差s=2s =110.4
30分钟训练 (巩固类训练,可用于课后)
1.已知样本12、7、11、12、11、12、10、10、9、8、13、12、10、9、6、11、8、9、8、10,那么频率为0.25的样本的范围是( )
A.[5.5,7.5)
B.[7.5,9.5)
C.[9.5,11.5)
D.[11.5,13.5)
答案:D
解析:样本容量为20,发生在[11.5,13.5)的频数为5,∴频率为20
5=0.25. 2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高1.50 m,由此可推断我国13岁男孩的平均身高为( )
A.1.54 m
B.1.55 m
C.1.56 m
D.1.57 m
答案:C
解析:2003005.12006.1300+⨯+⨯=x =1.56. 3.甲、乙两人在相同条件下,各射击10次,命中环数如下:
甲:8 6 9 5 10 7 4 8 9 5
乙:7 6 7 8 6 9 6 8 7 7
根据上述数据估计两人的技术稳定性,结论是( )
A.甲优于乙
B.乙优于甲
C.两人相同
D.无法比较
答案:B
解析:10
59847105968+++++++++=甲x =7.1. 10
7786968767+++++++++=乙x =7.1.
又∵s 2乙<s 2甲,乙甲x x =,∴乙优于甲.
4.从总体中抽取的样本数据有m 个a ,n 个b ,p 个c ,则总体的平均数μ的估计值为( )
A.3c b a ++
B.3p n m ++
C.3
pc nb ma ++ D.p n m pc nb ma ++++ 答案:D
解析:样本均值p
n m pc nb ma x ++++=,把它作为总体均值的估计. 5.(2006重庆高考,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁—18岁的男生体重(kg),得到频率分布直方图如下图:根据图可得这100名学生中体重在[56.5,64.5)的学生人数是( )
A.20
B.30
C.40
D.50
答案:C
解析:由组距
频率×组距=频率,即(0.03+0.05+0.05+0.07)×2=0.4为体重在[56.5,64.5)的频率.又频率=样本容量
频数,∴人数为100×0.4=40. 6.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2.那么样本甲和样本乙的波动大小情况是( )
A.甲、乙的波动大小一样
B.甲的波动比乙的波动大
C.乙的波动比甲的波动大
D.甲、乙的波动大小无法比较
答案:C
解析:平均数:51=
甲x (5+4+3+2+1)=3,51=乙x (4+0+2+1-2)=1, 方差为s 2甲=
51[(5-3)2+(4-3)2+…+(1-3)2]=2, s 2乙=5
1[(4-1)2+(0-1)2+…+(-2-1)2]=4, ∴s 2甲<s 2乙.
7.一个样本方差是S 2=10
1[(x 1-15)2+(x 2-15)2+…+(x 10-15)2],则这个样本均值x =___________,样本容量是___________.
答案:15 10
8.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.20,则a 1,a 2,…,a 20,x 这21个数据的方差约为___________.
答案:0.19
解析:由题意得:
20
1[(a 1-x )2+(a 2-x )2+…+(a 20-x )2]=0.20, ∴(a 1-x )2+(a 2-x )2+…+(a 20-x )2=4,且a 1+a 2+…+a 20=20x , ∴x x x x a a a =+=++++21
20212021 ,即a 1,a 2,…,a 20,x 这21个数据的平均数也是x . ∴这21个数据的方差是s 2=21
4])(4[2112=-+x x ≈0.19. 9.甲、乙两台机床同时加工直径100毫米的零件,为了检验产品质量,从产品中各随机抽出6件进行测量,测得数据如下(单位:毫米):
甲:99,100,98,100,100,103;
乙:99,100,102,99,100,100.
(1)分别计算上述两组数据的平均数和方差;
(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求.
解:(1)61100+
=甲x (-1+0-2+0+0+3)=100;6
1100+=乙x (-1+0+2-1+0+0)=100. s 2甲=61[(-1)2+02+(-2)2+02+02+32]=37,s 2乙=61[(-1)2+02+22+(-1)2+02+02]=1. (2)由(1)知,x 甲=x 乙,s 2甲>s 2乙,∴乙机床加工的这种零件更符合要求.
10.假定下述数据是甲、乙两个供货商的交货天数.
甲:10,9,10,10,11,11,9,11,10,10;
乙:8,10,14,7,10,11,10,8,15,12.
估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性. 解:甲x =10
1(10+9+…+10)=10.1,
乙x =
10
1(8+10+…+12)=10.5, s 2甲=10
1[(10-10.1)2+(9-10.1)2+…+(10-10.1)2]=0.49, s 2乙=101[(8-10.5)2+(10-10.5)2+…+(12-10.5)2]=6.05. 从交货天数的平均值来看,甲供货商的供货天数短一些;从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商.。