北师大版数学必修3课时分层作业用样本估计总体
【高中教育】高中数学 第一章 统计 用样本估计总体学案 北师大版必修3.doc
用样本估计总体一、新情景引入:在西方国家还有这种观点:游泳比乘坐客车危险小的多,通过调查发现,实际上游泳死亡要比车祸要大的多,因为每个家庭的后院都有自己的游泳池。
孩子逆水死亡是经常的事情;在西方国家,每当飞机发生空难,乘客对飞机的安全系数产生怀疑时,常听到航空公司的有关人士辩解说:“乘坐飞机还是比乘坐火车安全的。
”理由是:飞机飞行10万公理死亡1人,而火车行驶5万公理就有1人死亡,你认为这个结论正确吗,能否给出合理的解释呢?二、要点精析1、用样本估计总体时,常用的统计图表有频率分布表、频率分布直方图、频率分布折线图和茎叶图。
2、列样本数据的频率分布表、频率分布直方图的步骤:(1)计算极差。
极差是样本数据的最大值与最小值的差。
(2)决定组距与组数。
组距选取据情况而定,越小越能反映总体分布。
(3)决定分点。
使分点与样本数据不重合,一般使分点比样本数据多一位小数,并且第一小组的起点比最小数据稍微减小一点,要保证每一个样本数据不重不漏。
(4)列频率分布表,累计频率等于1.(5)绘制频率分布直方图。
直方图中横轴表示样本数据,纵轴表示频率与组距的比值。
各小长方形的面积等于相应各组的频率,故所有长方形面积之和等于1.3、频率分布折线图,把频率分布直方图各个长方形上边的中点用线段连接起来得到频率分布折线图。
设样本容量不断增大,分组的组距不断缩小,则样本分布实际上越来越接近于总体分布,可用一条光滑的曲线来描绘,叫在总体密度曲线,它精确地反映了一个总体在各个区域那取值的规律。
4、茎叶图。
从频率分布直方图可清楚的看出数据分布的总体态势,但从其本身得不出原始的数据内容;茎叶图没有原始信息的损失,且方便记录和表示,但只适合两位数字的数据。
5、在实际生活中,我们往往更关注总体的某些数字特征,如平均数和标准差。
用样本平均数估计总体平均数,用样本标准差估计总体标准差。
6、记n 个样本数据n x x x ,,21的平均数为x ,方差为2s ,标准差为s ,则:(1)样本平均数nx x x x n ,,21=; (2)样本方差n x x x x x x s n 222212)()()(-++-+-= ; (3)样本标准差nx x x x x x s n 22221)()()(-++-+-= 注意:要熟练掌握用函数型计算器求样本平均数和标准差。
2020-2021学年北师大版数学必修3作业课件:1.5 第8课时 用样本估计总体
A.0.11
B.0.12
C.0.13
D.0.14
解析:依题意及频率分布直方图,知0.02+0.1+x+0.37+ 0.39=1,解得x=0.12.
5.从一群学生中抽取一个一定容量的样本对他们的学习成 绩进行分析,已知不超过70分的人数为8,其频率为0.4,则样本 容量是( A )
A.20 B.40 C.70 D.80
8.在抽查产品尺寸的过程中,将其尺寸分成若干组.[a,b)
是其中的一组,抽查出的个体在该组上的频率为m,该组在直方
图中的
h C.m
D.h+m
频率 解析:|a-b|为组距,在频率分布直方图中,纵轴为 组距 ,则
|a-b|=mh .
二、填空题(本大题共3小题,每小题5分,共15分) 9.一个容量为n的样本,分成若干组,已知某组的频数和频 率分别为50和0.25,则n= 200 .
解析:n=05.205=200.
10.某乡镇供电所为了调查农村居民用电量情况,随机抽取 了500户居民去年的用电量(单位:kW·h),将所得数据整理后,画 出频率分布直方图如图.直方图中从左到右前3个小矩形的面积 之比为1∶2∶3,该乡镇月均用电量在37~39(kW·h)的居民共有
125 户.
解析:设频率分布直方图中从左到右前3个小矩形的面积分 别为P,2P,3P.由频率分布直方图可知,最后两个小矩形的面积之和 为(0.087 5+0.037 5)×2=0.25.因为频率分布直方图中各小矩形的 面积之和为1,所以P+2P+3P=0.75,即P=0.125.则2P=0.25, 那么可知月均用电量在37~39(kW·h)的居民共有0.25×500= 125(户).
24 50
=
0.48.
数学高一(北师大)必修3素材 1.3例谈用样本估计总体的图与表
关注用样本估计总体的图与表统计图表是表达和分析数据的重要工具,它不仅可以帮助我们从数据中获得有用的信息,还可以帮助我们直观、准确地理解相应的结果.用样本估计总体的方法.在高中数学中主要有频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图、频率分布扇形图和频率分布条形图等.本文举例说明用样本估计总体的图、表及其应用.一、频率分布表和频率分布直方图1.频率分布表(1)列频率分布表的关键是决定组距、组 数.分组过少,数据就非常集中,分组过多,数据就非常分散,这就掩盖了分布的特征.一般来说,当样本容量在100以内时,一般应分5 ~12组;(2)各个小组的频数之和等于数据总和;(3)各个小组的频率之和等于1.2.从频率分布直方图中可以清楚地看出数据分布的总体态势,但把数据表示成直方图后,原有的具体数据就丢掉了.在频率分布直方图中,每个(1)小长方形的宽都相等,且等于组距;(2)小长方形的高=频数数据总数组距组距频率⨯⨯=1,即小长方形的高与该组频数成正比.(3)频率分布直方图中,各小长方形面积之和等于1.例1.某制造商生产长度为6 cm 的金属棒,抽样40根检查,测得每根长度(精确到两位小数)结果如下(单位:cm):6.02 6.01 5.94 5.94 5.97 5.96 5.98. 6.01 5.98 5.99 6.00 6.03 5.99 5.97 5.98 6.00 6.03 5.95 6.00 6.00 5.92 5.93 5.99 5.99 6.00 5.95 6.00 5.97 5.96 5.97 6.03 6.01 5.98 5.99 6.04 6.00 6.02 5.97 5.96 5.98(1)计算上述样本中金属棒的平均长度. (2)画出频率分布直方图.(3)如果允许制造商对这种棒与6 cm 的标准有0.2%的偏差,那么抽样检查中合格的金属棒有几根?合格率是多少?解:(1)金属棒平均长度为5.985 cm.(2)最大值6.04,最小值5.92,极差0.12,组距0.026,组数=1384026.012.0 ,分5组,频率分布表如下:频率分布直方图如下图所示.(3)∵允许与6 cm 有0.2%的偏差,即合格的金属棒长度在[5.988, 6.012]cm 之间,抽样中合格的有15根,合格率为4015=37.5% 点评:正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布指的是一个样本数据在各个小范围内所占的比例的大小.一般用频率分布直方图反映样本的频率分布.、二、频率分布折线图及其应用在频率分布直方图中,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义.如果样本容量越大,所分组数越多,图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小. 如果样本容量不断增大,分组的组距不断缩小,频率分布直方图越来越接近于总体的分布,用一条光滑的曲线来描绘,就得到了总体密度曲线.例2.甲、乙两人在相同条件下打靶 十次,每次打靶的成绩情况如图:(1)请填写下表:(2)从下列三个不同角度对这次测验结果进行分析: 从平均数和中位数相结合看,谁的成绩好些?从平均数和命中9环以上 的次数想结合看,谁的成绩好些? 从折线图两人射击命中环数的走势看,谁更有潜力?解析:(1)甲的数据为:2,4,6,7,7,8,8,9,9,10.所以甲的中位数为7.5,命中9环以上次数为3.乙的数据为:5,6,6,7,7,7,7,8,8,9.所以乙的平均数为7,乙的中位数为7,命中9环以上次数为1.(2)从平均数和中位数相结合看,甲成绩比乙稳定;从平均数和命中9环以上 的次数想结合看,甲成绩比乙好一些;从折线图两人射击命中环数的走势看,甲的潜力更大一些.三、用茎叶图表示样本数据,并进行有关数据分析茎叶图中左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据要重复记录,不能遗漏.茎叶图的优点:(1)所有的信息都可以从这个茎叶图中得到,(2)茎叶图便于记录和表示.茎叶图的缺点:茎叶图表示三位数以上的数据时不够方便.例3在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.812.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.213.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.分析:本题与前面的茎叶图相联系充分体现其优点.解:茎叶图如图所示:中位数为13.35.点评:中位数是将一组数据由小到大排列,位于中间的数.当数据有奇数个时,有一个中位数, 当数据有偶数个时,两个数的平均值是数据的中位数.茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征,如初中接触到的众数、中位数、平均数等,四、频率分布扇形图和频率分布条形图频率分布扇形图是用扇形的面积来表示某一部分数据在样本总体中所占的比例.频率分布条形图是样本频率分布表为不连续型变量的频率分布,它是用条形图的高度来表示频率分布情况.例4.英才学校的四个年级学生分布如扇形图,通过对全体学生暑假期间所读课外书情况的调查,制成各年级读书情况的条形图.已知英才学校被调查的四个年级共有学生1500人,则:(1)高一年级学生暑假期间共读课外书本;(2)暑假期间读课外书总量最少的是年级的学生,共读课外书本;(3)该校暑假期间四个年级人均读课外书 本.解析:初一年级学生暑假期间读课外书的人数是1500×28%=420,共读课外书420×5.6=2352(本).初二年级学生暑假期间读课外书的人数是1500×24%=360,共读课外书360×6.6=2376 (本).高二年级学生暑假期间读课外书的人数是1500×22%=330,共读课外书330×7.3=2409(本).所以高一年级学生暑假期间读课外书的人数是1500-420-360-330=390,共读课外书390×6.2=2418 (本).该校暑假期间四个年级人均读课外书为(2352+2376+2409+2418)÷1500= 6.37答案:(1)2418,(2)初一,2352.(3)6.37为了正确地用样本估计总体,用样本的图、表估计总体的分布,应当做好以下几点:1.牢固掌握概念之间、图表之间的区别和联系,及其在实际问题中的应用.2.能读懂频率分布表、频率分布直方图、频率分布折线图、总体密度曲线、茎叶图、频率分布扇形图和频率分布条形图等,会分析图表和处理数据,解决实际问题,注重能力培养,加大训练力度。
【北师大版】数学必修三:第1章-5-6用样本估计总体课时作业(含解析)
【成才之路】高中数学第1章 5-6用样本估计总体统计活动:结婚年龄的变化课时作业北师大版必修3一、选择题1.用样本频率估计总体分布的过程中,下列说法中正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确[答案] C[解析]估计实质上是通过研究总体中样本的性状,来判断总体性状.样本容量越大,就与总体越接近,估计也越精确.故选C.2.下列叙述中正确的是( )A.从频率分布表可以看出样本数据对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距[答案] C[解析]A中表示样本数据对于平均数波动大小的为方差与标准差;B中频数为落在各小组内数据的个数;D中组数是极差除以组距.3.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A.0.2 B.0.3C.0.4 D.0.5[答案] C[解析]数据落在[114.5,124.5)内的有:120,122,116,120,共4个,故所求频率为4 10=0.4,故选C.4.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45 C.0.55 D.0.65 [答案] B[解析]本题考查了频数的运算,由表可知样本数据落在[10,40)的频数为2+3+4=9,故频率为920=0.45.求频率要准确确定其频数及该样本的容量.5.对某校400名学生的体重(单位:kg)进行统计,得到如图所示的频率分布直方图,则学生体重在60kg以上的人数为( )A.200 B.100C.40 D.20[答案] B[解析]由频率分布直方图可知学生体重在60kg以上的频率为(0.04+0.01)×5=0.25,故学生体重在60kg以上的人数为400×0.25=100.6.已知样本:10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12.那么频率为0.2的范围是( )A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5[答案] D[解析]只要列出频率分布表,就可找到答案,频率分布表如下表.二、填空题7.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽样的100根中,有________根棉花纤维的长度小于20 mm.[答案] 30[解析] 本题主要考查频率分布直方图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力.由题意知,棉花纤维的长度小于20mm 的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20mm 的有0.3×100=30(根).8.将容量为n 的样本中的数据分成6组,绘制成频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________.[答案] 60[解析] 设第一组至第六组数据的频率分别为2x,3x,4x,6x,4x ,x ,则2x +3x +4x +6x +4x +x =1,解得x =120,所以前三组数据的频率分别是220,320,420,故前三组数据的频数之和等于2n 20+3n 20+4n20=27,解得n =60.三、解答题9.(2015·青岛检测)某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本总量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.[分析] 根据频率之和等于1可求出x 的值,同时运用公式频数相应的频率=样本容量,可求出样本容量及相应频数.[解析] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,且频率之和等于1,∴0.050×2+0.100×2+0.125×2+0.150×2+x ×2=1, ∴x =0.075.(2)样本中身高小于100厘米的频率为 (0.050+0.100)×2=0.3. ∴样本容量N =360.3=120.(3)样本中身高大于或等于98厘米并且小于104厘米的频率为(0.100+0.150+0.125)×2=0.75.∴学生数为120×0.75=90人.10.在某中学举行的信息知识竞赛中,将高二年级两个班的参赛学生成绩(得分均为整数)进行整理后分成五组,绘制出如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30、0.15、0.10、0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图. (2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)[解析] (1)因为各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30、0.15、0.10、0.05,所以第二小组的频率为1.00-(0.30+0.15+0.10+0.05)=0.40.因为第二小组的频率为0.40,所以落在59.5~69.5内的第二小组的小长方形的高=频率组距=0.4010=0.04,由此可补全频率分布直方图(如图阴影部分所示).(2)设高二年级两个班参赛的学生人数为x 人,因为第二小组的频数为40,频率为0.40,所以40x=0.40.解得x =100(人).所以高二年级两个班参赛的学生人数为100人.(3)高二年级两个班参赛学生的成绩的中位数应落在第二小组内.一、选择题1.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A. 3 C .3 D.85[答案] B[解析] ∵x -=20×5+10×4+30×3+30×2+10×1100=100+40+90+60+10100=3,∴s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]=1100×[20×22+10×12+30×02+30×12+10×22] =160100=85.∴s =2105,故选B.2.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则b 等于( )C .0.25 D.0.3[答案] A[解析] 样本容量n =100.05=200,∴m =20.又20200=a ,∴a =0.1. 则b =1-(0.05+0.15+0.2+0.4+0.1)=0.1. 二、填空题3.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.[答案] 600[解析] 由频率分布直方图易得,成绩低于60分的频率为0.002×10+0.006×10+0.012×10=0.2,故3 000名学生中成绩低于60分的学生数为:3 000×0.2=600(人).4.(2015·湖北文,14)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. [答案] 3 6 000[解析] 由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解之得a =3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6×10 000=6 000,故应填3;6 000.三、解答题5.“八·一”前夕,某中学举行国防知识竞赛,满分为100分,80分以上为优秀,现将高一的两个班参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)成绩的众数、中位数. (2)平均成绩.[解析] (1)由众数的概念可知,众数是出现次数最多的数,在直方图中高度最高的小长方形的中间值即为所求,所以众数为65.∵第一个小矩形的面积为0.03×10=0.3, 第二个小矩形的面积为0.04×10=0.4,∴第二个小矩形的中间线对应的成绩65分即为中位数. (2)取每个小矩形底边的中点值乘每个小矩形面积即为平均数. ∴平均数为55×0.3+65×0.4+75×0.15+85×0.10+95×0.05=67. 6.一名射击运动员射击8次所中环数如下: 9.9,10.3,9.8,10.1,10.4,10,9.8,9.7. (1)8次射击平均环数x -是多少?标准差是多少?(2)环数落在x --s 与x -+s 之间有几次?所占百分比是多少? (提示:0.55≈0.742,0.055≈0.235,0.44≈0.663)[解析] (1)x -=10+18(-0.1+0.3-0.2+0.1+0.4+0-0.2-0.3)=10(环),s 2=18[(9.9-10)2+(10.3-10)2+…+(9.7-10)2]=18[0.01+0.09+…+0.09]=18×0.44=0.055(环2),所以s =0.055≈0.235(环).(2)x --s =9.765,x -+s =10.235.所以环数落在x --s 与x -+s 之间的有5次,所占百分比为62.5%.7.(2015·新课标Ⅱ文,18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[解析] (1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区的用户的满意度等级为不满意的概率大.记C A表示事件“A地区的用户的满意度等级为不满意”;C B表示事件“B地区的用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.所以A地区的用户的满意度等级为不满意的概率大.。
北师大版高中数学必修三1.5用样本估计总体.docx
高中数学学习材料唐玲出品§5用样本估计总体[读教材·填要点]1.用样本估计总体的两种情况(1)用样本的分布估计总体的分布.(2)用样本的数字特征估计总体的数字特征.2.频率分布直方图在频率分布直方图中,纵轴表示f iΔx i,数据落在各小组内的频率用频率直方图的面积来表示,各小长方形的面积的总和等于1.3.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来接近于一条光滑曲线.[小问题·大思维]1.将数据的样本进行分组的目的是什么?提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.2.频率分布直方图中,每个小长方形的面积表示什么含义?提示:表示相应各组的频率.[研一题][例1]已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表.(2)画出频率分布直方图和频率分布折线图.(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少?[自主解答](1)计算极差:30-21=9.决定组距和组数:取组距为2.∵92=412,∴共分5组.决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组:20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.列出频率分布表如下:分组个数累计频数频率f i Δx i20.5~22.520.10.0522.5~24.530.150.07524.5~26.5正80.40.226.5~28.540.20.128.5~30.530.150.075合计2020 1.00(2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率分布折线图,如上图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.[悟一法]绘制频率分布直方图的具体步骤:(1)求极差:一组数据的最大值与最小值的差称为极差.(2)决定组距与组数:数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多,当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.(3)将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.(4)列频率分布表:计算各小组的频率,作出频率分布表.说明:制作好频率分布表以后,可利用各组的频率之和为1来检验该表是否正确.(5)画出频率分布直方图:依据频率分布表画出频率分布直方图.[通一类]1.下表给出了某校从500名12岁男孩中随机抽选出的120人的身高情况(单位:cm):身高范围[122,126)[126,130)[130,134)[134,138)[138,142) 人数58102233身高范围[142,146)[146,150)[150,154)[154,158)人数20116 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.解:(1)样本频率分布表如下所示:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计120 1.00(2)频率分布直方图如图所示.(3)由样本频率分布表可知,身高低于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以可以估计身高低于134 cm 的人数占总人数的19%.[研一题][例2] 某校开展了一次小制作评比活动,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图所示的频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答有关问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,则这两组哪组获奖率较高? [自主解答] (1)依题意知,第三组的频率为42+3+4+6+4+1=0.2,又因为第三组的频数为12, 故本次活动的参评作品有120.2=60件. (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18件.(3)第四组的获奖率是1018=59.因为第六组上交的作品数量为60×12+3+4+6+4+1=3,所以第六组的获奖率为23.而23>59,显然第六组的获奖率较高. [悟一法]频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.[通一类]2.(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72解析:样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.答案:B3.为提高公众对健康的自我管理能力和科学认识,某调查机构共调查了200人在一天中的睡眠时间.现将数据整理分组,如下表所示.由于操作不慎,表中A ,B ,C ,D 四处数据污损,统计员只记得A 处的数据比C 处的数据大4,由此可知B 处的数据为________.分组(睡眠时间)频数 频率 [4,5) 8 0.04 [5,6) 52 0.26 [6,7) A B [7,8) C D [8,9) 20 0.10 [9,10]40.02合计200 1解析:设A处的数据为x,则C处的数据为x-4,则x+x-4+8+52+20+4=200,解得x=60,则B处数据为60200=0.30.答案:0.30[研一题][例3]为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100只日光灯在必须换掉前的使用天数如下表:天数151~180181~210211~240241~270271~300301~330331~360361~390灯管数111182025167 2(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换合适?[自主解答](1)各组中值分别是165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可算得平均数约为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4≈268(天).(2)将各组中值对(1)问中的平均数求方差:1100×[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59.故标准差为 2 128.59≈46(天).答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天,故可在222到314天左右统一更换较合适.[悟一法]1.样本的标准差和方差描述了总体数据围绕平均数波动的大小程度,样本的标准差、方差越大,总体数据估计越分散;样本的标准差、方差越小,总体数据估计越集中.特别是当样本的标准差和方差都为0时,则表明总体数据估计没有波动,估计数据全相等.2.样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.[通一类]4.两台机床同时生产直径(单位:cm)为10的圆形截面零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:机床甲 10 9.8 10 10.2 机床乙10.1109.910如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?解:(1)先计算平均直径:x 甲=14×(10+9.8+10+10.2)=10,x 乙=14×(10.1+10+9.9+10)=10.由于x 甲=x 乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣. (2)再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02, s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005. s 2甲>s 2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.中小学生的视力状况受到全社会的广泛关注,某市有关部门从全市6万名高一新生中随机抽取了400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图,从左至右五个小组的频率之比依次是5∶7∶12∶10∶6.则全市高一新生视力在[3.95,4.25]范围内的学生约有多少人?[错解] 因为第五小组的频率是0.5, 所以第一小组的频率为0.5×56=512.所以全市6万名高一新生中视力在[3.95,4.25]范围内的学生约有60 000×512=25 000人.[错因] 错误原因在于对频率分布直方图理解不正确,图中标注的0.5并不是第五组的频率,0.5×0.3=0.15才是频率.[正解] 因为第五小组的频率是0.5×0.3=0.15, 所以第一小组的频率是0.15×56=0.125,∴全市6万名高一新生中视力在[3.95,4.25]范围内的学生约有60 000×0.125=7 500人.1.当收集到的数据量很大时,比较合适的统计图是( ) A .茎叶图 B .频率分布直方图 C .频率分布折线统计图D .频率分布表解析:当收集到的数据量很大时,一般用频率分布直方图表示. 答案:B2.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )A .hm B.m h C.h mD .h +m解析:频率组距=h ,故|a -b |=组距=频率h =m h .答案:B3.为了解一片经济林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图(如图所示),那么这100株树木中,底部周长小于110 cm 的树有( )A .80株B .70株C .60株D .50株解析:(0.01×10+0.02×10+0.04×10)×100=70(株). 答案:B4.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________.解析:∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1, ∴前三组频数为2+3+420·n =27,故n =60.答案:605.某社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人进行调查,则在[2 500,3 000)(单位:元)的月收入段应抽出________人.解析:100×(0.000 5×500)=25(人). 答案:256.如图所示,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下.观察图形,回答下列问题:(1)79.5至89.5这一组的频数、频率分别是多少? (2)估计这次环保知识竞赛的及格率(60分及以上为及格). 解:(1)频率为0.025×10=0.25,频数为60×0.25=15.(2)由频率分布直方图得(0.015+0.025+0.03+0.005)×10=0.75,所以及格率为75%.一、选择题1.下列说法不.正确的是( ) A .频率分布直方图中每个小矩形的高就是该组的频率 B .频率分布直方图中各个小矩形的面积之和等于1 C .频率分布直方图中各个小矩形的宽一样大D .频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的解析:频率分布直方图的每个小矩形的高=频率组距.答案:A2.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a ,样本数据落在[2,10)内的频率为b ,则a ,b 分别是( )A .32,0.4B .8,0.1C .32,0.1D .8,0.4解析:由于样本数据落在[6,10)内的频率为0.08×4=0.32,则a =100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b =0.08+0.32=0.4.答案:A3.将一个容量为50的样本数据分组后,组距与频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),3.则估计小于30的数据大约占总体的( ) A .94% B .6% C .92%D .12%解析:由样本的频率分布估计总体的分布.小于30.5的样本频数为3+8+9+11+10+6=47,所以其频率为4750=94%.小于27.5的样本频数为3+8+9+11+10=41,所以其频率为4150=82%.因此小于30的样本频率应在82%~94%之间,满足条件的只有92%.答案:C4.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则抽取的学生人数为( )A .46B .48C .50D .60解析:前3个小组的频率和为1-0.037 5×5-0.012 5×5=0.75.又因为前3个小组的频率之比为1∶2∶3,所以第2小组的频率为26×0.75=0.25.又知第2小组的频数为12,则120.25=48,即为所抽样本的人数.答案:B5.设矩形的长为a ,宽为b ,其比满足b :a =5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )A .甲批次的总体平均数与标准值更接近B .乙批次的总体平均数与标准值更接近C .两个批次总体平均数与标准值接近程度相同D .两个批次总体平均数与标准值接近程度不能确定 解析:x 甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613,∴x 甲与0.618更接近. 答案:A 二、填空题6.(2012·广东高考)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设x 1≤x 2≤x 3≤x 4,根据已知条件得到x 1+x 2+x 3+x 4=8,且x 2+x 3=4,所以x 1+x 4=4,又因为14[(x 1-2)2+(x 2-2)2+(x 3-2)2+(x 4-2)2]=1,所以(x 1-2)2+(x 2-2)2=2,又因为x 1,x 2,x 3,x 4是正整数,所以(x 1-2)2=(x 2-2)2=1,所以x 1=1,x 2=1,x 3=3,x 4=3.答案:1,1,3,37.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,2011年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.解析:(0.01×10+0.005×10)×28 800=4 320.答案:4 3208.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________,________.解析:由题意得原来数据的平均数是80+1.2=81.2,方差不变,仍是4.4.答案:81.2 4.4三、解答题9.有一个容量为50的样本,数据的分组及各组的频率如下:[25,30),3;[30,35),8;[35,40),9;[40,45),11;[45,50),10;[50,55),5;[55,60],4.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率分布折线图.解:(1)频率分布表如下:分组频数频率[25,30)30.06[30,35)80.16[35,40)90.18[40,45)110.22[45,50)100.20[50,55)50.10[55,60)40.08合计50 1.00(2)频率分布直方图、频率分布折线图如下图所示:10.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82848589798091897974 乙班:90768681848786828583(1)求两个样本的平均数;(2)求两个样本的方差和标准差;(3)试分析比较两个班的学习情况.解:(1)x甲=110(82+84+85+89+79+80+91+89+79+74)=83.2,x乙=110(90+76+86+81+84+87+86+82+85+83)=84.(2)s2甲=110[(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+(79-83.2)2+(80-83.2)2+(91-83.2)2+(89-83.2)2+(79-83.2)2+(74-83.2)2]=26.36,s2乙=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13.2,∴s甲=26.36≈5.13,s乙≈13.2≈3.63.(3)由于x甲<x乙,则甲班比乙班平均水平低.由于s甲>s乙,则甲班没有乙班稳定.∴乙班的总体学习情况比甲班好.。
高中数学 1.56 用样本估计总体课时作业 北师大版必修3
§5用样本估计总体§6统计活动:结婚年龄的变化课时目标1.通过实例体会分布的意义和作用,会作频率分布直方图和频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.3.体会样本估计总体的思想、初步了解频率分布的随机性.1.频率分布直方图中,数据落在各个区间内频率的大小,是该区间所对应的_______.2.当样本量较大时,样本中落在每个区间内样本数的频率会稳定于______________.3.我们可以用样本平均数和样本标准差,来分别估计______________________.一、选择题1.下列说法不正确的是( )A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形上端中点,直至右边所加区间的中点得到的组距[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2A.0.5 B.0.24 C.0.6 D.0.73.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有( )A.30辆 B.40辆C.60辆 D.80辆4.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:个):33,25,28,26,25,31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )A.900个 B.1 080个C.1 260个 D.1 800个5.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90 B.75题号1234 5答案6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.7.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是____________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54, 42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494 498 493 505 496 492 485 483 508 511495 494 483 485 511 493 505 488 501 491493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495 493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 496 501 510 496 487 511 501 496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升12.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?13.某市2010年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量答案 知识梳理1.频率直方图的面积 2.总体在相应区间内取值的概率 3.总体的平均数和标准差 作业设计 1.A 2.D3.B [时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C [样本的平均数为28,估计总共:45×28=1 260个.]5.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.100 0.15 8.45,46解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46. 9.m h 解析频率组距=h ,故|a -b|=组距=频率h =mh. 10.解分组 频数累计 频数频率 [41.5,45.5)2 0.045 5 [45.5,49.5)正 7 0.159 1 [49.5,53.5)正 8 0.181 8 [53.5,57.5)正正正 160.363 6 [57.5,61.5)正 5 0.113 6 [61.5,65.5)40.090 9[65.5,69.5]2 0.045 5合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:分组 个数累计频数频率累积频率[482.5,48 6.5) 正 8 0.080.08 [486.5,490.5) 3 0.030.11 [490.5,49 4.5) 正正正170.170.28 [494.5,498.5) 正正正正-21.210.49 [498.5,50 2.5) 正正 14.140.63 [502.5,50 6.5) 正 9 0.090.72 [506.5,510.5) 正正正190.190.91 [510.5,514.5) 正- 6 0.060.97 [514.5,518.5]3 0.031.00 合计1001.00(2)频率分布直方图与频率分布折线图如图.(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表,b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.12.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.13.解 (1)频率分布表:(2)频率分布直方图如图所示. (3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
高中数学北师大版必修三《1.5.2样本估计总体分布》课件
(5)作出频率散布直方图如下:
规律方法 (1)组数的决定方法是:设数据总数目为n,一般地, 当n≤50,则分为5~8组;当50≤n≤100时,则分为8~12组较 为合适. (2)分点数的决定方法是:若数据为整数,则分点数据减去0.5; 若数据是小数点后一位的数,则分点减去0.05,以此类推. (3)画频率散布直方图小长方形高的方法是:假设频数为1的小 长方形的高为h,则频数为k的小长方形高为kh.
频率折 线图
频数(频 率) 条形图
频率折线图的优点是它反应了数据的变化趋势.如果样 本容量不断增大,分组的组距不断缩小,那么折线图就 趋向于一条光滑曲线
频数(频率)条形图用其高表示各值的频数(频率),方便计 算机操作,和直方图一样给人明显的直观印象
题型一 频率散布直方图的画法及应用
某中学同年级40名男生的体重数据如下(单位:千克): 61 60 59 59 59 58 58 57 57 57 57 56 56 56 56 56 56 56 55 55 55 55 54 54 54 54 53 53 52 52 52 52 52 51 51 51 50 50 49 48 列出样本的频率散布表,画出频率散布直方图. [思路探索] 确定组距与组数是解决“样本中的个体取不同值较 多”这类问题的出发点.
(2)由(1)知,第 6 小组的频率是 0.14,又因为第 6 小组的频 数是 7,现设参加这次测试的男生有 x 人,根据频率定义, 得7x=0.14,即 x=50(人).
(1)将数据进行适当的分组,并画出相应的频率散布直方图和频率散 布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的散布情况.
[思路探索] 列频率分布表 → 画频率分布直方图 → 画频率分布折线图 → 对总体进行估计
高中数学北师大版必修3估计总体的分布课时作业Word版含答案
解析:分数大于或等于80的频率为1-0.05-0.15-0.35=0.45,故优秀的调查报告有0.45×60=27.
答案:D
6.已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,求时速在[60,70)的汽车大约有__________辆.
解析:时速在[60,70)的汽车的频率为0.04×10=0.4,故共有200×0.4=80辆.
8.对一批产品的长度(单位:毫米)进行抽样检测,右图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品,用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是__________.
A.0.001 B.0.1
C.0.03 D.0.3
解析:由图可知当新生婴儿体重在[2 700,3 000)内时,=0.001,而组距为300,所以频率为0.001×300=0.3,故选D.
答案:D
2.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()
A.B.
C.D.
解析:该组的频率为=.
答案:A
4.将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=__________.
解析:由题意得·n=27,即n=27,∴n=60.
答案:60
5.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图;由图中数据求身高在[120,130)内的学生人数.
高中数学北师大版必修3估计总体的数字特征课时作业Word版含答案
课时作业08估计总体的数字特征
(限时:10分钟)
1.某中学人数相等的甲、乙两班学生参加同一次数学测试,两班平均分和方差分别为22
答案:(1)0.32(2)36(3)0.08
(限时:30分钟)
.若样本1+x1,1+x2,1+x3,…,1+x n的平均数是10,方差为2,则对于样本2+,…,2+x n,下列结论正确的是()
若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估
计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);
设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计设甲校高三年级学生总人数为n . 由题意知30n
=0.05,解得n =600. 样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级这次联考数
学成绩的及格率为1-530=56
. 设甲、乙两校样本平均数分别为x ′1,x ′2.。
北师大必修三数学用样本估计整体第1课时ppt课件
一组的频数为( )
A.32
B.0.2
C.40
D.0.25
为深入学习习近平新时代中国特色社 会主义 思想和 党的十 九大精 神,贯彻 全国教 育大会 精神,充 分发挥 中小学 图书室 育人功 能
课堂小结:
频率分布直方图 读图
应用
画图
课后作业:
1.求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图
频率分布直方图如下:
频率 组距
0.50
0.40
0.5
0.44
0.30
0.20
0.3
0.28
0.10 0.16
0.08
0.12
0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
思考 :如果当地政府希望使 85% 以上的居民每月的用
水量不超出标准,根据频率分布表和频率分布直方图,
(1)从频率分布直方图可以清楚的 看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始的数 据内容,把数据表示成直方图后,原有 的具体数据信息就被抹掉了.
三、总体密度曲线 为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能
同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分
通过抽样,我们获得了100位居民某年 为深入学习习近平新时代中国特色社会主义思想和党的十九大精神,贯彻全国教育大会精神,充分发挥中小学图书室育人功能 的月平均用水量(单位:t) ,如下表:
北师大版高中数学必修三课件5.1估计总体的分布
3.02.92.42.41.91.31.41.80.72.0
2.52.82.32.31.81.31.31.60.92.3 2.62.72.42.11.71.41.21.50.52.4
2.52.62.32.11.61.01.01.70.82.4
2.82.52.22.01.51.01.21.80.62.2
如果希望大部分居民的日常生活不受影响,那么标准
ɑ定为多少比较合理?你认为为了较为合理地确定出 这个标准,需要做什么工作?
解析:由于城市住户较多,通常采用抽样调查的方
式,通过分析样本数据来估计全市居民用水量的分
布情况.假设通过抽样,我们获得了100位居民某年
的月均用水量(单位:t):
100位居民的月均用水量(单位:t)
用图中矩形的高度来反映频数.
我们也可以用区间上矩形的面积来反映频率,得到 下图.
f , 若每个小矩形的宽度为△xi(分组的宽度),高为小 Δx
i i
矩形的面积恰为相应的频率fi,通常我们称这样的 图形为频率分布直方图.
思考交流 观察此频率分布直方图,你能 知道: (1)头盖骨的宽度位于哪个 区间的数据最多? (2)头盖骨的宽度在140~ (1)140~145mm的最多 145mm的频率约是多少? (3)头盖骨的宽度小于 (2)0.434 140mm的频率约是多少? (3)0.283 (4)头盖骨的宽度在137~ (4)0.298 142mm的频率约是多少?
道这组数据的变动范围是4.3-0.2=4.1(t). 2.决定组距与组数(将数据分组). 组距:指每个小组的两个端点的距离.
组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组.
组数= 极差 4.1 8.2 组距 0.5
高中数学 1.5.1 用样本估计总体课后作业 北师大版必修
§5用样本估计总体5.1 估计总体的分布一、非标准1.在用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案:C2.已知样本:12,7,11,12,11,12,10,10,9,8,13,12,10,9,6,11,8,9,8,10,那么频率为0.25的样本所在的范围是( )A.[5.5,7.5)B.[7.5,9.5)C.[9.5,11.5)D.[11.5,13.5)解析:样本容量为20,其中样本数据落在范围[11.5,13.5)内的共有5个,其频率为=0.25.答案:D3.如图,有一频率分布直方图,图中x的值为( )A.0.4B.0.2C.0.04D.0.02解析:在频率分布直方图中,分组的宽度为1,于是有(0.1+0.15+2x+0.35)×1=1,解得x=0.2.答案:B4.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体位于该组上的频率为m,在频率分布直方图中,该组对应矩形的高为h,则|a-b|等于( )A.hmB.C. D.h+m解析:|a-b|即为分组的宽度,分组的宽度=.答案:B5.为了解某校男生体重情况,将样本数据整理后,画出其频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为12,则样本容量是( )A.32B.160C.45D.48解析:由已知得从左到右前3个小组的频率之和等于1-(0.0125+0.0375)×5=0.75,于是第3小组的频率为×0.75=0.375.若样本容量为n,则有=0.375,所以n=32.答案:A6.某班50名学生在一次健康体检中,身高全部介于155cm与185cm之间.其身高频率分布直方图如图所示,则在该班级中身高位于[170,185]之间的学生共有人.解析:身高在[170,185]之间的学生共有50-50×[(0.004+0.036+0.072)×5]=50-28=22(人).答案:227.已知在样本的频率分布直方图中,共有5个小长方形.若中间一个小长方形的面积是其余4个小长方形面积之和的,且中间一组的频数为10,则这个样本的容量是.解析:由已知得中间一个小长方形的面积是所有长方形面积的,即频率为,因此样本容量为=40.答案:408.某初一年级有500名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[130,140)内的学生中选取的人数应为.解析:如图所示,由频率分布直方图可得,频率之和为10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030,由此可得身高在[120,130),[130,140),[140,150]内的频率分别为10×0.030=0.3,10×0.020=0.2,10×0.010=0.1,由此可得此三组的人数分别为150,100,50,共300人,要从中抽取30人,则每一个个体被抽入样的概率为,其中身高在[130,140)内的学生中选取的人数为100×=10.答案:109.对某电子元件的寿命进行追踪调查,结果如下:寿命/h 个数100~2020200~3030300~4080400~5040500~6030(1)列出频率分布表;(2)作出频率分布直方图;(3)作出频率折线图.解:(1)频率分布表如下:数据分组(Δx i) 频数(n i)频率(f i)100~200 20 0.10200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1.00(2)由上表得频率分布直方图如图.(3)在上面的频率分布直方图中左右各加一个区间0~100,600~700,然后分别取0~100及600~700的中点以及各个矩形的顶端中点,再用线段依次连接起来,得到如图所示的频率折线图.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为=0.08.又频率=,所以,样本容量==150,即第二小组的频率为0.08,样本容量是150.(2)因为×100%=88%,即次数在110以上(含110次)的频率为88%,所以估计该学校全体高一学生的达标率是88%.。
北师大版必修3高中数学1.5、6用样本估计总体统计活动结婚年龄的变化课件
如下图所示,则新生婴儿体重(单位:g)在 [2700,3000)内的频率为( )
A.0.001 C.0.2
B.0.1
D.0.3 [答案] D [解析] 频率分布直方图中,各小矩形的面积 等于相应各组的频率.由频率分布直方图可 知,在区间[2700,3000)内取值的频率为 (3000-2700)×0.001=0.3.
已 知 一 个 样 本 : 30,29,26,24,25,27,26,22,24,25, 26,28,25,21,23,25,27,29,25,28. (1)列出样本的频率分布表; (2)画出频率分布直方图.
[思路分析]
由题目可获取以下主要信息: ①样本数据给出,容量为20; ②样本数据中,最大值是30,最小值是21, 解答本题可根据极差,选择适当的组距进行 分组,然后列表、画图即可.
fi 1 ________ ,所有小矩形的面积之和等于________ .
(3)在频率分布直方图中,按照分组的原则, 中点 再在左边和右边各加一个区间,从所加的左 边区间的________开始,用线段依次连接各 个矩形的顶端中点,直至右边所加区间的中 频率折线图 点,就得到一条折线,我们称之为 ________________. 概率 (4)当样本容量不断增大时,样本中落在每个 区间内的样本数的频率会越来越稳定于总体 在相应区间内取值的______.也就是说,一 般地,样本容量越大,用样本的频率分布去 减小 估计总体的分布就越准确. 光滑曲线 (5)随着样本容量的增大,所划分的区间数也
3.一个容量为80的样本最大值是140,最小
值是51,组距为10,则可以分成( A.10组 B.9组 C.8组 D.7组 [答案] B
[解析] 极差 140-51 = 10 =8.9,∴分为 9 组. 组距
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时分层作业(六)(建议用时:40分钟)一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的A[频率分布直方图的每个小矩形的高=频率组距.]2.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b 分别是()A.32,0.4B.8,0.1C.32,0.1 D.8,0.4A[数据落在[6,10)内的频率为0.08×4=0.32,则a=100×0.32=32.由于样本落在[2,6)内的频率为0.02×4=0.08,则样本落在[2,10)内的频率b=0.08+0.32=0.4.]3.有一个容量为200的样本,其频率分布直方图如图所示,据图估计,样本数据在[8,10)内的频数为()A .38B .57C .76D .95C [由题意可知样本数据在[8,10)之外的频率为(0.02+0.05+0.09+0.15)×2=0.62,所以样本数据在[8,10)内的频率为1-0.62=0.38.所以样本数据在[8,10)内的频数为0.38×200=76,选C.] 4.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的14,已知样本容量是80,则该组的频数为( )A .20B .16C .30D .35D [设该组的频数为x ,则其他组的频数之和为4x ,由样本容量是80,得x +4x =80,解得x =16,即该组的频数为16,故选B.]5.设矩形的长为a ,宽为b ,其比满足b ∶a =5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( )A .甲批次的总体平均数与标准值更接近B .乙批次的总体平均数与标准值更接近C .两个批次总体平均数与标准值接近程度相同D .两个批次总体平均数与标准值接近程度不能确定A [x 甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613. 所以x 甲与0.618更接近.]二、填空题6.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为18.5,则在26.5~28.5内的频数为________.1165[由题意知,极差为30-19=11;由于组距为2,则112=5.5不是整数,所以取6组;捐款数落在26.5~28.5内的有27,27,28,28,27共5个,因此频数为5.]7.已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,求时速在[60,70)的汽车大约有________辆.80[时速在[60,70)的汽车的频率为0.04×10=0.4,故共有200×0.4=80辆.] 8.一组数据中的每一个数据都减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________,________.81.2 4.4[由题意得原来数据的平均数是80+1.2=81.2,方差不变,仍是4.4.]三、解答题9.已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图.[解](1)计算极差:30-21=9;决定组距和组数,取组距为2;因为92=412,所以共分5组;决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组:20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.列出频率分布表如下表:分组频数频率20.5~22.520.122.5~24.530.1524.5~26.580.426.5~28.540.228.5~30.530.15合计20 1.00添加区间,取各小矩形上的顶端中点并用线段依次连接就构成了频率折线图.10.某校高一(1)班和(2)班各有男生30名,用随机抽样的方法从各班抽取10名男生,测得他们的身高分别为(单位:cm):高一(1)班:162,170,174,174,180,175,176,173,177,169;高一(2)班:168,183,175,178,182,160,174,166,165,179.(1)分别计算两班10个男生身高的中位数和极差;(2)如果要由一个班男生组成国旗班仪仗队,你建议由哪个班的男生组成,为什么?(注:组成国旗班仪仗队的男生的身高需相差不大)[解](1)高一(1)班10名男生身高的中位数为174+1742=174 (cm),极差为180-162=18(cm);高一(2)班10名男生身高的中位数为174+1752=174.5(cm),极差为183-160=23(cm).(2)高一(1)班10名男生身高的平均数为170+-8+0+4+4+10+5+6+3+7-110=173(cm),标准差为s=112+32+12+12+72+22+32+02+42+4210=22.6≈4.75(cm);高一(2)班10名男生身高的平均数为170+-2+13+5+8+12-10+4-4-5+910=173(cm),标准差为s=52+102+22+52+92+132+12+72+82+6210=55.4≈7.44(cm).由于高一(1)班和高一(2)班男生身高的平均数相同,而高一(1)班男生身高的标准差较小,即高一(1)班男生的身高相差不大,所以建议由高一(1)班的男生组成国旗班仪仗队.1.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n 个人中抽取50个人,则在[50,60)之间应抽取的人数为()A.10B.15C.25D.30B[支出在[50,60)的同学的频率为1-(0.01+0.024+0.036)×10=0.3,所以n=300.3=100.所以在[50,60)之间应抽取的人数为30×50100=15.]2.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B,则()A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s BB[由图像可知x A<x B,并且A的离散度大于B的离散度,故s A>s B.]3.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250)内的户数为____.(1)0.004 4(2)70[(1)50x=1-50×(0.001 2+0.002 4×2+0.003 6+0.006 0)=0.22,得x=0.004 4.(2)100×(0.0036+0.0060+0.0044)×50=70.]4.为了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生数为b,则a =________,b=________.0.2796[由频率分布直方图知组距为0.1,由前4组频数之和为40,后6组频数之和为87,知第4组频数为40+87-100=27,即4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.03-0.01=0.96,故视力在4.5到5.2之间的学生数b=0.96×100=96.]5.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?[解] (1)(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.。