2019_2020学年高中数学第一章统计1.5用样本估计总体1.6统计活动结婚年龄的变化学案北师大版必修3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.5 用样本估计总体 1.6 统计活动 结婚年龄的变化
[航向标·学习目标]
1.通过实例体会频率分布的意义和作用,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图,体会它们各自的特点.
2.会用样本的频率分布估计总体的分布,用样本的基本数字特征,估计总体的数字特征. 3.体会统计的作用和基本思想,形成对数据处理过程进行初步评价的意识,激发学生的兴趣.
[读教材·自主学习]
1.频率分布直方图:图中每个小矩形的宽度为□
01Δx i (分组的宽度),高为□02f i Δx i
,小矩形的面积恰为相应的□
03频率f i ,通常我们称这样的图形为频率分布直方图. 2.频率折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的□
04中点开始,用线段依次连接各个矩形的顶端□05中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
3.样本平均数:假设通过随机抽样得到的样本为x 1,x 2,…,x n ,我们把□06x -=
x 1+x 2+…+x n
n
称为样本平均数,用样本平均数来估计总体的平均数.
4.样本标准差:假设通过随机抽样得到的样本为x 1,x 2,…,x n . 我们把□
07s =s 2
=(x 1-x -)2+(x 2-x -)2+…+(x n -x -)
2
n
称为样本标准差.
用样本标准差来估计总体的标准差.
[看名师·疑难剖析]
1.频率分布表和频率分布直方图的特征
(1)频率分布表中的数字和频率分布直方图的形状都与分组数(组距)有关;频率分布直方图的外观还和坐标系单位长度有关.分组数的变化可引起频率分布表和频率分布直方图的结构变化;坐标系的单位长度的变化只能引起频率分布直方图的形状沿坐标轴方向的拉伸变化.
(2)随机性:频率分布表和频率分布直方图由样本决定,因此会随着样本的改变而改变. (3)规律性:根据频率趋近于概率的原理若固定分组数,随着样本容量的增加,频率分布表中的各个频率会稳定于总体中任一个体分布在相应分组的概率,从而频率分布直方图中的各个矩形的高度也会稳定在特定的值(即相应的概率除以组间距)上.
(4)在频率分布直方图中,每个小矩形的面积等于相应数据组的频率,小矩形的高等于数据组的频率除以组距.
2.频率分布表、频率分布直方图的优点
(1)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容.
(2)频率折线图的优点是它反映了数据的变化趋势.如果样本容量不断增加,分组的组距不断缩小,那么折线图就趋向于总体分布趋势的图形.
考点一频率分布表、频率分布直方图及折线图
例1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2001年的小布什,共43任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,4 2,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
[分析] 由本题可获得以下主要信息:
①本题给出了样本数据;②本题要列表画图.
解答本题可先列出频率分布表,再按步骤作出频率分布直方图及折线图.
[解] (1)以4为组距,列表如下:
年龄分组频数频率频率组距
[41.5,45.5)20.04650.0116 [45.5,49.5)60.13950.0349 [49.5,53.5)80.18600.0465 [53.5,57.5)160.37210.0930 [57.5,61.5)50.11630.0291 [61.5,65.5)40.09300.0233 [65.5,69.5]20.04650.0116
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
类题通法
在列频率分布表时,先求极差(即最大值-最小值)再分组,注意分组不能太多也不能太少,要牢固掌握列频率分布表及画频率分布直方图、频率分布折线图的步骤与方法.
[变式训练1]为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组数如下:
[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;
[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;
[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.
(1)列出频率分布表;
(2)画出频率分布直方图以及频率分布折线图;
(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是多大?
解(1)画出频率分布表.
分组频数频率
[10.75,10.85)30.03
[10.85,10.95)90.09
[10.95,11.05)130.13
[11.05,11.15)160.16
[11.15,11.25)260.26
[11.25,11.35)200.20
[11.35,11.45)70.07
[11.45,11.55) 4 0.04 [11.55,11.65]
2 0.02 合计
100
1.00
(2)画频率分布直方图与频率分布折线图,如下图所示.
(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,
即数据落在[10.95,11.35)范围内的可能性是75%. 考点二 样本平均数与标准差的计算
例2 一个水库养了某种鱼10万条,从中捕捞了20条,称得它们的质量如下(单位:千克):
1.15,1.04,1.11,1.07,1.10,1.32,1.25,1.19,1.15,1.21,1.18,1.14,1.09,1.25,1.21,1.29,1.16,1.24,1.12,1.16.
计算样本平均数,并根据结果估计水库里的所有鱼的总质量.
[分析] 利用样本均值公式x -=1
n
(x 1+x 2+…+x n ),由鱼的平均质量与水库中鱼的总数量
便可求得总质量.
[解] x -=1
20[1.15+1.04+1.11+1.07+1.10+1.32+1.25+1.19+1.15+1.21+
1.18+1.14+1.09+1.25+1.21+1.29+1.16+1.24+1.12+1.16]=1
20
×23.43=1.1715(千克).
水库中鱼的总质量约为1.1715×100000=117150(千克).
答:样本平均数为1.1715千克,估计水库里的所有鱼的总质量为117150千克. 类题通法
样本均值又称样本平均数,也称为样本的算术平均数,公式为x -=1
n
(x 1+x 2+…+x n ),本
例是计算样本平均数的简单应用,很明显是用部分反映整体的一个例子.
[变式训练2] 一名射击运动员射击8次所中环数如下: 9.9,10.3,9.8,10.1,10.4,10,9.8,9.7.
(1)8次射击平均环数x -
是多少?标准差是多少?
(2)环数落在x --s 与x -
+s 之间的有几次?所占百分比是多少? 分析 只有正确地利用平均数公式求出x -
,才能正确地求出标准差. 解 (1)x -
=10+18
(-0.1+0.3-0.2+0.1+0.4+0-0.2-0.3)=10(环),
s 2=18[(9.9-10)2+(10.3-10)2+…+(9.7-10)2]=18[0.01+0.09+…+0.09]=
18
×0.44=0.055(环2
),所以s =0.055≈0.235(环).
(2)x --s =9.765,x -
+s =10.235.
所以环数落在x --s 与x -
+s 之间的有5次,所占百分比为62.5%. 考点三 用样本数字特征估计总体数字特征
例3 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下.
(1)试估计这种日光灯的平均使用寿命和标准差; (2)若定期更换,可选择多长时间统一更换合适?
[分析] 总体的平均数与标准差往往很难求,甚至是不可求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差.只要样本的代表性好,这种做法是合理的.
[解] (1)各组中值分别为165,195,225,255,285,315,345,375,
由此,算得平均数约为1
100
(165×1+195×11+225×18+255×20+285×25+315×16+
345×7+375×2)=267.9≈268(天).
将各组中值对于此平均数求方差, 得
1100
×[1×(165-268)2+11×(195-268)2+18×(225-268)2+20×(255-268)2
+25×(285-268)2
+16×(315-268)2
+7×(345-268)2
+2×(375-268)2
]≈2128.6(天2
),
故标准差约为2128.6≈46(天).
估计这种日光灯的平均使用寿命约为268天,标准差约为46天. (2)由(1)可知,可在222天到314天内的某一天统一更换较合适. 类题通法
(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
(2)平均数和标准差是工业生产中监测产品质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离.应该进行检查,找出原因,从而及时解决问题.
[变式训练3] 某农户在承包的荒山上共种植了44棵樱桃树,2018年采摘时,先随意采摘5棵树上的樱桃,称得每棵树上的樱桃重量为(单位:千克)35,35,34,39,37.
(1)根据以上数据估计该农户2018年樱桃的产量;
(2)已知该农户的44棵樱桃树在2016年共收获樱桃1100千克,若近几年的产量的年增长率相同.依照(1)中所估计的2018年的产量,预计2019年该农户可收获樱桃多少千克.
分析 (1)首先应计算样本平均数,然后用样本平均数去估计总体平均数,从而计算出总产量.(2)由2016年的产量,设每年的增长率为x ,则可列出2018的产量,从而求出增长率,最后由增长率可估计出2019年的产量.
解 (1)从44棵樱桃树中抽取5棵,每棵的平均产量为: x -
=x 1+x 2+x 3+x 4+x 55
=35+35+34+39+375
=35+1
5
(0+0-1+4+2)=36(千克).
所以估计2018年的总产量为:36×44=1584(千克).
(2)设2016年到2018年中,樱桃产量的年增长率为x ,根据题意,得1100(1+x )2
=1584,即(1+x )2
=1.44,解这个方程得x 1=0.2,x 2=-2.2(舍去).根据每年的增长率相同,则预计2019年的产量为:1584(1+x )=1584×1.2=1900.8(千克).
答:(1)估计该农户2018年樱桃的产量是1584千克.(2)预计2019年该农户可收获樱桃
1900.8千克.
[例] (12分)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:
(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?
(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? (一)精妙思路点拨
(二)分层规范细解
(1)依题意知第三组的频率为 42+3+4+6+4+1①
=15.2分
又∵第三组的频数为12,
∴本次活动的参评作品数为12 1
5
=
60
②.4分
(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,
共有60×
6
2+3+4+6+4+1
①=18(件).8分
(3)第四组的获奖率是
10
18
=
5
9
.
第六组上交的作品数量为
60×
1
2+3+4+6+4+1
①=3(件),11分
∴第六组的获奖率为
2
3
=
6
9
,显然第六组的获奖率高.12分
(三)来自一线的报告
通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②见分层规范细解过程)
(四)类题练笔掌握
某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个
小矩形的面积之比为1∶2∶3,试估计:
(1)该乡镇月均用电量在39.5~43.5内的居民所占百分比约是多少? (2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)
解 (1)设直方图从左到右前3个小矩形的面积分别为P,2P,3P .由直方图可知,最后两个小矩形的面积之和为(0.0875+0.0375)×2=0.25.
因为直方图中各小矩形的面积之和为1,所以P +2P +3P =1-0.25,即P =0.125, 所以3P +0.0875×2=0.55.
由此估计,该乡镇居民月均用电量在39.5~43.5内的居民所占百分比约是55%. (2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P -2P =0.5-0.375=0.125.
设样本数据的中位数为39.5+x ,正中间一个矩形的面积为3P =0.375, 所以x ∶2=0.125∶0.375, 即x =2
3≈0.67.
从而39.5+x ≈40.17,
由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h). (五)解题设问
(1)频率分布直方图中,小矩形的面积的含义是什么?________.
(2)根据中位数的含义,过样本数据中位线对应的点,作横轴的垂线,此垂线应在什么位置?________.
答案 (1)对应组的频率 (2)直方图面积的平分线处
1.在频率分布直方图中,各个长方形的面积表示( ) A .落在相应各组的数据的频数 B .相应各组数据的频率 C .该样本所分成的组数 D .该样本的样本容量 答案 B
解析 在频率分布直方图中,横轴是组距,纵轴是频率
组距
,故每个小长方形的面积是相应各组数据的频率.故选B.
2.用样本中的频率分布来估计总体情况时,下列说法中正确的是( ) A .样本容量的大小与估计准确与否无关 B .估计准确与否只与总体容量的大小有关 C .样本容量越大,估计结果越准确 D .估计结果准确与否仅与样本分组数有关 答案 C
解析 一般来说,样本容量越大,估计准确度越高,而与分组数无关. 3.有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3.根据样本的频率分布估计,大于或等于31.5的数据约占( )
A.
211 B.13 C.12 D.23
答案 B
解析 由题意知,样本容量为66,而落在[31.5,43.5)内样本数为12+7+3=22,故所求概率为2266=1
3
.
4.容量为100的样本的频率分布直方图如下图,试根据图形中的数据填空.
(1)样本数据落在范围[6,10)内的频率为________;
(2)样本数据落在范围[10,14)内的频数为________.答案(1)0.32 (2)36
解析频率=频率
组距
×组距,频数=频率×样本容量.故样本数据落在[6,10)内的频率为
0.08×4=0.32,数据落在[10,14)内的频数为0.09×4×100=36.
5.有一个容量为50的样本,数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5],4.
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计,数据落在[15.5,24.5)内的可能性约是多少?
解(1)频率分布表如下表:
分组频数频率
[12.5,15.5)30.06
[15.5,18.5)80.16
[18.5,21.5)90.18
[21.5,24.5)110.22
[24.5,27.5)100.20
[27.5,30.5)50.10
[30.5,33.5]40.08
合计50 1.00
(2)频率分布直方图如下图所示.
(3)数据落在[15.5,24.5)内的频率为8+9+1150=28
50=0.56,所以数据落在[15.5,24.5)内
的可能性约是56%.。