用样本的频率分布表和频率分布图估计总体分布
用样本的频率分布估计总体分布(VI)
收集样本数据
按照抽样计划进行数据收集,确保数据的真 实性和完整性。
数据整理
对收集到的数据进行整理,包括核对、筛选、 分类等,确保数据的质量。
数据的分组与频数统计
数据分组
根据研究目的和数据的特征,将数据分成若干组,以 便进行频数统计。
频数统计
对每组数据进行频数统计,计算每个组内的数据个数。
绘制频数分布表
03
估计总体分布
估计总体均值
计算样本均值
根据样本数据,计算所有数值的平均值,得到样本均值。
估计总体均值
将样本均值作为总体均值的估计值,即用样本均值来估计总体均 值。
误差分析
分析样本均值与总体均值的误差大小,了解估计的准确性和可靠 性。
估计总体方差
计算样本方差
根据样本数据,计算所有数值的方差,得到样 本方差。
根据每个组的频率,可以作出频率分布直方图。
实例结论总结
通过以上实例分析,我们可以看到, 通过将数据分组并计算每个组的频率, 可以大致估计出总体的分布情况。这 种方法适用于大样本数据,当样本量 足够大时,频率分布可以近似地代表 总体分布。
VS
பைடு நூலகம்
在实际应用中,可以根据需要选择合 适的分组方式和组距,以便更好地估 计总体分布。同时,需要注意样本的 代表性和数据的可靠性,以保证估计 结果的准确性。
估计总体方差
将样本方差作为总体方差的估计值,即用样本 方差来估计总体方差。
误差分析
分析样本方差与总体方差的误差大小,了解估计的准确性和可靠性。
估计总体分布形状
观察样本频率分布
01
根据样本数据,绘制频率分布直方图或曲线图,观察分布形状。
估计总体分布形状
用样本的频率分布估计总体的频率分布
用样本的频率分布估计总体的频率分布频率分布是一种用于描述数据集中频次分布情况的统计工具,它描述了每个数值或数值范围出现的频率。
在样本中,我们可以利用频率分布来估计总体的频率分布,从而了解总体的特征。
为了确切估计总体的频率分布,我们需要采取一定的统计方法,下面将介绍一种常用的方法,直方图。
一、直方图的构建构建频率分布的首要任务是将数据分为不同的组或区间。
一般来说,我们会根据数据的特点选择合适的组距,然后根据不同的组距将数据分组。
例如,假设我们有一组数据代表了一些班级学生的测试成绩,我们选择了组距为10,那么我们可以将数据分为以下几个组:然后,我们统计每个组内数据出现的次数,即频次,得到每个组的频次数。
二、计算频率频率是频次的一个重要衍生指标,它反映的是不同数据值或数据范围在总体中的比例。
频率的计算公式为:频率=频次/总样本量在直方图中,我们通常将频率表示为每个组的相对频率。
这样可以更好地反映出组与组之间的差异。
三、绘制直方图绘制直方图是一种直观地表现频率分布的方法。
在直方图上,x轴表示不同的组或区间,y轴表示频率。
我们可以用矩形的高度来表示每个组的频率,矩形的宽度表示组距。
通过绘制多个矩形,可以将频率分布更直观地展示出来。
在绘制直方图时,需要注意以下几点:1.组距应该选择合适,既不过小也不过大,以保证直方图的直观性和准确性。
2.直方图的高度应该符合频率的大小,即高度越高表示频率越大。
3.直方图的矩形之间应该没有间隙,以保证数据的完整性。
四、利用样本频率分布估计总体频率分布样本的频率分布可以提供总体频率分布的一种估计方法。
我们可以基于样本数据构建直方图,并计算每个组的频率。
然后,我们可以将样本频率分布与总体的频率分布进行比较。
如果两个分布形状相似并且没有明显的偏差,那么我们可以认为样本的频率分布可以很好地估计总体的频率分布。
当然,在使用样本频率分布进行总体频率分布估计时,还需要注意以下几点:1.样本的选取应该具有代表性,以避免样本偏差对估计结果的影响。
用样本估计总体
用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
每组数除以全体数据的个数的商叫做该组的频率。
频率反映数据在每组中所占比例的大小。
(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。
(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。
如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。
用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。
(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。
为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。
(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。
设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。
y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。
a b内的百分比就是图中带斜线部分的面积。
对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。
用样本的频率分布估计总体的频率分布
通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:
条形图
饼状图
频数分布直方图
具体步骤: 1、求极差 即一组数据中最大值与最小值的差 2、决定组距与组数 组数:将数据分组 组距:指每个小组的两个端点的距离 3、 决定分点 分组时应保证将样本数据落在每一组的内部
具体步骤: 1、求极差 即一组数据中最大值与最小值的差 2、决定组距与组数 组数:将数据分组 组距:指每个小组的两个端点的距离 3、 决定分点 分组时应保证将样本数据落在每一组的内部
小结
画频率分布直方图的骤:
一、求极差:即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、决定分点: 分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间 四、列频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
作业: 请大家抽查我们年级同学每天数学作业的 用时,作出频率分布直方图,并对数据进 行分析,结合实际情况,向我们年级数学 备课组提出合理化建议。 要求:1、可以按班级小组进行合作调查 2、结果以电子文档形式呈现 3、下周三完成。谢谢
用样本的频曹付生
我国是世界上严重缺水的国家之一,城市缺 水问题较为突出,某市政府为了节约生活 用水,计划在本市试行居民生活用水定额 管理,即确定一个居民月用水量标准a,用 水量不超过a的部分按平价收费,超出a的 部分按议价收费。 (1)如果希望大部分居民的日常生活不受影 响,那么标准a定为多少比较合理呢 ? (2)你认为,为了较为合理地确定出这个标 准,需要做哪些工作?
4、 列频率分布表
100位居民月平均用水量的频数分布直方图
5、画频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
用样本频率分布估计总体分布
实验结果 频数
频率
正面向上 36 124 0.501 1
反面向上 35 964
频率分布条形图
0.498 9
结论:当试验次数
无限增大时 结果的频率大致相等。
0.6
“反面向上”记为1
0.5
注意:
0.4
① 各长方形长条的宽度要相同。
0.3
②相邻长条的间距要适当。
0.2
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
频率 组距 0.5 0.4 0.3 0.2 0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
课件6:2.2.1 用样本的频率分布估计总体的分布
[思路探索] 根据画频率分布直方图的步骤先画频率分布直方图,再 画折线图.
解 (1)频率分布表如下:
分组
频数 频率
[10.75,10.85)
3Байду номын сангаас
0.03
[10.85,10.95)
9
0.09
[10.95,11.05) [11.05,11.15) [11.15,11.25) [11.25,11.35) [11.35,11.45) [11.45,11.55) [11.55,11.65]
题型二 频率的分布直方图的应用 例2.(1)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出 了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24, 23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主 任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图 时先计算最大值与最小值的差是________.若取组距为2,则应分成 ________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为 ________. (2)将容量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79, 而剩下的三组中频率依次相差0.05,则剩下的三组中频率最大的一组的 频率为________.
(4)数据小于11.20的可能性即数据小于11.20的频率,设为x, 则(x-0.41)÷(11.20-11.15) =(0.67-0.41)÷(11.25-11.15), 所以x-0.41=0.13,即x=0.54, 从而估计数据小于11.20的可能性是54%.
变式3.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年 就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就 任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥 巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50,48, 65,52,56,46,54,49,51,47,55,55,54,42,51,56, 55,51,54,51,60,62,43,55,56,61,52,69,64,46, 54,48 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率 分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
用样本估计总体
月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
用样本的频率分布估计总体分布 课件
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内, 以“正”字确定各个小组内数据的个数. (5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定 不能标成频率.
类型 二 频率分布直方图的应用
1.如图是根据
部分城市某年6月份的平均气温
(单位:℃)数据得到的样本频率
分布直方图,其中平均气温的范
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义
连接频率分布直方图中各小长方形上端的_____,就得到频率 中点
分布折线图.
2.总体密度曲线的定义
在样本频率分布直方图中,随着样本容量的增加,所分组数的
增加,组距减小,相应的频率折线图会越来越接近于一条_____ 光滑
_____,统计中称这条光滑曲线为总体密度曲线.它能够精确地
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大 多集中在80~100之间,中位数是98分. 甲同学的得分情况除一个特殊得分外,也大致对称,多集中在 70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于 低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
【拓展提升】
1.频率分布直方图的应用
频率分布指的是一个样本数据在各个小范围内所占比例的大
小,一般用频率分布直方图反映样本的频率分布,其中
(1)频率分布直方图中纵轴表示 ;
(2)频率分布直方图中,各个小长频方率形的面积等于频率,各个 组距
小长方形的面积之和为1;
(3)长方形的高的比也就是频率之比;
(4)对于一组样本取其一代表值,一般取其中值,可以近似地估
【解析】1.选D.列频率分布表如下:
分组
频数累计
频数 频率
[5.5,7.5)
高考一轮复习第10章统计统计案例第2讲用样本估计总体
第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
人教a版必修三:《2.2.1用样本的频率分布估计总体分布(1)》ppt课件(38页)
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
跟踪训练 2 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位:cm).
区间界限 人数 区间界限 人数
[122,126) [126,130) [130,134) [134,138) [138,142) 5 8 10 22 33
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点一:频率分布表
分组 [150.5,153.5) [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5)
主目录
频率 0.025 0.075 0.15 0.225 0.35 0.075 0.075 0.025 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
探究点二:频率分布直方图
(2)频率分布直方图如图所示.
明目标、知重点
填要点、记疑点
主目录
探要点、究所然
当堂测、查疑缺
探要点、究所然
明目标、知重点 填要点、记疑点
频数 5 8 10 22 33 20 11 6 5 120
主目录
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1
探要点、究所然 当堂测、查疑缺
探要点、究所然
2.2.1(一)
用样本的频率分布估计总体分布(整理2019年11月)
利用样本频分布对总体分布进行相应估计
(1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢?
(2)样本容量越大,这种估计越精确。
(3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑
曲线——总体密度曲线。
总体密度曲线
组数=
极差 组距
4.1 0.5
8.2
4、列出频率分布表.(学生填写频率/组距一栏) 5、画出频率分布直方图。
频率分布直方图如下:
频率
连接频率分布直方图
组距
中各小长方形上端的
中点,得到频率分布折
线图
0.50
0.40
0.30
0.20
0.10
月均用水量
/t
0.5 1 1.5 2 2.5 3 3.5 4 4.5
的两根同号,求k的取值范围。
ห้องสมุดไป่ตู้
(2)
画频率分布直方图的步骤:
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1
2、决定组距与组数(将数据分组)
组距:指每个小组的两个端点的距离,组距
组数:将数据分组,当数据在100个以内时,
3、
按数据多少常分5-12组。 将数据分组(8.2取整,分为9组)
频率 组距
月均用 水量/t
ab
(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。
总体密度曲线
总体密度曲线反映了总体在各个范围 内取值的百分比,精确地反映了总体的分布 规律。是研究总体分布的工具.
用样本分布直方图去估计相应的总体分布 时,一般样本容量越大,频率分布直方图就 会无限接近总体密度曲线,就越精确地反映 了总体的分布规律,即越精确地反映了总体 在各个范围内取值百分比。
用样本的频率分布估计总体分布 课件
4.在上述背景下,相应的频率分布折线图越来越接近于一条光滑 曲线,统计中称这条光滑曲线为总体密度曲线.那么下图中阴影部 分的面积有何实际意义?
提示图中阴影部分的面积,就是总体在区间(a,b)内的取值的百分 比.
14
0.14
24
0.24
15
0.15
12
0.12
9
0.09
11
0.11
0.008 0.028 0.048 0.030 0.024 0.018 0.022
[125,130) [130,135]
6
0.06
0.012
2
0.02
0.004
(2)频率分布直方图和频率分布折线图如图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为 0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率 为0.11+0.06+0.02=0.19,所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
解:甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中 位数是98;甲同学的得分情况也大致对称,中位数是88.乙同学的成 绩比较稳定,总体情况比甲同学好.
提示为了制定一个较为合理的标准a,必须先了解全市居民日常 用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们 占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析 样本数据来估计全市居民用水量的分布情况.
2.2.1用样本的频率分布估计总体
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1
乙
2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表
2.2.1用样本的频率分布估计总体分布
1
板出课题 1 分钟
让学生展开讨论 2 分钟
填空 2 分钟
以课本 P66 制定 居民用水标准问 题为例, 题为例,经过以 上几个步骤画出 频率分布直方 图。 学生动手作 ( 图)10 分钟 让学生仔细观察 表和图, 表和图,得出结 论 2 分钟
心灵寄语 :后悔过去,不如奋斗将来。——马克思 (1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 ) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 不出原始的数据内容, (2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有 ) 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后, 的具体数据信息就被抹掉了。 的具体数据信息就被抹掉了。 探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 :同样一组数据 〖探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 : 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断, 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距 重新作图,然后谈谈你对图的印象? 重新作图,然后谈谈你对图的印象? 思考〗 :如果当地政府希望使 以上的居民每月的用水量不超出标准, 〖思考〗 如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-2 : 以上的居民每月的用水量不超出标准 和频率分布直方图 2.2-1,你能对制定月用水量标准提出建议吗? ,你能对制定月用水量标准提出建议吗? 频率分布折线图、 〈二〉频率分布折线图、总体密度曲线 1.频率分布折线图的定义: .频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点 就得到频率分布折线图。 中各小长方形上端的中点, 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 2.总体密度曲线的定义: .总体密度曲线的定义: 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 它能给我们提供更加精细的信息。 它能给我们提供更加精细的信息。 思考〗 〖思考〗 : 对于任何一个总体,它的密度曲线是不是一定存在?为什么? 1.对于任何一个总体,它的密度曲线是不是一定存在?为什么? 对于任何一个总体,它的密度曲线是否可以被非常准确地画出来? 2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么 实际上,尽管有些总体密度曲线是饿、客观存在的, 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确 地画出来,我们只能用样本的频率分布对它进行估计 一般来说,样本容量越大, 进行估计, 地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估 计就越精确. 计就越精确. 〈三〉茎叶图 茎叶图的概念: 1.茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字, 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像植物的茎, 字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出 来的叶子,因此通常把这样的图叫做茎叶图。 来的叶子,因此通常把这样的图叫做茎叶图。 2.茎叶图的特征: .茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失, (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加, 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记 录与表示。 录与表示。 茎叶图只便于表示两位有效数字的数据, 且茎叶图只方便记录两组的数据, (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、典型例题 例题精析】 【例题精析】 人的身高(单位cm cm) 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位cm) 观察表和图, 观察表和图,得 出结论 2 分钟
用样本估计总体
基础知识
题型分类
思想方法
练出高分
由直方图可知众数为:100
中位数:设x为中位数,则有:
0.00610 0.02610 0.038x 95 0.5 得x 99.74
基础知识
题型分类
思想方法
练出高分
基础知识
度剖析
作茎叶图时, 将高位(十位与百位) 作为茎,低位 (个位)作为叶,逐 个统计;根据茎叶图分析两组数 据的特点,可以得出结论.
基础知识
题型分类
思想方法
练出高分
题型分类·深度剖析
题型二 茎叶图的应用
解析 探究提高 思维启迪 【例 2】 某良种培育基地正在培育一种小麦 新品种 A.将其与原有的一个优良品种 B 进 行对照试验.两种小麦各种植了 25 亩,所 解 (1)如下图 得亩产数据(单位:千克)如下: 品种 A: 357,359,367,368,375,388,392,399,400,405,41 2,414,415,421,423,423,427,430,430,434,443, 445,445,451,454 品种 B: 363,371,374,383,385,386,391,392,394,394,39 (2) 由于每个品种的数据都只有 25 个,样本不大,画茎叶图很方 5,397,397,400,401,401,403,406,407,410,412, 便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比 415,416,422,430 (1)作出数据的茎叶图; 较,没有任何信息损失,而且还可以随时记录新的数据. (2)用茎叶图处理现有的数据,有什么优点? (3) 通过观察茎叶图可以看出:①品种 A 的亩产平均数(或均值) (3)通过观察茎叶图,对品种 A 与 B 的亩产 比品种 B 高; ②品种 A 的亩产标准差(或方差)比品种 B 大, 故品 量及其稳定性进行比较,写出统计结论.
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2
;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这组数据的平均数是
x (1.5 2 1.6 3 1.85 1.9) 1.69
答:17名运动员成绩的众数、中位数、平均数 依次是1.75(米)、1.70(米)、1.69(米).
练1: 2.3, 2.4, 2.5, 2.6, 2.7中的中位数 为 2.5 . 2: 2.3, 2.4, 2.5, 2.6, 2.7, 2.8 中的
练习:对于样本数据:3.1,2.5,2.0,0.8,1.5, 1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
茎叶 08 10 5 2057 3115 43
用样本的数字特征 估计总体的数字特征
➢怎样将各个样本数据汇 总为一个数值,并使它成 为样本数据的中心点?
➢能否用一个数值来描写 样本数据的离散程度?
频率分布直方图有哪几个步骤
• 第一步: 求极差: • 第二步: 决定组距与组数: • 第三步: 将数据分组 • 第四步: 列频率分布表. • 第五步: 画频率分布直方图
频率分布直方图
(1)含义:表示样本数据分布规律的图 形.
(2)作法: 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点, 在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组 距的商为高,分别画出各组对应的小长 方形.
• 一般地,样本容量越大,这种估计就越精 确。总体估计要掌握:(1)“表”(频率分布 表);(2)“图”(频率分布直方图)。提醒: 直方图的纵轴(小矩形的高)一般是频率除以 组距的商(而不是频率),横轴一般是数据的 大小,小矩形的面积表示频率。
课本例1和题组集训1
(一)频率分布折线图:
画好频率分布直方图后,我们把频率分布直方 图中各小长方形上端连接起来,得到的图形。.
用样本的频率分布估计总体分布 (一)
1.不易知一个总体的分布情况时,往往从总体中 抽取一个样本,用样本的频率分布去估计总体的 频率分布,样本容量越大,估计就越精确. 2. 目前有:频率分布表、直方图、茎叶图. 3.当总体中的个体取值很少时,用茎叶图估计总 体的分布;当总体中的个体取值较多时,将样本 数据恰当分组,用各组的频率分布描述总体的分 布,方法是用频率分布表或频率分布直方图。
成绩 (单位:米)
1.50
1.60 1.65 1.70
1.75
1.80 1.85 1.90
人数 2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数,中位数与
平均数 解:在17个数据中,1.75出现了4次,出现的 次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大 的顺序排列的,其中第9个数据1.70是最中间 的一个数据,即这组数据的中位数是1.70;
. 中位数为 2.55
分析: [(2.5+ 2.6) ÷2]=2.55
3:一组数据1, 2, 8, 4, 3, 9, 5, 4, 5, 4. 那么( A )
A.这组数据的众数是4; B.这组数据的中位数是3; C.这组数据的平均数是4;
两组并列
的情况下,两 组数都是众数.
D.以这组数为一个样本,样本容量为9.
中,从这些样本数
据的频率分布直方
0.5
图可以看出,月均
0.4
用所示:
0.2
0.1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水量(t)
频率/组距 (取组距中点, 并连线 )
0.6
0.5
0.5
0.44
0.4
0.3
0.3
0.28
0.2
0.16
0.1 0.08
0.12 0.08 0.04
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
总体密度曲线:
在样本频率分布直方图中,当样本容量增加,作图 时所分的组数增加,组距减少,相应的频率折线图会越 来越接近于一条光滑曲线,统计中称这条光滑曲线为总 体密度曲线. 它能够精确地反映了总体在各个范围内取 值的百分比,它能给我们提供更加精细的信息.
甲
8 4, 6, 3 3, 6, 8 3, 8, 9
1
叶
乙
0
1
2, 5
2
5, 4
3
1, 6, 1, 6, 7, 9
4
4, 9
5
0
茎
叶
画茎叶图的步骤:
1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎 为十位上的数字,叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小次序排成一列,写在 左(右)侧; 3.将各个数据的叶按大小次序写在其茎右(左)侧.
2.初中学过的众数、中位数、平均
数,其定义分别是 (1)在一组数据出中现次数最多 的数
据叫做这组数据的众数.
最(中2)间将位一置组数据按大小顺序依次排列,
把处在
的一个数据(或最中
间两个数据的平均数)叫做这组数据的中
位数.
例: 在一次中学生田径运动会上,参加男
子跳高的17名运动员的成绩如下表所示:
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一没有原始数据信 息的损失,所有数据信息都可以从茎叶图中得到;二数据 可以随时记录,随时添加,方便记录与表示。 (2)茎叶图只便于表示两位有效数字的数据,而且茎叶 图只方便记录两组的数据,两个以上的数据虽然能够记录, 但是没有表示两个记录那么直观,清晰。
频率 组距
0
ab
月均用水量/t
(二)茎叶图(一种被用来表示数据的图)
当数据是两位有效数字时,用中间的数字 表示十位数,即第一个有效数字,两边的数字 表示个位数,即第二个有效数字,它的中间部 分像植物的茎,两边部分像植物茎上长出来的 叶子,因此通常把这样的图叫做茎叶图 。
例: 某赛季甲乙两名篮球运动员比赛得分记录如下: 甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39 用茎叶图表示两人成绩,说明哪一个成绩好.
从居民月均用水量样本数据可知,该样本的众数是2.3, 中位数是2.0,平均数是1.973
思考:
如何从频率分布直方图中读取众数,中位数,平均数?
一、在频率分布直方图中读取众数,中位数,平均数
1、众数在样本数据的频率分布直方图中,就是最高
矩形的中点的横坐标.
频率 组距
例如,在上一节调 查的100位居民的 月均用水量的问题