用样本的频率分布估计总体分布(一)(解析版)
用样本的频率分布估计总体的频率分布
通过抽样,我们获得了100位居民某年的月平均用水量 (单位:t) ,如下表:
条形图
饼状图
频数分布直方图
具体步骤: 1、求极差 即一组数据中最大值与最小值的差 2、决定组距与组数 组数:将数据分组 组距:指每个小组的两个端点的距离 3、 决定分点 分组时应保证将样本数据落在每一组的内部
具体步骤: 1、求极差 即一组数据中最大值与最小值的差 2、决定组距与组数 组数:将数据分组 组距:指每个小组的两个端点的距离 3、 决定分点 分组时应保证将样本数据落在每一组的内部
小结
画频率分布直方图的骤:
一、求极差:即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、决定分点: 分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间 四、列频率分布表
五、画出频率分布直方图(纵轴表示频率/组距)
作业: 请大家抽查我们年级同学每天数学作业的 用时,作出频率分布直方图,并对数据进 行分析,结合实际情况,向我们年级数学 备课组提出合理化建议。 要求:1、可以按班级小组进行合作调查 2、结果以电子文档形式呈现 3、下周三完成。谢谢
用样本的频曹付生
我国是世界上严重缺水的国家之一,城市缺 水问题较为突出,某市政府为了节约生活 用水,计划在本市试行居民生活用水定额 管理,即确定一个居民月用水量标准a,用 水量不超过a的部分按平价收费,超出a的 部分按议价收费。 (1)如果希望大部分居民的日常生活不受影 响,那么标准a定为多少比较合理呢 ? (2)你认为,为了较为合理地确定出这个标 准,需要做哪些工作?
4、 列频率分布表
100位居民月平均用水量的频数分布直方图
5、画频率分布直方图
频率/组距 0.50 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
《用样本的频率分布估计总体分布》教学设计 (1)
《用样本的频率分布估计总体分布》教学设计教学目标:1 知识与能力目标:(1).了解样本的频率分布与总体分布的关系,能用样本的频率分布去估计相应的总体分布。
(2).在表示样本数据的过程中,学会列出频率分布表、画频率分布直方图、频率折线图,体会它们各自的特点。
(3).通过学生应用所学知识解决实际问题,进一步提高学生理论联系实际的能力。
2 情感目标:(1)渗透数形结合思想。
(2)结合教学内容培养学生学习数学的兴趣及“用数学”的意识,激励学生勇于自我创新。
(3)培养学生普遍联系、数学来源于实践又指导实践的辩证唯物主义观点及勇于探索的创新精神。
教学重点:通过实例体会分布的意义和作用,能做出样本的频率分布表、画频率分布直方图和频率折线图。
教学方法:以教师为主导,学生为主体,以能力发展为目标,强化学生的注意力及新旧知识的联系,通过教师讲授、学生尝试练习,调动学生的积极性,发挥学生的主体作用。
教学环节教学内容师生互动设计意图复习统计的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体。
前面我们学习了哪些抽样方法?问题:抽取样本后怎样用样本来估计总体呢?即用什么方法来处理得到的样本数据,来估计、推测总体的特征、特性?理论证明,可以用样本的频率分布估计总体的分布,用样本数字特征估计总体的数字特征。
本节我们学习用样本的频率分布估计总体的分布,教师提出问题,铺垫复习,学生思考、积极回答问题教师根据学生的回答、进一步提出问题,导入新课。
学生思考、讨论教学重难点新课前的复习即可加深对学过的知识的理解,又可为学习新知识埋下伏笔。
先设疑、激发学生的求知欲望、提高学生学习教学的兴趣让学生了解本节学生内容和学习的重难点,为学好本节做好知识和心理上的准备。
导入(1)为了了解中学生的身体发育情况,对某中学同年龄的60名女学生的身高进行了测量,结果如下(单位:厘米)167 154 159 166 169 159 156 166162 158 159 156 166 160 164 160 157 156 157 161 158 158153 158 164 158 163 158 153157 162 162 159 154 165 166157 151 146 151 158 160 165158 163 163 162 161 154 165162 162 159 157 159 149 164 168 159 153我们希望了解身高在哪个小范围内的学生多,在那个小范围内的学生少?(2)为了考察甲、乙两种小麦的长势,分别从中抽取了10株苗,测得苗高如下(单位:厘米)甲:12 13 14 15 10 16 13 11 15 11乙:11 16 17 14 13 19 6 8 1016问:那种小麦的10株苗高比较整齐?频率分布直方图如果样本容量较大,很难从一个个数字中直接看出样本所包含的信息。
221用样本的频率分布估计总体分布1
(3)估计该片经济林中底部周长小于100cm的树木 约占多 少,周长不小于120cm的树木约占多少。
解: (1)从表中可以看出: 这组数据的最大值为135,最小值为80, 故极差为55, 可将其分为11组,组距为5。
从第1组[80,85)开始, 将各组的频数、频率和 频率/组距 填入表中
分组
频数
[80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125)
[125,130)
[130,135) 合计
频率
频数/组距
1
0.01 0.002
2
0.02 0.004
4
0.04 0.008
14
0.40 0.30 0.20 0.10
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量/t
画一组数据的频率分布直方图,可以按以下的 步骤进行:
一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间,
取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表
三级品 13
0.43
次品
4
0.13
(2)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.
2.有一个容量为50的样本,数据的分组及其 频数如下所示, 请将其制成频率直方图.
频率分布表如下:
分组 [25,30) [30,35) [35,40) [40,45)
[45,50) [50,55) [55,60]
2.2.1 用样本的频率分布估计总体分布(1)
0.020 0.053 0.060 0.073 0.067 0.033 0.027
频率分布直方图如下:
频率 组距 0.070 0.060 0.050
0.040
0.030 0.020 0.010
12.5 15.5
练习
1. 已知一组数据如下: 25 21 23 25 27 29 25 28 30 29 26 24 25 27 26 22 24 25 26 28 填写下面的频率分布表,绘出频率分布直方图. 组别 频数累计 频数 频率
率,你能用公式表示出样本容量、频数 和频率之间的关系吗?各组的频数和等 于几?各组的频率和呢?
(1) f i
ti n
(2)t1 t 2 ... t n n
(3) f 1 f 2 ... f n 1
小结
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 4.1 8.2 3、 将数据分组(8.2取整,分为9组)
例2 有一个容量为50的样本数据的分组的频数
如下: [12.5, 15.5) 3
[15.5, 18.5) [18.5, 21.5) 8 9
[24.5, 27.5) [27.5, 30.5)
10 5
[30.5, 33.5)
4
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
2.2.1用样本的频率分布估计总体分布
分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
用样本的频率分布估计总体分布教案
用样本的频率分布估计总体分布教案教案:用样本的频率分布估计总体分布一、教学目标:1.了解频率分布的概念和作用;2.学会使用频率分布来估计总体分布;3.掌握构建频率分布表的方法;4.能够利用频率分布表对总体进行估计。
二、教学内容:1.频率分布的概念和作用2.构建频率分布表的方法3.利用频率分布表对总体进行估计三、教学过程:一、频率分布的概念和作用(10分钟)1.频率分布是指对一组数据中各个数值出现的次数进行统计,从而得到数值的分布情况。
2.频率分布的作用是可以帮助我们了解数据的分布规律,从而对总体进行估计。
二、构建频率分布表的方法(30分钟)1.确定数据的分组区间:首先需要确定分组的宽度,即把数据分为若干个区间。
常用的方法有等宽分组和等频分组。
2.计算各个分组的频数:统计每个区间内数据的个数。
3.计算各个分组的频率:将各个分组的频数除以总样本数量,得到各个分组的频率。
4.制作频率分布表:将各个分组的上界、下界、频数和频率列成表格。
三、利用频率分布表对总体进行估计(40分钟)1.利用频率分布表进行估计的方法有两种:直接估计和间接估计。
2.直接估计是通过频率分布表直接读取各个分组的频率来估计总体分布。
3.间接估计是通过频率分布表的图形化表示来估计总体分布,常用的图形有直方图和折线图。
4.对于直方图,可以通过观察分布的形状和峰值来估计总体的分布情况。
5.对于折线图,可以通过观察分布曲线的形状来估计总体的分布情况。
四、练习和小结(20分钟)1.让学生根据给定的数据,完成频率分布表的构建。
2.让学生根据给定的频率分布表,进行总体分布的估计。
3.对学生进行小结和概念回顾,检查他们对于频率分布和总体估计的理解程度。
四、教学反思:通过本节课的教学,学生能够了解频率分布的概念和作用,掌握构建频率分布表的方法,以及利用频率分布表对总体进行估计的方法。
在教学过程中,可以利用实际案例和练习来加深学生对于频率分布和总体估计的理解。
用样本的频率分布估计总体分布 课件
频率 这样每一组的频率可以用该组的组距为底、组距为高的小矩形的 面积来表示.其中,矩形的高=频组率距=组距×样1 本容量×频数;
(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的 频率分布直方图的形状也会不同; (5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量 为100的样本,所形成的样本频率分布直方图一般会与前一个样本 频率分布直方图有所不同,但它们都可以近似地看做总体的分布.
【探究1】 一个容量为n的样本,分成若干组,已知某组的频数 和频率分别为40,0.125,则n的值为________. 解析 由题意得4n0=0.125,解得 n=320.
答案 320
【探究2】 在画频率分布直方图时,某组的频数为10,样本容量
为50,总体容量为600,则该组小矩形的面积是______.
解析 该组小矩形的面积即是数据落在该组的频率:1500=15.
答案
1 5
【探究3】 从某小区抽取100户居民进行月用电量调查,发现其 用电量都在50至350度之间,频率分布直方图如图所示.直方图中 x的值为________.
解析 ∵(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50 =1,∴x=0.004 4. 答案 0.004 4
用样本的频率分布估计总体分布
知识点1 频率分布直方图 1.频率分布直方图的画法
最大值与最小值
不小于k的最小
左闭右开
分组 频数累计 频数
频率
合计
样本容量
1
频率/组距 各小长方形的面积
1
2.频率分布折线图与总体密度曲线
2.2.1用样本的频率分布估计总体分布
总体密度曲线
反映了总体在各个范围内取值的百分比,精确地 反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超出a的 部分按议价收费.那么①标准a定为多少比较合 理呢? ②为了较合理地确定这个标准,你认 为需要做哪些工作?
通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表:
思考:由上表,大家可以得到什么信息?
2019/4/10
二、画频率分布直方图的步骤
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
极差 4.1 2.决定组距与组数: = 组距= = 0.5 8 组数
当数据在100个以内时,常分8-12组.
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
月均用水量 /t 4.5
归纳: 作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组 的组距,以此线段为底作矩形,高等于 该组的频率/组距, 这样得到一系列矩形, 每一个矩形的面积恰好是该组上的频率, 这些矩形构成了频率分布直方图.
三、频率分布直方图再认识 1、小长方形
频率
的面积总和=?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2019/4/10
当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量) ,随着样本容量的增加,作图时 所分的组数增多,组距减少,你能想象出相应的 频率分布折线图会发生什么变化吗?
用样本的频率分布估计总体分布
25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41
25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39
26.5~28.5
28.5~30.5
合计
2020/12/13
23
第二十三页,共34页。
红星养猪场400头猪的质量频率分布直方图如图,其中数据不在分点上。按图回答:
练 习
1)质量在
组里的猪最多,有
二 2)质量在60.5kg以上的猪有
头。
头。
3)这400头猪的总质量约 55k.g5,~60.5
400×0.4=160
分数段 40.5~50.5 50.5~60.5 60.5~70.5 70.5~80.5 80.5~90.5 90.5~100.5
人数 2 2 7 16 8 5
频率 与全班人数的比
0.05
00..44
0.05
00..33
0.175
0.2
0.40 0.20 0.125
0.1 00
20学20生/1分2/1数3分布表(频率分布表)
25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40
25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56
25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49
4、列出频率分布表.(学生填写频率/组距一栏)
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
用样本的频率分布估计总体分布 课件
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内, 以“正”字确定各个小组内数据的个数. (5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定 不能标成频率.
类型 二 频率分布直方图的应用
1.如图是根据
部分城市某年6月份的平均气温
(单位:℃)数据得到的样本频率
分布直方图,其中平均气温的范
二、频率分布折线图、总体密度曲线
1.频率分布折线图的定义
连接频率分布直方图中各小长方形上端的_____,就得到频率 中点
分布折线图.
2.总体密度曲线的定义
在样本频率分布直方图中,随着样本容量的增加,所分组数的
增加,组距减小,相应的频率折线图会越来越接近于一条_____ 光滑
_____,统计中称这条光滑曲线为总体密度曲线.它能够精确地
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大 多集中在80~100之间,中位数是98分. 甲同学的得分情况除一个特殊得分外,也大致对称,多集中在 70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于 低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.
【拓展提升】
1.频率分布直方图的应用
频率分布指的是一个样本数据在各个小范围内所占比例的大
小,一般用频率分布直方图反映样本的频率分布,其中
(1)频率分布直方图中纵轴表示 ;
(2)频率分布直方图中,各个小长频方率形的面积等于频率,各个 组距
小长方形的面积之和为1;
(3)长方形的高的比也就是频率之比;
(4)对于一组样本取其一代表值,一般取其中值,可以近似地估
【解析】1.选D.列频率分布表如下:
分组
频数累计
频数 频率
[5.5,7.5)
高考一轮复习第10章统计统计案例第2讲用样本估计总体
第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。
(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)
第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。
9.5 用样本的频率分布估计总体分布课件-2023届广东省高职高考数学第一轮复习第九章概率与统计初步
A.甲
B.乙
C.丙
D.丁
【解析】 因为丙的平均数最大,方差最小,故选 C.
8.在学校组织的一次技能竞赛中,某班学生
成绩的频率分布直方图如图所示,若低于 60
分的有 12 人,则该班学生的人数为( B )
A.35
B.40
C.45
D.50
第 8 题图
【解析】 如图所知:低于 60 分的频率为 20×(0.005+0.010)=0.3, 设该班有学生 n 人,则1n2=0.3,解得 n=40,故选 B.
=0.4×40=16,故选 D.
4.某同学进行技能训练,录得近五次的训练成绩分别为:88,84,86,
85,87,则这组数据的方差为( A )
A.2
B.3
C.4
D.9
【解析】 因为x-=x1+x2+x53+x4+x5=86,所以,方差 s2=n1[(x1-x-)2
+
(x2
-
-
x
)2
+
…
+
(xn
-
-
二、填 空 题
9.将一个容量为 m 的样本分成 3 组,已知第 1 组的频数为 8,第 2 和第 3 组的频率为 0.15 和 0.45,则 m=___2_0__. 【解析】 由题意得,第一组的频率为m8 ,则m8 +0.15+0.45=1,解得 m=20.
10.容量为 100 的样本数据,按从小到大的顺序分为 8 组,如下表: 组号 1 2 3 4 5 6 7 8 频数 10 13 14 14 15 13 12 9
9.5 用样本的频率分布估计总体分布
知识点1 知识点2
1.用样本的频率分布估计总体 (1)频数与频率 将一组数据按要求分成若干个组,各组内数据的个数叫做该组的频 数,每组的频数除以全体数据的个数的商叫做该组的频率,频率反 映数据在每组中所占比例的大小.
用样本频率分布估计总体分布 课件
题型三 频率分布直方图的应用
例3 为了了解高一学生的体能情况, 某 校抽取部分学生进行一分钟跳绳次数测 试, 将所得数据整理后, 画出频率分布直方 图(如图所示), 图中从左到右各小长方形面 积之比为2∶4∶17∶15∶9∶3, 第二小组频 数为12.
(1)第二小组的频率是多少?样本容量是多 少? (2)若次数在110次以上(含110次)为达标, 试估计该校全体高一学生的达标率是多少?
如果把这些数据形成频率分布表或频率分 布直方图, 就可以比较清楚地看出样本数 据的特征, 从而估计总体的分布情况. (2)频率分布直方图 在频率分布直方图中, 纵轴表示 ___频__率_/_组__距____, 数据落在各小组内的频 率用各_小__长__方_形__的__面__积______表示, 各小长 方形面积的总和等1于________.
题型一 频率分布表、频率分布直 方图及折线图
例1 (本题满分12分)美国历届总统中, 就任时年纪最小的是罗斯福, 他于1901年 就任, 当时年仅42岁; 就任时年纪最大的是 里根, 他于1981年就任, 当时69岁.
下面按时间顺序(从1789年的华盛顿到 2009年的奥巴马, 共44任)给出了历届美国 总统就任时的年龄: 57,61,57,57,58,57,61,54,68,51,49,64,50, 48, 65,52,56,46,54,49,51,47,55,55,54,42,51, 56, 55,51,54,51,60,62,43,55,56,61,52,69,64, 46, 54,48
【名师点评】 频率分布直方图也反映了 各个范围内取值的可能性, 利用样本在这 一范围内的频率, 可近似估计总体在这一 范围内的可能性.
互动探究 3. 在本例中, 一分钟跳绳次数在120以下 (含120次)的人数是多少?
2.2.1用样本的频率分布估计总体的分布
⑤上例中,如果规定,钢管内径的尺寸在 区间25.325~25.475内为优等品,我们可依 据抽样分析统计出产品中优等品的比例, 也就是它的频率。从上表或上图容易看出, 这个频率值等于0.12+0.18+0.25+0.16 +0.13=0.84,于是可以估计出所有生产的 钢管中有84%的优等品。工厂可以根据质 量规范,看看是否达到优等品率的要求, 如果没有达到,就需要进一步分析原因, 解决问题。
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
④登记频数,计算频率,列出频率分布表 频数 频率= —————,如第1小组的频率 样本容量 1 为——— =0.01. 100
频率分布表:
⑤ 绘制频率分布直方图 利用直方图反映样本的频率分布规律, 这样的直方图称为频率分布直方图,简称 频率直方图。 下面仍以上例中的数据加 以说明。 (1)频率分布直方图的绘制方法与步骤 S1 先制作频率分布表,然后作直角坐标 系,以横轴表示产品内径尺寸,纵轴表示 频率/组距.
运用上面的算法得出这组样本数据的最 大值是25.56,用类似的算法可以得出最 小值是25.24它们的差为 25.56-25.24= 0.32,所以极差等于0.32mm. ②决定组距与组数 样本数据有100个,由上面算得极差为 0.32,取组距为0.03, 极差 那么组数= ——— =10.67,于是分成11组。 组距
4.列频率分布表的步骤
下面我们通过一个具体的实例来阐述这 一方法。 某钢铁加工厂生产内径为25.40mm的钢 管,为了掌握产品的生产状况,需定期对 产品进行检测,下面的数据是一次抽样中 的100件钢管的内径尺寸:
最大值
最小值
列频率分布表的方法步骤: ①求极差(也称全距,即一组数据中最 大值与最小值的差): 计算极差时,需要找出这组数据的最 大值和最小值,当数据很多时,可借助 如下算法(最大值): S1 把这100个数据命名为A(1)、A(2)、 A(3)、……、A(100); S2 设变量x=A(1); S3 把A(i) (i=2,3,……,100)逐个与x比 较,如果A(i)>x,则x=A(i);
2.2.1用样本的频率分布估计总体
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1
乙
2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表
2.2.1用样本的频率分布估计总体分布
1
板出课题 1 分钟
让学生展开讨论 2 分钟
填空 2 分钟
以课本 P66 制定 居民用水标准问 题为例, 题为例,经过以 上几个步骤画出 频率分布直方 图。 学生动手作 ( 图)10 分钟 让学生仔细观察 表和图, 表和图,得出结 论 2 分钟
心灵寄语 :后悔过去,不如奋斗将来。——马克思 (1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 ) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 不出原始的数据内容, (2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有 ) 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后, 的具体数据信息就被抹掉了。 的具体数据信息就被抹掉了。 探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 :同样一组数据 〖探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 : 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断, 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距 重新作图,然后谈谈你对图的印象? 重新作图,然后谈谈你对图的印象? 思考〗 :如果当地政府希望使 以上的居民每月的用水量不超出标准, 〖思考〗 如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-2 : 以上的居民每月的用水量不超出标准 和频率分布直方图 2.2-1,你能对制定月用水量标准提出建议吗? ,你能对制定月用水量标准提出建议吗? 频率分布折线图、 〈二〉频率分布折线图、总体密度曲线 1.频率分布折线图的定义: .频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点 就得到频率分布折线图。 中各小长方形上端的中点, 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 2.总体密度曲线的定义: .总体密度曲线的定义: 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 它能给我们提供更加精细的信息。 它能给我们提供更加精细的信息。 思考〗 〖思考〗 : 对于任何一个总体,它的密度曲线是不是一定存在?为什么? 1.对于任何一个总体,它的密度曲线是不是一定存在?为什么? 对于任何一个总体,它的密度曲线是否可以被非常准确地画出来? 2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么 实际上,尽管有些总体密度曲线是饿、客观存在的, 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确 地画出来,我们只能用样本的频率分布对它进行估计 一般来说,样本容量越大, 进行估计, 地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估 计就越精确. 计就越精确. 〈三〉茎叶图 茎叶图的概念: 1.茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字, 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像植物的茎, 字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出 来的叶子,因此通常把这样的图叫做茎叶图。 来的叶子,因此通常把这样的图叫做茎叶图。 2.茎叶图的特征: .茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失, (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加, 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记 录与表示。 录与表示。 茎叶图只便于表示两位有效数字的数据, 且茎叶图只方便记录两组的数据, (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、典型例题 例题精析】 【例题精析】 人的身高(单位cm cm) 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位cm) 观察表和图, 观察表和图,得 出结论 2 分钟
用样本分布估计总体分布
思考2:
6.(2019·福州高一检测)甲、乙两个小组各10名学生的英语 口语测试成绩如下(单位:分): 甲组:76 90 84 86 81 87 86 82 85 83 乙组:82 84 85 89 79 80 91 89 79 74 用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐 一些.
4、世界卫生组织指出青少 年的身体健康状况是一个应该 引起大家足够重视的问题,某 校为了了解小学生的体能情况, 抽取了一个年级的部分学生进 行一分钟跳绳次数测试.将所得数据整理后,画出频率分布直 方图,如图所示.已知图中从左到右前三个小组的频率分别为 0.1,0.3,0.4,第一个小组的频数为5.
2.数据123,127,131,151,157,135,129,138,147, 152,134,121,142,143的茎叶图中,茎应取 ______.
3.某班25人的数学成绩茎叶图如下图所示,则最高分为 ______,最低分为______,优秀率(90分以上)为 ______.
【解析】根据茎叶图中数据的排列规律,分析数据,可得最高 分为91,最低分为51,优秀率为1/25=4%. 答案:91 51 4%
【解析】选B 频率=
频数
样本容量
3.为了了解某地区高三学生的身体发育情况,抽查了该地区 100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方 图,如图,据图可得这100名学生中体重在[56.5,64.5) kg的 学生人数是( )
(A)20
(B)30
(C) 在[56.5,64.5) kg范围内的矩形的面积是(0.03+0.05+0.05+0.07)×2=0.4, 则数据落在这一范围的频率是0.4.所以这100名学生中体重在[56.5,64.5)的 学生人数是100×0.4=40.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本的频率分布估计总体分布(一)班级:____________ 姓名:__________________一、选择题1.下列说法中错误的是()①用样本的频率分布估计总体频率分布的过程中,样本容量越大,估计越精确;②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为240;③频率分布直方图中,小长方形的高等于该小组的频率;④将频率分布直方图中各小长方形上端的一个端点顺次连接起来,就可以得到频率分布折线图;⑤每一个总体都有一条总体密度曲线,它反映了总体在各个范围内取值的百分比.A.①③B.②③④C.②③④⑤D.①②③④⑤解析:选C.样本越多往往越接近于总体,所以①正确;②中n=40÷0.125=320;③中频率分布直方图中,小长方形的高等于该小组的频率÷组距;④中应将频率分布直方图中各小长方形上端的中点顺次连接起来得到频率分布折线图;⑤中有一些总体不存在总体密度曲线,如“掷硬币”这样的离散型总体(结果是固定的,只有正面和反面两种可能,且可能性相等),故②③④⑤错误.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为()A.0.1 B.0.2C.0.3 D.0.4解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.3.在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的14,已知样本容量是80,则该组的频数为()A.20 B.16C.30 D.35解析:选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x+4x=80,解得x =16,即该组的频数为16,故选B.4.某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为[76,78),[78,80),…,[84,86].若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是()A.12 B.18C.25 D.90解析:选D.净重大于或等于78克且小于84克的频率为(0.100+0.150+0.125)×2=0.75,所以在该范围内的产品个数为120×0.75=90.5.对于向量a,b,c和实数 ,下列命题中正确的是()A .若0a b ⋅=,则0a =或0b =B .若0a λ=,则0λ=或0a =C .若22a b =,则a b =或a b =-D .若a b a c ⋅=⋅,则b c =【答案】B【解析】对于A 中,若0a b ⋅=,则0a =或0b =或a b ⊥,所以不正确; 对于B 中,若0a λ=,则0λ=或0a =是正确的;对于C 中,若22a b =,则a b =,不能得到a b =或a b =-,所以不正确;对于D 中,若a b a c ⋅=⋅,则()0a b c -=,不一定得到b c =,可能是()a b c ⊥-,所以不正确,综上可知,故选B.6.已知是12,e e ,夹角为60︒的两个单位向量,则12a e e =+与122b e e =-的夹角是( ) A .60︒ B .120︒ C .30 D .90︒【答案】B【解析】22222121122||()2a a e e e e e e ==+=+⋅+022cos 603,||3a =+⨯=∴=22222121122||(2)44b b e e e e e e ==-=-⋅+ 054cos 603,||3b =-⨯==,1212()(2)a b e e e e ⋅=+⋅-2201122321cos602e e e e =-⋅-=--=-,设,a b 的夹角为1,cos 2||||a b a b θθ⋅==-,20,3πθπθ≤≤∴=. 故选:B,7.设a ,b ,c 为平面向量,2a b a b ==⋅=,若()()20c a c b ⋅--=,则c b ⋅的最大值是( )A B .52+ C .174D .94【答案】B【解析】∵2a b a b ==⋅=,若a 与b 的夹角为θ知1cos 2θ= ∴3πθ=, 令(2,0),(1,3)b OB a OA ====,设(,)c OC x y ==而c b ⋅= 2x ,故求它的最大值即是求x 的最大值故2(21,23)c a x y -=--,(2,)c b x y -=-,又()()20c a c b ⋅--=即(2)()c a c b -⊥- ∴(21)(2)(23)0x x y y --+=,即223(21)(2)0y x x -+--= 方程有解:38(21)(2)0x x ∆=---≥523523x -+≤≤∴c b ⋅的最大值为532故选:B8.在ABC ∆中,2BAC π∠=,2AB AC ==,P 为ABC 所在平面上任意一点,则()PA PB PC⋅+的最小值为( )A .1B .12-C .-1D .-2【答案】C【解析】如图,以,AB AC 为,x y 建立平面直角坐标系,则(0,0),(2,0),(0,2)A B C ,设(,)P x y ,(,)PA x y =--,(2,)PB x y =--,(,2)PC x y =--,(22,22)PB PC x y +=--,∴()22(22)(22)2222PA PB PC x x y y x x y y ⋅+=----=-+-22112()2()122x y =-+--,∴当11,22x y ==时,()PA PB PC ⋅+取得最小值1-. 故选:C .二、填空题9.某地政府调查了工薪阶层1 000人的月工资收入,并把调查结果画成如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则[40,45)(百元)月工资收入段应抽出________人.解析:月工资收入在[40,45)(百元)段的频率为1-(0.01+0.02+0.04+0.05×2)×5=0.15,则[40,45)(百元)月工资收入段的总人数为0.15×1 000=150,现用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则[40,45)(百元)月工资收入段应抽出150×1001 000=15(人).答案:1510.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.解析:底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.答案:24 11.为了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a ,视力在4.5到5.2之间的学生数为b ,则a =________,b =________.解析:由频率分布直方图知组距为0.1,由前4组频数之和为40,后6组频数之和为87,知第4组频数为40+87-100=27,即4.6到4.7之间的频数最大,为27,故最大频率a =0.27.视力在4.5到5.2之间的频率为1-0.03-0.01=0.96,故视力在4.5到5.2之间的学生数b =0.96×100=96.答案:0.27 9612.已知a b c ,,为单位向量,且满足370a b c λ++=,a 与b 的夹角为3π,则实数λ=___________.【答案】8λ=-或5λ=【解析】由370a b c λ++=,可得7(3)c a b λ=-+,则22224996b b c a a λλ=++⋅.由a b c ,,为单位向量,得2221a b c ===,则24996cos 3πλλ=++,即23400λλ+-=,解得8λ=-或5λ=.三、解答题13.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.(1)求直方图中x 的值;(2)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)x =[1-(0.002+0.009 5+0.011+0.012 5+0.005+0.002 5)×20]÷20=0.007 5. (2)由频率分布直方图知,月平均用电量为[220,240),[240,260),[260,280),[280,300]的共有[(0.012 5+0.007 5+0.005+0.002 5)×20]×100=55(户),其中在[220,240)中的有0.012 5×20×100=25(户),因此,在所抽取的11户居民中,月平均用电量在[220,240)的用户中应抽取2555×11=5(户).14.已知△ABC 中,角A 、B 、C 的对边为a ,b ,c ,向量m (2cos sin )2C C =-,, n =(cos 2sin )2CC ,,且m n ⊥. (1)求角C ; (2)若22212a b c =+,试求sin()A B -的值 【答案】(1)60C =︒;(23. 【解析】(1)由题意知,0m n =,即222cos2sin 02CC -=,21cos 2(1cos )0C C +--=, 22cos cos 10C C +-=,即cos 1C =-,或1cos 2C =, 因为0C π<<,所以60C =︒. (2)2222221122a b c a b c =+⇒-=, 222222sin()sin cos sin cos 2222a a c b b b c a A B A B B A R ac R bc+-+--=-=-()2222314442a b c c sinC cRcR R -=====.。