用样本估计总体
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以从身高在[140,150]内的学生中选取的人数应为 3.
2.(2016·河南三市调研)在检验某产品直径尺寸的过程中,
将某尺寸分成若干组,[a,b)是其中的一组,抽查出的个体数
在该组上的频率为 m,该组在频率分布直方图上的高为 h,则|a
-b|等于( )
m A. h C.mh
h B.m D.与 h,m 无关
18 人参加一项活动,则从身高在[140,150]内的学生中选取的人
数应为( )
A.2
B.3
C.4
D.5
[解析] 选 B 依题意可得 10×(0.005+0.01+0.02+a+ 0.035)=1,则 a=0.03.
所以身高在[ 120,130),[ 130,140),[ 140,150] 三组内的学生 比例为 3∶2∶1.
3.茎叶图
定义
是统计中用来表示数据的一种图,茎是指中间的一列数,叶 就是从茎的旁边生长出来的数
对于样本数据较少,且分布较为集中的一组数据:若数据是 两位整数,则将十位数字作茎,个位数字作叶;若数据是三 画法 位整数,则将百位、十位数字作茎,个位数字作叶.样本数 据为小数时做类似处理.对于样本数据较少,且分布较为集 中的两组数据,关键是找到两组数据共有的茎
由方差公式得 s2=15[(8-11)2+(9-11)2+(10-11)2+(13- 11)2+(15-11)2]=15(9+4+1+4+16)=6.8.
[答案] 6.8
考点一 频率分布直方图的绘制及应用(基础型考点——
自主练透)
[方法链接]
(1)绘制频率分布直方图时需注意:①制作好频率分布表后
可以利用各组的频率之和是否为 1 来检验该表是否正确;②频
[答案] A
4.一个容量为 20 的样本,数据的分组及各组的频数如下: [10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4; [60,70),2;则 x=________;根据样本的频率分布估计,数据 落在[10,50)的概率约为________.
[解析] x=20-(2+3+5+4+2)=4,P=2+3+ 204+5= 0.7 或 P=1-4+ 202=170=0.7.
(2)直方图中中位数两侧的矩形面积和相等,即频率和相 等,前三组的频率和为 0.28,前四组的频率和为 0.56,∴中位 数位于第 4 组内.
考点二 茎叶图的应用(重点型考点——师生共研) 【例 1】 某学校随机抽取 20 个班,调查各班中有网上购 物经历的人数,所得数据的茎叶图如图所示,以组距为 5 将数 据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分 布直方图是( )
[答案] B
3.(2016·广州模拟)对某商店一个月内每天的顾客人数进行 了统计,得到样本的茎叶图(如图所示),则该样本的中位数、 众数、极差分别是( )
A.46,45,56 C.47,45,56
B.46,45,53 D.45,47,53
[解析] 茎叶图中共有 30 个数据,所以中位数是第 15 个 和第 16 个数字的平均数,即12(45+47)=46,排除 C,D;再计 算极差,最小数据是 12,最大数据是 68,所以 68-12=56, 故选 A.
[答案] D
【名师说“法”】
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这 个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎 与叶的含义.
跟踪训练
1.某苗圃基地为了解基地内甲、乙两块地种植的同一种树
苗的长势情况,从两块地各随机抽取了 10 株树苗,用茎叶图表
A.甲网店的极差大于乙网店的极差 B.甲网店的中位数是 46 C.乙网店的众数是 42 D.甲网店的销售业绩好
[解析] 甲网店极差为 58-6=52,乙网店极差为 58-5= 53,A 错;甲网店中位数为 44,B 错;乙网店的众数为 13,C 错;甲网店平均数110(6+11+12+32+43+47+45+51+58+ 51)=35.6,乙网店平均数为110(5+7+13+13+13+22+34+42 +42+58)=24.9,所以甲网店的业绩好. 故选 D.
值等于每个小矩形的面积乘以小矩形底 边中点的横坐标之和
反映了各个样本数据
聚集于样本平均数周
围的程度.标准差越
标 标准差是样本数据到平均数的一种平均 小,表明各个样本数
准 距离,即 s=
据在样本平均数周围
差
n1[x1--x 2+x2--x 2+…+xn--x 2].越集中;标准差越大,
表明各个样本数据在
[质疑探究3] 平均数、标准差与方差反映了数据的哪些特 征?
提示:平均数反映了数据取值的平均水平,标准差、方差 反映了数据对平均数的波动情况,即标准差、方差越大,数据 的离散程度越大,越不稳定;反之离散程度越小,越稳定.
[小题查验] 1.给出下列命题,正确的是( ) ①一组数据的平均数一定大于这组数据中的每个数据 ②平均数、众数与中位数都可以描述数据的集中趋势 ③一组数据的方差越大,说明这组数据的波动越大 ④频率分布直方图中,小矩形的面积越大,表示样本数据 落在该区间内的频率越高
[答案] B
2.某雷达测速区规定:凡车速大
于或等于 70 km/h 的汽车视为“超
速”,并将受到处罚,如图是某路段
的一个检测点对 200 辆汽车的车速进
行检测所得结果的频率分布直方图,
则从图中可以看出被处罚的汽车大约有( )
A.30 辆
B.40 辆
C.60 辆
D.80 辆
[解析] 由题图可知,车速大于或等于 70 km/h 的汽车的频 率为 0.02×10=0.2,则将被处罚的汽车大约有 200×0.2= 40(辆).故选 B.
4.会用样本的频率分布估计总体分布,会用样本的基本数 字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一 些简单的实际问题.
[要点梳理] 1.作频率分布直方图的步骤
[质疑探究1] 频率分布直方图中纵轴表示什么含义?小长 方形的面积表示什么?各小长方形面积之和等于多少?
频率 率分布直方图的纵坐标是组距,而不是频率.
(2)由频率分布直方图进行相关计算时,需掌握下列关系
频率 式:组距×组距=频率.
[题组集训]
1.(2016·黄冈月考)从某小学随
机抽取 100 名同学,将他们的身高(单
位:厘米)数据绘制成频率分布直方
图(如图).若要从身高在[120,130),
[130,140),[140,150]三组内的学生中,用分层抽样的方法选取
[解析] 月工资收入落在(30,35](百元)内的频率为 1-(0.02 +0.04+0.05+0.05+0.01)×5=1-0.85=0.15,则 0.15÷5= 0.03,所以各组的频率比为 0.02∶0.04∶0.05∶0.05∶0.03∶0.01 =2∶4∶5∶5∶3∶1,所以(30,35](百元)月工资收入段应抽出
(1)求这次铅球测试成绩合格的人数; (2)若由直方图来估计这组数据的中位数,指出该中位数在 第几组内,并说明理由.
[解] (1)由题易知,第 6 小组的频率为 1-(0.04+0.10+ 0.14+0.28+0.30)×1=0.14,∴此次测试的总人数为0.714=50.
∴ 这 次 铅 球 测 试 成 绩 合 格 的 人 数 为 (0.28×1 + 0.30×1 + 0.14×1)×50=36.
[答案] 4 0.7
5.如图所示是某学校一名篮球运动员在五场比赛中所得分 数的茎叶图,则该运动员在这五场比赛中得分的方差为 ________.
(注:方差 s2=1n[(x1- x )2+(x2- x )2+…+(xn- x )2],其中 x 为 x1,x2,…,xn 的平均数)
[解析] 依题意知,运动员在 5 次比赛中的分数依次为 8,9,10,13,15,其平均数为8+9+105+13+15=11.
用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图 优缺 中得到;(2)便于记录和读取,能够展示数据的分布情况.缺 点 点是:当样本数据较多或数据位数较多时,茎叶图就显得不
太方便
4. 样本的Fra Baidu bibliotek字特征
数字特征
定义
特点
众数
体现了样本数据的最大 在一组数据中出现次数
集中点,不受极端值的 最多的数据
频率 提示:组距,频率,1.
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:把频率分布直方图中各个长方形上 边的__中__点__用线段连接起来,就得到频率分布折线图. (2)设想如果样本容量_______不__断__增__大_____,分组的组距 __不__断__缩__小________,则频率分布直方图实际上越来越接近于 _总__体__的__分__布___,它可以用一条光滑曲线__y=__f_(_x_) _来描绘,这 条光滑曲线就叫做总体密度曲线.
影响,而且不唯一
中位数
将一组数据按大小顺序 依次排列,处在最中间 中位数不受极端值的影 位置的一个数据(或最 响,仅利用了排在中间 中间两个数据的平均 数据的信息 数)
如果有 n 个数 x1,x2,…,xn,那么-x = 平 样本数据的 1n(x1+x2+…+xn)叫做这 n 个数的平均 均
算术平均数 数.在频率分布直方图中,平均数的估计 数
230×100=15(人). [答案] 15
4.(2016·烟台四校联考)据悉山东省高考要将体育成绩作为 参考,为此,济南市为了了解今年高中毕业生的体能状况,从 本市某校高中毕业班中抽取一个班进行铅球测试,成绩在 8.0 m(精确到 0.1 m)以上的为合格.把所得数据进行整理后,分成 6 组,并画出频率分布直方图的一部分如图所示.已知从左到 右前 5 个小组对应矩形的高分别为 0.04,0.10,0.14,0.28,0.30,且 第 6 小组的频数是 7.
⑤茎叶图中的数据要按从小到大的顺序写,相同的数据可
以只记一次.
A.①③④
B.②③④
C.③④
D.②③④⑤
[解析] ①错误.平均数一定不大于这组数据中的最大值; ②正确.平均数表示一组数据的平均水平,众数表示一组数据 中出现次数最多的数,中位数等分样本数据所占频率,都可以 从不同的角度描述数据的集中趋势.③正确.由方差的意义知 结论正确.④正确.由频率分布直方图的意义知结论正确.⑤ 错误,茎叶图要求不能丢失数据.故选 B.
[解析] 选 A 根据概率分布直方图的概念可知,|a-b|×h
=m,由此可知|a-b|=mh .
3.某地政府调查了工薪阶层 1 000 人的月工资收入,并根 据调查结果画出如图所示的频率分布直方图,为了了解工薪阶 层对月工资收入的满意程度,要用分层抽样的方法从调查的 1 000 人中抽出 100 人做电话询访,则(30,35](百元)月工资收入段 应抽出________人.
[解析] 由分组可知 C,D 一定不对;由茎叶图可知[0,5) 有 1 人,[5,10)有 1 人,∴第一、二小组频率相同,频率分布直 方图中矩形的高应相等,可排除 B.
[答案] A
【例 2】 (2016·九江模拟)甲、乙两人在淘宝网各开一家 网店,直销同一厂家的同一种产品,厂家为考察两人的销售业 绩,随机选了 10 天,统计两店销售量,得到如图所示的茎叶图, 由图知( )
样本平均数的两边越
分散
同标准差一样用来 方 标准差的平方,即 s2=1n[(x1--x )2+(x2 衡量样本数据的离
差 -x)2+…+(xn--x )2]
散程度,但是平方 后夸大了偏差程度
[质疑探究2] 怎样利用频率分布直方图求众数、中位数与 平均数?
提示:在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直 方图中每个小长方形的面积乘以小长方形底边中点的横坐标之 和.
第九章 统计、统计案例 第2节 用样本估计总体
◆考纲·了然于胸◆
1.了解分布的意义与作用,能根据频率分布表画频率分布 直方图、频率折线图、茎叶图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准 差.
3.能从样本数据中提取基本的数字特征(如平均数、标 准 差),并做出合理的解释.
2.(2016·河南三市调研)在检验某产品直径尺寸的过程中,
将某尺寸分成若干组,[a,b)是其中的一组,抽查出的个体数
在该组上的频率为 m,该组在频率分布直方图上的高为 h,则|a
-b|等于( )
m A. h C.mh
h B.m D.与 h,m 无关
18 人参加一项活动,则从身高在[140,150]内的学生中选取的人
数应为( )
A.2
B.3
C.4
D.5
[解析] 选 B 依题意可得 10×(0.005+0.01+0.02+a+ 0.035)=1,则 a=0.03.
所以身高在[ 120,130),[ 130,140),[ 140,150] 三组内的学生 比例为 3∶2∶1.
3.茎叶图
定义
是统计中用来表示数据的一种图,茎是指中间的一列数,叶 就是从茎的旁边生长出来的数
对于样本数据较少,且分布较为集中的一组数据:若数据是 两位整数,则将十位数字作茎,个位数字作叶;若数据是三 画法 位整数,则将百位、十位数字作茎,个位数字作叶.样本数 据为小数时做类似处理.对于样本数据较少,且分布较为集 中的两组数据,关键是找到两组数据共有的茎
由方差公式得 s2=15[(8-11)2+(9-11)2+(10-11)2+(13- 11)2+(15-11)2]=15(9+4+1+4+16)=6.8.
[答案] 6.8
考点一 频率分布直方图的绘制及应用(基础型考点——
自主练透)
[方法链接]
(1)绘制频率分布直方图时需注意:①制作好频率分布表后
可以利用各组的频率之和是否为 1 来检验该表是否正确;②频
[答案] A
4.一个容量为 20 的样本,数据的分组及各组的频数如下: [10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4; [60,70),2;则 x=________;根据样本的频率分布估计,数据 落在[10,50)的概率约为________.
[解析] x=20-(2+3+5+4+2)=4,P=2+3+ 204+5= 0.7 或 P=1-4+ 202=170=0.7.
(2)直方图中中位数两侧的矩形面积和相等,即频率和相 等,前三组的频率和为 0.28,前四组的频率和为 0.56,∴中位 数位于第 4 组内.
考点二 茎叶图的应用(重点型考点——师生共研) 【例 1】 某学校随机抽取 20 个班,调查各班中有网上购 物经历的人数,所得数据的茎叶图如图所示,以组距为 5 将数 据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分 布直方图是( )
[答案] B
3.(2016·广州模拟)对某商店一个月内每天的顾客人数进行 了统计,得到样本的茎叶图(如图所示),则该样本的中位数、 众数、极差分别是( )
A.46,45,56 C.47,45,56
B.46,45,53 D.45,47,53
[解析] 茎叶图中共有 30 个数据,所以中位数是第 15 个 和第 16 个数字的平均数,即12(45+47)=46,排除 C,D;再计 算极差,最小数据是 12,最大数据是 68,所以 68-12=56, 故选 A.
[答案] D
【名师说“法”】
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这 个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎 与叶的含义.
跟踪训练
1.某苗圃基地为了解基地内甲、乙两块地种植的同一种树
苗的长势情况,从两块地各随机抽取了 10 株树苗,用茎叶图表
A.甲网店的极差大于乙网店的极差 B.甲网店的中位数是 46 C.乙网店的众数是 42 D.甲网店的销售业绩好
[解析] 甲网店极差为 58-6=52,乙网店极差为 58-5= 53,A 错;甲网店中位数为 44,B 错;乙网店的众数为 13,C 错;甲网店平均数110(6+11+12+32+43+47+45+51+58+ 51)=35.6,乙网店平均数为110(5+7+13+13+13+22+34+42 +42+58)=24.9,所以甲网店的业绩好. 故选 D.
值等于每个小矩形的面积乘以小矩形底 边中点的横坐标之和
反映了各个样本数据
聚集于样本平均数周
围的程度.标准差越
标 标准差是样本数据到平均数的一种平均 小,表明各个样本数
准 距离,即 s=
据在样本平均数周围
差
n1[x1--x 2+x2--x 2+…+xn--x 2].越集中;标准差越大,
表明各个样本数据在
[质疑探究3] 平均数、标准差与方差反映了数据的哪些特 征?
提示:平均数反映了数据取值的平均水平,标准差、方差 反映了数据对平均数的波动情况,即标准差、方差越大,数据 的离散程度越大,越不稳定;反之离散程度越小,越稳定.
[小题查验] 1.给出下列命题,正确的是( ) ①一组数据的平均数一定大于这组数据中的每个数据 ②平均数、众数与中位数都可以描述数据的集中趋势 ③一组数据的方差越大,说明这组数据的波动越大 ④频率分布直方图中,小矩形的面积越大,表示样本数据 落在该区间内的频率越高
[答案] B
2.某雷达测速区规定:凡车速大
于或等于 70 km/h 的汽车视为“超
速”,并将受到处罚,如图是某路段
的一个检测点对 200 辆汽车的车速进
行检测所得结果的频率分布直方图,
则从图中可以看出被处罚的汽车大约有( )
A.30 辆
B.40 辆
C.60 辆
D.80 辆
[解析] 由题图可知,车速大于或等于 70 km/h 的汽车的频 率为 0.02×10=0.2,则将被处罚的汽车大约有 200×0.2= 40(辆).故选 B.
4.会用样本的频率分布估计总体分布,会用样本的基本数 字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一 些简单的实际问题.
[要点梳理] 1.作频率分布直方图的步骤
[质疑探究1] 频率分布直方图中纵轴表示什么含义?小长 方形的面积表示什么?各小长方形面积之和等于多少?
频率 率分布直方图的纵坐标是组距,而不是频率.
(2)由频率分布直方图进行相关计算时,需掌握下列关系
频率 式:组距×组距=频率.
[题组集训]
1.(2016·黄冈月考)从某小学随
机抽取 100 名同学,将他们的身高(单
位:厘米)数据绘制成频率分布直方
图(如图).若要从身高在[120,130),
[130,140),[140,150]三组内的学生中,用分层抽样的方法选取
[解析] 月工资收入落在(30,35](百元)内的频率为 1-(0.02 +0.04+0.05+0.05+0.01)×5=1-0.85=0.15,则 0.15÷5= 0.03,所以各组的频率比为 0.02∶0.04∶0.05∶0.05∶0.03∶0.01 =2∶4∶5∶5∶3∶1,所以(30,35](百元)月工资收入段应抽出
(1)求这次铅球测试成绩合格的人数; (2)若由直方图来估计这组数据的中位数,指出该中位数在 第几组内,并说明理由.
[解] (1)由题易知,第 6 小组的频率为 1-(0.04+0.10+ 0.14+0.28+0.30)×1=0.14,∴此次测试的总人数为0.714=50.
∴ 这 次 铅 球 测 试 成 绩 合 格 的 人 数 为 (0.28×1 + 0.30×1 + 0.14×1)×50=36.
[答案] 4 0.7
5.如图所示是某学校一名篮球运动员在五场比赛中所得分 数的茎叶图,则该运动员在这五场比赛中得分的方差为 ________.
(注:方差 s2=1n[(x1- x )2+(x2- x )2+…+(xn- x )2],其中 x 为 x1,x2,…,xn 的平均数)
[解析] 依题意知,运动员在 5 次比赛中的分数依次为 8,9,10,13,15,其平均数为8+9+105+13+15=11.
用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图 优缺 中得到;(2)便于记录和读取,能够展示数据的分布情况.缺 点 点是:当样本数据较多或数据位数较多时,茎叶图就显得不
太方便
4. 样本的Fra Baidu bibliotek字特征
数字特征
定义
特点
众数
体现了样本数据的最大 在一组数据中出现次数
集中点,不受极端值的 最多的数据
频率 提示:组距,频率,1.
2.频率分布折线图和总体密度曲线 (1)频率分布折线图:把频率分布直方图中各个长方形上 边的__中__点__用线段连接起来,就得到频率分布折线图. (2)设想如果样本容量_______不__断__增__大_____,分组的组距 __不__断__缩__小________,则频率分布直方图实际上越来越接近于 _总__体__的__分__布___,它可以用一条光滑曲线__y=__f_(_x_) _来描绘,这 条光滑曲线就叫做总体密度曲线.
影响,而且不唯一
中位数
将一组数据按大小顺序 依次排列,处在最中间 中位数不受极端值的影 位置的一个数据(或最 响,仅利用了排在中间 中间两个数据的平均 数据的信息 数)
如果有 n 个数 x1,x2,…,xn,那么-x = 平 样本数据的 1n(x1+x2+…+xn)叫做这 n 个数的平均 均
算术平均数 数.在频率分布直方图中,平均数的估计 数
230×100=15(人). [答案] 15
4.(2016·烟台四校联考)据悉山东省高考要将体育成绩作为 参考,为此,济南市为了了解今年高中毕业生的体能状况,从 本市某校高中毕业班中抽取一个班进行铅球测试,成绩在 8.0 m(精确到 0.1 m)以上的为合格.把所得数据进行整理后,分成 6 组,并画出频率分布直方图的一部分如图所示.已知从左到 右前 5 个小组对应矩形的高分别为 0.04,0.10,0.14,0.28,0.30,且 第 6 小组的频数是 7.
⑤茎叶图中的数据要按从小到大的顺序写,相同的数据可
以只记一次.
A.①③④
B.②③④
C.③④
D.②③④⑤
[解析] ①错误.平均数一定不大于这组数据中的最大值; ②正确.平均数表示一组数据的平均水平,众数表示一组数据 中出现次数最多的数,中位数等分样本数据所占频率,都可以 从不同的角度描述数据的集中趋势.③正确.由方差的意义知 结论正确.④正确.由频率分布直方图的意义知结论正确.⑤ 错误,茎叶图要求不能丢失数据.故选 B.
[解析] 选 A 根据概率分布直方图的概念可知,|a-b|×h
=m,由此可知|a-b|=mh .
3.某地政府调查了工薪阶层 1 000 人的月工资收入,并根 据调查结果画出如图所示的频率分布直方图,为了了解工薪阶 层对月工资收入的满意程度,要用分层抽样的方法从调查的 1 000 人中抽出 100 人做电话询访,则(30,35](百元)月工资收入段 应抽出________人.
[解析] 由分组可知 C,D 一定不对;由茎叶图可知[0,5) 有 1 人,[5,10)有 1 人,∴第一、二小组频率相同,频率分布直 方图中矩形的高应相等,可排除 B.
[答案] A
【例 2】 (2016·九江模拟)甲、乙两人在淘宝网各开一家 网店,直销同一厂家的同一种产品,厂家为考察两人的销售业 绩,随机选了 10 天,统计两店销售量,得到如图所示的茎叶图, 由图知( )
样本平均数的两边越
分散
同标准差一样用来 方 标准差的平方,即 s2=1n[(x1--x )2+(x2 衡量样本数据的离
差 -x)2+…+(xn--x )2]
散程度,但是平方 后夸大了偏差程度
[质疑探究2] 怎样利用频率分布直方图求众数、中位数与 平均数?
提示:在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直 方图中每个小长方形的面积乘以小长方形底边中点的横坐标之 和.
第九章 统计、统计案例 第2节 用样本估计总体
◆考纲·了然于胸◆
1.了解分布的意义与作用,能根据频率分布表画频率分布 直方图、频率折线图、茎叶图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准 差.
3.能从样本数据中提取基本的数字特征(如平均数、标 准 差),并做出合理的解释.