最新-2018届高考数学一轮复习 第9章第三节 用样本估计总体课件 文 精品
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【名师点评】 考查样本数据的平均水平及 稳定情况时,应先比较其平均数,若平均数 相同,再比较其方差或标准差.
变式训练2 甲、乙两组数据如下: 甲 11.2 9.8 12.3 8.9 9.0 10.7 13.1 乙 10.3 8.9 13.0 9.7 8.6 11.2 12.3 (1)求两组数据的平均数; (2)画出茎叶图求中位数; (3)求两组数据的方差; (4)对两组数据加以比较.
(4)标准差:设样本数据是 x1,x2,…,xn, x 表 示这组数据的平均数,xi 到 x 的距离是|xi- x |(i =1,2,…,n). 于是样本中数据到平均数的“平均距离”是 s= n1(|x1- x |+|x2- x |+…+|xn- x |). 由于上式含绝对值,运算不太方便,因此,通
(6)茎叶图的特征: ①用茎叶图表示数据有两个优点:一是统计 图上没有原始数据信息的损失,所有数据信 息都可以从茎叶图中得到;二是茎叶图中的 数据可以随时记录,随时添加,方便记录与 表示. ②茎叶图只便于表示两位有效数字的数据, 而且茎叶图只方便记录两组数据,两组以上 的数据虽然能够记录,但是没有表示两组数 据那么直观、清晰.
例2 某良种培育基地正在培育一种小麦新品 种A,将其与原有的一个优良品种B进行对照 试验.两种小麦各种植了25亩,所得亩产数据 (单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400, 405,412,414,415,421,423,423,427,430,430,434,44 3,445,445,451,454
(2)中位数:样本数据中,累计频率为0.5时所 对应的样本数据(累计频率:样本数据小于某 一数值的频率叫做该数值点的累计频率)或将 数据按大小排列,位于最中间的数据.如果 数据的个数为偶数,就取最中间两个数据的 平均数作为中位数. (3)平均数:样本数据的算术平均数,即 x =n1(x1 +x2+…+xn).
2.(2011年徐州调研)某射手在一次训练中五次 射击的成绩分别为9.4,9.4,9.4,9.6,9.7,则 该射手成绩的方差是________. 答案:0.016
3.某赛季,甲、乙两名篮球运动员都参加了 11场比赛,他们每场比赛得分的情况用如图所 示的茎叶图表示,则甲、乙两名运动员比赛 得分的中位数之和是________. 答案:32
第三节 用样本估计总体
双基研习·面对高考 第 三 节
用
考点探究·挑战高考
样
本
估
计
总
体
考向瞭望·把脉高考
双基研习·面对高考
基础梳理 1.频率分布直方图与茎叶图 (1)频率分布表:当总体很大或不便于获得时, 可以用样本的频率分布估计总体的频率分布, 我们把反映总体频率分布的表格称为_频__率__分__ _布__表__.
【思路分析】 (1)利用每组中频 频数 率相等;(2)利 用分布直方图中每个小矩形的意义补图;(3) 成绩在 75.5~85.5 分的学生分别为第三组和第 四组中学生的一半.
【解】 (1)
分组 50.5~60.5 60.5~70.5 70.5~80.5 80.5~90.5 90.5~100.5
合计
甲:10 分,13 分,12 分,14 分,16 分;
乙:13 分,14 分,12 分,12 分,14 分.
x
甲=10+
13+
12+14+ 5
16=13,
x
乙=13+
14+
12+12+ 5
14=13,
s2甲=15
5
i 1
(xi- x )2=15[(10-13)2+(13-13)2+(12-13)2
+(14-13)2+(16-13)2]=4,
(4)频率分布直方图的特征:①从频率分布直方 图可以清楚地看出数据分布的总体趋势;②从 频率分布直方图中得不出原始的数据内容,把 数据表示成直方图后,原有的具体数据信息就 被抹掉了.
(5)茎叶图:当数据是两位有效数字时,用中 间的数字表示_十__位__数__,即第一个有效数字, 两边的数字表示_个__位__数__,即第二个有效数字, 它的中间部分像植物的茎,两边部分像植物 茎上长出来的叶子,因此通常把这样的图叫 做茎叶图.
【名师点评】 但当样本数据较多时,茎叶 图就显得不太方便了.因为数据较多时,枝 叶就会很长,需要占据较多的空间.
用样本的数字特征估计总体的数字 特征
(1)各数字特征的优缺点:众数体现了样本数据 的最大集中点,但对其他数据信息的忽视使得 无法客观地反映总体特征;中位数是样本数据 所占频率的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它对极端值 的不敏感有时也成为缺点.因为这些极端值有
(2)频率分布直方图:利用直方图反映样本的 _频__率__分__布__规律,这样的直方图称为频率分布 直方图. (3)画频率分布直方图的一般步骤:①计算一组 数据中最大值与最小值的差,即求极差;②确 定 _组__距__与__组__数__ ; ③ 将 数 据 分 组 ; ④ 列 频 率 分 布表;⑤画频率分布直方图.
分组 50.5~60.5 60.5~70.5 70.5~80.5 80.5~90.5 90.5~100.5
合计
频数 4
10 16
50
频率 0.08 0.16
0.32
(1)填充频率分布表中的空格(将答案直接填在 表格内); (2)补全频率分布直方图;
(3)若成绩在75.5~85.5分的学生可以获得二等 奖,问获得二等奖的学生约为多少人?
例3 甲乙二人参加某体育项目训练,近期的 五次测试得分情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练 成绩作出评价. 【思路分析】 (1)先通过图象统计出甲、乙 二人的成绩; (2)利用公式求出平均数、方差,再分析两人 的成绩,作出评价.
【解】 (1)由图象可得甲、乙两人五次测试的成绩分别 为
频数 4 8 10 16 12 50
频率 0.08 0.16 0.20 0.32 0.24 1.00
(2)频率分布直方图如图所示:
(3)成绩在 75.5~80.5 分的学生占成绩在 70.5~ 80.5 分的学生的150,因为成绩在 70.5~80.5 分 的学生的频率为 0.20,所以成绩在 75.5~80.5 分的学生的频率为 0.10. 成绩在 80.5~85.5 分的学生占成绩在 80.5~ 90.5 分的学生的150,因为成绩在 80.5~90.5 分
①将数据分组,确定合适的组距,列出频率分
布表,本题中已经给出频率分布表;②明确纵、
频率
频数
横轴的意义,纵轴表示组距,频率=样本容量,
横轴表示样本数据,画出直方图;③直方图 中每一个小长方形的面积是样本数据落在这 个区间上的频率,所有的小长方形的面积之 和等于1,即频率之和为1,由此可以估计样 本数据落在某个区间的频率或概率或者总体 的数字特征.
常改为如下公式来计算标准差:
s=
n1[x1- x 2+x2- x 2+…+xn- x 2].
(5)方差:从数学的角度考虑,有时用标准差的
平方 s2(方差)来代替标准差,作为衡量样本数据
离散程度的工具,s2=n1[(x1- x )2+(x2- x )2+… +(xn- x )2].
课前热身
1.为了解一片经济林的生长情况,随机测量 了其中100株树木的底部周长(单位:cm).根 据所得数据画出样本的频率分布直方图如图, 那么在这100株树木中,底 部周长小于110 cm的株数是 __________. 答案:70i- x )2=15[(13-13)2+(14-13)2+(12-13)2
+(12-13)2+(14-13)2]=0.8.
(2)由 s2甲>s2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的 成绩上下波动,可知甲的成绩在不断提高,而乙 的成绩则无明显提高.
的学生的频率为 0.32,所以成绩在 80.5~85.5 分的学生的频率为 0.16. 所以成绩在 75.5~85.5 分的学生的频率为 0.26, 由于有 900 名学生参加了这次竞赛, 所以该校获得二等奖的学生约为 0.26×900= 234(人).
【名师点评】 一般用频率分布直方图反映样 本的频率分布,从而对总体的频率分布作出估 计.其具体步骤如下:
互动探究1 例1条件不变,问本次竞赛成绩 的中位数落在哪一组内?
解:中位数落在第四组内,前三组的频率之 和为0.44,第四组的频率为0.32,所以应落在 第四组内.
茎叶图的应用
由于茎叶图较好地保留了原始数据,所以可以 帮助我们分析样本数据的大致频率分布.在利 用茎叶图分析数据特点时,要注意区别茎与 叶.
4.我市某机构调查小学生课业负担的情况, 设平均每人每天做作业时间为x(单位:分钟), 按时间分下列四种情况统计:①0~30分钟; ②30~60分钟;③60~90分钟;④90分钟及 90分钟以上,有1000名小学生参加了此项调 查,下图是此次调查的流程图,已知输出的 结果是600,则平均每天做作业时间在0~60 分钟内的学生的频率是__________.
时是不能忽视的.与众数、中位数比较起来, 平均数可以反映出更多的关于样本数据全体 的信息,但平均数受数据中极端值的影响较 大,这使其在估计总体时可靠性降低. (2)标准差、方差描述了一组数据围绕平均数 波动的大小.标准差、方差越大,数据的分 散程度越大,标准差、方差越小,数据的分 散程度越小.
(3)标准差、方差的取值范围为[0,+∞),标 准差、方差为0时,样本中各数据全相等,表 明数据没有波动,数据没有分散性. (4)因为方差与原始数据的单位不同,且平方 后可能夸大了偏差的程度,所以虽然方差与 标准差在刻画样本数据的分散程度上是一样 的,但在解决实际问题时,一般多采用标准 差.
品种B:363,371,374,383,385,386,391,392,394, 394,395,397,397,400,401,401,403,406,407,410,4 12,415,416,422,430 (1)完成数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量及 其稳定性进行比较,写出统计结论. 【思路分析】 确定茎、叶,画茎叶图,观 察A、B的平均值、方差,得结论.
断增大,分组的组距不断缩小,则频率分布 直方图实际上越来越接近于总体的分布,它 可以用一条光滑曲线y=f(x)来描绘,这条光 滑的曲线就叫做_总__体__密__度__曲__线__. 3.众数、中位数、平均数、标准差、方差 (1)众数:在样本数据中,频率分布最大值所 对应的样本数据或出现次数最多的那个数 据.
【解】 (1)
(2)由于每个品种的数据都只有25个,样本不 大,画茎叶图很方便;此时茎叶图不仅清晰、 明了地展示了数据的分布情况,便于比较, 没有任何信息损失,而且还可以随时记录新 的数据. (3)通过观察茎叶图可以看出:①品种A的亩产 平均数(或均值)比品种B高;②品种A的亩产 标准差(或方差)比品种B大,故品种A的亩产 稳定性较差.
2.频率分布折线图与总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各 小长方形上端的_中__点__,就得到频率分布折线 图. (2)总体密度曲线:在样本频率分布直方图中, 样本容量越大,所分组数越多,图中表示的频 率分布就越接近于总体在各个小组内所取值的 个数与总数比值的大小.设想如果样本容量不
答案:0.4
考点探究·挑战高考
考点突破
频率分布直方图在总体估计中的应用
频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标表示组距,纵坐标
频率
频率
表示组距,频率=组距×组距.
(2)频率分布直方图中各小长方形的面积之和 为1,因此在频率分布直方图中组距是一个固 定值,所以各小长方形高的比也就是频率比 组距. (3)频率分布表和频率分布直方图是一组数据 频率分布的两种表现形式,前者准确,后者 直观.
例1 (2011年徐州质检)为了让学生了解环保 知识,增强环保意识,某中学举行了一次 “环保知识竞赛”,共有900名学生参加了这 次竞赛.为了解本次竞赛的成绩情况,从中 抽取了部分学生的成绩(得分均为整数,满分 为100分)进行统计.请你根据尚未完成并有局 部污损的频率分布表和频率分布直方图(如图), 解答下列问题:
变式训练2 甲、乙两组数据如下: 甲 11.2 9.8 12.3 8.9 9.0 10.7 13.1 乙 10.3 8.9 13.0 9.7 8.6 11.2 12.3 (1)求两组数据的平均数; (2)画出茎叶图求中位数; (3)求两组数据的方差; (4)对两组数据加以比较.
(4)标准差:设样本数据是 x1,x2,…,xn, x 表 示这组数据的平均数,xi 到 x 的距离是|xi- x |(i =1,2,…,n). 于是样本中数据到平均数的“平均距离”是 s= n1(|x1- x |+|x2- x |+…+|xn- x |). 由于上式含绝对值,运算不太方便,因此,通
(6)茎叶图的特征: ①用茎叶图表示数据有两个优点:一是统计 图上没有原始数据信息的损失,所有数据信 息都可以从茎叶图中得到;二是茎叶图中的 数据可以随时记录,随时添加,方便记录与 表示. ②茎叶图只便于表示两位有效数字的数据, 而且茎叶图只方便记录两组数据,两组以上 的数据虽然能够记录,但是没有表示两组数 据那么直观、清晰.
例2 某良种培育基地正在培育一种小麦新品 种A,将其与原有的一个优良品种B进行对照 试验.两种小麦各种植了25亩,所得亩产数据 (单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400, 405,412,414,415,421,423,423,427,430,430,434,44 3,445,445,451,454
(2)中位数:样本数据中,累计频率为0.5时所 对应的样本数据(累计频率:样本数据小于某 一数值的频率叫做该数值点的累计频率)或将 数据按大小排列,位于最中间的数据.如果 数据的个数为偶数,就取最中间两个数据的 平均数作为中位数. (3)平均数:样本数据的算术平均数,即 x =n1(x1 +x2+…+xn).
2.(2011年徐州调研)某射手在一次训练中五次 射击的成绩分别为9.4,9.4,9.4,9.6,9.7,则 该射手成绩的方差是________. 答案:0.016
3.某赛季,甲、乙两名篮球运动员都参加了 11场比赛,他们每场比赛得分的情况用如图所 示的茎叶图表示,则甲、乙两名运动员比赛 得分的中位数之和是________. 答案:32
第三节 用样本估计总体
双基研习·面对高考 第 三 节
用
考点探究·挑战高考
样
本
估
计
总
体
考向瞭望·把脉高考
双基研习·面对高考
基础梳理 1.频率分布直方图与茎叶图 (1)频率分布表:当总体很大或不便于获得时, 可以用样本的频率分布估计总体的频率分布, 我们把反映总体频率分布的表格称为_频__率__分__ _布__表__.
【思路分析】 (1)利用每组中频 频数 率相等;(2)利 用分布直方图中每个小矩形的意义补图;(3) 成绩在 75.5~85.5 分的学生分别为第三组和第 四组中学生的一半.
【解】 (1)
分组 50.5~60.5 60.5~70.5 70.5~80.5 80.5~90.5 90.5~100.5
合计
甲:10 分,13 分,12 分,14 分,16 分;
乙:13 分,14 分,12 分,12 分,14 分.
x
甲=10+
13+
12+14+ 5
16=13,
x
乙=13+
14+
12+12+ 5
14=13,
s2甲=15
5
i 1
(xi- x )2=15[(10-13)2+(13-13)2+(12-13)2
+(14-13)2+(16-13)2]=4,
(4)频率分布直方图的特征:①从频率分布直方 图可以清楚地看出数据分布的总体趋势;②从 频率分布直方图中得不出原始的数据内容,把 数据表示成直方图后,原有的具体数据信息就 被抹掉了.
(5)茎叶图:当数据是两位有效数字时,用中 间的数字表示_十__位__数__,即第一个有效数字, 两边的数字表示_个__位__数__,即第二个有效数字, 它的中间部分像植物的茎,两边部分像植物 茎上长出来的叶子,因此通常把这样的图叫 做茎叶图.
【名师点评】 但当样本数据较多时,茎叶 图就显得不太方便了.因为数据较多时,枝 叶就会很长,需要占据较多的空间.
用样本的数字特征估计总体的数字 特征
(1)各数字特征的优缺点:众数体现了样本数据 的最大集中点,但对其他数据信息的忽视使得 无法客观地反映总体特征;中位数是样本数据 所占频率的等分线,它不受少数几个极端值的 影响,这在某些情况下是优点,但它对极端值 的不敏感有时也成为缺点.因为这些极端值有
(2)频率分布直方图:利用直方图反映样本的 _频__率__分__布__规律,这样的直方图称为频率分布 直方图. (3)画频率分布直方图的一般步骤:①计算一组 数据中最大值与最小值的差,即求极差;②确 定 _组__距__与__组__数__ ; ③ 将 数 据 分 组 ; ④ 列 频 率 分 布表;⑤画频率分布直方图.
分组 50.5~60.5 60.5~70.5 70.5~80.5 80.5~90.5 90.5~100.5
合计
频数 4
10 16
50
频率 0.08 0.16
0.32
(1)填充频率分布表中的空格(将答案直接填在 表格内); (2)补全频率分布直方图;
(3)若成绩在75.5~85.5分的学生可以获得二等 奖,问获得二等奖的学生约为多少人?
例3 甲乙二人参加某体育项目训练,近期的 五次测试得分情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练 成绩作出评价. 【思路分析】 (1)先通过图象统计出甲、乙 二人的成绩; (2)利用公式求出平均数、方差,再分析两人 的成绩,作出评价.
【解】 (1)由图象可得甲、乙两人五次测试的成绩分别 为
频数 4 8 10 16 12 50
频率 0.08 0.16 0.20 0.32 0.24 1.00
(2)频率分布直方图如图所示:
(3)成绩在 75.5~80.5 分的学生占成绩在 70.5~ 80.5 分的学生的150,因为成绩在 70.5~80.5 分 的学生的频率为 0.20,所以成绩在 75.5~80.5 分的学生的频率为 0.10. 成绩在 80.5~85.5 分的学生占成绩在 80.5~ 90.5 分的学生的150,因为成绩在 80.5~90.5 分
①将数据分组,确定合适的组距,列出频率分
布表,本题中已经给出频率分布表;②明确纵、
频率
频数
横轴的意义,纵轴表示组距,频率=样本容量,
横轴表示样本数据,画出直方图;③直方图 中每一个小长方形的面积是样本数据落在这 个区间上的频率,所有的小长方形的面积之 和等于1,即频率之和为1,由此可以估计样 本数据落在某个区间的频率或概率或者总体 的数字特征.
常改为如下公式来计算标准差:
s=
n1[x1- x 2+x2- x 2+…+xn- x 2].
(5)方差:从数学的角度考虑,有时用标准差的
平方 s2(方差)来代替标准差,作为衡量样本数据
离散程度的工具,s2=n1[(x1- x )2+(x2- x )2+… +(xn- x )2].
课前热身
1.为了解一片经济林的生长情况,随机测量 了其中100株树木的底部周长(单位:cm).根 据所得数据画出样本的频率分布直方图如图, 那么在这100株树木中,底 部周长小于110 cm的株数是 __________. 答案:70i- x )2=15[(13-13)2+(14-13)2+(12-13)2
+(12-13)2+(14-13)2]=0.8.
(2)由 s2甲>s2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的 成绩上下波动,可知甲的成绩在不断提高,而乙 的成绩则无明显提高.
的学生的频率为 0.32,所以成绩在 80.5~85.5 分的学生的频率为 0.16. 所以成绩在 75.5~85.5 分的学生的频率为 0.26, 由于有 900 名学生参加了这次竞赛, 所以该校获得二等奖的学生约为 0.26×900= 234(人).
【名师点评】 一般用频率分布直方图反映样 本的频率分布,从而对总体的频率分布作出估 计.其具体步骤如下:
互动探究1 例1条件不变,问本次竞赛成绩 的中位数落在哪一组内?
解:中位数落在第四组内,前三组的频率之 和为0.44,第四组的频率为0.32,所以应落在 第四组内.
茎叶图的应用
由于茎叶图较好地保留了原始数据,所以可以 帮助我们分析样本数据的大致频率分布.在利 用茎叶图分析数据特点时,要注意区别茎与 叶.
4.我市某机构调查小学生课业负担的情况, 设平均每人每天做作业时间为x(单位:分钟), 按时间分下列四种情况统计:①0~30分钟; ②30~60分钟;③60~90分钟;④90分钟及 90分钟以上,有1000名小学生参加了此项调 查,下图是此次调查的流程图,已知输出的 结果是600,则平均每天做作业时间在0~60 分钟内的学生的频率是__________.
时是不能忽视的.与众数、中位数比较起来, 平均数可以反映出更多的关于样本数据全体 的信息,但平均数受数据中极端值的影响较 大,这使其在估计总体时可靠性降低. (2)标准差、方差描述了一组数据围绕平均数 波动的大小.标准差、方差越大,数据的分 散程度越大,标准差、方差越小,数据的分 散程度越小.
(3)标准差、方差的取值范围为[0,+∞),标 准差、方差为0时,样本中各数据全相等,表 明数据没有波动,数据没有分散性. (4)因为方差与原始数据的单位不同,且平方 后可能夸大了偏差的程度,所以虽然方差与 标准差在刻画样本数据的分散程度上是一样 的,但在解决实际问题时,一般多采用标准 差.
品种B:363,371,374,383,385,386,391,392,394, 394,395,397,397,400,401,401,403,406,407,410,4 12,415,416,422,430 (1)完成数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量及 其稳定性进行比较,写出统计结论. 【思路分析】 确定茎、叶,画茎叶图,观 察A、B的平均值、方差,得结论.
断增大,分组的组距不断缩小,则频率分布 直方图实际上越来越接近于总体的分布,它 可以用一条光滑曲线y=f(x)来描绘,这条光 滑的曲线就叫做_总__体__密__度__曲__线__. 3.众数、中位数、平均数、标准差、方差 (1)众数:在样本数据中,频率分布最大值所 对应的样本数据或出现次数最多的那个数 据.
【解】 (1)
(2)由于每个品种的数据都只有25个,样本不 大,画茎叶图很方便;此时茎叶图不仅清晰、 明了地展示了数据的分布情况,便于比较, 没有任何信息损失,而且还可以随时记录新 的数据. (3)通过观察茎叶图可以看出:①品种A的亩产 平均数(或均值)比品种B高;②品种A的亩产 标准差(或方差)比品种B大,故品种A的亩产 稳定性较差.
2.频率分布折线图与总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各 小长方形上端的_中__点__,就得到频率分布折线 图. (2)总体密度曲线:在样本频率分布直方图中, 样本容量越大,所分组数越多,图中表示的频 率分布就越接近于总体在各个小组内所取值的 个数与总数比值的大小.设想如果样本容量不
答案:0.4
考点探究·挑战高考
考点突破
频率分布直方图在总体估计中的应用
频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标表示组距,纵坐标
频率
频率
表示组距,频率=组距×组距.
(2)频率分布直方图中各小长方形的面积之和 为1,因此在频率分布直方图中组距是一个固 定值,所以各小长方形高的比也就是频率比 组距. (3)频率分布表和频率分布直方图是一组数据 频率分布的两种表现形式,前者准确,后者 直观.
例1 (2011年徐州质检)为了让学生了解环保 知识,增强环保意识,某中学举行了一次 “环保知识竞赛”,共有900名学生参加了这 次竞赛.为了解本次竞赛的成绩情况,从中 抽取了部分学生的成绩(得分均为整数,满分 为100分)进行统计.请你根据尚未完成并有局 部污损的频率分布表和频率分布直方图(如图), 解答下列问题: