2020-2021学年高中数学必修3人教A版课件:第二章 统 计 章末高效整合

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.应用三种抽样方法时需搞清楚它们的使用原则: (1)当总体容量较小,样本容量较小时,制签简单,号签容易搅匀,可采用抽 签法; (2)当总体容量较大,样本容量较小时,可用随机数表法; (3)当总体容量较大,样本容量也较大时,可用系统抽样法; (4)当总体中个体差异较显著时,可采用分层抽样法.
某工厂有 1 003 名工人,从中抽取 10 人参加体检,试采用简单随机抽 样和系统抽样进行具体实施.
答案: 25
专题三 用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律,还可以通过样本数据的众数、中位数、
平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出
现最多的那个值;中位数就是处于中间位置的那个数(或者两个数的平均数);平
均数就是所有样本数据的平均值,用 x 表示;标准差是反映样本数据分散程度大
2.茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便 于记录和表示,但数据较多时不方便.
3.样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括 众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我 们常通过样本的数字特征估计总体的数字特征.
4.在用样本的频率分布估计总体的分布时应注意: (1)对于同一组样本数据,确定的组距不同,得到的组数及分组也不同,绘制 的频率分布直方图就会有差异,但都是对总体的近似估计. (2)应用频率分布直方图时,需明确纵轴表示的是频率/组距,进而进行相关 计算. (3)绘制茎叶图时需注意同一组数据中的相同数据要一一列出.
解析: (1) x 甲=1.69(m), x 乙=1.68(m). (2)s甲2 =0.000 6,s2乙=0.003 15, 因为 s甲2 <s乙2 ,所以甲稳定. (3)可能选甲参加,因为甲 8 次成绩都跳过 1.65 m 而乙有 3 次低于 1.65 m; 且 x 甲> x 乙,s2甲<s2乙. 不管是跳过 1.65 m 还是跳过 1.70 m 才有可能拿冠军,都选甲.
解析: (1)调查的旅客共 100 名,因而样本容量为 100. 频数
(2)由频数之和为 100,频率=样本容量可补全频率分布表和频率分布直方图 (图中的阴影部分).其中,第四组的频数为 50,频率为 0.50,第二组的频率为 0.10.
(3)设旅客平均购票时间为 s min,则有 0×0+5×10+10×11000+15×50+20×30≤s <5×0+10×10+15×10100+20×50+25×30, 即 15≤s<20. ∴旅客购票用时的平均数可能落在第四小组. (4)设需增加 x 个窗口, 则 20-5x≤10,解得 x≥2. ∴至少需要增加 2 个窗口.
[能力挑战] 2.从某小学随机抽取 100 名学生,将他们的身高(单位:厘米)数据绘制成频 率分布直方图(如图).由图中数据可知 a=_____________________________. 若要从身高在[120,130),[130,140),[140,150]内的学生中,用分层抽样的方 法选取 18 人参加一项活动,则应从身高在[140,150]内的学生中选取的人数为 ________.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大, 说明乙的状态在提升,更有潜力.
[能力挑战] 3.市体校准备挑选一名跳高运动员参加全市中学生运动会,对跳高运动队的 甲、乙两名运动员进行了 8 次选拔比赛.他们的成绩(单位:m)如下: 甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67 乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75 (1)甲、乙两名运动员的跳高平均成绩分别是多少? (2)哪位运动员的成绩更为稳定? (3)若预测跳过 1.65 m 就很可能获得冠军,该校为了获得冠军,可能选哪名运 动员参赛?若预测跳过 1.70 m 才能得冠军呢?
1
乙 7 5.4 7.5
3
(2)①甲、乙的平均数相同,均为 7,但 s甲2 <s2乙,说明甲偏离平均数的程度小, 而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次 数比甲多.
③甲、乙的平均水平相同,而乙命中 9 环以上(包含 9 环)的次数比甲多 2 次, 可知乙的射靶成绩比甲好.
热点考点例析
专题一 抽样方法的应用 1.应用抽样方法抽取样本时,应注意以下几点: (1)用随机数表法抽样时,对个体所编的号码位数要相等,当问题所给位数不 等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.如 1,2,3,…, 20 可凑成 01,02,03,…,20. (2)用系统抽样法抽样时,如果总体容量 N 能被样本容量 n 整除,抽样间隔为 k=Nn;如果总体容量 N 不能被样本容量 n 整除,先用简单随机抽样法剔除多余个 体,抽样间隔 k=Nn.
5.在用样本的数字特征估计总体的数字特征时应注意: (1)任何一个样本数据的改变都会引起平均数的改变.特殊情况下,平均数可 能受某几个极端值的影响,而偏离一般情况. (2)标准差的平方是方差,标准差的单位与样本数据的单位一致. (3)用样本的平均数和标准差估计总体的平均数和标准差时,样本的平均数和 标准差只是总体的平均数和标准差的近似.
三、变量的相关关系 1.两个随机变量 x 和 y 之间相关关系的判断方法有: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断. (2)表格、关系式法:结合表格或关系式进行判断. (3)经验法:借助积累的经验进行分析判断.
2.用公式求回归方程的一般步骤是: (1)列表.
n
n
(2018·上海徐汇区一模)某车间为了规定工时定额,需要确定加工零件所 花费的时间,为此作了四次试验,得到的数据如下:
零件的个数 x(个) 2 3 4 5 加工的时间 y(时) 2.5 3 4 4.5
(1)在给定的坐标系中画出表中数据的散点图; (2)求出 y 关于 x 的线性回归方程∧y=b∧x+a∧,并在坐标系中画出回归直线; (3)试预测加工 10 个零件需要多少时.
第一章
章末高效整合
知能整合提升
一、抽样方法
1.抽样方法有:简单随机抽样、系统抽样、分层抽样.
2.三种抽样方法比较
类别 共同点
各自特点
相互联系
适用范围
简单随 从总体中逐个抽取
机抽样 抽样过程中
总体中的个体数较 少
系统 每个个体被 将总体均分成几个部分,按事 在第一部分抽样时采 总体中的个体数较
抽样 抽取的概率 先确定的规则在各部分抽取 用简单随机抽样
+7+7+8+9+9+10)=7,乙的射靶环数从小到大排列为 2,4,6,7,7,8,8,9,9,10,所
以中位数是7+2 8=7.5;甲的射靶环数从小到大排列为 5,6,6,7,7,7,7,8,8,9,所以中位
数为 7.于是填充后的表格如表所示:
平均数 方差 中位数 命中 9 环及以上
甲 7 1.2 7
专题二 用样本频率分布估计总体分布 1.用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列 表、作图处理. 2.茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便 于记录和表示.
某车站在春运期间为了改进服务,随机抽样调查了 100 名旅客从开始 在购票窗口排队到购到车票所用的时间 t(以下简称购票用时,单位:min).下面 是这次抽样的频率分布表和频率分布直方图,解答下列问题:
[能力挑战] 1.某学校共有教师 490 人,其中不到 40 岁的有 350 人,40 岁及以上的有 140 人.为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体 教师中抽取一个容量为 70 人的样本进行普通话水平测试,其中在不到 40 岁的教 师中应抽取的人数为多少人?
解析: 第一步,确定抽样比47900=17; 第二步,在不到 40 岁的教师中应抽取的人数为 350×17=50(人); 第三步,由以上的计算可知其中在不到 40 岁的教师中应抽取的人数为 50 人.
解析: 成绩在区间[60,70)内的学生人数的频率为 0.04×10=0.4,因此学生 总 人 数 为 04.04 = 100. 又 成 绩 在 区 间 [70,90) 内 的 学 生 人 数 是 成 绩 在 区 间 [70,80) 和 [80,90)内的学生人数的和,这两个区间相对应的小矩形的面积的和为(0.015+ 0.01)×10=0.25,此即为成绩在区间[70,90)内的学生人数的频率,因此成绩在 [70,90)内的学生有 100×0.25=25(人).
分组
频数
频率
第一组
0≤t<5
0
0
第二组
5≤t<10
10
第三组 10≤t<15
10 0.10
第四组 15≤t<20
第五组 20≤t<25
30 0.30
合计
100 1.00
(1)这次抽样的样本容量是多少? (2)在表中填写出缺失的数据并补全频率分布直方图; (3)旅客购票用时的平均数可能落在哪一小组? (4)若每增加一个购票窗口可使平均购票用时减少 5 min,要使平均购票用时 不超过 10 min,那么你估计至少要增加几个窗口?
1

5.4
3
(2)请从四个不同的角度对这次测试进行分析: ①从平均数和方差结合分析偏离程度; ②从平均数和中位数结合分析谁的成绩好些; ③从平均数和命中 9 环以上的次数相结合看谁的成绩好些; ④从折线图上看两人射击命中环数及走势分析谁更有潜力.
解析: (1)乙的射靶环数依次为 2,4,6,8,7,7,8,9,9,10,所以 x 乙=110(2+4+6+8
(2)计算 x , y ,x2i ,xiyi.
ห้องสมุดไป่ตู้i=1
i=1
(3)代入公式计算b∧,a∧的值. (4)写出回归直线方程.
3.学习变量的相关性时: (1)注意通过实例辨析确定性关系(函数关系)与相关关系.根据散点图分析两 个变量间的相关关系是正相关还是负相关. (2)学会用最小二乘法求已知样本数据的回归直线方程.用回归直线方程对总 体进行估计时,得到的结果不是准确值.
解析: (1)简单随机抽样: ①将每一个人编一个号由 0 001 至 1 003. ②制作大小相同的号签,并写上号码. ③放入一个大容器内,均匀搅拌. ④依次抽取 10 个号签. 具有这十个编号的人组成一个样本.
(2)系统抽样: ①将每个人编一个号由 0 001 至 1 003. ②利用随机数表抽取 3 个号,将这 3 个人剔除. ③重新编号 0 001 至 1 000. ④分段1 10000=100,所以 0 001 至 0 100 为第一段. ⑤在第一段内由简单随机抽样方法抽得一个号 l. ⑥按编号将 l,100+l,…,900+l 共 10 个号选出,这 10 个号所对应的人组 成样本.
小的最常用统计量,其计算公式为:
s=
1n[x1- x 2+x2- x 2+…+xn- x 2]
有时也用标准差的平方 s2——方差来代替标准差,实质一样.
甲、乙两人在相同的条件下各射靶 10 次,每次射靶成绩(单位:环) 如图所示.
(1)填写下表:
平均数 方差 中位数 命中 9 环及以上
甲 7 1.2

分层 是相同的 将总体分成几层,分层进行抽 各层抽样时采用简单 总体由差异明显的
抽样

随机抽样或系统抽样 几部分组成
二、用样本估计总体 1.作频率分布直方图的步骤: (1)求极差. (2)决定组距与组数,注意样本容量越大,所分组数越多. (3)将数据分组.
各小组频数 (4)计算各小组的频率,作频率分布表,各小组的频率= 样本容量 . (5)画频率分布直方图.
专题四 回归方程的应用 除了函数关系这种确定性的关系外,还有大量因变量的取值带有一定随机性 的两个变量之间的关系——相关关系. 分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间 是否存在相关关系,如果线性相关可利用最小二乘法求出回归直线方程.具体地 说就是把样本数据表示的点在直角坐标系中作出,叫散点图.从散点图上,我们 可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心 的一条直线附近,那么就说这两个变量之间具有线性相关关系.这条直线叫作回 归直线,直线方程叫作回归方程.
相关文档
最新文档