高考数学考点总复习课件 第64讲 抽样方法与总体分布的估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【解析】由题设,共分 10 个系统,每个系统 5 个个体,第 1 个系统的号码是 1,2,3,4,5.若在其中 抽取的号码为 n0,则第 k 个系统应抽的号码是(k -1)×10+n0,其中 1≤k≤10.由此可知应选 D.
2.某单位有老年人 28 人,中年人 54 人,青年人 81 人.为了解他们的学历水平,从中抽取容量为 36 的样 本,最适合的抽样方法是( )
3 ⑧ _______________________,就得到频
率分布折线图,随着样本容量的增加,折线 图会越来越近于一条光滑曲线,称之为总体 密度曲线.
4 茎叶图也能用来表示数据,茎是中间的一
列数,叶是从茎旁边上长出来的数,当样本 数据较少时,用茎叶图表示数据的效果更好.
3.样本的数字特征估计总体的数字特征
三 直方图、茎叶图的应用
【例 3】某良种培育基地正在培育一种小麦新品种 A.将其与原有的一个优良品种 B 进行对照试验.两种小 麦各种植了 25 亩,所得亩产数据(单位:千克)如下:
品种 A: 357,359,367,368,375,388,392,399,400,405,412,414,415,4 21,423,423,427,430,430,434,443,445,444,451,454
1 众数、中位数.
一组数据中出现次数⑨ ________的数据叫做 这组数据的众数. 将一组数据按照从大到小(或从小到大)排列, 处在⑩ ____________ 上的一个数据(或中间两 位数据的平均数)叫做这组数据的中位数.
2 平均数和方差的计算.
ⅰ( )如果有n个数据x1,x2,,xn,则x ⑪__ ________________ 叫做这组数据的平均数, s2 ⑫_______________________________ ____ 叫做这组数据的方差,而s叫做标准差. (ⅱ)公式s2 ⑬________________________ . (ⅲ)当一组数据x1,x2,,xn中各数较大时, 可将各数据减去一个适当的常数a,得到x1 x1 a,x2 x2 a,,xn xn a,则s2 ⑭_ ______________________________________ .
A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老年人中剔除 1 人,再分层抽样
【解析】由题设,个体有明显差异,因此应选择 分层抽样,但抽样比例若是 36∶163,不能得到整数值, 而先剔除 1 名老年人后按比例 36∶162,即 2∶9,能 从各层中抽取整数个个体,故选 D.
3.一个样本数据的茎叶图如下,其中位数为 22,则 x 的值为( )
轴上,纵轴表示频率与组距的比值,以每个 组距为底,以各频率除以组距的商为高,分 别画矩形,共得k个矩形,这样得到的图形 叫做⑦ ____________________ . 频率分布直方图的性质:ⅰ( )第i个矩形的面积等 于样本值落入区间[ti1,ti )的频率;(ⅱ)由于f1 f2 fk 1,所以所有小矩形的面积之和为1.
品种 B: 363,371,374,383,385,386,391,392,394,394,395,397,3 97,400,401,401,403,406,407,410,412,415,416,422,430
(1)绘出品种 A、B 产量的茎叶图,并根据茎叶图比较 品种 A、B 的平均产量和稳定性;
3分层抽样是总体由⑥ ________________,
常将总体按差异分成几个部分,然后按各部 分所占的比值进行抽样,其中所分成的各部 分叫做层.
4 系统抽样是当总体中的个数较多时,将总
体均分成几部分,按事先确定的规则在各部 分抽取.
2.总体分布的估计
1 列频率分布表.
2 画频率分布直方图,将区间[a,b)标在横
];⑭1 n
[(x12 x22 xn2 ) nx2 ];⑮a x b;⑯a2s2
1.现要从已编号(1~50)的 50 枚最新研制的 某型号导弹中随机抽取 5 枚进行发射试验,决定 采取系统抽样的方法确定选取的 5 枚导弹的编号 可能是( )
A.5,10,15,20,25 B.1,2,3,4,5 C.2,4,8,16,32 D.3,13,23,33,43
【点评】抽样方法是样本估计总体的关键第一 步,同时三种不同的抽样方法适用的情境也各 不相同,高考中通常将抽样方法渗入直方图、 茎叶图、数据统计分析和概率计算间进行考查.
素材2
对某单位 1000 名职工进行某项专门调查,调查的项 目与职工的任职年限有关,人事部门提供了如下资料:
任职年限 5年以下 5~10年 10年以上
【解析】 -x 甲=14(10+9.8+10+10.2)=10,
-x 乙=41(10.1+10+9.9+10)=10. -x 甲=-x 乙,故平均直径不能反映质量优劣.
s2甲=14[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02,
s2乙=14[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.
人 数 300
500
200
根据上述资料,设计一个样本容量为总体数量的110的 抽样方案.
【解析】因为调查的项目与职工的任职年限有关,即总 体由差异明显的几部分组成,采用分层抽样的方法抽取.
样本容量为:1000×110=100(人). 抽取方案为: 任职年限在 5 年以下的抽取 300×110=30(人); 任职年限在 5~10 年的抽取 500×110=50(人); 任职年限在 10 年以上的抽取 200×110=20(人).
【解析】(1)甲、乙两人五次测试的成绩分别为: 甲 10 分 13 分 12 分 14 分 16 分 乙 13 分 14 分 12 分 12 分 14 分 甲的平均得分为10+13+152+14+16=13, 乙的平均得分为13+14+152+12+14=13.
s2甲
=
1 5
[(10-
13)2
+
要点指南:①简单随机抽样;②分层抽样;
③系统抽样;④抽签法;⑤随机数表法;
⑥差异明显方形上
边的中点;⑨最多;⑩中间位置;⑪1 n
(
x1
x2
xn
);⑫1 n
[(
x1
x)2
(
x2
x)2
( xn
x)2
];⑬1 n
[( x12
x22
xn2
)
2
nx
(3)抽取的 5 名观众中,大于 40 岁的 3 人设为 a1, a2,a3,20 至 40 岁的 2 人设为 b1,b2,则从 5 人中抽取 2 人的基本事件有:(a1,a2),(a1,a3),(a2,a3),(b1,b2), (a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3, b2),共 10 种,其中恰有 1 人在 20 至 40 岁的有 6 种, 故所求概率 P=160=35.
【解析】根据(0.035+a+0.020+0.010+0.005)×10 =1,求得 a=0.030.
身高在[120,130)内的学生有 0.030×10×100=30 人, 身高在[130,140)内的学生有 0.020×10×100=20 人, 身高在[140,150)内的学生有 0.010×10×100=10 人, 则 从 身 高 在 [140,150) 内 的 学 生 中 选 取 的 人 数 为 30+1280+10×10=3 人.
【解析】(1)因为在 20 至 40 岁的 58 名观众中有 18 名收 看新闻节目,而大于 40 岁的 42 名观众中有 27 名观众收看 新闻节目,所以直观分析,收看新闻节目的观察与年龄有关.
(2)由题中所给条件,收看新闻节目的共 45 名,随机抽 取 5 名,则抽样比例为455=19,故大于 40 岁的观众应抽取 27×19=3(人).
A.1 C.0
B.2 D.3
【解析】由于样本数据为偶数,所以 22=20+2x+23, 求解 x=1,故选 A.
4.从某小学随机抽取 100 名同学,将他们的身高(单 位:cm)数据制成频率分布直方图如下,由图中数据可知 a = 0.030 .若要从身高[120,130),[130,140),[140,150)三 组内的学生中,用分层抽样选取 18 人参加一次活动,则从 身高在[140,150)内的学生中选取的人数为 3 人.
通过对样本的分析和研究更准确的反映总体 的情况,常用的抽样方法有① ____________、 ② ____________、③ ______________ .
2简单随机抽样是指一个总体的个数为N (较
小的有限数),通过逐个抽取一个样本,且每 次抽取时每个个体被抽取的概率相等.简单随 机抽样的两种常用方法为④ _______ 和⑤ ___ _________ .
5.某运动员第二赛季各场次得分的茎叶图 如下,则其中“4 |”表示 本赛季所有比赛 中,没有一场得过四十几分 .
0 68
1
2
2
6
7
2 24799
3
0
0
3
6
4
5 5
一 用样本估计总体
【例 1】甲、乙两人参加某体育项目训练,近期的五次 测试成绩情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和(1)算得的结果,对两人的训练成绩作出评价.
(2)设从品种 A 中亩产量不低于 440 千克的试验品种 中随机抽取两种进行下一年的对比试验,求亩产量 445 千克被抽中的频率.
【解析】(1)品种 A、B 的亩产量茎叶图如下:
通过茎叶图可以看出:①品种 A 的亩产平均数比 品种 B 高;②品种 A 的亩产标准差(或方差)比品种 B 的大,故品种 A 的亩产稳定性较差.
1.会用简单随机抽样方法从总体中抽取样本; 了解分层抽样和系统抽样方法. 2.会列频率分布表,会画频率分布直方图、 频率分布折线图、茎叶图,理解他们各自特点, 会计算数据的标准差、方差,会用样本的基本 数字特征估计总体的基本数字特征,会用样本 的频率分布估计总体分布.
1.抽样方法
1 抽样要具有随机性、等可能性,这样才能
s
2
乙
<
s
2
甲
,
说
明
乙
机
床
生
产
出
的
零
件
直
径
波
动
小
,
由
此
,
从质量稳定性的角度判断,乙机床生产的零件质量更符合要求.
二 抽样方法及实际应用
【例 2】(2011·佛山模拟)某电视台在一次对收看文艺 节目和新闻节目的抽样调查中,随机抽取了 100 名电视 观众,相关的数据如下表所示:
(1)由表中数据直观分析,收看新闻节目的观众是否与 年龄有关? (2)用分层抽样方法在收看新闻节目的观众中随机抽 取 5 名 , 大 于 40 岁 的 观 众 应 该 抽 取 几 名 ? (3)在上述抽取的 5 名观众中任取 2 名,求恰有 1 名观 众的年龄为 20 至 40 岁的概率.
(13-
13)2+
(12-
13)2+
(14-
13)2
+(16-13)2]=4,
s2乙
=
1 5
[(13-
13)2
+
(14-
13)2+
(12-
13)2+
(12-
13)2
+(14-13)2]=0.8.
(2)由 s2甲>s乙2 可知乙的成绩较稳定. 从折线图看,甲的成绩基本上呈上升状态,而乙的 成绩在平均线上下波动,可知甲的成绩在不断提高,而 乙的成绩无明显提高.
【点评】平均数与方差是重要的统计数字特征, 分别反映平均水平和波动状态,它们的实际意义应联 系实际分析判断.
素材1
两台机床同时生产直径为 10 的零件,为了检验产品 质量,质检员从两台机床生产的产品中各抽出 4 件进行测 量,结果如下:
如果你是质检员,在收集上述数据后,你将通过怎 样的运算来判断哪台机床生产的零件质量更符合要 求?
3 数据x1,x2,,xn的平均数为x,方差为s 2,
则数据y1,y2,,yn,其中yi axi b(i 1, 2, ,n)的平均数 y ⑮__________,方差s12 ⑯__________ . 4.总体平均值和方差的估计人类的长期实践 和理论研究都充分证明了同样本的平均数估 计总体平均值,用样本方差估计总体方差是可 行的,而且样本容量越大,估计就越准确.