高考数学 冲刺60天解题策略 专题四 概率与统计 第三节概率与统计的综合应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考数学 冲刺60天解题策略 专题四 概率与统计 第三节
概率与统计的综合应用
近几年高考中,概率与统计的应用题多出现在解答题中,难度以中档和中档偏易为多,难度值在0.5~0.8.命题形式以学生生活实践为背景材料进行考查. 考试要求:(1)以大纲为准则,考查相关概率在实际问题中的应用;(2)理解各种统计方法;(3)会分析样本数据,并会求数据的特征数字(如平均数、标准差);(4)会用正确的算法求解概率统计和其他数学知识的交汇(如三角函数、框图、算法、几何等)问题.
题型一 随机抽样方法及其应用
例1 (1)用系统抽样方法从160名学生中抽取容量为20的样本,将160名学生从1—160编号,按编号顺序平均分成20组(1—8号,9—16号,…,153—160号),若第16组抽出的号码是126,则第1组用抽签方法确定的号码是 .
点拨:本题考查随机抽样的系统抽样.三种抽样方法均为等概率抽样,系统抽样是按简单随机抽样抽取第一个样本,再按相同的间隔抽取其他样本,即抽取号码成等差数列.公式为(1),(m n l p l =-+为间隔长,n 为组数,p 为第一个样本号).
解:16,8,126, 6.n l m p ===∴=
易错点:式中的第几组的组号应减“1”.
变式与引申1:⑴某单位200名职工的年龄分布情况 如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全
体职工随机按1-200编号,并按编号顺序平均分 为40组(1-5号,6-10号,…,196-200号). 若第5组抽出的号码为22,则第8组抽出的号码应是 .若用分层抽样方法,则40岁以下年龄段应抽取 人.
⑵从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000人再按系统抽样的方法进行,则每人入选的概率( )
A. 不全相等
B. 均不相等
C. 都相等且为251002
D. 都相等且为40
题型二 例2 为了解某校高三学生的视力情况,随机地抽查了该校100名 高三学生的视力情况,得到频率直方图如图432--所示,由于 不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组 的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的 学生数为b ,求,a b 的值. 点拨:(1)此题数据是以图形给出,注意观察图中数据及变化
情况;(2)看清图中横、纵坐标的实际意义;(3)结合等差与等比
数列知识,本题有一定的综合性.
解:组距=0.1, 4.3~4.4的频数100=⨯0.10.11⨯=,4.4~4.5的频数3=. 前4组频数成等比数列, 4.5∴~4.6的频数9=,4.6~4.7的频数27=.
又
后6组频数成等差数列,设公差为d ,6(61)
62710013872
d ⨯-∴⨯+
⨯=-=, 5020% 30
%
40—5040岁以下
50岁以上 图431-- O 0.3
0.1
5d ∴=,从而 4.6~ 5.0的频数27(27=+5)(2710)(2715)78-+-+-=. 0.27,78a b ∴==.
易错点:要注意1 频数=⨯⨯组距组距
频率样本容量;2
区别频数与频率,审清题意.
变式与引申2:如图433(1)(2)--,样本A 和B 分别取自两个不同的总体,它们的样本平均
数分
A. B A B A s s x x >>,
B. B A B A s s x x ><,
C. B A B A s s x x <>,
D. B A B A s s x x <<,
题型三 概率与统计和其他数学知识交汇(如三角函数、框图算法、几何等)
例3 如下图434(1)--是某公司金融危机时员工的月工资条形统计图,从左到右的各条形表示的员工人数依次记为1210,,
,A A A (如2A 表示工资为[2500,2550)内的人数,(单位:
元)).
图434(2)--是统计图434(1)--中工资在一定范围内员工人数的一个算法流程图。
现要 统计月工资在2600~2800元(含2600元,不含2800元)的员工人数, 那么在流程图中
的判断框内应填
写的条件是( )
A. 9i <
B. 8i <
C. 7i <
D. 6i <
点拨:(1)
要认真读题,明
确每个变量表示 的实际意义;(2) 可以把选项逐一 放入判断框理解.
解:现要统计的是月工资在2600~2800元之间的员工人数,即是要计算4567,,,A A A A 的和,
图434(1)--
图434(2)-- ,
所以流程图中空白框应是8i <,当8i <时就会返回进行叠加运算,当8i ≥将数据直接输出,不再进行任何的返回叠加运算,此时已把数据45,,A A 67,A A 叠加起来送到s 中输出,故选B. 易错点:本题在统计中的条形图与算法流程图的交汇处命题,有一定的综合性,若不认真读图和审题容易出错.
变式与引申3:某班班主任为了解班上女生的月消费情况,
随机抽查了5名本班女生,她们近两周的消费金额如下表所示:
女 生 1
2
3
4
5
消费金额
1a
2
a
3
a
4
a
5
a
图435--是统计该5名女生近两周消费金额总数的程序框图,则 判断框中应填 , =s .
题型四 线性回归方程与相关系数实际应用
例4某地10户家庭的年收入和年饮食支出的统计资料如下表:
年收入x (万元) 2 4 4 6 6 6 7 7 8 10 年饮食支出y (万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3 (1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系; (2)如果某家庭年收入为9万元,预测其年饮食支出.
点拨:通过所给数据,判断变量间的线性关系;若线性相关,用最小二乘思想求出线性回归方程. 解:(1)由题意知,年收入x 为解释变量,年饮食支出y 为预报变量,作散点图(如图所示). 从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的 线性相关关系,因此可以用线性回归方程刻画它们之间的关系. 6x =∵, 1.83y =,10
21
406i
i x ==∑,10
21
35.13i
i y ==∑,10
1
117.7i i i x y ==∑,
0.172b ≈∴, 1.830.17260.798a y bx =-=-⨯=.
从而得到回归直线方程为0.1720.798y x =+. (2)0.17290.798 2.346y =⨯+=万元.
易错点:此题对计算能力的要求较高,若计算不慎,失分很严重. 变式与引申4:(1)(2011年高考山东卷。
文)某产品的广告费用x 与销售额y 的统计数据
如下表
广告费用x (万元)
4 2 3
5 销售额y (万元)
49
26
39
54
根据上表可得回归方程ˆˆˆy
bx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
(2)某企业上半年产品的产量与单位成本资料如下:
月 份 1 2 3 4 产量(千件) 2 3 4 3 单位成本(元)
73
72
71
73
① ② 指出产量每增加1000件时,单位成本平均变动多少? ③ 假定产量为6000件时,单位成本为多少元? 本节主要考查:(1)用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法及其应用;考查在应用问题中构造抽样模型,识别模型,收集数据等能力和方法.(2)用样本估计总体是统计学的基本思想,以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题,了解一些基本的统计思想.(3)作两个相关变量数据的散点图,判断两个变量的线性相关性,了解最小二乘法的思想,会求给出公式下的相关系数及线性回归方程;考查看图、作图和运算求解等基本数学能力.(4)利用古典概型解决统计中的某些问题.
点评:(1)概率与统计中的部分内容是实施新课标后新增内容,也是高考考点之一.主要考查随机抽样方法的应用(如例1),数据的数字特征(如例2,习题2、3),概率统计与其他知识(算法、不等式)综合应用(如例3,习题5)相关系数与线性回归及独立性检验(如例4).(2)在随机抽样中,简单随机抽样、系统抽样和分层抽样都是等概率抽样,但这三种方法适用范围各不相同,简单随机抽样适用于总体个数较少的,系统抽样适用于总体个数较多的,而分层抽样适用于总体由差异比较明显的几部分组成的.(3)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数的波动的大小,标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定.(4)求回归方程时,先判定变量的相关性,若变量不线性相关,求出回归方程也毫无意义.(5)概率与统计实际应用中,很多数据都是图、表的形式给出的,背景有考生共有的生活气息.题目篇幅长,要善于看图、作图、理解图所传递的信息,对数据的精确处理要求有较强的计算能力.
习题4-3
1.某中学有高一学生400人,高二学生302人,高三学生250人,现在按年级分层抽样方
法从所有学生中抽取一个容量为190人得到样本,应该剔除 人,每个年级依次应抽取 人.
2.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:
123s s s ,,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有(
)
A.
312s s s >> B. 213s s s >> C. 123s s s >> D.
213s s s >>
3.若1220,,
,a a a 这20个数据的平均数为,x 方差为0.20,则数据1220,,,a a a ,,x 这
21个数据的方差是 .
4.某中学高一(2)班甲、乙两名同学自高中以来每场数学考试成绩情况如下: 甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101. (Ⅰ)完成所附的茎叶图;
(Ⅱ)用茎叶图处理现有的数据,有什么优点?
(Ⅲ)通过观察茎叶图,对两人的成绩进行比较,写出统计结论.
5.有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表,已知在全部105人中随机抽取,抽到1人为优秀的概率为27
.
优秀 非优秀 总计 甲班 10 乙班 30 合计
105
① 请完成上面的2×2列联表;
② 根据2×2列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”? ③ 若按下面的方法从甲班优秀的学生抽取1人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取的序号。
试求抽到6或10号的概率.
【答案】
丙的成绩 环数 7 8 9 10 频数 4 6 6 4 甲的成绩 环数 7 8 9 10 频数 5 5 5 5 乙的成绩 环数 7 8 9 10 频数 6 4 4 6
又因A 中数据均小于等于10,B 中数据不小于10,所以B A x x <. 法二:直接法.(略)
变式与引申3: 解:123455,.i a a a a a ≤++++
变式与引申4: 解:(1)B. 7
,42,9.4,9.12
x y y x a a =
==+∴=,把
665.5x y ==代入方程,可得故选B.
(2)①12
3,72.25,4867,4x y x y ===∴⋅=4
1273372471373865,i i i x y ==⨯+⨯+⨯+⨯=∑
4
21
4916938,
i i x ==+++=∑2
865867
436,-1,
3836
x b -=∴=
=-又
,72.25+1375.25,y bx a a y bx =+∴=-=⨯=
+75.25.y x ∴=-
②1,b =-∴每增加1000件时,单位成本减少1元. ③6,69.25.x y =∴=∴单位成本为69.25元.
习题4-3
1. 2,80,60,50.
2. B. 解:观察法.丙的环数集中在8环和9环,较稳定,而乙的集中在7环和10环,不稳定,甲的7、8、9、10环的次数各均等,故213s s s >>.
3.
421,解:依题意有22212201
[()()()]0.2020
a x a x a x -+-++-=
22212201220,()()() 4.,,
,20a x a x a x a a a x ∴-+-+
+-==,
122020,2121
a a a x
x x
x ++
+++∴=
=即1220,,,a a a ,
x 的平均数也是,x
∴这21个数据的方差2
14
[4()].2121
s x x =
+-= 乙
甲 3 8 8 9
1 9 10 11 1 4 5 7 0
4. 解:(Ⅰ)茎叶图如右图所示:
(Ⅱ)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.
(Ⅲ)通过观察茎叶图,甲的成绩主要集中在89~80分,乙的成绩主要集中在9099~分,乙的成绩相对较好。