备战2018年高考数学 解答题高分宝典 专题03 概率与统计(核心考点)理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题03概率与统计
核心考点一概率与随机变量的分布列
随机变量的分布列及期望是高考考查的热点,在考查时经常与统计知识结合在一起考查,求离散型随机变量的分布列一般要涉及到随机变量概率的求法,求概率时一定要弄清相应的概率类型(古典概型、相互独立事件的概率、独立重复实验、条件概率).
【经典示例】从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为
111,,234
. (1)设X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.
答题模板
第一步,理解ξ的意义,写出ξ可能取的全部值; 第二步,求ξ取每个值的概率; 第三步,写出ξ的分布列; 第四步,由均值的定义求E (ξ)..
【满分答案】(1)随机变量X 的所有可能取值为0,1,2,3.
()111101112344
P X ⎛⎫⎛⎫⎛⎫==-⨯-⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,
()11111111111
111111123423423424P X ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==⨯-⨯-+-⨯⨯-+-⨯-⨯= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,
()1111111111
21112342342344
P X ⎛⎫⎛⎫⎛⎫==-⨯⨯+⨯-⨯+⨯⨯-= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,
()1111
323424
P X ==
⨯⨯=
. 所以随机变量X 的分布列为
随机变量X的数学期望1111113
()0123
42442412
E X=⨯+⨯+⨯+⨯=.
(2)设Y表示第一辆车遇到红灯的个数,Z表示第二辆车遇到红灯的个数,则所求事件的概率为(1)(0,1)(1,0)
P Y Z P Y Z P Y Z
+====+===
(0)(1)(1)(0) P Y P Z P Y P Z
==+==
11111111 42424448
=⨯+⨯=.
所以这2辆车共遇到1个红灯的概率为11 48
.
【解题技巧】
1.利用古典概型求事件A的概率,关键是要分清基本事件总数n与事件A包含的基本事件数m.如果基本事件的个数比较少,可用列举法把古典概型试验所含的基本事件一一列举出来,然后再求出事件A中的基本事件数,利用公式P(A)=求出事件A的概率,注意列举时必须按照某一顺序做到不重不漏;如果基本事件个数比较多,列举有一定困难时,也可借助两个计数原理及排列组合知识直接计算m,n,再运用公式P(A)=求概率.
2.几个事件不能同时发生的应用问题,可转化为互斥事件来解决,关键是分清事件是否互斥;相互不影响的事件是否发生的实际应用问题,可转化为独立事件的概率问题,解决此类问题要注意相互独立事件同时发生与二项分布的区别与联系.
3.对于复杂概率的计算一般要先设出事件,准确地确定事件的性质,把问题化归为古典概型、互斥事件、独立事件、独立重复试验四类事件中的某一种;其次判断事件是A+B还是AB事件,确定事件至少有一个发生,还是同时发生,分别运用相加或相乘事件公式;最后选用相应的求古典概型、互斥事件、条件概率、独立事件、n次独立重复试验的概率公式求解.
4.超几何分布的特点是:①整体一般由两部分组成,比如“正,反”、“黑,白”、“男生、女生”“正品、次品”等,②总体一般是有限个,超几何分布主要应用于抽查产品,摸不同类型的小球等模型注意特殊背景下的“超几何分布”被转化为“二项分布”,如从两类对象中不放回地抽取n个元素,当两类对象的总数量很大时,超几何分布近似于二项分布.
5.列出分布列后,可用所有概率之和为1进行检验.
模拟训练
1.甲、乙两人组成“星队”参加猜成语活动,每轮活动由甲、乙各猜一个成语,在一轮活动中,如果两人都猜对,则“星队”得3分;如果只有一个人猜对,则“星队”得1分;如果两人都没猜对,则“星队”得
0分.已知甲每轮猜对的概率是3
4
,乙每轮猜对的概率是
2
3
;每轮活动中甲、乙猜对与否互不影响.各轮结
2
3
果亦互不影响.假设“星队”参加两轮活动,求: (1)“星队”至少猜对3个成语的概率;
(2)“星队”两轮得分之和为X 的分布列和数学期望EX
.
()()()()()()
P E P ABCD P ABCD P ABCD P ABCD P ABCD =++++=
()()()()()()()()()()
()()P A P B P C P D P A P B P C P D P A P B P C P D +++
()()()
()()()()()P P A A P P B B P C P D D P C P +=
323212323132224343434343433
⎛⎫⨯⨯⨯+⨯⨯⨯⨯+⨯⨯⨯= ⎪⎝⎭, 所以“星队”至少猜对3个成语的概率为
2
3
. (2)由题意,随机变量X 的可能取值为0,1,2,3,4,6.由事件的独立性与互斥性, 得()1111104343144P X
==⨯⨯⨯=,()31111211105124343434314472P X ⎛⎫==⨯⨯⨯⨯+⨯⨯⨯== ⎪⎝⎭
,
()313131121231121225
24343434343434343144P X ==⨯⨯⨯+⨯⨯⨯+⨯⨯⨯+⨯⨯⨯=
, ()321111321
34343434312
P X ==⨯⨯⨯+⨯⨯⨯=
,
()32313212605
42=4343434314412P X ==⨯⨯⨯⨯+⨯⨯⨯=⎛⎫ ⎪⎝⎭
,
()32321
643434
P X ==⨯⨯⨯=.
可得随机变量X 的分布列为
所以数学期望01234614472144121246
EX =⨯
+⨯+⨯+⨯+⨯+⨯=.
4
核心考点二正态分布
正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从,μσ入手,对于应用问题,要注意从较大的阅读量中提取有用的信息.
【经典示例】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布(
)2
,N μσ

(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在
()–3,3μσμσ+之外的零件数,求
()1P X …及X 的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在
()–3,3μσμσ+之外的零件,就认为这条生产线在这一天的生
产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96
9.96 10.01 9.92
9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得161
19.9716i i x x ===∑
,0.212s ===,其中i x 为抽取的第i 个零件的尺寸,1216i =⋯,,,. 用样本平均数
x 作为μ的估计值ˆμ
,用样本标准差s 作为σ的估计值ˆσ
,利用估计值判断是否需对当天的生产过程进行检查?剔除
()ˆˆˆˆ3,3μ
σμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z 服从正态分布(
)2
,N μσ
,则
()–330.9974P Z μσμσ<<+=,160.99740.9592≈
0.09≈.
答题模板
第一步,读懂题意,从题中提取有用信息;. 第二步,通过计算确定,μδ的值;.
5
第三步,利用正态分布的性质或3δ解题. 第四步,检验、作答.
【满分答案】(1)由题可知尺寸落在()33μσμσ-+,
之内的概率为0.9974,落在()33μσμσ-+,之外的概率为0.0026.()()0
16
160C 10.99740.99740.9592P X ==-≈,
()()11010.95920.0408P X P X =-=≈-=…,
由题可知()~160.0026X B ,
,所以()160.00260.0416E X =⨯=. (2)(i )尺寸落在()33μσμσ-+,
之外的概率为0.0026,由正态分布知尺寸落()33μσμσ-+,之外为小概
率事件,因此上述监控生产过程的方法合理.
(ii )39.9730.2129.334μσ-=-⨯=,39.9730.21210.606μσ+=+⨯=,
()()339.33410.606μσμσ-+=,
,,因为()9.229.33410.606∉,, 所以需对当天的生产过程检查. 因此剔除9.22,剔除数据之后:9.97169.22
10.0215
μ⨯-=
=.
()()()()()2
2
2
2
2
2[9.9510.0210.1210.029.9610.029.9610.0210.0110.02σ=-+-+-+-+-+
()()()()()
22222
9.9210.029.9810.0210.0410.0210.2610.029.9110.02-+-+-+-+-+
()()()()()
2
2
2
2
2
1
10.1310.0210.0210.0210.0410.0210.0510.029.9510.02]0.00815
-+-+-+-+-⨯

. 所以0.09σ=≈. 【解题技巧】
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x =μ对称,及曲线与x 轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
模拟训练
2.从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
6
(1)求这500件产品质量指标值的样本平均数x 和样本方差s 2
(同一组中的数据用该组区间的中点值作代表); (2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2
),其中μ近似为样本平均数x ,σ2
近似为样本方差s 2
.
①利用该正态分布,求P (187.8<Z <212.2);
②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数.利用①的结果,求E (X ).
附:150≈12.2.若Z ~N (μ,σ2
),则P (μ-σ<Z <μ+σ)=0.682 6,P (μ-2σ<Z <μ+2σ)=0.954 4.
核心考点三统计图表的应用
频率分布直方图及茎叶图一直是高考考查的热点,近两年折线图、条形图、饼形图等也多有考查,这类问题大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.该类问题阅读量一般比较大,但难度多为中等或中等偏易.
【经典示例】我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)0,0.5,[)0.5,1,⋅⋅⋅,[)4,4.5分成9组,制成了如图所示的频率分布直方图.
7
(1)求直方图中a 的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于
3吨的人数,请说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.
答题模板
第一步,读懂题意,确定各组频率;. 第二步,利用概率之和为1,求a 的值; 第三步,用频率分别直方图估计平均数. 第四步,用样本数据对总体进行估计代换.
【满分答案】(1)由频率分布直方图知,月均用水量在[)00.5,中的频率为0.080.50.04
⨯=,同理,在[)0.5,1,[)1.5,2,[)22.5,
,[)33.5,,[)3.54,,[)44.5,中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02. 由0.04+0.08+0.50.200.260.50.060.040.021a a ⨯+++⨯+++=,解得0.30a =. (2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为
3000000.1236000⨯=.
(3)因为前6组的频率之和为0.040.080.150.200.260.15=0.880.85----->, 而前5组的频率之和为0.04+0.08+0.150.200.26=0.730.85--<, 所以2.5 3.x <…由()0.3 2.50.850.73x ⨯-=-,解得 2.9x =. 【解题技巧】
1.解决频率分布直方图问题时要抓住:
8
(1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率
组距,即矩
形的面积.(3)直方图中每组样本的频数为频率×总体数. 2.频率分布直方图与众数、中位数与平均数的关系:
(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数等于频率分布直方图中每个小长方形的面积i S 乘以小长方形底边中点的横坐标i x 之和,即平均数=
1
n
i i i S x =∑.
模拟训练
3.,,A B C 三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼
时间,数据如下表(单位:小时);
(1)试估计C 班的学生人数;
(2)从A 班和C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙,假设
所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从,,A B C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记为1μ,表格中数据的平均数记为0μ,试判断0μ和1μ的大小,(结论不要求证明).
从A 班抽出的学生中选取一人甲有5种选法,从C 班抽出的学生中选取一人乙有8种选法.由分步计数原理知,选出甲、乙两人共有5840⨯=种选法.其中甲的锻炼时间比乙的锻炼时间长的选法有
()()6,3,6,4.5()()()6.5,3,6.5,4.5,6.5,6()()()7,3,7,4.5,7,6()()()7.5,3,7.5,4.5,7.5,6
()()()()8,3,8,4.5,8,6,8,7.5(其中()6,3表示该周甲、
乙的锻炼时间分别是6小时,3小时,其余类推).
9
共有2333415++++=种. 所以153
()408
P A =
=,即该周甲的锻炼时间比乙的锻炼时间长的概率是38
. (3)10μμ<.因为表格中三组数据的平均数分别为7,9,8.25,所以总的的平均值,08.2μ=. 新加的三个数据7,9,8.25,平均值为8.08,比0μ小,所以拉低了平均值,即10μμ<
.
核心考点四回归分析
高考对回归分析的考查方向比较固定,即先根据数据确定回归方程,再根据散点图或相关系数判断相关性的强弱,最后根据回归方程进行预测,此类问题运算量一般较大,要注意运算的准确性.
【经典示例】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图
y
年生活垃圾无害化处理量年份代码t
(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明
(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:
7
1
9.32i
i y
==∑,7
1
40.17i i i t y ==∑
0.55
= 2.646≈.
参考公式:相关系数()()
n
i
i
t t y y r --=

回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:1
2
1
()()
()n
i
i i n
i
i t
t y y b t
t ==--=
-∑∑,=.a y bt -
1
答题模板
第一步,利用散点图或相关系数r ,确定两个变量的相关程度的高低;
第二步,用最小二乘法求回归直线方程y
ˆ=b ˆx +a ˆ; 第三步,利用回归直线方程进行预报;
第四步,对于非线性(可线性化)
的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原.
【满分答案】(1)由折线图中数据和附注中参考数据得4t =,
()
2
7
1
28i
i t
t
=-=∑0.55=,
()()777
1
1
1
40.1749.32 2.89i
i
i i
i
i i i t t y y t y t y
===--=-=-⨯=∑∑∑, 2.89
0.990.55
2 2.646
r ≈
≈⨯⨯.
因为
y 与t 的相关系数近似为0.99
,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y
与t 的关系.
(1)变量
y 与t 的相关系数7
777
()()
7i
i
i i i i
t t y y t y t y r ---⋅=
=
∑∑∑∑
,

7
1
28i
i t
==∑,71
9.32i i y ==∑,7
1
40.17
i i i t y ==∑ 5.292==0.55=,
所以740.17289.32
0.997 5.2920.55
r ⨯-⨯=
≈⨯⨯,
故可用线性回归模型拟合变量
y 与t 的关系.
(2)4t =,y =7
1
17i i y =∑,所以7
1
7
22
1
1
740.17749.32
7ˆ0.1028
7i i
i i
i t y
t y b t
t ==-⋅-⨯⨯⨯===-∑∑, 1ˆˆ9.320.1040.937
a
y bx =-=⨯-⨯≈,所以线性回归方程为ˆ0.10.93y t =+. 当9t =时,ˆ0.190.93 1.83y
=⨯+=.因此,我们可以预测2016年我国生活垃圾无害化处理1.83亿吨. 【解题技巧】线性回归分析问题的类型
(1)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
(2)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b ^
.
(3)回归方程的拟合效果,可以利用相关系数判断,当|r |越趋近于1时,两变量的线性相关性越强.
模拟训练
4.某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x 个月)和市场占有率
(y %)的几组相关对应数据:
(1)根据上表中的数据,(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).
附:b ^

∑i =1
n
x i y i
-n x -·y

∑i =1
n
x 2
i -n x -
2
,a ^=y --b ^x -
.
所以线性回归方程为y ^
=0.042x -0.026.
(2)由(1)中的回归方程可知,上市时间与市场占有率正相关, 即上市时间每增加1个月,市场占有率约增加0.042个百分点. 由y ^
=0.042x -0.026>0.5,解得x ≥13,
故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.
核心考点五独立性检验
在高考中独立性检验常与抽样方法、样本对总体的估计等知识结合在一起考查,难度多为中等或中等以下,
属于得分题.
【经典示例】某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
附:K2=
答题模板
没有关系;
均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),25周岁以下组工人有40×0.05=2(人),从5名工人中随机抽取2人有C25=10种情形,每种情形都是等可能出现的,其中至少抽到一名“25周岁以下组”工人有C13C12+C22=7种,故所求概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如图所示:
所以K 2
===≈1.79.
因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关” . 【解题技巧】
(1)在列联表中注意事件的对应及相关值的确定,不可混淆.
(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
模拟训练
5.某公司为评估两套促销活动方案(方案1运作费用为5元/件;方案2的运作费用为2元/件),在某地区部分营销网点进行试点(每个试点网点只采用一种促销活动方案),运作一年后,对比该地区上一年度的销售情况,制作相应的等高条形图如图所示.
(1)请根据等高条形图提供的信息,为该公司今年选择一套较为有利的促销活动方案(不必说明理由); (2)已知该公司产品的成本为10元/件(未包括促销活动运作费用),为制定本年度该地区的产品销售价格,统计上一年度的8组售价i x (单位:元/件,整数)和销量i y (单位:件)(1,2,,8i =)如下表
所示:
①请根据下列数据计算相应的相关指数2
R ,并根据计算结果,选择合适的回归模型进行拟合; ②根据所选回归模型,分析售价x 定为多少时?利润z 可以达到最大.
(附:相关指数()()2
212
1ˆ1n
i i i n i
i y y
R y y ==-=--∑∑)
回归模型2
11003
ˆ2y
x =-+对应的相关指数230.9986R =. 因为222
321R R R >>,所以采用回归模型211003ˆ2y
x =-+进行拟合最为合适. ②由(1)可知,采用方案1的运作效果较方案2好, 故年利润()211200153z x x ⎛⎫
=-
+- ⎪⎝⎭
, ()()3040z x x '=-+-, 当()0,40x ∈时, ()211200153z x x ⎛⎫
=-
+- ⎪⎝⎭单调递增; 当()40,x ∈+∞时, ()211200153z x x ⎛⎫
=-
+- ⎪⎝⎭
单调递减, 故当售价40x =时,利润达到最大.
本文档仅供文库使用。

百度文库是百度发布的供网友在线分享文档的平台。

百度文库的文档由百度用户上传,需要经过百度的审核才能发布,百度自身不编辑或修改用户上传的文档内容。

网友可以在线阅读和下载这些文档。

百度文库的文档包括教学资料、考试题库、专业资料、公文写作、法律文件等多个领域的资料。

百度用户上传文档可以得到一定的积分,下载有标价的文档则需要消耗积分。

当前平台支持主流的doc(.docx)、.ppt(.pptx)、.xls(.xlsx)、.pot、.pps、.vsd、.rtf、.wps、.et、.dps、.pdf、.txt文件格式。

相关文档
最新文档