18年高考数学复习解决方案真题与模拟单元重组卷重组十七大题冲关——概率与统计的综合问题试题理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重组十七 大题冲关——概率与统计的综合问题
测试时间:120分钟
满分:150分
解答题(本题共10小题,每小题15分,共150分,解答应写出文字说明、证明过程或演
算步骤)
1.[2016·湖南重点中学模拟] 在一次全国高中五省大联考中,有90万名学生参加,考后对所有学生成绩统计发现,英语成绩服从正态分布N (μ,σ2
).右表用茎叶图列举了20名学生的英语成绩,巧合的是这20个数据的平均数和方差恰好比所有90万个数据的平均数和方差都多0.9,且这20个数据的方差为49.9.
(1)求μ,σ;
(2)给出正态分布的数据:P (μ-σ<X <μ+σ)=0.6826,P (μ-2σ<X <μ+2σ)=0.9544.
①若从这90万名学生中随机抽取1名,求该生英语成绩在(82.1,103.1)的概率; ②若从这90万名学生中随机抽取1万名,记X 为这1万名学生中英语成绩在(82.1,103.1)的人数,求X 的数学期望.
解 (1)通过计算可得这20个数据的平均数为x -
=90, ∴由题可得μ=90-0.9=89.1,σ=49.9-0.9=7.(5分) (2)①∵μ=89.1,σ=7,∴(82.1,103.1)=(μ-σ,μ+2σ), ∴该生英语成绩在(82.1,103.1)的概率为0.6826+0.9544
2=0.8185.(10分)
②由题可得X 服从二项分布B (10000,0.8185), ∴E (X )=10000×0.8185=8185.(15分)
2.[2016·江西两校联考] 前不久,社科院发布了2015年度“全国城市居民幸福排行榜”,北京市成为本年度最“幸福城”,随后,某师大附中学生会组织部分同学,用“10分制”随机调查“阳光”社区人们的幸福度,现从调查人群中随机抽取16名,如图所示的茎叶图记录了他们的幸福度分数(以小数点前的一位数字为茎,小数点后一位数字为叶).
(1)指出这组数据的众数和中位数;
(2)若幸福度不低于9.5分,则称该人的幸福度为“极幸福”.求从这16人中随机选取3人,至多有1人是“极幸福”的概率;
(3)以这16人的样本数据来估计整个社区的总体数据,若从该社区(人数很多)任选3人,记ξ表示抽到“极幸福”的人数,求ξ的分布列及数学期望.
解 (1)众数:8.6;中位数:8.75.(2分)
(2)设A i (i =0,1,2,3)表示所取3人中有i 个人是“极幸福”,至多有1人是“极幸福”记为事件A ,
则P (A )=P (A 0)+P (A 1)=C 3
12C 316+C 14C 2
12C 316=121
140.(8分)
(3)解法一:ξ的所有可能取值为0,1,2,3.
P (ξ=0)=⎝ ⎛⎭
⎪⎫
343=2764
;P (ξ=1)=C 13×14×⎝ ⎛⎭
⎪⎫34
2
=2764
; P (ξ=2)=C 23⎝ ⎛⎭
⎪⎫142×34=
964
;P (ξ=3)=⎝ ⎛⎭
⎪⎫14
3
=164
. ξ的分布列为:
(13分)
所以E (ξ)=0×2764+1×2764+2×964+3×1
64=0.75.(15分)
解法二:ξ的所有可能取值为0,1,2,3.
则ξ~B ⎝ ⎛⎭
⎪⎫3,14,
P (ξ=k )=C k 3⎝ ⎛⎭⎪⎫14k ⎝ ⎛⎭
⎪
⎫
343-k
,k =0,1,2,3.(13分) 所以E (ξ)=3×1
4
=0.75.(15分)
3.[2017·河南开封月考]随机询问某大学40名不同性别的大学生在购买食物时是否读营养说明,得到如下列联表:
性别与读营养说明列联表
(1)根据以上列联表进行独立性检验,能否在犯错误的概率不超过0.01的前提下认为性别与是否读营养说明之间有关系?
(2)从被询问的16名不读营养说明的大学生中,随机抽取2名学生,求抽到男生人数ξ的分布列及其均值(即数学期望).
(注:K 2
=
n ad -bc 2a +b
c +
d a +c
b +d
,其中n =a +b +c +d 为样本容量.)
解 (1)根据性别与读营养说明列联表,计算随机变量K 2
的观测值得:
K 2
=
-
2
24×16×20×20
≈6.67>6.635,
因此,能在犯错误的概率不超过0.01的前提下,认为性别与读营养说明有关.(5分) (2)ξ的取值为0,1,2.
P (ξ=0)=C 2
12C 216=1120,P (ξ=1)=C 1
12×C 1
4C 216=25,P (ξ=2)=C 2
4C 216=1
20.
ξ的分布列为
ξ的均值为
E (ξ)=0×1120
+1×25
+2×120=12
.(15分)
4.[2016·全国卷Ⅱ]某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
设该险种一续保人一年内出险次数与相应概率如下:
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (3)求续保人本年度的平均保费与基本保费的比值.
解 (1)设A 表示事件:“一续保人本年度的保费高于基本保费”,则事件A 发生当且仅当一年内出险次数大于1,故P (A )=0.20+0.20+0.10+0.05=0.55.(3分)
(2)设B 表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B 发生当且仅当一年内出险次数大于3,故P (B )=0.10+0.05=0.15.(5分)
又P (AB )=P (B ),故
P (B |A )=P AB P A =P B P A =0.150.55=311
,
因此所求概率为3
11
.(8分)
(3)记续保人本年度的保费为X ,则X 的分布列为
(12分)
E (X )=0.85a ×0.30+a ×0.15+1.25a ×0.20+1.5a ×0.20+1.75a ×0.10+2a ×0.05=
1.23a .
因此续保人本年度的平均保费与基本保费的比值为1.23.(15分)
5.[2017·天津南开中学月考]某大型汽车城为了了解销售单价(单位:万元)在[8,20]内的轿车的销售情况,从2016年上半年已经销售的轿车中随机抽取100辆,获得的所有样本数据按照[8,10),[10,12),[12,14),[14,16),[16,18),[18,20]分成6组,制成如图所示的频率分布直方图.
已知样本中销售单价在[14,16)内的轿车数是销售单价在[18,20]内的轿车数的2倍. (1)求出x 与y ,再根据频率分布直方图估计这100辆轿车销售单价的平均数(同一组中的数据用该组区间的中点值作代表);
(2)若将频率视为概率,从这批轿车中有放回地随机抽取3辆,求至少有1辆轿车的销售单价在[14,16)内的概率;
(3)用分层抽样的方法从销售单价在[8,20]内的轿车中共抽取20辆,再从抽出的20辆轿车中随机抽取2辆,X 表示这2辆轿车中销售单价在[10,12)内的轿车的数量,求X 的分布列及数学期望E (X ).
解 (1)样本中轿车的销售单价在[14,16)内的轿车数是x ×2×100=200x ,样本中轿车的销售单价在[18,20]内的轿车数是y ×2×100=200y ,
依题意,有200x =2×200y ,即x =2y ,①(2分)
根据频率分布直方图可知(0.1×2+0.025+x +0.05+y )×2=1,②(3分) 由①②得x =0.15,y =0.075.(4分)
根据频率分布直方图估计这100辆轿车销售单价的平均数为8+102×0.025×2+
10+122×0.05×2+
12+142×0.1×2+14+162×0.15×2+16+182×0.1×2+18+20
2
×0.075×2=0.45+1.1+2.6+4.5+3.4+2.85=14.9(万元).(6分)
(2)若将频率视为概率,从这批轿车中有放回地随机抽取3辆,则至少有1辆轿车的销售单价在[14,16)内的概率为1-C 0
3(0.3)0
×(0.7)3
=1-0.343=0.657.(8分)
(3)因为销售单价在[8,10),[10,12),[12,14),[14,16),[16,18),[18,20]的轿车的分层抽样比为1∶2∶4∶6∶4∶3,故在抽取的20辆轿车中,销售单价在[10,12)内的轿车有20×2
20
=2(辆),
X 的所有可能取值为0,1,2,
则P (X =0)=C 02C 2
18C 220=153
190,
P (X =1)=C 12C 1
18C 220=36190=18
95,
P (X =2)=C 22C 220=1
190.(12分)
所以X 的分布列为
E (X )=0×
153190+1×1895+2×190=5
.(15分) 6.[2016·北京高考]A ,B ,C 三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时):
(1)试估计C 班的学生人数;
(2)从A 班和C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙.假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;
(3)再从A ,B ,C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是7,9,8.25(单位:小时).这3个新数据与表格中的数据构成的新样本的平均数记为μ1,表格中数据的平均数记为μ0,试判断μ0和μ1的大小.(结论不要求证明)
解 (1)由题意知,抽出的20名学生中,来自C 班的学生有8名.根据分层抽样方法,C 班的学生人数估计为100×
8
20
=40.(3分) (2)设事件A i 为“甲是现有样本中A 班的第i 个人”,i =1,2,...,5,事件C j 为“乙是现有样本中C 班的第j 个人”,j =1,2, (8)
由题意可知,P (A i )=15,i =1,2,…,5;P (C j )=1
8
,j =1,2,…,8.(5分)
P (A i C j )=P (A i )P (C j )=15×18=140
,i =1,2,…,5,j =1,2,…,8.(7分)
设事件E 为“该周甲的锻炼时间比乙的锻炼时间长”.由题意知,
E =A 1C 1∪A 1C 2∪A 2C 1∪A 2C 2∪A 2C 3∪A 3C 1∪A 3C 2∪A 3C 3∪A 4C 1∪A 4C 2∪A 4C 3∪A 5C 1∪A 5C 2∪A 5C 3∪A 5C 4.(9分)
因此P (E )=P (A 1C 1)+P (A 1C 2)+P (A 2C 1)+P (A 2C 2)+P (A 2C 3)+P (A 3C 1)+P (A 3C 2)+P (A 3C 3)+
P (A 4C 1)+P (A 4C 2)+P (A 4C 3)+P (A 5C 1)+P (A 5C 2)+P (A 5C 3)+P (A 5C 4)=15×140=38
.(12分)
(3)μ1<μ0.(15分)
7.[2017·衡水中学模拟]某产品按行业生产标准分成8个等级,等级系数X 依次为1,2,…,8,其中X ≥5为标准A ,X ≥3为标准B ,已知甲厂执行标准A 生产该产品,产品的零售价为6元/件;乙厂执行标准B 生产该产品,产品的零售价为4元/件,假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X 1的概率分布列如下所示:
且X 1的数字期望E (X 1)=6,求a ,b 的值;
(2)为分析乙厂产品的等级系数X 2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
3 5 3 3 8 5 5 6 3
4 6 3 4 7
5 3 4 8 5 3 8 3 4 3 4 4 7 5
6 7
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X 2的数学期望. (3)在(1)、(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由.
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价; ②“性价比”大的产品更具可购买性.
解 (1)∵E (X 1)=6,∴5×0.4+6a +7b +8×0.1=6,即6a +7b =3.2,(2分) 又由X 1的概率分布列得0.4+a +b +0.1=1,即a +b =0.5,(4分)
由⎩⎪⎨⎪⎧
6a +7b =3.2,a +b =0.5,
解得⎩⎪⎨
⎪⎧
a =0.3,
b =0.2.
(5分)
(2)由已知得,样本的频率分布表如下:
(7分)
用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X 2的概率分布列如下:
(9分)
∴E (X 2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,即乙厂产品的等级系数的数学期望等于4.8.(11分)
(3)乙厂的产品更具可购买性,理由如下:
∵甲厂产品的等级系数的数学期望等于6,价格为6元/件,∴其性价比为6
6=1,∵乙厂
产品的等级系数的期望等于4.8,价格为4元/件,∴其性价比为4.8
4=1.2,据此,乙厂的产
品更具可购买性.(15分)
8.[2016·北京东城区质检]现有两个班级,每班各出4名选手进行羽毛球的男单、女单、男女混合双打(混双)比赛(注:每名选手打且只打一场比赛).根据以往的比赛经验,各项目平均完成比赛所需时间如图表所示,现只有一块比赛场地,各场比赛的出场顺序等可能.
(1)求按女单、混双、男单的顺序进行比赛的概率;
(2)设随机变量X 表示第三场比赛开始时需要等待的时间,求X 的数学期望; (3)若要使所有参加比赛的人等待的总时间最少,应该怎样安排比赛顺序(写出结论即可).
解 (1)三场比赛共有A 3
3=6种方式,其中按女单、混双、男单的顺序进行比赛只有1种,所以按女单、混双、男单的顺序进行比赛的概率为1
6
.(4分)
(2)令A 表示女单比赛、B 表示男单比赛、C 表示混双比赛.
按ABC 顺序进行比赛,第三场比赛等待的时间是t 1=20+25=45(分钟). 按ACB 顺序进行比赛,第三场比赛等待的时间是t 2=20+35=55(分钟). 按BAC 顺序进行比赛,第三场比赛等待的时间是t 3=20+25=45(分钟). 按BCA 顺序进行比赛,第三场比赛等待的时间是t 4=35+25=60(分钟). 按CAB 顺序进行比赛,第三场比赛等待的时间是t 5=35+20=55(分钟). 按CBA 顺序进行比赛,第三场比赛等待的时间是t 6=35+25=60(分钟). 且上述六个事件是等可能事件,每个事件发生概率为1
6
.
(10分)
所以平均等待时间为
E (X )=
45+45+55+55+60+606=160
3
.(13分)
(3)按照混双、女单、男单的顺序参加比赛,可使等待的总时间最少.(15分) 9.[2016·全国卷Ⅰ]某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
解(1)由柱状图并以频率代替概率可得,1台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而(2分)
P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.(6分)
所以X的分布列为
(7分)
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.(10分)
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200
+3×500)×0.04=4040.(12分)
当n =20时,
E (Y )=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4080.(14
分)
可知当n =19时所需费用的期望值小于当n =20时所需费用的期望值,故应选n =19.(15分)
10.[2016·黄冈质检]噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解强度D (单位:分贝)与声音能量I (单位:W/cm 2
)之间的关系,将测量得到的声音强度
D i 和声音能量I i (i =1,2,…,10)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中W i =lg I i ,W =1
10∑i =1
10W i .
(1)根据表中数据,求声音强度D 关于声音能量I 的回归方程D =a +b lg I ;
(2)当声音强度大于60分贝时属于噪音,会产生噪声污染,城市中某点P 共受到两个声源的影响,这两个声源的声音能量分别是I 1和I 2,且1I 1+1I 2
=1010
.已知点P 的声音能量等于
声音能量I 1与I 2之和.请根据(1)中的回归方程,判断P 点是否受到噪声污染的干扰,并说明理由.
附:对于一组数据(μ1,v 1),(μ2,v 2),……,(μn ,v n ),其回归直线v =α+βμ的
11 斜率和截距的最小二乘估计分别为:
β^=∑i =1
n u i -u
v i -
v ∑i =1
n u i -u 2,α^=v -β^u .
解 (1)令W i =lg I i ,先建立D 关于I 的线性回归方程,由于b ^=∑i =110 W i -W D i -
D ∑i =110
W i -W -2
=5.10.51
=10,(3分) ∴a ^=D -b ^W =160.7,
∴D 关于W 的线性回归方程是D ^
=10W +160.7,
即D 关于I 的回归方程是:D ^
=10lg I +160.7.(7分)
(2)点P 的声音能量I =I 1+I 2,∵1I 1+4I 2
=1010, ∴I =I 1+I 2=10
-10⎝ ⎛⎭⎪⎫1I 1+4I 2(I 1+I 2) =10-10⎝ ⎛⎭
⎪⎫5+I 2I 1+4I 1I 2≥9×10-10,(10分) 根据(1)中的回归方程,点P 的声音强度D 的预报值: D ^
=10lg (9×10-10)+160.7=10lg 9+60.7>60, ∴点P 会受到噪声污染的干扰.(15分)。