专题2.6 概率与统计-随机变量及其分布(解析版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题2.6 概率与统计-随机变量及其分布
1.求解离散型随机变量X 的数学期望与方差的一般步骤: (1)分析随机变量X 的可取值12,,...,n x x x ;
(2)计算随机变量X 取不同值时对应的概率12,,...,n p p p ; (3)由期望和方差的计算公式,求得数学期望()(),E X D X ;.
(4)若随机变量X 的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的期望和方差的公式求解.
2.求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时,要注意应用计数原理、古典概型等知识的运用.
3.计算时要细心,写出分布列后注意根据概率和为1进行检验.
1.某商场为吸引客源推出了为期三天的优惠活动,全场购物每满1000元减300元,即一次购物总金额(未享受优惠前)为x 元,若1000x <,付款时无优惠;若10002000x ≤<,付款时优惠300元;若20003000x ≤<,付款时优惠600元……以此类推.某机构在该商场门口随机采访了100位购物的顾客,统计他们的购物金额如下表所示,并将购物总金额低于3000元的顾客称为“理性购物者”,购物总金额不低于3000元的顾客称为“非理性购物者”.
(1)能否在犯错误的概率不超过0.01的前提下认为是否为“理性购物者”与性别有关? (2)设甲、乙两名“非理性购物者”相互独立地来此商场购物,甲、乙两位顾客的购物总金额(单位:元)在[3000,4000)内的概率分别为
12,23,在[4000,5000)内的概率分别为1
2
,1
3
.设甲、乙两位顾客付款时的优惠金额之和为随机变量X ,求X 的分布列与数学期望.
参考公式及数据:2
2
()()()()()
n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.
【试题来源】数学-学科网2021年高三3月大联考(山东卷) 【分析】(1)计算出卡方值,和6.635比较即可得出结论;
(2)由题可得X 的所有可能取值为1800,2100,2400,计算出X 取不同值时的概率,即可写出分布列,求出期望. 【解析】(1)由题可得2
K
的观测值2100(40252510)900
9.890 6.6355050653591
k ⨯⨯-⨯==≈>⨯⨯⨯,
所以在犯错误的概率不超过0.01的前提下,能认为“理性购物者”与性别有关.
(2)由题可得,购物总金额在[3000,4000)内,优惠3003900⨯=元,购物总金额在
[4000,5000)内,优惠30041200⨯=元,
则随机变量X 的所有可能取值为1800,2100,2400, 且121(1800)233P X ==⨯=,11121
(2100)23232P X ==⨯+⨯=,
111
(2400)2P X ==⨯=,所以X 的分布列为
所以111
()1800210024002050326
E X =⨯+⨯+⨯=.
2.某用人单位在一次招聘考试中,考试卷上有A ,B ,C 三道不同的题,现甲、乙两人同时去参加应聘考试,他们考相同的试卷已知甲考生对A ,B ,C 三道题中的每一题能解出的概率都是
23,乙考生对A ,B ,C 三道题能解出的概率分别是34,23
,1
2,且甲、乙
两人解题互不干扰,各人对每道题是否能解出是相互独立的. (1)求甲至少能解出两道题的概率;
(2)设X 表示乙在考试中能解出题的道数,求X 的数学期望;
(3)按照“考试中平均能解出题数多”的择优录取原则,如果甲、乙两人只能有一人被录取,你认为谁应该被录取,请说出理由.
【试题来源】全国百强名校“领军考试”2020-2021学年下学期4月高三(理)
【分析】(1)依题意直接求出概率;(2)由题意知X 的所有可能取值为0,1,2,3.分别求出各自的概率,最终算出数学期望;(3)求出甲数学期望,根据甲、乙两人的期望判断.
【解析】(1)依题意,甲至少能解出两道题的概率2
3
233
322220C 1C 33327
P ⎫⎫⎫⎛⎛⎛=-+= ⎪ ⎪
⎪⎝⎝⎝⎭
⎭⎭. (2)由题意知,X 的所有可能取值为0,1,2,3.则
3211
(0)11143224P X ⎫⎫⎫⎛⎛⎛==---= ⎪⎪⎪⎝⎝⎝⎭⎭⎭
;
32132(1)11143243P X ⎛⎫⎛⎫⎛⎫==--+-⨯ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭132161
1112432244
⎛⎫⎛⎫⎛⎫⨯-+--⨯== ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭;
321(2)1432P X ⎛⎫
==⨯-+
⎪⎝⎭
321321111143243224
⎛⎫⎛⎫-⨯+-⨯⨯= ⎪ ⎪⎝⎭⎝⎭; 32161(3)432244
P X ==
⨯⨯==. 故X 的数学期望()1111123012324424412
E X =⨯+⨯+⨯+⨯=(道). (3)设Y 表示甲在考试中能解出题的道数,则随机变量Y 服从二项分布,即2~3,3Y B ⎛
⎫ ⎪⎝⎭
. 知Y 的数学期望2
()323
E Y =⨯
=.因为()()E Y E X >,故甲应该被录取. 3.天问一号火星探测器于2021年2月10日成功被火星捕获,实现了中国在深空探测领域的技术跨越.为提升探测器健康运转的管理水平,西安卫星测控中心组织青年科技人员进行探测器遥控技能知识竞赛,已知某青年科技人员甲是否做对每个题目相互独立,做对A ,B ,
C 三道题目的概率以及做对时获得相应的奖金如表所示.
规则如下:按照A ,B ,C 的顺序做题,只有做对当前题目才有资格做下一题.
(1)求甲获得的奖金X的分布列及均值;
(2)如果改变做题的顺序,获得奖金的均值是否相同?如果不同,你认为哪个顺序获得奖金的均值最大?(不需要具体计算过程,只需给出判断)
【试题来源】山东枣庄2021届高三数学二模试题
【分析】(1)由题意,X的可能取值为0,1000,3000,6000,计算每个取值的概率,写出分布列,最后计算均值即可;(2)根据均值的性质以及概率的性质进行判断即可.【解析】(1)解:分别用A,B,C表示做对题目A,B,C的事件,则A,B,C相互独立.由题意,X的可能取值为0,1000,3000,6000.
()()
P X P AB
===⨯=;
00.2
10000.80.40.32
===;()()
P X P A
()()
P X P ABC
===⨯⨯=;
30000.80.60.60.288
()()
P X P ABC
===⨯⨯=.
60000.80.60.40.192
所以甲获得的奖金X的分布列为
()00.210000.3230000.28860000.1922336
E X=⨯+⨯+⨯+⨯=.
(2)改变做题的顺序,获得奖金的均值互不相同.
E X大的做题顺序,这称为期望值原则.做对的概率大表示题决策的原则是选择期望值()
目比较容易,做对的概率小表示题目比较难.
猜想:按照由易到难的顺序做题,即按照题目A,B,C的顺序做题,得到奖金的期望值最大.
4.单板滑雪型池比赛是冬奥会比赛中的一个项目,进入决赛阶段的名运动员按照预赛成绩由低到高的出场顺序轮流进行三次滑行,裁判员根据运动员的腾空高度、完成的动作难度和效果进行评分,最终取单次最高分作为比赛成绩.现有运动员甲、乙二人在2021赛季单板滑雪U型池世界杯分站比赛成绩如下表:
假设甲、乙二人每次比赛成绩相互独立.
(1)从上表5站中随机选取1站,求在该站运动员甲的成绩高于运动员乙的成绩的概率; (2)从上表5站中任意选取2站,用X 表示这2站中甲的成绩高于乙的成绩的站数,求X 的分布列和数学期望;
(3)假如从甲、乙2人中推荐1人参加2022年北京冬奥会单板滑雪U 型池比赛,根据以上数据信息,你推荐谁参加,并说明理由.
(注:方差()()
()
222
2
121n s x x x x x x n ⎡
⎤=
-+-++-⎢
⎥⎣⎦
,其中x 为1x ,2x ,…,n x 的平均
数)
【试题来源】北京市房山区2021高三一模
【分析】(1)先得到甲站和乙站的成绩,再根据该站运动员甲的成绩高于运动员乙的成绩,由古典概型求解;(2)X 的可能取的值为0,1,2,然后分别求得其相应的概率,列出分布列,根据分布列中的数据再求期望;(3)根据甲站和乙站的平均成绩以及方差比较下结论. 【解析】(1)设“该站运动员甲的成绩高于该站运动员乙的成绩”为事件A ;
运动员乙第1站、第2站、第3站、第4站、第5站的成绩分别为
88.4088.6089.1088.2087.70、 、 、 、 ,
运动员甲第1站、第2站、第3站、第4站、第5站的成绩分别为 86.2092.8087.5089.5086.00、 、 、 、 ,
其中第2站和第4站甲的成绩高于乙的成绩,2
()5
P A ∴=
, (2)X 的可能取的值为0,1,2,则0223253
(0)10
C C P X C ===,
11232563(1)105C C P X C ====,2023251
(2)10
C C P X C ===,所以X 的分布列为
3
3()012105105E X =⨯
+⨯+⨯=; (3)推荐乙.
甲5站的平均成绩为1
(86.2092.8087.5089.5086.00)88.405
x =
++++=甲 乙5站的平均成绩为1
(88.4088.6089.1088.2087.70)88.405
x =++++=乙 甲5站成绩方差为
2
22221[(88.4086.20)(88.4092.80)(88.40-87.50)(88.4089.50)5
s =-+-++-+甲
2(88.4086.00)] 6.396-=,
乙5站成绩方差为
2
22221[(88.4088.40)(88.4088.60)(88.4089.10)(88.4088.20)5
s =-+-+-+-+
乙2(88.4087.70)]0.212-=,
x x =甲乙说明甲乙二人水平相当,2
2
s s >甲乙表明乙的发挥比甲的更稳定
所以预测乙的成绩会更好.
5.2022年第24届冬季奥林匹克运动会,简称“北京张家口冬奥会”,将在2022年02月04日~2022年02
月20日在北京市和张家口市联合举行,这是中国历史上第一次举办冬季奥运会,北京将承办所有冰上项目,延庆和张家口将承办所有的雪上项目.下表是截取了2月5日和2月6日两天的赛程表:
说明:“*”代表当日有不是决赛的比赛;数字代表当日有相应数量的决赛. (1)①若在这两天每天随机观看一个比赛项目,求恰好看到冰壶和冰球的概率; ②若在这两天每天随机观看一场决赛,求两场决赛恰好在同一赛区的概率;
(2)若在2月6日(星期日)的所有决赛中观看三场,记X 为赛区的个数,求X 的分布列及期望()E X .
【试题来源】北京市延庆区2021届高三模拟考试
【分析】(1)①先根据分步乘法计数原理计算出“每天随机观看一个项目”对应的情况数,然后分析“看到冰壶和冰球”的情况数,由此求解出对应概率;②先根据分步乘法计数原理计算出“每天随机观看一场决赛”对应的情况数,然后分析“决赛恰好在同一赛区”的情况数,由此求解出对应概率;(2)先分析随机变量X 的可取值,然后利用组合数计算出X 取不同值时对应的概率,由此得到X 的分布列,并结合期望的计算公式求解出()E X .
【解析】(1)①记“在这两天每天随机观看一个项目,恰好看到冰壶和冰球”为事件A . 由表可知,在这两天每天随机观看一个项目,共有1010100⨯=种不同情况, 其中恰好看到冰壶和冰球,共有2种不同情况,所以()P A =
21
=10050
. ②记“在这两天每天随机观看一场决赛,两场决赛恰好在同一赛区”为事件B . 由表可知,在这两天每天随机观看一场决赛共有6742⨯=种不同情况,
其中两场决赛恰好在北京赛区共有2种不同情况,在张家口赛区共有4416⨯=种不同情况, 所以()P B =
2163
=427
+. (2)随机变量X 的所有可能取值为1,2,3.
根据题意,34374
(1)35
C P X C ===,
12121221121424243
71612423
(2)3535C C C C C C C C P X C ⋅+⋅+++++====, 111
1243
78
(3)35
C C C P X C ⋅⋅===.随机变量X 的分布列是
数学期望()12335353535
E X =⨯
+⨯+⨯=. 6.某地发现6名疑似病人中有1人感染病毒,需要通过血清检测确定该感染人员,血清检测结果呈阳性的即为感染人员,呈阴性表示没感染.拟采用两种方案检测:方案甲:将这6名疑似病人血清逐个检测,直到能确定感染人员为止;方案乙:将这6名疑似病人随机分成2组,每组3人.先将其中一组的血清混在一起检测,若结果为阳性,则表示感染人员在该组中,然后再对该组中每份血清逐个检测,直到能确定感染人员为止;若结果为阴性,则对另一组中每份血清逐个检测,直到能确定感染人员为止, (1)求这两种方案检测次数相同的概率;
(2)如果每次检测的费用相同,请预测哪种方案检测总费用较少?并说明理由. 【试题来源】江苏省苏锡常镇四市2021届高三下学期3月教学情况调研(一) 【分析】设甲方案检测的次数{1,2,3,4,5}X ∈,记乙方案检测的次数{2,3}Y ∈, (1)记两种方案检测的次数相同为事件A ,根据独立事件的概率的乘法公式,即可求解; (2)分别求得随机变量X 和Y 的期望,结合期望的大小,即可求解. 【解析】由题意可设甲方案检测的次数是X ,
则{1,2,3,4,5}X ∈,记乙方案检测的次数是Y ,则{2,3}Y ∈, (1)记两种方案检测的次数相同为事件A , 则()()()11121
2,23,363636
P A P X Y P X Y ===+===⨯+⨯=, 所以两种方案检测的次数相同的概率为
16
.
(2)由11(1)(2)(3)(4),(5)63
P X P X P X P X P X ==========, 所以1111110
()12345666633E X =⨯
+⨯+⨯+⨯+⨯=, 122(2),(3)1333P Y P Y ====⨯=,则128
()23333
E Y =⨯+⨯=,
因为()()E X E Y >,所以采用乙方案.
7.下围棋既锻炼思维又愉悦身心,有益培养人的耐心和细心,舒缓大脑并让其得到充分休息.现某学校象棋社团为丰富学生的课余生活,举行象棋大赛,要求每班选派一名象棋爱好者参赛.现某班有12位象棋爱好者,经商议决定采取单循环方式进行比赛,(规则采用“中国数目法”,没有和棋.)即每人进行11轮比赛,最后靠积分选出第一名去参加校级比赛.积分规则如下(每轮比赛采取5局3胜制,比赛结束时,取胜者可能会出现3:0,3:1,3:2.三种赛式).
9轮过后,积分榜上的前两名分别为甲和乙,甲累计积分26分,乙累计积分22分.第10轮
甲和丙比赛,设每局比赛甲取胜的概率均为23,丙获胜的概率为1
3
,各局比赛结果相互独立.
(1)①在第10轮比赛中,甲所得积分为X ,求X 的分布列; ②求第10轮结束后,甲的累计积分Y 的期望;
(2)已知第10轮乙得3分,判断甲能否提前一轮获得累计积分第一,结束比赛.(“提前一轮”即比赛进行10轮就结束,最后一轮即第11轮无论乙得分结果如何,甲累计积分最多)?若能,求出相应的概率;若不能,请说明理由.
【试题来源】山东省临沂市沂水一中2021届高三 二轮复习联考(一)
【分析】(1)①求得随机变量X 的可能取值,利用独立重复试验的公式,求得相应的概率,即可得出分布列,②求得随机变量Y 的可能取值,利用公式,即可求得积分Y 的期望;
()2由3X =,得到甲10轮后的总积分和第10轮和第11轮都得3分,进而求得提前一轮结
束比赛的概率.
【解析】(1)①由题意,随机变量X 的可能取值为3,2,1,0,
则()32
23
22221631333327
P X C ⎛⎫⎛⎫⎛⎫⎛⎫==+-= ⎪ ⎪
⎪⎪⎝⎭⎝⎭
⎝⎭⎝⎭,
()2
2
24
222162133381
P X C ⎛⎫
⎛⎫⎛⎫==⋅-⋅= ⎪
⎪ ⎪⎝⎭
⎝⎭
⎝⎭, ()2
3
24228113381
P X C ⎛⎫⎛⎫
==⋅-= ⎪ ⎪⎝⎭
⎝⎭, ()3
3
1322210113339
P X C ⎛⎫⎛⎫⎛⎫==-+-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭,
所以X 的分布列为
②随机变量Y 的可能取值为29,28,27,26, 则()161681229029282726278181981
E Y =
⨯+⨯+⨯+⨯= ()2若3X =,则甲10轮后的总积分为29分,乙即便第10轮和第11轮都得3分,
则11轮过后的总积分是28分,2928>,
所以甲如果第10轮积3分,则可提前一轮结束比赛,其概率为()16
327
P X ==
. 8.某资源网推出精品资料营销数学学科新教材必修第一册共计推出48个教案,为了更好地将课程内容呈现给学生,现对某一时段教案的下载量进行统计:
(1)现从48个教案中采用分层抽样的方式选出6个,求出的下载量超过200的个数; (2)为了更好地鼓励作者,现在在基本工资的基础上推出如下奖励施,若下载量在区间
[0,100]内不子奖励,若下载量在区间(100,200]内,则每个教案奖励500元;下载量超过
200,则每个教案奖励1000元,现从(1)中选出的6个教案中随机取出2个教案进行奖励,
求奖励金额X 的分布列与数学期望.
【试题来源】2021届普通高中教育教学质量监测考试全国I 卷(理) 【分析】(1)利用分层抽样直接计算;
(2)先写出X 的可能取值,分别计算概率,写出分布列和数学期望. 【解析】(1)根据分层抽样的特点,选出的下载量超过200的个数为16
6248
⨯=个. (2)X 的可能取值为500,1000,1500,2000.
1113
26C C 1(500)C 5P X ===;211
3122
6C C C 1(1000)C 3P X +===; 113226C C 2(1500)C 5P X ===;22
2
6C 1(2000)C 15
P X ===. 则奖励金额X 的分布列为
故奖励金额X 的数学期望()500100053E X =⨯
+⨯13500150020005153
+⨯+⨯=. 9.2020年是不平凡的一年,“新冠病毒”影响全世界,中国在这场“斗争”中取得了全面的胜利.为防止病毒传播,武汉封城,并对部分地区的每个居民的血液进行检验.现有两种方案, 方案一:依次检查,N 个人需要N 次.
方案二:先把受检验者分组,假设每组k 个人,把这k 个人的血液混合在一起进行检验,如果检验结果为阴性,说明这k 个人血液全为阴性,因而这k 个人总共只要检验1次就够了,检验工作量减少了.但如果检验结果为阳性,为明确k 个人中是哪几个人为阳性,就要对这
k 个人再一一进行检验,这时检验的总次数为()1k +次.
在接受检验的人群中,每个人的检验结果是阴性还是阳性是独立的,假设每个人都是阳性结果的概率为p .采用方案二,设人均检验次数为X .
(1)求X 的分布列及期望值()E X ,并指出p ,k 满足什么条件时采用方案二好; (2)若某小区有10000人,采用方案二,若0.1p =,4k =.这10000人检验次数为Y ,求()E Y .
【试题来源】2021届新高考同一套题信息原创卷(三)
【分析】(1)根据题意,写出 X 的分布列并求出期望值,当期望小于1时,方案二较好,求得此时的p ,q 关系;
(2)将 k ,p 的值代入(1)的表达式中,求出期望即可. 【解析】(1)采用方案二,每组k 人,人均检验次数X 的分布列为
X
1
k 1k
k
+ P
()
1k
p -
()11k
p --
()()()11111k k k E p X p k k +⎡⎤=
-+--⎣⎦()111k
p k
=--+. 当()1E X <,即()11k
p k ->
,1
1k p k
->时,方案二好. (2)0.1p =,4k =时,()4
1
10.90.59394
E X =-+
=, ()~10000,0.5939Y B ,所以()100000.59395939E Y =⨯=.
【名师点睛】本题以“新冠病毒”
为背景,在正确理解题意的前提下,使用概率统计知识,
计算随机变量分布列、数学期望,体现了数学建模、数学运算的核心素养.
10.拉拉裤又叫成长裤,是等宝宝调皮了自己会解纸尿裤了或者换尿裤的时候总动来动去使用的,拉拉裤不但有防尿功能,且具有普通短裤的功能,拉拉裤易于穿着、方便活动,能减轻妈妈的劳累,让宝宝轻轻松松学步,渗透性能是体现其功能的重要指标,对渗透性能的考量又分滑渗量、回渗量、渗漏量三个方面,其中,回渗量是一个直接与孩子健康挂钩的指标,国家在这方面有严格规定,要求不得超过10克.某品牌拉拉裤的生产商为了测量某批新产品的回渗量,从该批产品中随机抽取了1000片,得到如下频率分布直方图:
注:以频率作为概率,该品牌拉拉裤的生产商规定回渗量小于220毫克为合格品. (1)从这批拉拉裤中随机抽取4片,记合格片数为ξ,求ξ的分布列与期望. (2)从这批拉拉裤中随机抽取m 片,全是合格品的概率不低于60%,求m 的最大值. (3)为提高新产品的质量,该厂商研发部拟订了Ⅰ,Ⅰ两种技术更新方案,试验结果如下:方案Ⅰ,随机抽取100片,合格片数的期望是96;方案Ⅰ,随机抽取120片,合格片数的期望是115.试问该厂商应按哪个改进方案投入生产?
【试题来源】普通高等学校招生全国统一考试数学预测卷(二) 【分析】(1)由频率分布直方图,得到所抽取拉拉裤是合格品的概率为
9
10
,确定随机变量ξ的所有可能取值,求得相应的概率,得出分布列,利用公式求得期望;(2)求得这这批拉拉
裤中随机抽取m 片,全是合格品的概率为910m ⎛⎫ ⎪⎝⎭
,结合90.610m
⎛⎫≥ ⎪⎝⎭,即可求解;(3)按
方案Ⅰ,Ⅰ分别得到合格品个数()100,X B a 和()120,Y B b ,求得期望,即可得到结
论.
【解析】(1)由频率分布直方图可知,所抽取拉拉裤是不合格品的频率为
()0.0040.001200.1+⨯=,
所以所抽取拉拉裤是合格品的频率为10.10.9-=, 即所抽取拉拉裤是合格品的概率为
9
10
. 从这批产品中随机抽取4片,合格品的个数ξ的所有可能取值为0,1,2,3,4,
则()41101010000P ξ⎛⎫=== ⎪⎝⎭,()3
1491361C 101010000P ξ⎛⎫==⋅⋅= ⎪
⎝⎭, ()2
224914862C 101010000P ξ⎛⎫
⎛⎫==⋅⋅= ⎪
⎪⎝⎭
⎝⎭,()3
349129163C 101010000
P ξ⎛⎫==⋅⋅= ⎪
⎝⎭, ()4
9656141010000
P ξ⎛⎫===
⎪⎝⎭,所以ξ的分布列为
所以数学期望()01234 3.61000010000100001000010000
E ξ=⨯
+⨯+⨯+⨯+⨯=.
(2)从这这批拉拉裤中随机抽取m 片,全是合格品的概率为910m
⎛⎫ ⎪⎝⎭
,
因为4
90.656110⎛⎫= ⎪⎝⎭,5
90.5904910⎛⎫= ⎪⎝⎭,依题意得90.610m
⎛⎫≥ ⎪⎝⎭
,则m 的最大值为4. (3)按方案Ⅰ,设随机抽取一个产品合格的概率是a ,随机抽取100片, 合格品个数()100,X
B a ;
按方案Ⅰ,设随机抽取一个产品合格的概率是b ,随机抽取120片, 合格品个数()120,Y
B b .
依题意()10096E X a ==,()120115E Y b ==,解得2425a =,23
24
b =. 因为
2423
2524
>,所以应选择方案Ⅰ. 11.在2020年的新冠肺炎疫情影响下,国内国际经济形势呈现出前所未有的格局.某企业统计了2020年前5个月份企业的利润,如下表所示:
(1)根据所给的数据建立该企业所获得的利润y (万元)关于月份x 的回归直线方程
ˆˆˆy
bx a =+,并预测2020年12月份该企业所获得的利润; (2)企业产品的质量是企业的生命,该企业为了生产优质的产品投放市场,对于生产的每一件产品必须要经过四个环节的质量检查,若每个环节中出现不合格产品立即进行修复,且每个环节是相互独立的,前三个环节中生产的产品合格的概率为
1
2
,每个环节中不合格产品所需要的修复费用均为100元,第四个环节中产品合格的概率为
3
4
,不合格产品需要的修复费用为50元,设每件产品修复的费用为ξ元,写出ξ的分布列,并求出每件产品需要修复的平均费用.
参考公式:回归直线方程ˆˆˆy bx a =+中斜率和截距的最小二乘估计公式分别为
1
2
2
1
ˆn
i i
i n
i
i x y nxy
b
x
nx ==-=-∑∑,ˆˆa y bx
=-,x ,y 为样本数据的平均值. 【试题来源】2021届新高考同一套题信息原创卷(六)
【分析】(1)根据给出的数值,计算出x ,y ,利用最小二乘法可得回归直线的方程; (2)由题意可确定ξ所有可能的取值,依次求出每个取值对应的概率,进而得到分布列,由数学期望计算公式可求出期望. 【解析】(1)由表格数据知1234535x ++++=
=,9095105100110
1005
y ++++==,
5
1
5
22
1
5ˆ5i i
i i
i x y xy b
x x ==-∴=-∑∑
()()2
2
2
2
2
2
19029531054100511053100
1234553⨯+⨯+⨯+⨯+⨯-⨯⨯=++++-⨯459102
=
=, 由回归直线经过样本点的中心(),x y 可知9ˆ10032a =
⨯+,173
ˆ2
a ∴=,
则回归直线方程为9173
ˆ22
y
x =+. 预测2020年12月份该企业所获得的利润为
9173
12140.522
⨯+=(万元). (2)根据题意知ξ所有可能取值为0,50,100,150,200,250,300,350,
()313302432P ξ⎛⎫∴==⨯= ⎪⎝⎭;
()3
111502432
P ξ⎛⎫==⨯= ⎪⎝⎭;
()2
23113910022432P C ξ⎛⎫==⨯⨯= ⎪⎝⎭;()2
23111315022432P C ξ⎛⎫==⨯⨯=
⎪⎝⎭;
()2
13113920022432P C ξ⎛⎫==⨯⨯= ⎪⎝⎭;()2
13111325022432
P C ξ⎛⎫==⨯⨯= ⎪⎝⎭; ()31333002432P ξ⎛⎫==⨯= ⎪⎝⎭;()3
111
3502432
P ξ⎛⎫==⨯= ⎪⎝⎭;
ξ∴的分布列为
()319393305010015020025030032323232323232
E ξ∴=⨯
+⨯+⨯+⨯+⨯+⨯+⨯+135032⨯
3252
=,即每件产品需要修复的平均费用为3252元. 【名师点睛】本题考查离散型随机变量的分布列与数学期望的求解,解题关键是能够根据独立事件概率的计算方法准确求解随机变量每个取值所对应的概率.
12.某观影平台为了解观众对最近上映的某部影片的评价情况(评价结果仅有“好评”、“差评”),从平台所有参与评价的观众中随机抽取216人进行调查,部分数据如下表所示(单位:人):
(1)请将22⨯列联表补充完整,并判断是否有99%的把握认为“对该部影片的评价与性别有关”?
(2)若将频率视为概率,从观影平台的所有给出“好评”的观众中随机抽取3人,用随机变量X 表示被抽到的男性观众的人数,求X 的分布列;
(3)在抽出的216人中,从给出“好评”的观众中利用分层抽样的方法抽取10人,从给出“差
评”的观众中抽取()
m m *
∈N 人.现从这(10)m +人中,随机抽出2人,用随机变量Y 表示
被抽到的给出“好评”的女性观众的人数.若随机变量Y 的数学期望不小于1,求m 的最大值.
参考公式:22
()()()()()
n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.
参考数据:
)20x 0.102.706【试题来源】江苏省高考第二次适应性考试
【分析】(1)根据数据完善22⨯列联表,求出2χ,根据参考数据可判断.
(2)先求出随机抽取1人为男性的概率,由题意2~3,5X B ⎛⎫
⎪⎝⎭
,由二项分布可得答案. (3) Y 的可能取值为0,1,2.求出概率,求出期望,建立不等式,可得答案. 【解析】(1)填写22⨯列联表如下:
所以
222
2
()216(68604048)2162160()()()()100116108108100116108108
n ad bc a b c d a c b d χ-⨯-⨯⨯===
++++⨯⨯⨯⨯⨯⨯ 2162020216
7.45 6.63510011629
⨯⨯=
=≈>⨯,
所以有99%的把握认为“观影评价与性别有关”.
(2)从观影平台的所有给出“好评”的观众中随机抽取1人为男性的概率为402
1005
=, 且各次抽取之间相互独立,所以2~3,5X B ⎛⎫ ⎪⎝⎭
,
所以3327(0)5125
P X ⎛⎫=== ⎪⎝⎭,2
1
32354(1)55125P X C ⎛⎫==⨯⨯=
⎪⎝⎭, 2
2
32336(2)55125P X C ⎛⎫==⨯⨯=
⎪⎝⎭,3
28(3)5125
P X ⎛⎫=== ⎪⎝⎭.故X 的分布列为
(3)从给出“好评”的观众中利用分层抽样的方法抽取10人,则男性4人,女性6人. 则Y 的可能取值为0,1,2.
所以24210(0)m m C P Y C ++==,1146210(1)m m C C P Y C ++==,0246
2
10
(2)m m C C P Y C ++==. 所以2110244646
222
101010
()0121m m m m m m C C C C C E Y C C C ++++++=⨯+⨯+⨯≥,即12410630m m C C +++≥, 即27180m m +-≤,解得92m -≤≤,又*m ∈N , 所以m 的最大值为2.
【名师点睛】本题考查对立性检验、二项分布和期望,解答本题的关键是将问题转化为二项分布问题,即根据条件得出2~3,5X B ⎛⎫
⎪⎝
⎭
,以及求出对应概率,属于中档题.
13.某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测.现从该生产线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数μ=14,标准差σ=2,绘制如图所示的频率分布直方图.以频率值作为概率估计值.
(1)从该生产线加工的产品中任意抽取一件,记其数据为X ,依据以下不等式评判(P 表示对应事件的概率):
①P (μ-σ<X <μ+σ)≥0.682 6; ②P (μ-2σ<X <μ+2σ)≥0.954 4; ③P (μ-3σ<X <μ+3σ)≥0.997 4.
评判规则为若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;
(2)将数据不在(μ-2σ,μ+2σ)内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为Y,求Y的分布列与数学期望E(Y).
【试题来源】【高频考点解密】2021年新高考数学二轮复习讲义分层训练
【分析】(1)利用直方图计算概率并判断不等式成立的个数可得结论;
(2)根据Y~B
3
(2,)
50
可求出分布列和数学期望.
【解析】(1)由题意知,μ=14,σ=2,由频率分布直方图得
P(μ-σ<X<μ+σ)=P(12<X<16)=(0.29+0.11)×2=0.8>0.682 6,
P(μ-2σ<X<μ+2σ)=P(10<X<18)=(0.04+0.29+0.11+0.03)×2=0.94<0.954 4,P(μ-3σ<X<μ+3σ)=P(8<X<20)=0.94+(0.015+0.005)×2=0.98<0.997 4,
所以不满足至少两个不等式成立,故该生产线需检修.
(2)由(1)知P(μ-2σ<X<μ+2σ)=0.94=47 50
,
所以任取一件是次品的概率为1-47
50
=
3
50
,
所以任取两件产品得到的次品数Y可能值为0,1,2,且Y~B
3 (2,)
50
.
则P(Y=0)=
2
47
50
⎛⎫
⎪
⎝⎭
=
2209
2500
;P(Y=1)=1
2
473141
50501250
C⨯⨯=;
P(Y=2)=
2
39
502500
⎛⎫
=
⎪
⎝⎭
.所以Y的分布列为
所以E(Y)=
3
2
5025⨯=.
【名师点睛】(1)中利用频率分布直方图求频率是解题关键(2)中利用二项分布求解是解题关键.
14.某乡村中学教师资源薄弱,多数教师都在超负荷工作,为了体现按劳分配的原则,鼓励教师在力所能及的范围内多带课,学校计划把绩效工资根据教师每周代课的节数进行重新分
配.每周课时量(仅是上课节数,不包括班主任工作)在区间[]7,12内为满工作量;在(]12,16内为超工作量;(]
16,30为严重超工作量.为了了解本校教师的代课情况,通过简单随机抽样,获得了10名教师的代课情况统计表如下:
(1)在计算教师一周总的课时津贴时(备注:本校全体教师的课时都不小于7节课),课时量介于[]7,12内部分,按4元/节计算课时津贴;课时量介于(]12,16内部分,按6元/节计算课时津贴;课时量介于(]16,30 内部分,按9元/节计算课时津贴,试求教师一周总的课时津贴y 与总的课时量x 之间的函数关系;
(2)现要在这10名教师中任意选取3名,求取到超工作量(课时节数在(]12,16内)的教师人数的分布列与期望;
(3)用抽到的10名教师样本估计全校教师的代课情况,用频率代替概率.现在从全校教师中随机抽取10名教师,若抽到k 名教师周代课量为满工作量(课时节数在[]7,12内)的可能性最大,求k 的值.
【试题来源】河南省名校联盟2020-2021学年高三4月联考(一)(理)
【分析】(1)根据课时量介于[]7,12内部分,按4元/节计算课时津贴;课时量介于(]12,16内部分,按6元/节计算课时津贴;课时量介于(]16,30 内部分,按9元/节计算课时津贴求解; (2)设取到超工作量的教师人数为ξ,可知超工作量的教师有3名,则ξ可取0,1,2,3,求得其相应概率,列出分布列,再求期望;
(3)根据310,5X B ⎛⎫
⎪⎝⎭
,得到()()1010
320,1,2,3,
,1055k
k
k P X k C k -⎛⎫⎛⎫
=== ⎪ ⎪
⎝⎭⎝⎭
,
然后由()()()()11P X k P X k P X k P X k ⎧=≥=+⎪⎨=≥=-⎪⎩
求解.
【解析】(1)因为课时量介于[]7,12内部分,按4元/节计算课时津贴;课时量介于(]12,16内部分,按6元/节计算课时津贴;课时量介于(]16,30 内部分,按9元/节计算课时津贴,。