2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标(文)(含解析)新人教A版

合集下载

2024版高考数学大一轮第九章概率与统计综合突破六概率与统计综合问题

2024版高考数学大一轮第九章概率与统计综合突破六概率与统计综合问题
[答案] 若利用线性回归模型,可得2022年我国新能源乘用车的年销售量的预测值为 .若利用模型 ,可得2022年我国新能源乘用车的年销售量的预测值为 .
(3) 你认为(2)中用哪个模型得到的预测值更可靠?请说明理由.参考数据:设 ,其中 .
144
4.78
841
5.70
380
528
参考公式:对于一组具有线性相关关系的数据 ,其回归直线 的斜率和截距的最小二乘估计公式分别为 , .
[答案] 设“在一次检测中,发现需要对本次的生产过程进行检查”为事件 ,则 .依题意,需对生产设备进行检修的概率 .故一天中需对生产设备进行检修的概率为0.01.
【点拨】①利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线 对称,及曲线与 轴之间的面积为1;②利用 原则求概率问题时,要注意把给出的区间或范围与正态变量的 , 进行对比联系,确定它们属于 , , 中的哪一个(或哪两个的组合区间).
[答案] 设中位数为 ,则 ,解得 ,所以中位数为63.3.
(3) 用频率估计概率,从使用该软件的所有用户中随机抽取10人,以 表示这10人中满意度的等级为“满意”的人数,求 的数学期望和方差.
[答案] 依题意可知 ,则 , .
【点拨】解决此类问题需要“闯三关”,即“文字关”“图表关”“计算关”.重在审图表、明数据,准确提取信息是关键,然后根据信息一步步实现图表数据与数学符号语言的转化,建立数学模型解决问题.
(1) 下面是检验员某次抽取的16件产品的关键指标数据:
10.02
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课件理新人教A版

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课件理新人教A版

【例 2】(2018·北京卷)电影公司随机收集了电影的有关数 据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510
好评率 0.4 0.2 0.15 0.25 0.2 0.1 好评率是指:一类电影中获得好评的部数与该类电影总部
解析 (1)设“从电影公司收集的电影中随机选取 1 部,这
部电影是获得好评的第四类电影”为事件 A.
因为第四类电影中获得好评的电影有 200×0.25=50(部),
所以
P(A)

50 140+50+300+200+800+510

2
50 000

0.025.
(2)设“从第四类电影和第五类电影中各随机选取 1 部,恰
个红灯的概率.
解析 (1)随机变量 X 的所有可能取值为 0,1,2,3. P(X=0)=1-21×1-31×1-41=14, P(X=1)=12×1-31×1-41+1-21×13×1-41+1-21 ×1-31×14=2114, P(X=2)=1-21×13×14+12×1-31×14+12×13×1-41= 14,
素养解读 本题考查统计中的概率计算、随机变量的方差计算,考查 运算求解能力,体现了数据分析、数学运算等核心素养.试题 难度:中.
【突破训练 2】 (2017·全国卷Ⅲ)某超市计划按月订购一种
Hale Waihona Puke 酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,
未售出的酸奶降价处理,以每瓶 2 元的价格当天全部处理完.根
【例 3】 (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、 旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网 箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如 下.

2020版高考数学一轮复习高考大题增分课6概率与统计中的高考热点问题教学案理含解析北师大版

2020版高考数学一轮复习高考大题增分课6概率与统计中的高考热点问题教学案理含解析北师大版

高考大题增分课六 概率与统计中的高考热点问题[命题解读] 1.概率与统计是高考中相对独立的一个内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查应用意识及阅读理解能力、分类讨论与化归转化能力.2.概率问题的核心是概率计算,其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具,统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,但近两年全国卷突出回归分析与独立性检验的考查.3.离散型随机变量的分布列及其均值的考查是历年高考的重点,难度多为中档类题目,特别是与统计内容渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.统计与统计案例以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查数据处理能力,分析问题、解决问题的能力.【例1】 (2018·全国卷Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.[解] (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)[律方规法] 1.在求两变量相关系数和两变量的回归方程时,由于r和b的公式组成比较复杂,求它们的值计算量比较大,为了计算准确,可将其分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.2.有关独立性检验的问题的解题步骤:(1)作出2×2列联表;(2)计算随机变量K2的值;(3)查临界值,检验作答.科技扶贫是精准扶贫的一项重要措施,某科研机构将自己研发的一项葡萄种植技术提供给某山区果农.为验证该技术的效果,该果农选择40株葡萄树进行试验,其中20株不进行任何处理,记为对照组,另外20株采用新技术培养,记为实验组.葡萄成熟收割后,该果农统计了这40株葡萄树的年产量数据(单位:kg).对照1215212326243535343251524946435344616343 组实验2332343642415159464343455267656562565558组(1)根据数据完成对照组和试验组葡萄产量的茎叶图,并通过茎叶图比较对照组和实验组葡萄产量的平均值和方差的大小(不要求计算出具体值,得出结论即可);(2)若每株葡萄树的年产量不低于45 kg ,则认为“产量高”,否则认为“产量一般”.请根据此样本完成此2×2列联表,并据此样本分析是否有95%的把握认为产量的提高与使用新技术有关;对照组实验组合计产量高产量一般合计(3)从“产量高”的数据中随意抽取3株做进一步科学研究中,计算恰好有2株来自实验组的概率.附:χ2=,其中n =a +b +c +d .n ad -bc 2a +bc +d a +c b +dP (χ2≥k )0.0500.0100.001k3.8416.63510.828[解] (1)实验组的葡萄平均产量要高于对照组的葡萄平均产量;实验组的葡萄产量的方差要小于对照组葡萄产量的方差.(2)完成2×2列联表如下表所示:对照组实验组合计产量高71219产量一般13821合计202040所以χ2的观测值k =≈2.506<3.841.40× 7×8-12×13 220×20×19×21所以没有95%的把握认为产量的提高与使用新技术有关.(3)记事件A 为“这3株中恰好有2株来自实验组”,则P (A )==.C 212C 17C 319154323所以恰好有2株来自实验组的概率为.154323离散型随机变量的分布列、均值和方差的应用离散型随机变量及其分布列、均值与方差及应用是高考的一大热点,每年均有解答题,属于中档题.复习时应强化应用题的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率的确定与转化是解题的基础,准确计算是解题的核心.【例2】 (本题满分12分)(2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.①现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在柱状图:三年使用期内更换的易损零件数,得如图所示的②以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,③n表示购买2台机器的同时购买的易损零件数.(1)求X的分布列;P X≤n ≥0.5,(2)若要求④确定n的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?[信息提取] 看到①这种条件,想到解题时可能要分类求解;看到②想到频数与频率间的关系,想到横轴中的取值含义;看到③想到X的所有可能取值;看到④想到X和n的含义,想到(1)中的分布列.[规范解答] (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2. ·················1分由题意可知X的所有可能取值为16,17,18,19,20,21,22.从而P(X=16)=0.2×0.2=0.04;P(X=17)=2×0.2×0.4=0.16;P(X=18)=2×0.2×0.2+0.4×0.4=0.24;P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;P(X=20)=2×0.2×0.4+0.2×0.2=0.2;P(X=21)=2×0.2×0.2=0.08;P(X=22)=0.2×0.2=0.04.····································4分所以X的分布列为X16171819202122 P0.040.160.240.240.20.080.04·····························································6分(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19. ···········································7分(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).当n=19时,E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04= 4 040;···································9分当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04= 4 080. ··························································11分可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19. ·······················································12分[易错与防范]易错点防范措施忽视X的实际含义导致取值错误,进而导致概率计算错误.细心审题,把握题干中的重要字眼,关键处加标记,同时理解X取每个值的含义.忽视P(X≤n)≥0.5的含义,导致不会求解.结合(1)中的分布列及n的含义,推理求解便可.忽视n=19与n=20的含义导致无法解题.本题中购买零件所需费用包含两部分,一部分为购买机器时购买零件的费用,另一部分为备件不足时额外购买的费用.[通性通法] 解答离散型随机变量的分布列及相关问题的一般思路:(1)明确随机变量可能取哪些值.(2)结合事件特点选取恰当的计算方法计算这些可能取值的概率值.(3)根据分布列和均值、方差公式求解.某校首届安琪杯教职工运动会上有一个扑克小游戏,游戏规则如下:甲、乙双方每局比赛均从5张扑克牌(3张红桃A,2张黑桃A)中轮流抽取1张,抽取到第2张黑桃A 的人获胜,并结束该局比赛.每三局比赛为一轮.(1)若在第一局比赛中甲先抽牌,求甲获胜的概率;(2)若在一轮比赛中规定:第一局由甲先抽牌,并且上一局比赛输的人下一局比赛先抽,每一局比赛先抽牌并获胜的人得1分,后抽牌并获胜的人得2分,未获胜的人得0分.求此轮比赛中甲得分X 的概率分布列及其数学期望E (X ).[解] (1)设“在第一局比赛中甲先抽牌,甲获胜”为事件M ,甲先抽牌,甲获胜等价于把这5张牌进行排序,第二张黑桃A 排在3号位置或5号位置,共有2+4=6(种),而2张黑桃A 的位置共有C =10(种).25所以P (M )==.2+41035(2)甲得分X 的所有可能取值为0,1,2,3,5.由(1)知在一局比赛中,先抽牌并获胜(后抽牌并输)的概率为,35则后抽牌并获胜(先抽牌并输)的概率为.25当X =0时,即三局甲都输,P (X =0)=××=;2525258125当X =1时,即第一局甲胜,二、三局甲输或第二局甲胜,一、三局甲输或第三局甲胜,一、二局甲输,P (X =1)=××+××+××=;当X =2时,即第一局甲胜,35352525353525253548125第二局甲输,第三局甲胜,P (X =2)=××=;35353527125当X =3时,即第一局甲输,二、三两局甲都胜或者第一局甲胜,第二局甲胜,第三局甲输,P (X =3)=××+××==;25352535253530125625当X =5时,即三局甲都胜,P (X =5)=××=.35252512125所以此轮比赛中甲得分X 的概率分布列为X 01235P 8125481252712562512125E (X )=0×+1×+2×+3×+5×=.8125481252712562512125252125概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算.【例3】 (2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图所示的频率分布直方图:(1)求这500件产品质量指标值的样本平均数和样本方差s 2(同一组中的数据用该组区x -间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s 2.x -①利用该正态分布,求P (187.8<Z <212.2);②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E (X ).附:≈12.2.150若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)=0.682 6,P (μ-2σ<Z <μ+2σ)=0.954 4.[解] (1)抽取产品的质量指标值的样本平均数和样本方差s 2分别为=170×0.02+x x 180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,s 2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.(2)①由(1)知,Z ~N (200,150),从而P (187.8<Z <212.2)=P (200-12.2<Z <200+12.2)=0.682 6.②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X ~B (100,0.682 6),所以E (X )=100×0.682 6=68.26.[律方规法] 统计与概率的综合应用(1)正态分布:若变量X 服从正态分布N (μ,σ2),其中μ为样本的均值,正态分布曲线的对称轴为x =μ;σ为样本数据的标准差,体现了数据的稳定性.(2)二项分布:若变量X ~B (n ,p ),则X 的期望E (X )=np ,方差D (X )=np (1-p ).某篮球队在某赛季已结束的8场比赛中,队员甲得分统计的茎叶图如图.(1)根据这8场比赛,估计甲每场比赛中得分的均值μ和标准差σ;(2)假设甲在每场比赛的得分服从正态分布N (μ,σ2),且各场比赛间相互没有影响,依此估计甲在82场比赛中得分在26分以上的平均场数.参考数据:≈5.66,≈5.68,≈5.70.3232.2532.5正态总体N (μ,σ2)在区间(μ-2σ,μ+2σ)内取值的概率约为0.954.[解] (1)μ=(7+8+10+15+17+19+21+23)=15,18σ2=[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.所以σ≈5.68.18所以估计甲每场比赛中得分的均值μ为15,标准差σ为5.68.(2)由(1)得甲在每场比赛中得分在26分以上的概率P (X ≥26)≈[1-P (μ-2σ<X <μ+2σ)]≈(1-0.954)=0.023,1212设在82场比赛中,甲得分在26分以上的次数为Y ,则Y ~B (82,0.023).Y 的均值E (Y )=82×0.023≈2.由此估计甲在82场比赛中得分在26分以上的平均场数约为2.[大题增分专训]1.某县响应中央的号召,积极开展了建设社会主义新农村的活动,实行以奖代补,并组织有关部门围绕新农村建设中的五个方面(新房舍、新设施、新环境、新农民、新风尚)对各个村进行综合评分,高分(大于等于88分)的村先给予5万元的基础奖励,然后比88分每高1分,奖励增加5千元,低分(小于等于75分)的村给予通报,取消5万元的基础奖励,且比75分每低1分,还要扣款1万元,并要求重新整改建设,分数在(75,88)之间的只享受5万元的基础奖励,下表是甲、乙两个乡镇各10个村的得分数据(单位:分):甲:62,74,86,68,97,75,88,98,76,99;乙:71,81,72,86,91,77,85,78,83,84.(1)根据上述数据完成以下茎叶图,并通过茎叶图比较两个乡镇各10个村的得分的平均值及分散程度(不要求计算具体的数值,只给出结论即可);(2)为继续做好社会主义新农村的建设工作,某部门决定在这两个乡镇中各任意抽取一个进行工作总结,求抽取的2个村中至少有一个得分是低分的概率;(3)从获取奖励的角度看,甲、乙两个乡镇哪个获取的奖励多?[解] (1)茎叶图:通过茎叶图可以看出,甲乡镇10个村的平均得分比乙乡镇10个村的平均得分高,甲乡镇10个村的得分比较分散,乙乡镇10个村的得分比较集中.(2)由茎叶图可知甲乡镇10个村中低分的有4个,乙乡镇10个村中低分的有2个,所以从甲乡镇10个村中随机抽取1个,得分是低分的概率为=,从乙乡镇10个村中随机抽取141025个,得分是低分的概率为=,故抽取的2个村中至少有一个得分是低分的概率为×+×21015254535+×=.1525151325(3)由茎叶图可知甲乡镇10个村中,高分(大于等于88分)有4个,分别是88分、97分、98分、99分,奖励分共9+10+11=30分,低分(小于等于75分)有4个,分别是75分、74分、68分、62分,扣款分共1+7十13=21分,分数在(75,88)之间的有2个,故甲乡镇所获奖励为6×5+30×0.5-21×1=30+15-21=24万元.由茎叶图可知乙乡镇10个村中,高分(大于等于88分)有1个,为91分,奖励分共3分,低分(小于等于75分)有2个,分别是71分、72分,扣款分共4+3=7分,分数在(75,88)之间的有7个,故乙乡镇所获奖励为8×5+3×0.5-7×1=40+1.5-7=34.5万元.故从获取奖励的角度看,乙乡镇获取的奖励多.2.(2018·太原二模)按照国家质量标准:某种工业产品的质量指标值落在[100,120)内,则为合格品,否则为不合格品.某企业有甲、乙两套设备生产这种产品,为了检测这两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本,对规定的质量指标值进行检测.甲套设备的样本频数分布表和乙套设备的样本频率分布直方图如下所示.甲套设备的样本频数分布表质量指标值[95,100)[100,105)[105,110)[110,115)[115,120)[120,125]频数14192051乙套设备的样本频率分布直方图(1)填写下面列联表,并根据列联表判断是否有90%的把握认为这种产品的质量指标值与甲、乙两套设备的选择有关;甲套设备乙套设备合计合格品不合格品合计(2)根据以上数据,对甲、乙两套设备的优劣进行比较;(3)将频率视为概率,若从甲套设备生产的大量产品中,随机抽取3件产品,记抽到的不合格品的个数为X ,求X 的数学期望E (X ).附:P (χ2≥k 0)0.150.100.050.0250.01k 02.0722.7063.8415.0246.635χ2=.n ad -bc 2a +bc +d a +c b +d[解] (1)根据题中数据填写列联表如下:甲套设备乙套设备合计合格品484391不合格品279合计5050100由列联表得χ2=≈3.053.100× 48×7-2×43 250×50×91×9∵3.053>2.706,∴有90%的把握认为这种产品的质量指标值与甲、乙两套设备的选择有关.(2)根据题中数据可知,甲套设备生产的合格品的概率约为,乙套设备生产的合格品的4850概率约为,并且甲套设备生产的产品的质量指标值主要集中在[105,115)之间,乙套设备生4350产的产品的质量指标值与甲套设备的相比,较为分散.因此,可以认为甲套设备生产的合格品的概率更高,且质量指标值更稳定,从而甲套设备优于乙套设备.(3)由题知,X ~B ,(3,125)∴E (X )=3×=.1253253.(2018·石家庄二模)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站2017年1~8月促销费用(万元)和产品销量(万件)的具体数据.月份12345678促销费用x 2361013211518产品销量y11233.5544.5(1)根据数据可知y 与x 具有线性相关关系,请建立y 关于x 的回归方程y =bx +a (系数精确到0.01);(2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以z (单位:件)表示日销量,z ∈[1 800,2 000),则每位员工每日奖励100元;z ∈[2 000,2 100),则每位员工每日奖励150元;z ∈[2 100,+∞),则每位员工每日奖励200元.现已知该网站6月份日销量z 服从正态分布N (2 000,10 000),请你计算某位员工当月奖励金额总数大约为多少元.(当月奖励金额总数精确到百分位)参考数据:x i y i =338.5,x =1 308,其中x i ,y i 分别为第i 个月的促销费用和产∑8i =1∑8i =12i 品销量,i =1,2,3, (8)参考公式:①对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y =bx +a 的斜率和截距的最小二乘估计分别为b =,a =-b .∑ni =1x i y i -n xy∑ni =1x 2i -nx 2y x ②若随机变量Z 服从正态分布N (μ,σ2),则P (μ-σ,μ+σ)=0.682 7,P (μ-2σ,μ+2σ)=0.954 5.[解] (1)由题可得=11,=3,x y将数据代入得b =∑8i =1x i y i -8xy∑8i =1x 2i -8x 2=338.5-8×11×31 308-8×11×11=≈0.219,74.5340a =-b ≈3-0.219×11≈0.59,y x 所以y 关于x 的回归方程y =0.22x +0.59.(2)由题知该网站6月份日销量z 服从正态分布N (2 000,10 000),则日销量在[1 800,2 000)上的概率为=0.477 25,0.954 52日销量在[2 000,2 100)上的概率为=0.341 35 ,0.682 72日销量在[2 100,+∞)上的概率为=0.158 65,1-0.682 72所以某位员工当月奖励金额的总数为(100×0.477 25+150×0.341 35+200×0.158 65)×30=3 919.725≈3 919.73(元).。

2020版高考数学复习专项突破6高考中的概率、统计与统计案例课件文北师大版

2020版高考数学复习专项突破6高考中的概率、统计与统计案例课件文北师大版
������ =1 3 3 i=1
∴b=434-432 = 2,
5 a=27-2×12=-3, 5 y=2x-3.
977-972
5
∴y 关于 x 的线性回归方程为
5 (3)当 x=10 时,y= ×10-3=22,|22-23|<2, 2 5 当 x=8 时,y=2×8-3=17,|17-16|<2.
������甲 = =195(cm), 乙厂这批轮胎宽度的平均值为
1
1 (195+194+196+193+194+197+196+195+193+197) 10
������乙 = 10(195+196+193+192+195+194+195+192+195+193) =194(cm).
-14题型一
-10题型一
题型二
题型三
题型四
题型五
题型六

④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时
间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方 式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致 呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布 的区间相同,故可以认为用第二种生产方式完成生产任务所需的时 间比用第一种生产方式完成生产任务所需的时间更少.因此第二种 生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由即 可.
所得到的线性回归方程是可靠的.
-19题型一
题型二
题型三
题型四
题型五
题型六
解题心得在求两变量相关系数和两变量的回归方程时,由于r和b 的计算公式比较复杂,求它们的值时计算量比较大,因此为了计算 准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个 攻破,提高了计算的准确度.

高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理(含解析)新人教A版

高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理(含解析)新人教A版

高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理(含解析)新人教A 版高考必考题突破讲座 (六)1.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的13,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得⎩⎪⎨⎪⎧100.035+0.025+c +2b +a =1,2b =a +c⇒b =0.01,因为成绩在[90,100]内的有6人,所以n =60.01×10=60.(2)由⎩⎪⎨⎪⎧a +c =0.02,c =3a⇒⎩⎪⎨⎪⎧a =0.005,c =0.015,于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3.且P (X =0)=C 39C 03C 312=2155,P (X =1)=C 29C 13C 312=2755,P (X =2)=C 19C 23C 312=27220,P (X =3)=C 09C 33C 312=1220,所以X 的分布列如下X 0 1 2 3P2155 2755 27220 1220故X 的数学期望为E (X )=0×55+1×55+2×220+3×1220=34.2.下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望. 解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=112,且A i ∩A j =∅(i ≠j ).(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12, 所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=512.即此人到达当日空气重度污染的概率为512.(2)由题意可知,ξ的所有可能取值为0,1,2,3.P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)=312=14, P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)=212=16, P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)=212=16,P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3)=1-14-16-16=512,所以ξ的分布列为ξ 0 1 2 3 P14 512 16 16故ξ的数学期望E (ξ)=0×4+1×12+2×6+3×6=54.3.(2019·焦作模拟)某单位共10名员工,他们某年的收入如下表.员工编号 123 4567 89 10年薪/万元 3 3.5 4 5 5.5 6.5 7 7.5 8 50(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程y ^=b ^x +a ^中系数计算公式b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2,a ^=y --b ^x -,其中x -,y -表示样本均值.解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2. P (ξ=0)=C 24C 210=215,P (ξ=1)=C 14C 16C 210=815,P (ξ=2)=C 26C 210=13,所以ξ的分布列为ξ 0 1 2 P215 815 13数学期望为E (ξ)=0×215+1×15+2×3=5.(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪, 则x -=2.5,y -=5,∑i =14x i -x -)2=2.25+0.25+0.25+2.25=5,∑i =14x i -x -)(y i -y -)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,b ^=∑i =14x i -x-y i -y-∑i =14x i -x-2=75=1.4, a ^=y --b ^x -=5-1.4×2.5=1.5,因此线性回归方程为y =1.4x +1.5,可预测该员工第5年的年薪收入为8.5万元.4.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X).②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解析(1)由题意知,20件产品中恰有2件不合格品的概率为f(p)=C220p2(1-p)18.因此,f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17·(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0,所以f(p)的最大值点p0=0.1.(2)由(1)知,p=0.1.①令Y表示余下的180件产品中的不合格品的件数.依题意知,Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.②如果对余下的所有产品作检验,那么这一箱产品所需要的检验费用为400元.由于E(X)>400,因此应该对这箱余下的所有产品作检验.5.(2019·甘肃兰州诊断)“中国式过马路”是网友对部分中国人集体闯红灯现象的一种调侃.即“凑够一撮人就可以走了,和红绿灯无关”,某校研究性学习小组对全校学生按“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”等三种形式过马路进行调查,获得下表数据:闯红灯”的人中抽取了66人.(1)求n的值;(2)在所抽取的“带头闯红灯”的人中,任选2人参加星期天社区组织的“文明交通”宣传活动,求这2人中至少有1人是女生的概率.解析 (1)由题意得,66980+340=n980+340+410+150+60+60,解得n =100.(2)因为所有参与调查的人数为980+340+410+150+60+60=2 000,所以从“带头闯红灯”的人中用分层抽样的方法抽取的人数为(60+60)×1002 000=6,其中男生有60×1002 000=3人,女生有60×1002 000=3人,将这3名男生用A 1,A 2,A 3表示,3名女生用B 1,B 2,B 3表示,则从这6人中任选2人的所有基本事件为A 1A 2,A 1A 3,A 2A 3,A 1B 1,A 1B 2,A 1B 3,A 2B 1,A 2B 2,A 2B 3,A 3B 1,A 3B 2,A 3B 3,B 1B 2,B 1B 3,B 2B 3,共15个.这2人均是男生的基本事件有A 1A 2,A 1A 3,A 2A 3,共3个,记“这2人中至少有1人是女生”为事件M ,则M 包含的基本事件共有12个,所以P (M )=1215=45.故从这6人中任选2人,至少有1个是女生的概率为45.6.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表中:超过m 不超过m 第一种生产方式 第二种生产方式(3)根据(2) 附:K 2=n ad -bc 2a +bc +d a +cb +d,P (K 2≥k 0) 0.050 0.010 0.001k 03.841 6.635 10.828解析 (1)(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少为82 min ;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多78 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min ;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80 min ;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)(2)由茎叶图知m =79+812=80.列联表如下:超过m 不超过m 第一种生产方式 15 5 第二种生产方式515(3)由于K 2=40220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.。

高考数学一轮复习高考大题专项突破6高考中的概率与统计市赛课公开课一等奖省名师优质课获奖PPT课件

高考数学一轮复习高考大题专项突破6高考中的概率与统计市赛课公开课一等奖省名师优质课获奖PPT课件
P(X=0)= 1-
1
2
1
× 1-
1
× 1-
3
1
1
4
1
= ,
4
1
1
1
1
1
1
P(X=1)=2 × 1- 3 × 1- 4 + 1- 2 × 3 × 1- 4 + 1- 2 × 1- 3 ×
1
4
=
11
24
,
P(X=2)= 11
1
2
1
1
1113412
3
× × + × 11
1
1
1
1
4
2
3
4
× + × × 1-
加以说明;
(2)建立y关于t回归方程(系数准确到0.01),预测年我国生活垃圾
无害化处理量.
附注:
7
7
7
参考数据: ∑ yi=9.32, ∑ tiyi=40.17,
=1
i=1
∑ ( -)2 =0.55, 7≈2.646.
=1

参考公式:相关系数 r=
∑ ( -)( -)
=1
,
高,从而可以用线性回归模型拟合 y 与 t 的关系.
6/49
-7题型一
题型二
(2)由 =
题型三
9.32
7
题型四
≈1.331 及(1)得
7
^
=
∑ ( -)( - )
=1
7
∑ ( -)
2
=
2.89
28
≈0.103,
=1
^
^
= − ≈1.331-0.103×4≈0.92.

新教材人教版一轮复习专题突破六概率与统计综合问题课件(35张)

新教材人教版一轮复习专题突破六概率与统计综合问题课件(35张)

类题通法 频率分布直方图、条形图等是考查数据收集和整理的常用依据, 掌握图中常见数据的提取方法,将频率看作概率是解决这类问题的关 键.
题型二 概率与经验回归方程的综合 [例2] [2021·山东滨州模拟]某企业进行深化改革,使企业的年利润不断增 长.该企业记录了从2014年到2019年的年利润y(单位:百万)的相关数据,如下:
年份 年份代号t
年利润 y/百万
2014 2015 2016 2017 2018 2019
1
2
3
4
5
6
3
5
8 11 13 14
类题通法 概率与经验回归方程的综合应用常涉及相互独立事件的概率、二 项分布、超几何分布以及经验回归方程等知识,考查学生的阅读能力、 数据处理能力、运算求解能力及应用意识.
巩固训练2:2018年反映社会现实的电影《我不是药神》引起了很大的 轰动,治疗特种病的创新药研发成了当务之急.为此,某药企加大了研发 投入,市场上治疗一类慢性病的特效药品A的研发费用x(百万元)和销量 y(万盒)的统计数据如下:
年经验,该校初三年级学生经过一年的训练,正式测试时每人每分钟 跳绳个数都有明显进步,假设2020年正式测试时每人每分钟跳绳个数 比初三上学期开始时个数增加10,利用现所得正态分布模型:
(ⅰ)预估2020年全年级1 000名学生正式测试时每分钟跳193个以上 的人数(结果四舍五入到整数);
(ⅱ)若在该地区2020年所有初三毕业生中任意选取3人,记正式测 试时每分钟跳202个以上的人数为ξ,求随机变量ξ的分布列和期望.
男生 女生 合计
选择“物理” 30
选择“地理” 10
总计
每分钟跳 [165,
绳个数 175)

高考数学大题突破 专项六 概率与统计

高考数学大题突破 专项六 概率与统计
例1某地区2012年至2018年农村居民家庭人均纯收入y(单位:千 元)的数据如下表:
年份 年份代号 t 人均纯收入 y
2012 2013 2014 2015 2016 2017 2018 1234567 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2012年至2018年该地区农村居民
高三数学一轮课件
高考大题突破专项六 概率与统计
题型一 题型二 题型三 题型四 题型五 题型六
-3-
题型一 回归分析与相关系数
突破策略 分散、合成计算法
^n
������
在计算回归方程的斜率������
=
i=∑1(������������-������)(������������-������)
������
96
99
100
(1)一般来说,学生的物理成绩与数学成绩具有线性相关关系,根
据上表提供的数据,求两个变量x,y的线性回归方程
^������
=
^
b
x+���^���
;
(2)从以上5个班级中任选2个班级参加某项活动,设选出的2个班
级中数学平均分在115分以上的个数为X,求X的分布列和均值.
^ ^ ^ ������
,
������
=
������

������ ������ .
-8-
题型一 题型二 题型三 题型四 题型五 题型六
������
解:(1)由题意得������=119,������=96, ∑ (xi-x)(yi-y)=100,
������
������=1

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理含解析新人教A

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标理含解析新人教A

高考必考题突破讲座 (六)1.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的,规定60分以下为不及格,13从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得Error!⇒b =0.01, 因为成绩在[90,100]内的有6人,所以n ==60.60.01×10(2)由Error!⇒Error!于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3.且P (X =0)==,P (X =1)==,C 39C 03C 3122155C 29C 13C 3122755P (X =2)==,P (X =3)==,C 19C 23C 31227220C 09C3C 3121220所以X 的分布列如下X 0123P21552755272201220故X 的数学期望为E (X )=0×+1×+2×+3×=.21552755272201220342.下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望.解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=,且A i ∩A j =∅(i ≠j ).112(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12,所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=.512即此人到达当日空气重度污染的概率为.512(2)由题意可知,ξ的所有可能取值为0,1,2,3.P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)==, 31214P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)==,21216P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)==,21216P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3)=1---=,141616512所以ξ的分布列为ξ0123P145121616故ξ的数学期望E (ξ)=0×+1×+2×+3×=.145121616543.(2019·焦作模拟)某单位共10名员工,他们某年的收入如下表.员工编号12345678910年薪/万元33.5455.56.577.5850(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程=x +中系数计算公式y ^ b ^ a ^=,=-,其中,表示样本均值.b ^n∑i =1x i -x-y i -y -n∑i =1x i -x -2a ^ y -b ^ x - x - y -解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.P (ξ=0)==,P (ξ=1)==,P (ξ=2)==,C 24C 210215C 14C 16C 210815C 26C 21013所以ξ的分布列为ξ012P21581513数学期望为E (ξ)=0×+1×+2×=.2158151365(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,x i -)2=2.25+0.25+0.25+2.25=5, x - y -4∑i =1x -x i-)(y i-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,4∑i =1x- y -===1.4,b ^4∑i =1x i -x-y i -y -4∑i =1x i -x -275=-=5-1.4×2.5=1.5,因此线性回归方程为y =1.4x +1.5,可预测该员工a ^y - b ^ x -第5年的年薪收入为8.5万元.4.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为p (0<p <1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X ).②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解析 (1)由题意知,20件产品中恰有2件不合格品的概率为f (p )=C p 2(1-p )18.220因此,f ′(p )=C [2p (1-p )18-18p 2(1-p )17]=2C p (1-p )17·(1-10p ).令f ′(p )=2202200,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0,所以f (p )的最大值点p 0=0.1.(2)由(1)知,p =0.1.①令Y 表示余下的180件产品中的不合格品的件数.依题意知,Y ~B (180,0.1),X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=40+25×180×0.1=490. ②如果对余下的所有产品作检验,那么这一箱产品所需要的检验费用为400元.由于E (X )>400,因此应该对这箱余下的所有产品作检验.5.(2019·甘肃兰州诊断)“中国式过马路”是网友对部分中国人集体闯红灯现象的一种调侃.即“凑够一撮人就可以走了,和红绿灯无关”,某校研究性学习小组对全校学生按“跟从别人闯红灯”“从不闯红灯”“带头闯红灯”等三种形式过马路进行调查,获得下表数据:跟从别人闯红灯从不闯红灯带头闯红灯男生98041060女生34015060用分层抽样的方法,从所有被调查的人中抽取一个容量为n 的样本,其中在“跟从别人闯红灯”的人中抽取了66人.(1)求n 的值;(2)在所抽取的“带头闯红灯”的人中,任选2人参加星期天社区组织的“文明交通”宣传活动,求这2人中至少有1人是女生的概率.解析 (1)由题意得,=,解得n =100.66980+340n980+340+410+150+60+60(2)因为所有参与调查的人数为980+340+410+150+60+60=2 000,所以从“带头闯红灯”的人中用分层抽样的方法抽取的人数为(60+60)×=6,其中男生有60×=1002 0001002 0003人,女生有60×=3人,将这3名男生用A 1,A 2,A 3表示,3名女生用B 1,B 2,B 3表1002 000。

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课件理新人教A版

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课件理新人教A版

高考必考题突破讲座 ( 六 )
概率与统计的综合问题
高考总复习 · 数学(理科)
题型特点考情分析命题趋势
1.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,它们是高考考查的核心内容.2.离散型随机变量的分布列及其期望的考查是历来高考的重点,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.2018·全国卷Ⅰ,20
2018·北京卷,17
2018·天津卷,16
2018·全国卷Ⅱ,18
2018·全国卷Ⅲ,18
以统计的图、
表为载体,结合概
率的应用,考查特
征数字和概率的计
算,以及独立变
量、相关变量间的
关系判断.
分值:10~12分
目录
高考必考题突破讲座。

2020版高考数学大一轮复习概率、随机变量及其分布专题探究课六高考中概率与统计问题的热点题型教案含解析

2020版高考数学大一轮复习概率、随机变量及其分布专题探究课六高考中概率与统计问题的热点题型教案含解析

专题探究课六 高考中概率与统计问题的热点题型1.(2016·全国Ⅱ卷)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率; (3)求续保人本年度的平均保费与基本保费的比值.解 (1)设A 表示事件:“一续保人本年度的保费高于基本保费”,则事件A 发生当且仅当一年内出险次数大于1,故P (A )=0.20+0.20+0.10+0.05=0.55.(2)设B 表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B 发生当且仅当一年内出险次数大于3,故P (B )=0.10+0.05=0.15. 又P (AB )=P (B ), 故P (B |A )=P (AB )P (A )=P (B )P (A )=0.150.55=311.因此所求概率为311.(3)记续保人本年度的保费为X ,则X 的分布列为E (X )=0.85a +2a ×0.05=1.23a .因此续保人本年度的平均保费与基本保费的比值为1.23.2.(2016·贵州模拟)为了增强消防安全意识,某中学对全体学生做了一次消防知识讲座,从男生中随机抽取50人,从女生中随机抽取70人参加消防知识测试,统计数据得到如下列联表:(1)试判断能否有90%附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(2)6人组成宣传小组.现从这6人中随机抽取2人到校外宣传,求到校外宣传的同学中男生人数X 的分布列和数学期望.解 (1)因为K 2=120×(15×40-35×30)250×70×45×75≈2.057,且2.057<2.706.所以没有90%的把握认为测试成绩优秀与否与性别有关. (2)用分层抽样的方法抽取时抽取比例是645=215,则抽取女生30×215=4人,抽取男生15×215=2人.依题意,X 可能的取值为0,1,2. P (X =0)=C 24C 26=615=25;P (X =1)=C 14C 12C 26=815;P (X =2)=C 22C 26=115.X 的分布列为:X 的数学期望E (X )=0×25+1×15+2×15=3.3.(2017·武汉调研)某公司准备将1 000万元资金投入到市环保工程建设中,现有甲、乙两个建设项目选择.若投资甲项目一年后可获得的利润ξ1(万元)的概率分布列如下表所示:且ξ1的期望E (ξ1)=120ξ2(万元)与该项目建设材料的成本有关,在生产的过程中,公司将根据成本情况决定是否在第二和第三季度进行产品的价格调整,两次调整相互独立且调整的概率分别为p (0<p <1)和1-p .若乙项目产品价格一年内调整次数X (次)与ξ2的关系如下表所示:(1)求m ,n 的值; (2)求ξ2的分布列;(3)若E (ξ1)<E (ξ2),则选择投资乙项目,求此时p 的取值范围.解 (1)由题意得⎩⎪⎨⎪⎧m +0.4+n =1,110m +120×0.4+170n =120,解得m =0.5,n =0.1.(2)ξ2的可能取值为41.2,117.6,204,P (ξ2=41.2)=(1-p )[1-(1-p )]=p (1-p ),P (ξ2=117.6)=p [1-(1-p )]+(1-p )(1-p )=p 2+(1-p )2, P (ξ2=204)=p (1-p ),所以ξ2的分布列为(3)由(2)可得E (ξ2)=41.2p (1-p )+117.6[p 2+(1-p )2]+204p (1-p )=-10p 2+10p +117.6,由E (ξ1)<E (ξ2),得120<-10p 2+10p +117.6, 解得0.4<p <0.6,即当选择投资乙项目时,p 的取值范围是(0.4,0.6).4.(2017·长沙测试)某中学为丰富教职工生活,国庆节举办教职工趣味投篮比赛,有A ,B 两个定点投篮位置,在A 点投中一球得2分,在B 点投中一球得3分.规则是:每人投篮三次按先A 后B 再A 的顺序各投篮一次,教师甲在A 和B 点投中的概率分别是12和13,且在A ,B两点投中与否相互独立.(1)若教师甲投篮三次,求教师甲投篮得分X 的分布列和数学期望;(2)若教师乙与教师甲在A ,B 投中的概率相同,两人按规则各投三次,求甲胜乙的概率. 解 (1)根据题意知X 的可能取值为0,2,3,4,5,7,P (X =0)=⎝ ⎛⎭⎪⎫1-122×⎝ ⎛⎭⎪⎫1-13=16,P (X =2)=C 12×12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-12=13,P (X =3)=⎝⎛⎭⎪⎫1-12×13×⎝⎛⎭⎪⎫1-12=112,2⎝⎭326P (X =5)=C 12×12×⎝⎛⎭⎪⎫1-12×13=16, P (X =7)=12×13×12=112,∴教师甲投篮得分X 的分布列为E (X )=0×16+2×13+3×112+4×16+5×16+7×112=3.(2)教师甲胜教师乙包括:甲得2分,3分,4分,5分,7分五种情形.这五种情形之间彼此互斥,因此,所求事件的概率为P =13×16+112×⎝ ⎛⎭⎪⎫16+13+16×⎝ ⎛⎭⎪⎫16+13+112+16×⎝ ⎛⎭⎪⎫16+13+112+16+112×⎝⎛⎭⎪⎫1-112=1948.5.(2017·广州调研)如图,李先生家住H 小区,他工作在C 科技园区,从家开车到公司上班路上有L 1,L 2两条路线,L 1路线上有A 1,A 2,A 3三个路口,各路口遇到红灯的概率均为12;L 2路线上有B 1,B 2两个路口,各路口遇到红灯的概率依次为34,35.(1)若走L 1路线,求最多遇到1次红灯的概率; (2)若走L 2路线,求遇到红灯次数X 的数学期望;(3)按照“平均遇到红灯次数最少”的要求,请你帮助李先生从上述两条路线中选择一条最好的上班路线,并说明理由.解 (1)设“走L 1路线最多遇到1次红灯”为事件A ,包括没有遇到红灯和只遇到红灯一次两种情况,所以P (A )=C 03⎝ ⎛⎭⎪⎫123+C 13×12×⎝ ⎛⎭⎪⎫122=12, 所以走L 1路线,最多遇到1次红灯的概率为12.(2)依题意,X 的可能取值为0,1,2.⎝⎭4⎝⎭510P (X =1)=34×⎝⎛⎭⎪⎫1-35+⎝⎛⎭⎪⎫1-34×35=920,P (X =2)=34×35=920.所以随机变量X 的分布列为所以E (X )=110×0+920×1+20×2=20.(3)设选择L 1路线遇到红灯次数为Y ,则随机变量Y 服从二项分布,即Y ~B ⎝ ⎛⎭⎪⎫3,12,所以E (Y )=3×12=32,所以E (X )<E (Y ), 所以应选择L 2路线上班.6.(2017·成都诊断)某银行柜台设有一个服务窗口,假设顾客办理业务所需的时间互相独立,且都是整数分钟,对以往顾客办理业务所需的时间统计结果如下:(1)估计第三个顾客恰好等待4分钟开始办理业务的概率;(2)X 表示至第2分钟末已办理完业务的顾客人数,求X 的分布列及数学期望. 解 设Y 表示顾客办理业务所需的时间,用频率估计概率,得Y 的分布列如下:(1)A A 对应三种情形:①第一个顾客办理业务所需的时间为1分钟,且第二个顾客办理业务所需的时间为3分钟;②第一个顾客办理业务所需的时间为3分钟,且第二个顾客办理业务所需的时间为1分钟;③第一个和第二个顾客办理业务所需的时间均为2分钟.所以P (A )=P (Y =1)P (Y =3)+P (Y =3)·P (Y =1)+P (Y =2)·P (Y =2)=0.1×0.3+0.3×0.1+0.4×0.4=0.22.(2)法一 X 所有可能的取值为0,1,2.X =0对应第一个顾客办理业务所需的时间超过2分钟,所以P (X =0)=P (Y >2)=0.5;X =1对应第一个顾客办理业务所需的时间为1分钟且第二个顾客办理业务所需的时间超过1分钟,或第一个顾客办理业务所需的时间为2分钟,所以P(X=1)=P(Y=1)P(Y>1)+P(Y=2)=0.1×0.9+0.4=0.49;X=2对应两个顾客办理业务所需的时间均为1分钟,所以P(X=2)=P(Y=1)P(Y=1)=0.1×0.1=0.01;所以X的分布列为E(X)法二X所有可能的取值为0,1,2.X=0对应第一个顾客办理业务所需的时间超过2分钟,所以P(X=0)=P(Y>2)=0.5;X=2对应两个顾客办理业务所需的时间均为1分钟,所以P(X=2)=P(Y=1)P(Y=1)=0.1×0.1=0.01;P(X=1)=1-P(X=0)-P(X=2)=0.49;所以X的分布列为E(X)。

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标文含解析新人教A版

2020版高考数学大一轮复习高考必考题突破讲座6概率与统计的综合问题课时达标文含解析新人教A版

(2)根据以上数据,该家庭使用节水龙头后 50 天日用水量小于 0.35
m3 的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于
0.35 m3 的概率的估计值为 0.48.
1 (3)该家庭未使用节水龙头 50 天日用水量的平均数为 x1=50×(0.05×1+0.15×3+
(3)喜欢运动的女志愿者有 6 人,设分别为 A,B,C,D,E,F,其中 A,B,C,D 懂得
医疗救护,则从这 6 人中任取 2 人的情况有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),
(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共 15 种,其中两
利润(注:保险产品的保费收入=每份保单的保费×销量).
解 析 (1)收 益 率 的 平 均 值 为 0.05×0.1+ 0.15×0.2+ 0.25×0.25+ 0.35×0.3+
0.45×0.1+0.55×0.05=0.275.
25+30+38+45+52 190
(2)①x=
= =38,
5
5
7.5+7.1+6.0+5.6+4.8 31
消费次数 第 1 次 第 2 次 第 3 次 第 4 次 5 次及以上
频数
60
20
10
5
5
假设汽车美容一次,公司成本为 150 元,根据所给数据,解答下列问题:
(1)估计该公司一位会员至少消费两次的概率;
(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;
(3)该公司要从这 100 位里至少消费两次的顾客中按消费次数用分层抽样方法抽出 8 人,

高考数学大一轮复习 高考必考题突破讲座(六)概率与统

高考数学大一轮复习 高考必考题突破讲座(六)概率与统

高考必考题突破讲座(六) 概率与统计1.以实际背景为载体考查古典概型从近几年的高考命题来看,高考对概率的考查,一般以实际生活题材为背景,以应用题的形式出现.概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率.解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或其对立事件的概率求解.解决古典概型问题的关键在于确定基本事件.2.线性回归分析线性回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义,根据回归方程进行预报,仅是一个预报值,而不是真实发生的值,由于考题提供的数据较复杂,因此要注意以下两点:(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程y ^=b ^x +a ^必过样本点中心(x ,y ). 3.独立性检验(1)2×2列联表是反映两个分类变量的频数表,通过特殊的计算,能说明两个变量之间关系的强弱.如果两个变量没有关系,则应满足ad -bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad -bc|越大,说明两个变量之间关系越强.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:①根据样本数据制成2×2列联表;②根据公式K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K 2的观测值k 0;③比较k 0与临界值的大小关系,作统计推断.【例1】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表.以最高气温位于各区间的频率估计最高气温位于该区间的概率. (1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.解析 (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y =6×450-4×450=900;若最高气温位于区间[20,25),则Y =6×300+2(450-300)-4×450=300; 若最高气温低于20,则Y =6×200+2(450-200)-4×450=-100. 所以Y 的所有可能值为900,300,-100.当Y 大于零时,最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8,因此Y 大于零的概率的估计值为0.8.【例2】 (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸.经计算得x =116∑i =116x i =9.97,s =116∑i =116 (x i -x )2=116⎝ ⎛⎭⎪⎪⎫∑i =116x 2i -16x - 2≈0.212,∑i =116(i -8.5)2≈18.439,∑i =116(x i -x )·(i-8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i)(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01).附:0.008≈0.09,样本(x i ,y i )(i =1,2,3,4,…,n)的相关系数r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2.解析 (1)由样本数据得(x i ,i)(i =1,2,…,16)的相关系数为r =∑i =116(x i -x )(i -8.5)∑i =116(x i -x )2∑i =116(i -8.5)2=-2.780.212×16×18.439≈-0.18. 由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均值为115×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02,∑i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.【例3】 (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下.(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解析 (1)旧养殖法的箱产量低于50 kg 的概率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得到列联表如下.K 2=200×(62×66-34×38)2100×100×96×104≈15.705>6.635.故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.1.某事业单位随机从甲部门抽取3人(2男1女),从乙部门抽取4人(2男2女),然后从这7人中随机抽取2人代表单位去参加市里的相关会议.(1)求这2人全部来自甲部门的概率; (2)求这2人中至少有1人是男生的概率.解析 将甲部门的2名男生分别记为A ,B,1名女生记为a ,乙部门的2名男生分别记为C ,D,2名女生分别记为b ,c ,从这7人中任选2人的所有基本事件为(A ,B),(A ,a),(A ,C),(A ,D),(A ,b),(A ,c),(B ,a),(B ,C),(B ,D),(B ,b),(B ,c),(a ,C),(a ,D),(a ,b),(a ,c),(C ,D),(C ,b),(C ,c),(D ,b),(D ,c),(b ,c),共21个,且这些基本事件出现的可能性相等.(1)记“这2人全部来自甲部门”为事件M ,则事件M 包含的基本事件有(A ,B),(A ,a),(B ,a),共3个,故P(M)=321=17.(2)记“这2人中至少有1人是男生”为事件N ,则事件N 包含的基本事件有(A ,B),(A ,a),(A ,C),(A ,D),(A ,b),(A ,c),(B ,a),(B ,C),(B ,D),(B ,b),(B ,c),(a ,C),(a ,D),(C ,D),(C ,b),(C ,c),(D ,b),(D ,c),共18个,故P(N)=1821=67.2.为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据.(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,预测t =8时,细菌繁殖个数. 附:回归直线的斜率和截距的最小二乘法估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解析 (1)由表中数据计算得,t =5,y =4,∑i =1n(t i -t )(y i -y )=8.5,∑i =1n(t i -t )2=10,b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2=0.85,a ^=y -b ^t =4-0.85×5=-0.25. 所以回归方程为y ^=0.85t -0.25. (2)将t =8代入(1)的回归方程中得 y ^=0.85×8-0.25=6.55.故预测t =8时,细菌繁殖个数为6.55千个.3.近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表.(1)请将列联表补充完整,若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?(2)为了研究三高疾病是否与性别有关,请计算出统计量K 2的观测值k 0,并说明是否可以在犯错误的概率不超过0.005的前提下认为三高疾病与性别有关.下面的临界值表供参考:⎝ ⎛⎭⎪⎫参考公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d解析 (1)完善补充列联表如下.在患三高疾病人群中抽9人,则抽取比例为936=14,所以女性应该抽取12×14=3(人).(2)根据2×2列联表,则K 2的观测值 k 0=60×(24×18-6×12)230×30×36×24=10>7.879.所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.课时达标 讲座(六)[解密考纲]概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力.概率问题的核心是概率计算,其中事件的互斥、对立是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖.1.某保险公司有一款保险产品的历史收益率(收益率=利润÷保费收入)的频率分布直方图如图所示.(1)试估计这款保险产品的收益率的平均值;(2)设每份保单的保费在20元的基础上每增加x 元,对应的销量为y(单位:万份).从历史销售记录中抽样得到如下5组x 与y 的对应数据.由上表知x 与y 有较强的线性相关关系,且据此计算出的回归方程为y ^=10-b ^x. ①求参数b ^的值;②若把回归方程y ^=10-b ^x 当作y 与x 的线性关系,用(1)中求出的收益率的平均值作为此产品的收益率,试问每份保单的保费定为多少元时此产品可获得最大利润,并求出最大利润(注:保险产品的保费收入=每份保单的保费×销量).解析 (1)收益率的平均值为0.05×0.1+0.15×0.2+0.25×0.25+0.35×0.3+0.45×0.1+0.55×0.05=0.275.(2)①x =25+30+38+45+525=1905=38,y =7.5+7.1+6.0+5.6+4.85=315=6.2.由y =10-b ^x ,得10-38b ^=6.2,解得b ^=0.1.②设每份保单的保费为(20+x)元,则销量为y =10-0.1x.则这款保险产品的保费收入为f(x)=(20+x)(10-0.1x)万元.所以f(x)=200+8x -0.1x 2=360-0.1(x -40)2.所以当x =40,即每份保单的保费为60元时,保费收入最大为360万元.预计这款保险产品的最大利润为360×0.275=99(万元).2.(2018·广东佛山质检)某网络广告A 公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此A 公司随机抽取了甲、乙两个网站某月中10天的日访问量n(单位:万次),整理后得到如下茎叶图,已知A 公司要从网站日访问量的平均值和稳定性两方面进行考察选择.(1)请说明A 公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布,A 公司根据所选网站的日访问量n 进行付费,其付费标准如下表.求A 公司每月(按30天计)应付给选定网站的费用S. 解析 (1)由茎叶图可知x 甲=(15+24+28+25+30+36+30+32+35+45)÷10=30, s 2甲=110×[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35-30)2+(45-30)2]=58,x 乙=(18+25+22+24+32+38+30+36+35+40)÷10=30, s 2乙=110×[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35-30)2+(40-30)2]=49.8,因为x 甲=x 乙,s 2甲>s 2乙,∴A 公司应选择乙网站.(2)由(1)得A 公司应选择乙网站,由题意可得乙网站日访问量n<25的概率为0.3,日访问量25≤n≤35的概率为0.4,日访问量n>35的概率为0.3,∴A 公司每月应付给乙网站的费用S =30×(500×0.3+700×0.4+1 000×0.3)=21 900(元).3.柴静《穹顶之下》的播出,让大家对雾霾天气的危害有了更进一步的认识,对于雾霾天气的研究也渐渐活跃起来,某研究机构对春节燃放烟花爆竹的天数x 与雾霾天数y 进行统计分析,得出下表数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据(2)求出的线性回归方程,预测燃放烟花爆竹的天数为9的雾霾天数. 解析 (1)散点图如图所示.(2)∑i =14x i y i =4×2+5×3+7×5+8×6=106,x =4+5+7+84=6,y =2+3+5+64=4, ∑i =14x 2i =42+52+72+82=154, 则b ^=∑i =14x i y i -4xy∑i =14x 2i -4x 2=106-4×6×4154-4×62=1,a ^=y -b ^x =4-6=-2, 故线性回归方程为y ^=x -2.(3)由线性回归方程可以预测,燃放烟花爆竹的天数为9的雾霾天数为7.4.(2016·北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.解析 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w 至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表.根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).5.(2018·河南郑州模拟)某小学为迎接校运动会的到来,在三年级招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者中分别各有10人和6人喜欢运动,其余人员不喜欢运动.(1)根据以上数据完成2×2列联表;(2)是否有95%的把握认为性别与喜欢运动有关,并说明理由;(3)如果喜欢运动的女志愿者中恰有4人懂得医疗救护,现从喜欢运动的女志愿者中抽取2名负责处理应急事件,求抽出的2名志愿者都懂得医疗救护的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解析 (1)依题意,2×2列联表如下.(2)由已知数据可得,K 2=30×(10×8-6×6)216×14×14×16≈1.157 5<3.841,因此没有95%的把握认为是否喜欢运动与性别有关.(3)喜欢运动的女志愿者有6人,设分别为A ,B ,C ,D ,E ,F ,其中A ,B ,C ,D 懂得医疗救护,则从这6人中任取2人的情况有(A ,B),(A ,C),(A ,D),(A ,E),(A ,F),(B ,C),(B ,D),(B ,E),(B ,F),(C ,D),(C ,E),(C ,F),(D ,E),(D ,F),(E ,F),共15种,其中两人都懂得医疗救护的情况有(A ,B),(A ,C),(A ,D),(B ,C),(B ,D),(C ,D),共6种,设“抽出的2名志愿者都懂得医疗救护”为事件M , 则P(M)=615=25.6.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解析 (1)由折线图中数据和附注中参考数据得 t -=4,∑i =17(t i -t -)2=28,∑i =17(y i -y -)2=0.55,∑i =17 (t i -t )(y i -y -)=∑i =17t i y i -t∑i =17y i =40.17-4×9.32=2.89,r≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t)(y i -y -)∑i =17(t i -t)2=2.8928≈0.103, a ^=y --b ^t -=1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t. 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.7.某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解析 (1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下.结合列联表可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.8.2017年“双节”期间,高速公路车辆较多,某调查公司在一个服务区从七座以下小型汽车中,按进服务区的先后每间隔50辆就抽取一辆的抽样方法抽取40名驾驶员进行询问调查,将他们在某段高速公路的车速(单位:km /h )分成六段[60,65),[65,70),[70,75),[75,80),[80,85),[85,90]后得到如图的频率分布直方图.(1)该调查公司在采样中,用到的是什么抽样方法? (2)求这40辆小型车辆车速的众数、中位数和平均数;(3)若从车速在[60,70)的车辆中任意抽取2辆,求车速在[65,70)的车辆至少有一辆的概率.解析 (1)由题意知这个抽样是按进服务区的先后每间隔50辆就抽取一辆的抽样方法抽取40名驾驶员进行询问调查,是一个具有相同间隔的抽样,并且总体的个数比较多,这是一个系统抽样.故调查公司在采样中,用到的是系统抽样.(2)众数的估计值为最高的矩形的中点,即众数等于77.5. 设图中虚线所对应的车速为x ,则中位数的估计值为0.01×5+0.02×5+0.04×5+0.06×(x-75)=0.5,解得x =77.5,即中位数为77.5. 平均数等于0.01×5×62.5+0.02×5×67.5+0.04×5×72.5+0.06×5×77.5+0.05×5×82.5+0.02×5×87.5=77.(3)从图中可知,车速在[60,65)的车辆数为m 1=0.01×5×40=2, 车速在[65,70)的车辆数为m 2=0.02×5×40=4,设车速在[60,65)的车辆记为a ,b ,车速在[65,70)的车辆记为c ,d ,e ,f ,则所有基本事件有(a ,b),(a ,c),(a ,d),(a ,e),(a ,f),(b ,c),(b ,d),(b ,e),(b ,f),(c ,d),(c ,e),(c ,f),(d ,e),(d ,f),(e ,f),共 15 种.其中车速在[65,70)的车辆至少有一辆的事件有(a ,c),(a ,d),(a ,e),(a ,f),(b ,c),(b ,d),(b ,e),(b ,f),(c ,d),(c ,e),(c ,f),(d ,e),(d ,f),(e ,f),共14种.所以车速在[65,70)的车辆至少有一辆的概率为P =1415.。

2020高考数学大一轮复习高考专题突破六高考中的概率与统计问题教师用书理苏教

2020高考数学大一轮复习高考专题突破六高考中的概率与统计问题教师用书理苏教

【2019最新】精选高考数学大一轮复习高考专题突破六高考中的概率与统计问题教师用书理苏教1.(2017·淮安月考)一射手对同一目标进行4次射击,且射击结果之间互不影响.已知至少命中一次的概率为,则此射手的命中率为________.答案23解析设此射手未命中目标的概率为p,则1-p4=,所以p=,故1-p=.2.在可行域内任取一点,其规则如流程图所示,则能输出数对(x,y)的概率是________.答案π4解析依题意可行域为正方形,输出数对(x,y)形成的图形为图中阴影部分,故所求概率为P==.3.红、蓝两色车、马、炮棋子各一枚,将这6枚棋子按车、马、炮顺序排成一列,记事件“每对同字的棋子中,均为红棋子在前,蓝棋子在后”为事件A,则事件A发生的概率为________.答案18解析红、蓝两色车、马、炮棋子各一枚,将这6枚棋子按车、马、炮顺序排成一列,基本事件总数n=2×2×2=8.每对同字的棋子中,均为红棋子在前,蓝棋子在后为事件A,则事件A包含的基本事件个数m=1,∴事件A发生的概率P==.4.设集合P={-2,-1,0,1,2},x∈P且y∈P,则点(x,y)在圆x2+y2=4内部的概率为________.答案925解析以(x,y)为基本事件,可知满足x∈P且y∈P的基本事件有25个.若点(x,y)在圆x2+y2=4内部,则x,y∈{-1,1,0},用列表法或坐标法可知满足x∈{-1,1,0}且y∈{-1,1,0}的基本事件有9个.所以点(x,y)在圆x2+y2=4内部的概率为. 5.为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适.答案甲解析根据茎叶图,可得甲=×(78+79+81+84+93+95)=85,x乙=×(75+80+83+85+92+95)=85.s=×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=,s=×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=.因为甲=乙,s<s,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适. 题型一古典概型与几何概型例1 (1)(2016·山东)在[-1,1]上随机地取一个数k,则事件“直线y=kx与圆(x -5)2+y2=9相交”发生的概率为________.(2)若任意x∈A,则∈A,就称A是“和谐”集合,则在集合M={-1,0,,,1,2,3,4}的所有非空子集中,“和谐”集合的概率是________.答案(1) (2)117解析(1)由已知得,圆心(5,0)到直线y=kx的距离小于半径,∴<3,解得-<k<,由几何概型得P==.(2)由题意,“和谐”集合中不含0和4,而2和,3和成对出现,1和-1可单独出现,故“和谐”集合分别为{1},{-1},{-1,1},{2,},{3,},{1,3,},{1,2,},{-1,2,},{-1,3,},{3,,2,},{2,,1,-1},{3,,1,-1},{1,3,,2,},{-1,3,,2,},{3,,2,,1,-1},共15个,而集合M的非空子集有28-1=255个,故“和谐”集合的概率是P==.思维升华几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(1)(2016·江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是________.(2)已知函数f(x)=x2+bx+c,其中0≤b≤4,0≤c≤4,记函数f(x)满足条件为事件A,则事件A发生的概率为________.答案(1) (2)58解析(1)基本事件共有36个.列举如下:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),其中满足点数之和小于10的有30个.故所求概率为P==.(2)即为作出0≤b≤4,0≤c≤4及表示的区域(图略),由几何概型概率公式得所求概率为P==.题型二求离散型随机变量的均值与方差例2 某公司春节联欢会中设一抽奖活动:在一个不透明的口袋中装入外形一样,号码分别为1,2,3,…,10的十个小球.活动者一次从中摸出三个小球,三球号码有且仅有两个连号的为三等奖,奖金30元;三球号码都连号为二等奖,奖金60元;三球号码分别为1,5,10为一等奖,奖金240元;其余情况无奖金.(1)求员工甲抽奖一次所得奖金ξ的概率分布与均值;(2)若员工乙幸运地先后获得四次抽奖机会,则他中奖次数η的方差是多少?解(1)由题意知甲抽奖一次,基本事件总数是C=120,奖金ξ的可能取值是0,30,60,240,∴P(ξ=240)=,P(ξ=60)==,P(ξ=30)==,P(ξ=0)=1---=.故ξ的概率分布为∴E(ξ)(2)由(1)可得乙抽奖一次中奖的概率是1-=,四次抽奖是相互独立的,∴中奖次数η~B(4,),∴V(η)=4××=.思维升华离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其概率分布然后代入相应公式计算,注意离散型随机变量的取值与概率间的对应.(2016·泰州模拟)为了参加市中学生运动会,某校从四支较强的班级篮球队A,B,C,D中选出12人组成校男子篮球队,队员来源如下表:(1)从这12(2)比赛结束后,学校要评选出3名优秀队员(每一个队员等可能被评为优秀队员),设其中来自A 队的人数为ξ,求随机变量ξ的概率分布和均值.解 (1)“从这12名队员中随机选出两名,两人来自同一个队”记作事件A ,则P(A)==.(2)ξ的所有可能取值为0,1,2,3. 因为P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,P(ξ=3)==.所以ξ的概率分布为E(ξ)题型三 概率与统计的综合应用例3 经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X(单位: t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润. (1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的均值. 解 (1)当X∈[100,130)时,T =500X -300(130-X)=800X -39 000.当X∈[130,150]时,T =500×130=65 000. 所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X<130,65 000,130≤X≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57 000元的概率的估计值为0.7.(3)依题意可得T的概率分布为所以E(T)59 400.思维升华概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.(1)求图中实数a的值;(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.解(1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.03.(2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M,则事件M包含的基本事件有(A,B),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共7个,故所求概率P(M)=.1.(2016·陕西西北工业大学附中二模)甲、乙两人进行两种游戏,两种游戏规则如下:游戏Ⅰ:口袋中有质地、大小完全相同的5个球,编号分别为1,2,3,4,5,甲先摸出一个球,记下编号,放回后乙再摸一个球,记下编号,如果两个编号的和为偶数算甲赢,否则算乙赢.游戏Ⅱ:口袋中有质地、大小完全相同的6个球,其中4个白球、2个红球,由裁判有放回地摸两次球,即第一次摸出记下颜色后放回再摸第二次,摸出两球同色算甲赢,摸出两球不同色算乙赢.(1)求游戏Ⅰ中甲赢的概率;(2)求游戏Ⅱ中乙赢的概率,并比较这两种游戏哪种游戏更公平,请说明理由.解(1)∵游戏Ⅰ中有放回地依次摸出两球的基本事件有5×5=25(个),其中甲赢有(1,1),(1,3),(1,5),(3,1),(3,3),(3,5),(5,1),(5,3),(5,5),(2,2),(2,4),(4,4),(4,2),共13个基本事件,∴游戏Ⅰ中甲赢的概率为P=.(2)设4个白球为a,b,c,d,2个红球为A,B,则游戏Ⅱ中有放回地依次摸出两球,基本事件有6×6=36(个),其中乙赢有(a,A),(b,A),(c,A),(d,A),(a,B),(b,B),(c,B),(d,B),(A,a),(A,b),(A,c),(A,d),(B,a),(B,b),(B,c),(B,d),共16个基本事件,∴游戏Ⅱ中乙赢的概率为P′==.∵|-|<|-|,∴游戏Ⅰ更公平.2.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数. (1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率. 解 (1)样本平均值为17+19+20+21+25+306==22.(2)由(1)知样本中优秀工人占的比例为=,故推断该车间12名工人中有12×=4(名)优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,则P(A)==.3.一个均匀的正四面体的四个面上分别涂有1,2,3,4四个数字,现随机投掷两次,正四面体面朝下的数字分别为b ,c.(1)z =(b -3)2+(c -3)2,求z =4的概率;(2)若方程x2-bx -c =0至少有一根x∈{1,2,3,4},就称该方程为“漂亮方程”,求方程为“漂亮方程”的概率.解 (1)因为是投掷两次,因此基本事件(b ,c):(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4),共16个.当z =4时,(b ,c)的所有取值为(1,3),(3,1), 所以P(z =4)==.(2)①若方程一根为x =1,则1-b -c =0, 即b +c =1,不成立.②若方程一根为x =2,则4-2b -c =0, 即2b +c =4,所以⎩⎪⎨⎪⎧b =1,c =2.③若方程一根为x =3,则9-3b -c =0, 即3b +c =9,所以⎩⎪⎨⎪⎧b =2,c =3.④若方程一根为x =4,则16-4b -c =0, 即4b +c =16,所以⎩⎪⎨⎪⎧b =3,c =4.由①②③④知(b ,c)的所有可能取值为(1,2),(2,3),(3,4), 所以方程为“漂亮方程”的概率为P =.4.(2016·南京、盐城、徐州联考)已知某校有甲、乙两个兴趣小组,其中甲组有2名男生、3名女生,乙组有3名男生、1名女生,学校计划从两兴趣小组中随机各选2名成员参加某项活动.(1)求选出的4名选手中恰好有一名女生的选派方法数;(2)记X 为选出的4名选手中女选手的人数,求X 的概率分布和均值.解 (1)选出的4名选手中恰好有一名女生的选派方法数为C·C·C+CCC =21种. (2)X 的可能取值为0,1,2,3.P(X =0)===, P(X =1)===, P(X =3)===,P(X =2)=1-P(X =0)-P(X =1)-P(X =3)=.所以X 的概率分布为E(X)5.某班甲、乙两名同学参加100米达标训练,在相同条件下两人10次训练的成绩(单位:秒)如下:的稳定性方面考虑,选派谁参加比赛更好,并说明理由(不用计算,可通过统计图直接回答结论);(2)经过对甲、乙两位同学的若干次成绩的统计,甲、乙的成绩都均匀分布在[11.5,14.5]之间,现甲、乙比赛一次,求甲、乙成绩之差的绝对值小于0.8秒的概率.解(1)甲、乙两人10次训练的成绩的茎叶图如图:从统计图中可以看出,乙的成绩较为集中,差异程度较小,乙成绩的稳定性更好,所以选派乙同学代表班级参加比赛更好.(2)设甲同学的成绩为x,乙同学的成绩为y,则|x-y|<0.8,得x-0.8<y<0.8+x,如图,阴影部分面积即为3×3-2.2×2.2=4.16,则P(|x-y|<0.8)=P(x-0.8<y<0.8+x)==.*6.一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确定有8道题的答案是正确的,其余题中有两道题都可判断两个选项是错误的,有一道题可以判断一个选项是错误的,还有一道题因不理解题意只好乱猜.请求出该考生:(1)得60分的概率;(2)所得分数X的概率分布和均值.解(1)设“可判断两个选项是错误的”两道题之一选对为事件A,“有一道题可以判断一个选项是错误的”选对为事件B,“有一道题不理解题意”选对为事件C,∴P(A)=,P(B)=,P(C)=,∴得60分的概率为P=×××=....精品 (2)X 可能的取值为40,45,50,55,60.P(X =40)=×××=;P(X =45)=C××××+×××+×××=;P(X =50)=×××+C××××+C××××+×××=; P(X =55)=C××××+×××+×××=;P(X =60)=×××=.故X 的概率分布为E(X)=40×+45×+50×+55×+60×48=.。

2020年高考理科数学复习高考必考题突破讲座(六)统计与概率、随机变量及其分布列

2020年高考理科数学复习高考必考题突破讲座(六)统计与概率、随机变量及其分布列

高考必考题突破讲座(六) 统计与概率、随机变量及其分布列题型特点考情分析命题趋势1.常见概率模型的计算几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.2.离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.3.概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.4.统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例1】 现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.(1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;(3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解析 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23.设“这4个人恰有i 人去参加甲游戏”事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝⎛⎭⎫13i ⎝⎛⎭⎫234-i.(1)这4个人中恰有2人参加甲游戏的概率 P (A 2)=C 24⎝⎛⎭⎫132⎝⎛⎭⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4且A 3与A 4互斥.故P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝⎛⎭⎫133×23+C 44⎝⎛⎭⎫134=19. (3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3)=C 14⎝⎛⎭⎫131·⎝⎛⎭⎫233+C 34⎝⎛⎭⎫133×23=4081, P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4)=C 04⎝⎛⎭⎫234+C 44⎝⎛⎭⎫134=1781. 于是ξ的分布列是【例2】 (2017·北京卷)名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论).解析 (1)由图知,在服药的50名患者中,指标y 的值小于60的有15人.所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×16+1×23+2×16=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 【例3】 (2018·湖南长沙一模)2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示.(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽出6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率,②若从这6名学生中随机抽取2名学生接受考官D 的面试,设第4组中有X 名学生被考官D 面试,求X 的分布列和数学期望.解析 (1)由频率分布直方图知: 第3组的人数为5×0.06×40=12; 第4组的人数为5×0.04×40=8; 第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人. ①设“甲或乙进入第二轮面试”为事件A ,则 P (A )=1-C 310C 312=511,所以甲或乙进入第二轮面试的概率为511.②X 的所有可能取值为0,1,2,P (X =0)=C 24C 26=25,P (X =1)=C 12C 14C 26=815,P (X =2)=C 22C 26=115.所以X 的分布列为E (X )=0×25+1×815+2×115=1015=23.【例4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y )2=0.55,7=2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘法估计公式分别为b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解析 (1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t=9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.1.(2018·河北沧州一模)甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和数学期望.解析 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5.(1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4)=P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (A 3)P (A 4) =⎝⎛⎭⎫232+13×⎝⎛⎭⎫232+23×13×⎝⎛⎭⎫232=5681. (2)X 的可能取值为2,3,4,5. P (X =2)=P (A 1A 2)+P (B 1B 2) =P (A 1)P (A 2)+P (B 1)P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29,P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081,P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881.故X 的分布列为E (X )=2×59+3×29+4×1081+5×881=22481.2.(2018·广东广州质检)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^=b ^x +a ^中,b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^=y -b ^x ,其中x ,y 为样本平均值.解析 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,l xx =∑i =1n x 2i -n x 2=80,又l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元). 3.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)(精确到0.01).附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).解析(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此事件A的概率估计值为0.62×0.66=0.409 2.(2)根据箱产量的频率分布直方图得列联表.K 2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).4.(2018·湖北襄阳五中适应性考试)某商场计划销售某种产品,现邀请生产该产品的甲、乙两个厂家进场试销10天.两个厂家提供的返利方案如下:甲厂家每天固定返利70元,且每卖出一件产品厂家再返利2元;乙厂家无固定返利,卖出40件以内(含40件)的产品,每件产品厂家返利4元,超出40件的部分每件返利6元.经统计,两个厂家的试销情况茎叶图如下.(1)现从甲厂家试销的10天中抽取两天,求这两天的销售量都大于40的概率; (2)若将频率视作概率,回答以下问题:①记乙厂家的日返利额为X (单位:元),求X 的分布列和数学期望;②商场拟在甲、乙两个厂家中选择一家长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.解析 (1)记“抽取的两天销售量都大于40”为事件A , 则P (A )=C 22C 210=145.(2)①设乙产品的日销售量为a ,则当a =38时,X =38×4=152;当a =39时,X =39×4=156; 当a =40时,X =40×4=160; 当a =41时,X =40×4+1×6=166; 当a =42时,X =40×4+2×6=172; ∴X 的所有可能取值为152,156,160,166,172, ∴X 的分布列为∴E (X )=152×110+156×15+160×15+166×25+172×110=162.②依题意,甲厂家的日平均销售量为38×0.2+39×0.4+40×0.2+41×0.1+42×0.1=39.5, ∴甲厂家的日平均返利额为70+39.5×2=149元, 由①得乙厂家的日平均返利额为162元(>149元), ∴推荐该商场选择乙厂家长期销售.课时达标 讲座(六)[解密考纲]概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力.概率问题的核心是概率计算,其中事件的互斥、对立、独立和随机变量的分布是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖.1.(2018·海南模拟)已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的13,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X 的分布列和数学期望.解析 (1)依题意得⎩⎪⎨⎪⎧10(0.035+0.025+c +2b +a )=1,2b =a +c ⇒b =0.01, 因为成绩在[90,100]内的有6人,所以n =60.01×10=60.(2)由⎩⎪⎨⎪⎧ a +c =0.02,c =3a ⇒⎩⎪⎨⎪⎧a =0.005,c =0.015,于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X 的所有可能取值为0,1,2,3,且P (X =0)=C 39C 03C 312=2155,P (X =1)=C 29C 13C 312=2755,P (X =2)=C 19C 23C 312=27220,P (X =3)=C 09C 33C 312=1220,所以X 的分布列如下!故X 的数学期望为E (X )=0×2155+1×2755+2×27220+3×1220=34.2.(2018·广东五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天.(1)求此人到达当日空气重度污染的概率;(2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望. 解析 设A i 表示事件“此人于11月i 日到达该市”(i =1,2,…,12). 依题意知,P (A i )=112,且A i ∩A j =∅(i ≠j ).(1)设B 为事件“此人到达当日空气重度污染”,则B =A 1∪A 2∪A 3∪A 7∪A 12, 所以P (B )=P (A 1∪A 2∪A 3∪A 7∪A 12)=P (A 1)+P (A 2)+P (A 3)+P (A 7)+P (A 12)=512,即此人到达当日空气重度污染的概率为512.(2)由题意可知,ξ的所有可能取值为0,1,2,3,P (ξ=0)=P (A 4∪A 8∪A 9)=P (A 4)+P (A 8)+P (A 9)=312=14,P (ξ=2)=P (A 2∪A 11)=P (A 2)+P (A 11)=212=16,P (ξ=3)=P (A 1∪A 12)=P (A 1)+P (A 12)=212=16,P (ξ=1)=1-P (ξ=0)-P (ξ=2)-P (ξ=3) =1-14-16-16=512,所以ξ的分布列为故ξ的数学期望E (ξ)=0×14+1×512+2×16+3×16=54.3.(2018·河南焦作模拟)某单位共10名员工,他们某年的收入如下表.(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?附:线性回归方程y ^=b ^x +a ^中系数计算公式b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b^x ,其中x ,y 表示样本均值.解析 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.P (ξ=0)=C 24C 210=215,P (ξ=1)=C 14C 16C 210=815,P (ξ=2)=C 26C 210=13,所以ξ的分布列为数学期望为E (ξ)=0×215+1×815+2×13=65.(3)设x i ,y i (i =1,2,3,4)分别表示工作年限及相应年薪,则x =2.5,y =5,∑i =14(x i -x )2=2.25+0.25+0.25+2.25=5,∑i =14(x i -x )(y i -y )=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,b ^=∑i =14(x i -x )(y i -y )∑i =14(x i -x )2=75=1.4, a ^=y -b ^x =5-1.4×2.5=1.5, 因此线性回归方程为y =1.4x +1.5,可预测该员工第5年的年薪收入为8.5万元.4.(2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 解析 (1)随机变量X 的所有可能取值为0,1,2,3. P (X =0)=⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14=14, P (X =1)=12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×14=1124, P (X =2)=⎝⎛⎭⎫1-12×13×14+12×⎝⎛⎭⎫1-13×14+12×13×⎝⎛⎭⎫1-14=14, P (X =3)=12×13×14=124.所以随机变量X 的分布列为∴E (X )=0×14+1×1124+2×14+3×124=1312.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0) =P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.5.(2018·河南洛阳统考)某教师为了了解本校高三学生一模考试的数学成绩情况,将所教两个班级的数学成绩(单位:分)绘制成如图所示的茎叶图.(1)分别求出甲、乙两个班级数学成绩的中位数、众数;(2)若规定成绩大于或等于115分为优秀,分别求出两个班级数学成绩的优秀率; (3)在(2)的条件下,若用甲班学生数学成绩的频率估计概率,从该校高三年级中随机抽取3人,记这3人中数学成绩优秀的人数为X ,求X 的分布列和数学期望.解析 (1)由所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,数量最多的是103,故甲班数学成绩的中位数是108.5,众数是103;乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92或101.(2)由茎叶图中的数据可知,甲班中数学成绩为优秀的人数为20,优秀率为2050=25;乙班中数学成绩为优秀的人数为18,优秀率为1848=38.(3)用甲班学生数学成绩的频率估计概率,则高三学生数学成绩的优秀率P =25,则X 的所有可能取值为0,1,2,3,且X ~B ⎝⎛⎭⎫3,25, P (X =0)=C 03⎝⎛⎭⎫353=27125; P (X =1)=C 13×25×⎝⎛⎭⎫352=54125; P (X =2)=C 23×⎝⎛⎭⎫252×35=36125; P (X =3)=C 33×⎝⎛⎭⎫253=8125; X 的分布列为!E (X )=0×27125+1×54125+2×36125+3×8125=65或E (X )=3×25=65.6.(2018·河北保定模拟)某市拟实行机动车尾号限行交替措施,为了解民众对“车辆限行”的态度,随机调查了50人,并将调查结果制成下表.人中不赞成“车辆限行”的人数记为X ,求X 的分布列和期望;(2)把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年,请根据上表完成2×2列联表,并说明民众对“车辆限行”的态度与年龄是否有关联.参考公式和数据χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )解析 (1)P (X =0)=C 24C 25·C 26C 210=90450=15,P (X =1)=C 24C 25·C 16C 14C 210+C 14C 25·C 26C 210=204450=3475,P (X =2)=C 14C25·C 16C 14C 210+C 24C 25·C 24C 210=132450=2275,P (X =3)=C 14C 25·C 24C 210=24450=475,X 的分布列为E (X )=0×15+1×3475+2×2275+3×475=1.2.(2)2×2列联表如图所示.χ2=50×(133-143)30×20×32×18≤2.706,说明民众对“车辆限行”的态度与年龄没有关联.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考必考题突破讲座 (六)1.某保险公司有一款保险产品的历史收益率(收益率=利润÷保费收入)的频率分布直方图如图所示.(1)试估计这款保险产品的收益率的平均值;(2)设每份保单的保费在20元的基础上每增加x 元,对应的销量为y (单位:万份).从历史销售记录中抽样得到如下5组x 与y 的对应数据.x /元 25 30 38 45 52y /万份 7.5 7.1 6.0 5.6 4.8由上表知x 与y 有较强的线性相关关系,且据此计算出的回归方程为y ^=10-b ^x . ①求参数b ^的值;②若把回归方程y ^=10-b ^x 当作y 与x 的线性关系,用(1)中求出的收益率的平均值作为此产品的收益率,试问每份保单的保费定为多少元时此产品可获得最大利润,并求出最大利润(注:保险产品的保费收入=每份保单的保费×销量).解析 (1)收益率的平均值为0.05×0.1+0.15×0.2+0.25×0.25+0.35×0.3+0.45×0.1+0.55×0.05=0.275.(2)①x =25+30+38+45+525=1905=38,y =7.5+7.1+6.0+5.6+4.85=315=6.2.由y =10-b ^x 得10-38b ^=6.2,解得b ^=0.1.②设每份保单的保费为(20+x )元,则销量为y =10-0.1x .则这款保险产品的保费收入为f (x )=(20+x )(10-0.1x )万元.所以f (x )=200+8x -0.1x 2=360-0.1(x -40)2.所以当x =40,即每份保单的保费为60元时,保费收入最大为360万元.预计这款保险产品的最大利润为360×0.275=99(万元).2.某网络广告A 公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此A 公司随机抽取了甲、乙两个网站某月中10天的日访问量n (单位:万次),整理后得到如下茎叶图.已知A 公司要从网站日访问量的平均值和稳定性两方面进行考察选择.(1)请说明A公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布,A公司根据所选网站的日访问量n进行付费,其付费标准如下表.选定网站的日访问量n(单位:万次)A公司的付费标准(单位:元/日)n<2550025≤n≤35700n>35 1 000 求A公司每月(按解析(1)由茎叶图可知x甲=(15+24+28+25+30+36+30+32+35+45)÷10=30,s2甲=110×[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35-30)2+(45-30)2]=58,x乙=(18+25+22+24+32+38+30+36+35+40)÷10=30,s2乙=110×[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35-30)2+(40-30)2]=49.8,因为x甲=x乙,s2甲>s2乙,所以A公司应选择乙网站.(2)由(1)得A公司应选择乙网站,由题意可得乙网站日访问量n<25的概率为0.3,日访问量25≤n≤35的概率为0.4,日访问量n>35的概率为0.3,所以A公司每月应付给乙网站的费用S=30×(500×0.3+700×0.4+1 000×0.3)=21 900(元).3.某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按200元/次收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下表:消费次数第1次第2次第3次第4次5次及以上收费比例10.950.900.850.80消费次数第1次第2次第3次第4次5次及以上频数6020105 5(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.解析 (1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为40100=0.4.(2)该会员第1次消费时,公司获得的利润为200-150=50(元),第2次消费时,公司获得的利润为200×0.95-150=40(元),所以公司获得的平均利润为50+402=45(元).(3)因为20∶10∶5∶5=4∶2∶1∶1,所以用分层抽样方法抽出的8人中,消费2次的有4人,分别设为A 1,A 2,A 3,A 4,消费3次的有2人,分别设为B 1,B 2,消费4次和5次及以上的各有1人,分别设为C ,D ,从中抽出2人,抽到A 1的有A 1A 2,A 1A 3,A 1A 4,A 1B 1,A 1B 2,A 1C ,A 1D ,共7种;去掉A 1后,抽到A 2的有A 2A 3,A 2A 4,A 2B 1,A 2B 2,A 2C ,A 2D ,共6种;……去掉A 1,A 2,A 3,A 4,B 1,B 2后,抽到C 的有CD ,共1种,总的抽取方法有7+6+5+4+3+2+1=28(种),其中恰有1人消费两次的抽取方法有4+4+4+4=16(种),所以抽出的2人中恰有1人消费两次的概率为1628=47.4.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)?解析(1)频率分布直方图如图所示.(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).5.某小学为迎接校运动会的到来,在三年级招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者中分别各有10人和6人喜欢运动,其余人员不喜欢运动.(1)根据以上数据完成2×2列联表;喜欢运动不喜欢运动总计男女总计(2)是否有95%的把握认为性别与喜欢运动有关,并说明理由;(3)如果喜欢运动的女志愿者中恰有4人懂得医疗救护,现从喜欢运动的女志愿者中抽取2名负责处理应急事件,求抽出的2名志愿者都懂得医疗救护的概率.附:K 2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d .P (K 2≥k 0) 0.050 0.025 0.010 0.001k 03.841 5.024 6.635 10.828解析 (1)依题意,2×2列联表如下.喜欢运动 不喜欢运动 总计 男 10 6 16 女 6 8 14 总计161430(2)由已知数据可得K 2=30×10×8-6×6216×14×14×16≈1.157 5<3.841,因此没有95%的把握认为是否喜欢运动与性别有关.(3)喜欢运动的女志愿者有6人,设分别为A ,B ,C ,D ,E ,F ,其中A ,B ,C ,D 懂得医疗救护,则从这6人中任取2人的情况有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共15种,其中两人都懂得医疗救护的情况有(A ,B ),(A ,C ),(A ,D ),(B ,C ),(B ,D ),(C ,D ),共6种,设“抽出的2名志愿者都懂得医疗救护”为事件M ,则P (M )=615=25.6.(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .解析 (1)由折线图中数据和附注中参考数据得t -=4, ∑i =17(t i -t -)2=28,∑i =17y i -y-2=0.55,∑i =17 (t i -t )(y i -y -)=∑i =17t i y i -t∑i =17yi=40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17t i -ty i -y-∑i =17t i -t2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.7.(2019·蓉城名校联考)成都市现在已是拥有1 400多万人口的城市,机动车保有量已达450多万辆,成年人中约40%拥有机动车驾驶证.为了解本市成年人的交通安全意识情况,某中学的同学利用国庆假期进行了一次全市成年人安全知识抽样调查.先根据是否拥有驾驶证,用分层抽样的方法抽取了200名成年人,然后对这200人进行问卷调查.这200人所得的分数都分布在[30,100]范围内,规定分数在80以上(含80)的为“具有很强安全意识”,所得分数的频率分布直方图如图所示.拥有驾驶证没有驾驶证合计具有很强安全意识不具有很强安全意识58合计200(1)补全上面的2×2列联表,并判断能否有超过95%的把握认为“‘具有很强安全意识’与是否拥有驾驶证”有关?(2)若规定参加调查的200人中分数在70以上(含70)的为“具有较强安全意识”,从参加调查的200人中根据是否具有较强安全意识,按分层抽样的方法抽出5人,再从5人中随机抽取3人,试求抽取的3人中恰有1人“具有较强安全意识”的概率.附表及公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.072 2.706 3.841 5.024 6.6357.87910.828 解析全意识的占20%,有40人,不具有很强安全意识的有160人.补全的2×2列联表如表所示:拥有驾驶证没有驾驶证合计具有很强安全意识221840不具有很强安全意识58102160合计80120200K2=200×240×80×160×120=16=4.687 5>3.841.所以有超过95%的把握认为“‘具有很强安全意识’与是否拥有驾驶证”有关.(2)5人中不具有较强安全意识的有3人,分别记为A,B,C,“具有较强安全意识”的有2人,分别记为d,e,易知这是一个古典概型.则从5人中随机抽取3人构成的所有基本事件为(A,B,C),(A,B,d),(A,B,e),(A,C,d),(A,C,e),(A,d,e),(B,C,d),(B,C,e),(B,d,e),(C,d,e),共10种;抽取的3人中恰有1人“具有较强安全意识”所包含的基本事件为(A,B,d),(A,B,e),(A,C,d),(A,C,e),(B,C,d),(B,C,e),共有6种.所以抽取的3人中恰有1人“具有较强安全意识”的概率P=610=35.8.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w∑i =18(x i -x )2∑i =18(w i -w )2∑i =18(x i -x )· (y i -y )∑i =18(w i -w )·(y i -y ) 46.6 563 6.8289.81.61 469108.8表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u 的斜率和截距的最小二乘估计分别为:β^=∑i =1nu i -uv i -v∑i =1nu i -u2,^α=v -^βu .解析 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于宣传费x 的回归方程类型.(2)令ω=x ,先建立y 关于ω的线性回归方程.由于d ^=∑8i =1ωi -ωy i -y∑8i =1ωi -ω2=108.81.6=68,c ^=y -d ^ω=563-68×6.8=100.6,所以y 关于ω的线性回归方程为y ^=100.6+68ω,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+68×49=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

相关文档
最新文档