2020高考理科概率与统计专题

合集下载

2020届全国各地高考试题分类汇编11 统计和概率

2020届全国各地高考试题分类汇编11 统计和概率

11 统计和概率1.(2020•北京卷)在52)-的展开式中,2x 的系数为( ). A. 5- B. 5C. 10-D. 10【答案】C【解析】首先写出展开式的通项公式,然后结合通项公式确定2x 的系数即可.【详解】)52展开式的通项公式为:()()55215522r rrrrr r T CC x--+=-=-,令522r -=可得:1r =,则2x 的系数为:()()11522510C -=-⨯=-.故选:C. 【点睛】二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n 和r 的隐含条件,即n ,r 均为非负整数,且n ≥r ,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项. 2.(2020•北京卷)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明)【答案】(Ⅰ)该校男生支持方案一的概率为13,该校女生支持方案一的概率为34;。

2020年高考数学试题分项版—统计概率(原卷版)

2020年高考数学试题分项版—统计概率(原卷版)

2020年高考数学试题分项版——统计概率(原卷版)一、选择题1.(2020·全国Ⅰ理,5)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2 C .y =a +b e xD .y =a +b ln x2.(2020·全国Ⅰ理,8)⎝⎛⎭⎫x +y2x (x +y )5的展开式中x 3y 3的系数为( ) A .5 B .10 C .15 D .203.(2020·全国Ⅱ理,3)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1 600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( ) A .10名 B .18名 C .24名 D .32名4.(2020·全国Ⅲ理,3)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑i =14pi =1,则下面四种情形中,对应样本的标准差最大的一组是()A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.25.(2020·新高考全国Ⅰ,3)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有( ) A .120种 B .90种 C .60种 D .30种6.(2020·新高考全国Ⅰ,12)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,…,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑( )A .若n =1,则H (X )=0B .若n =2,则H (X )随着p i 的增大而增大C .若p i =1n(i =1,2,…,n ),则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,…,m ,且P (Y =j )=p j +p 2m +1-j (j =1,2,…,m ),则H (X )≤H (Y )7.(2020·北京,3)在(x -2)5的展开式中,x 2的系数为( ) A .-5 B .5 C .-10 D .108.(2020·新高考全国Ⅱ,6)3名大学生利用假期到2个山村参加扶贫工作,每名大学生只去1个村,每个村至少1人,则不同的分配方案共有( ) A .4种 B .5种 C .6种 D .8种9.(2020·新高考全国Ⅱ,9)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )A .这11天复工指数和复产指数均逐日增加B .这11天期间,复产指数增量大于复工指数的增量C .第3天至第11天复工复产指数均增大都超过80%D .第9天至第11天复产指数增量大于复工指数的增量10.(2020·天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )A .10B .18C .20D .3611.(2020·全国Ⅰ文,4)设O 为正方形ABCD 的中心,在O ,A ,B ,C ,D 中任取3点,则取到的3点共线的概率为( ) A.15 B.25 C.12 D.4512.(2020·全国Ⅰ文,5)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2 C .y =a +b e xD .y =a +b ln x13.(2020·全国Ⅱ文,3)如图,将钢琴上的12个键依次记为a 1,a 2,…,a 12.设1≤i <j <k ≤12.若k -j =3且j -i =4,则称a i ,a j ,a k 为原位大三和弦;若k -j =4且j -i =3,则称a i ,a j ,a k 为原位小三和弦.用这12个键可以构成的原位大三和弦与原位小三和弦的个数之和为( )A .5B .8C .10D .1514.(2020·全国Ⅱ文,4)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( ) A .10名 B .18名 C .24名 D .32名15.(2020·全国Ⅲ文,3)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A .0.01B .0.1C .1D .10 二、填空题1.(2020·全国Ⅱ理,14)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有________种. 2.(2020·全国Ⅲ理,14)⎝⎛⎭⎫x 2+2x 6的展开式中常数项是________.(用数字作答) 3.(2020·天津,11)在⎝⎛⎭⎫x +2x 25的展开式中,x 2的系数是________. 4.(2020·天津,13)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为________;甲、乙两球至少有一个落入盒子的概率为________.5.(2020·江苏,3)已知一组数据4,2a,3-a,5,6的平均数为4,则a 的值是________. 6.(2020·江苏,4)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是________.7.(2020·浙江,12)二项展开式(1+2x )5=a 0+a 1x +a 2x 2+a 3x 3+a 4x 4+a 5x 5,则a 4=________,a 1+a 3+a 5=________.8.(2020·浙江,16)盒中有4个球,其中1个红球,1个绿球,2 个黄球,从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则P (ξ=0)=________,E (ξ)=________. 三、解答题1.(2020·全国Ⅰ理,19)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12.(1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率.2.(2020·全国Ⅱ理,18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i ix x =-=∑(,2021)9000i iy y =-=∑(,201))800ii ix y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r))niix y x y --∑((,2≈1.414.3.(2020·全国Ⅲ理,18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),4.(2020·新高考全国Ⅰ,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),5.(2020·新高考全国Ⅱ,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),6.(2020·北京,18)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(1)分别估计该校男生支持方案一的概率,该校女生支持方案一的概率;(2)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(3)将该校学生支持方案二的概率估计值记为p0,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为p1,试比较p0与p1的大小.(结论不要求证明)7.(2020·江苏,23)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为X n,恰有2个黑球的概率为p n,恰有1个黑球的概率为q n.(1)求p1,q1和p2,q2;(2)求2p n+q n与2p n-1+q n-1的递推关系式和X n的数学期望E(X n)(用n表示).8.(2020·全国Ⅰ文,17)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?9.(2020·全国Ⅱ文,18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i ix x =-=∑(,2021)9000i iy y =-=∑(,201))800ii ix y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r))niix y x y --∑((,2≈1.414.10.(2020·全国Ⅲ文,18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),。

2020版高考理数:专题(12)概率与统计ppt课件三

2020版高考理数:专题(12)概率与统计ppt课件三
对目标概率进行转化求解即可.
19
考点三 条件概率、独立性试验、二项分布和正态分布
例7 [贵州贵阳第一中学2017第五次适应性考试]设随机变量X~N(2,σ 2),其 正态分布密度曲线如图所示,且P(1<x≤3)=0.682 7,那么向正方形OABC中随机投 掷10 000个点,则落入阴影部分的点的个数的估计值为( )
判断一个随机变量是否服从二项分布的关键:①独立性,②重复性, 即试验是独立重复地进行n次.一般地,若试验可以看作是一个只有两种可能结 果A和A的独立重复试验,则n次试验中A发生的次数X服从二项分布.注意在实际 应用中往往出现“较大”“很大”“非常大”“频率近似等于概率”等字眼, 这表明试验可视为独立重复试验. 二项分布模型和超几何分布模型最主要的区别在于二项分布是有放回抽样,而 超几何分布是不放回抽样.
(附:随机变量ξ 服从正态分布N(μ ,σ 2),则P(μ -σ <ξ ≤μ +σ )=0.682 7,
P(μ -2σ <ξ ≤μ +2σ )=0.954 5,P(μ -3σ <ξ ≤μ +3σ )=0.997 3))
A.8 426 C.9 544
B.8 641 D.9 973
20
考点三 条件概率、独立性试验、二项分布和正态分布
13
考点三 条件概率、独立性试验、二项分布和正态分布
方法2 相互独立事件的概率的求法
(1)首先要搞清事件间的关系,正确区分“互斥事件”与“对立事 件”.当且仅当事件A和事件B相互独立时,才有P(AB)=P(A)·P(B). (2)A,B中至少有一个发生:A∪B. ①若A,B互斥,则P(A∪B)=P(A)+P(B),否则不成立. ②若A,B相互独立(不互斥),则概率的求法如下: 方法一: 方法二: (3)某些事件若含有较多的互斥事件,可考虑其对立事件的概率,这样可 减少运算量,提高准确率.要注意“至多”“至少”等题型的转化.

2020年高考数学(理)二轮专项复习专题11 概率统计

2020年高考数学(理)二轮专项复习专题11  概率统计

n( A B)
率”.在古典概型中,用 n(A)表示事件 A 中基本事件的个数,则有 P(B|A)=

n( A)
事件的独立性:设 A、B 为两个事件,如果 P(B|A)=P(B),则称事件 A 与事件 B 相互 独立,并称事件 A、B 为相互独立事件.
若 A、B 为两个相互独立事件,则 A 与 A 、 A 与 B、 A 与 B 也都相互独立.
2.频率与概率
频率:在相同的条件 S 下,重复 n 次试验,观察某个事件 A 是否出现,称 n 次试验中
事件 A 的出现次数 m 为事件 A 出现的频数,称事件 A 出现的比例 m 为事件 A 出现的频率. n
概率:一般的,在 n 次重复进行的试验中,事件 A 发生的频率 m ,当 n 很大时总是在 n


(1)射中 9 环或 10 环的概率;
公 信

(2)至少命中 8 环的概率;
(3)命中不足 8 环的概率.
【分析】射击运动员一次射击只能命中 1 个环数,命中不同的环数是互斥事件,射中 9 环或 10 环的概率等于射中 9 环与射中 10 环的概率和.命中不足 8 环所包含的事件较多,而
其对立事件为“至少命中 8 环”,可先求其对立事件的概率,再通过 P(A)=1-P( A )求解.
发生是等可能的. 用 M 表示“A1 恰被选中”这一事件,则 M={(A1,B1,C1),(A1,B1,C2),(A1,B2,C1), (A1,B2,C2),(A1,B3,C1),(A1,B3,C2)}
事件 M 由 6 个基本事件组成,因而 P(M ) 6 1 18 3
(Ⅱ)用 N 表示“B1,C1 不全被选中”这一事件,则其对立事件 N 表示“B1,C1 全被选

2020年高考数学试题分类汇编专题概率理精品

2020年高考数学试题分类汇编专题概率理精品

2020年高考试题数学(理科)概率、选择题1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A) 1(B) 2(C) 3(D )45 5 5 5【答案】B一2A2 AnA^ A^A^A: 2【解析】由古典概型的概率公式得P 1 A3A2 A22.A55 52.(2020年高考辽宁卷理科5)从1, 2, 3, 4, 5中任取2各不同的数,事件A= "取到的2 个数之和为偶数”,事件B= "取到的2个数均为偶数”,则P (Bl A)=(A) 1 (B) 1 (C) 2(D) 18 4 5 2Ci 2 cl 1 u , 1解析:由题意nP(A)= —―5―, P(AB) = —= 一P(B I At=--------- =—.耳5 弓10 , PA 4小组,每位同学参加各个小组的可能性相则这两位同学参加同一个兴趣小组的概率为同,(A) 1(B) 1(C) - (D)-3 2 3 4解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有3 13 3 9种方法;所以,甲乙两位同学参加同一个小组的概率为- -9 3点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。

4.(2011年高考广东卷理科6)甲、乙两队断排球决赛.现在的憧&是甲队只要再忘一局就获冠军,乙队初再高两局才能得国军.若两队胜每扃的概率相同.则甲队获谆冠军的概率为()金太阳新课标资源网【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获 (1113)3 (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个得冠军的概率p ————.所以选D.2 2 2 45.(2020年高考湖北卷理科7)如图,用K、A、A2三类不同的元件连成一个系统 .当K正常工作且A i 、A 2至少有一个正常工作时,系统正常工作 .已知K 、A 、A 2正常工作的概率依次为0.9、0.8、0.8 ,则系统正常工作的概率为B.0.864C.0.720D.0.576[-S]~~-in ———---- j L -----答案:B解析:系统正常工作概率为 C 2 0.9 0.8 (1 0.8) 0.9 0.8 0.8 0.864 ,所以选B.6. (2020年高考陕西卷理科 10)甲乙两人一起去“ 2020西安世园会”,他们约定,各自独立 地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A) — (B) 1 (Q 9(D) 1369 36 6【答案】D1到6号景点中任选4个进行游览有C 6c 6c 5c 5c 4c 4c 1c 3种,且等可能,最后一小时他们同在一个景点有 C 6c 5c 5c 4c 4c 30种,则最后一小时他们同在一个7. (2020年高考四川卷理科 12)在集合1,2,3,4,5中任取一个偶数a 和一个奇数b 构成以原点为起点的向量 a= (a,b ).从所有得到的以原点为起点的向量中任取两个向量为邻边作 平行四边形.记所有作成的平行四边形的个数为 n ,其中面积不超过.4的平行四边形的个数为m ,则m () n(A) —(B) 1(C) 2(D)-15 3 5 3答案:B2解析:基本事件:从(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)选取 2个,n C 6 3 5 15 .其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四 边形的为(2,3)(2,5);(2,1)(2,3) ; m=3+2=5 故 m — 1.n 15 3A.0.960【解析】:各自独立地从 景点的概率是p1111111C111111101C6 C6c5c5 C4c4c3c38. (2020年高考福建卷理科 4)如图,矩形 ABCN,点E 为边CD 的中点,若在矩形 ABCD内部随机取一个点 Q,则点Q 取自△ ABE 内部的概率等于8.12D.—3二、填空题:1 .(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递2 .....................................、,了个人简历,假定该毕业生得到甲公司面试的概率为 上,得到乙、丙两公司面试的概率为3〜 C 、 1 J 、口…… P ( 0) 一,则随机变量的数学期望12 5【答案】53 2 . (2020年高考江西卷理科 12)小波通过做游戏的方式来确定周末活动,他随机地往单位圆内投掷一点,若此点到圆心白^距离大于。

2020年高考试题分类汇编(统计与概率)

2020年高考试题分类汇编(统计与概率)

2020年高考试题分类汇编(统计与概率)考点1计数1.(2020·全国卷Ⅱ·理科)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有 种.2.(2020·海南卷·山东卷)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有A .120种B .90种C .60种D .30种 3.(2020·全国卷Ⅱ·文理科)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单配货,由于订单量大幅增加,导致订单积压,为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A .10名B .18名C .24名D .32名 考点2数据的数字特征1.(2020·全国卷Ⅲ·文科)设一座样本数据1x ,2x ,,n x 的方差为0.01,则数据110x ,210x ,,10n x 的方差为A .0.01B .0.1C .1D .102.(2020·全国卷Ⅲ·理科)在一组样本中,1,2,3,4出现的频率分别为1p ,2p ,3p ,4p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是A .140.1p p ==,230.4p p ==B .140.4p p ==,230.1p p ==C .140.2p p ==,230.3p p ==D .140.3p p ==,230.2p p == 3.(2020·北京卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是A .62%B .56%C .46%D .42% 4.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A .10B .18C .20D .36考点4回归分析1.(2020·全国卷Ⅰ·理科)某校一个课外学习小组为研究某作物的发芽率y 和温度x (单位:C )的关系,在20个不同的温度条件下进行种子发芽实验,有实验数据(,)i i x y (1i =,2,,20)得到下面的散点图:由此散点图,在10C 至40C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是A .y a bx =+B .2y a bx =+C .x y a be =+D .ln y a b x =+ 考点5概率1.(2020·天津卷)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为 ;甲、乙两球至少有一个落入盒子的概率为 .2.(2020·北京卷)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随发芽率20%40% 60% 80% 100% 010 20 3040◆◆ ◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆ ◆ ◆ ◆◆ ◆ ◆ ◆ ◆假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率; (Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明)3.(2020·全国卷Ⅰ·文科)某厂接受了一项加工业务,加工起来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元、50元、20元,对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂承接加工业务.甲分厂加工成本费25元/件,乙分厂加工成本费20元/件.厂家为决定由哪家分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:(Ⅰ)分别估计甲、乙两个分厂加工出来的一件产品为A 级品的概率; (Ⅱ)分别求甲、乙两个分厂加工出来的100件产品的平均利润,厂家应选哪个分厂承接加工业务?4.(2020·全国卷Ⅰ·理科)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,福者下一场轮空,直至由一人被淘汰;当一人被淘汰后,剩余的两人继续比赛直至其中一人被淘汰,另一人最终获胜,比赛结束.甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12.(Ⅰ)求甲连胜四场的概率;(Ⅱ)求需要进行第五场比赛的概率;(Ⅲ)求丙最终获胜的概率.考点6独立性检验及相关系数1.(2020·海南卷·山东卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的2.5PM和2SO浓度(单位:3/ug m),得下表:(Ⅰ)估计事件“该市一天空气中 2.5PM浓度不超过75,且2SO浓度不超过150”的概率;(Ⅲ)根据(Ⅱ)中的列联表,判断是否有99%的把握认为该市一天空气中 2.5PM浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,2.(2020·全国卷Ⅱ·文理科)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其方程面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(,)i i x y (1i =,2,,20),其中i x 和i y 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得2060i i x ==∑,201200ii y==∑,202()80i i x x =-=∑,202()9000i i y y =-=∑,20()()800i i i x x y y =--=∑.(Ⅰ)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数); (Ⅱ)求样本的相关系数(精确到0.01);(Ⅲ)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一你认为更合理的抽样方法,说明理由.附:相关系数()()niix x y y r --=∑1.414≈.3.(2020·全国卷Ⅲ·理科)某学生兴趣小组随机调查了某市100天中每天的空(Ⅰ)分别估计该市一天的空气质量等级为1,2,3,4的概率;(Ⅱ)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(Ⅲ)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面22⨯列联表,并根据列联表判断是否有95%的把握认为一天中到公园锻炼的人次与该市当天的空气质量有关?附:其中22()()()()()n ad bcKa b c d a c b d-=++++,。

高考数学专题《概率与统计》解读含答案解析

高考数学专题《概率与统计》解读含答案解析

重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。

试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。

概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。

取代了传统意义上的应用题,成为高考中的亮点。

解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。

求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。

相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。

定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。

标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。

有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。

对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。

新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。

专题10 概率与统计 原卷版(2016-2020)高考数学(理)真题分项详解

专题10 概率与统计     原卷版(2016-2020)高考数学(理)真题分项详解

专题10 概率与统计【2020年】1.(2020·新课标Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( ) A. 14230.1,0.4p p p p ==== B. 14230.4,0.1p p p p ==== C. 14230.2,0.3p p p p ====D. 14230.3,0.2p p p p ====2.(2020·山东卷)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有( ) A. 120种 B. 90种 C. 60种D. 30种3.(2020·山东卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( ) A. 62% B. 56% C. 46%D. 42%4.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A. 10B. 18C. 20D. 365.(2020·天津卷)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.6.(2020·浙江卷)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为ξ,则(0)P ξ==_______;()E ξ=______.7.(2020·江苏卷)已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是_____.8.(2020·江苏卷)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____.9.(2020·新课标Ⅱ)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有__________种. 【2019年】1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7D .0.82.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( ) A .中位数 B .平均数 C .方差D .极差3.【2019年高考浙江卷】设0<a <1,则随机变量X 的分布列是( )则当a 在(0,1)内增大时, A .()D X 增大B .()D X 减小C .()D X 先增大后减小D .()D X 先减小后增大4.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________. 5.【2019年高考全国Ⅱ卷理数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________.6.【2019年高考全国Ⅰ卷理数】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是______________. 【2018年】1.【2018·全国Ⅱ卷】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A .112 B .114 C .115D .1182.【2018·全国Ⅰ卷】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例 则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半3.【2018·全国Ⅲ卷】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,(4)(6)P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.34.【2018·浙江卷】设01p <<,随机变量ξ的分布列是ξ 0 1 2 P12p- 122p 则当p 在(0,1)内增大时, A .D (ξ)减小 B .D (ξ)增大C .D (ξ)先减小后增大D .D (ξ)先增大后减小5.【2018·全国Ⅰ卷】下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 36.【2018·江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为______________.7.【2018·江苏卷】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为______________. 【2017年】1.【2017·全国Ⅲ卷】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳2.【2017·全国Ⅰ卷】如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14 B .π8 C .12D .π43.【2017·山东卷】从分别标有1,2,⋅⋅⋅,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是A .518 B .49 C .59D .7912.【2017·浙江卷】已知随机变量i ξ满足P (i ξ=1)=p i ,P (i ξ=0)=1–p i ,i =1,2.若0<p 1<p 2<12,则A .1()E ξ<2()E ξ,1()D ξ<2()D ξB .1()E ξ<2()E ξ,1()D ξ>2()D ξC .1()E ξ>2()E ξ,1()D ξ<2()D ξD .1()E ξ>2()E ξ,1()D ξ>2()D ξ4.【2017·山东卷】为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166D .1705.【2017·全国Ⅱ卷】一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X 表示抽到的二等品件数,则DX =______________.6.【2017·江苏卷】记函数2()6f x x x =+-的定义域为D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是______________.7.【2017·江苏卷】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______________件. 【2016年】1. 【2016高考新课标1卷】某公司的班车在7:00,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ) (A )13 (B )12 (C )23 (D )342.【2016高考新课标3理数】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大 (C)三月和十一月的平均最高气温基本相同 (D)平均气温高于20C ︒的月份有5个3.【2016高考山东理数】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) (A )56(B )60(C )120(D )1404.【2016高考新课标2理数】从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为 (A )4n m (B )2n m (C )4m n (D )2m n5.【2016年高考北京理数】袋中装有偶数个球,其中红球、黑球各占一半.甲、乙、丙是三个空盒.每次从袋中任意取出两个球,将其中一个球放入甲盒,如果这个球是红球,就将另一个球放入乙盒,否则就放入丙盒.重复上述过程,直到袋中所有球都被放入盒中,则()A.乙盒中黑球不多于丙盒中黑球B.乙盒中红球与丙盒中黑球一样多C.乙盒中红球不多于丙盒中红球D.乙盒中黑球与丙盒中红球一样多6.【2016高考江苏卷】将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是 ▲ .7.【2016年高考四川理数】同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X 的均值是 .328.【2016高考新课标2理数】有三张卡片,分别写有1和2,1和3,2和3.甲,乙,丙三人各取走一张卡片,甲看了乙的卡片后说:“我与乙的卡片上相同的数字不是2”,乙看了丙的卡片后说:“我与丙的卡片上相同的数字不是1”,丙说:“我的卡片上的数字之和不是5”,则甲的卡片上的数字是 .9.【2016高考江苏卷】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________▲________.10.【2016高考山东理数】在[1,1]上随机地取一个数k,则事件“直线y=kx与圆22x y相交”发生(5)9的概率为.。

2020年高考数学(理)之高频考点解密26 统计与概率的综合(解析版)

2020年高考数学(理)之高频考点解密26 统计与概率的综合(解析版)

解密26统计与概率的综合考点1 古典概型与统计交汇考查题组一古典概型与用样本估计总体交汇考查调研1 五四青年节活动中,高三(1)、(2)班都进行了3场知识辩论赛,比赛得分情况的茎叶图如图所示(单位:分),其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x具有随机性(x∈N),那么高三(2)班的平均得分大于高三(1)班的平均得分的概率为A.34B.13C.35D.25【答案】D【解析】由茎叶图可得高三(1)班的平均分为x̅=89+92+933=2743,高三(2)的平均分为y̅=88+(90+x)+913=269+x3,由x̅<y̅,得10>x>5,又x∈N,所以x可取6,7,8,9,故所求的概率为P=410=25,故选D.调研2 某高中在今年的期末考试历史成绩中随机抽取n名考生的笔试成绩,作出其频率分布直方图如图所示,已知成绩在[75,80)中的学生有1名,若从成绩在[75,80)和[90,95)两组的所有学生中任取2名进行问卷调查,则2名学生的成绩都在[90,95)中的概率为A.23B.12C.35D.34【答案】C【解析】因为在[75,80)的频率为5×0.01=0.05,所以n=10.05=20,在[90,95)的频率为1-5×(0.01+0.02+0.06+0.07)=0.2,所以在[90,95)中的学生人数为20×0.2=4,所以[75,80)中有1个人,[90,95)中有4个人,共5个人,从5个人中任意取2个人共有10个基本事件,2名学生的成绩都在[90,95)中的基本事件有6个,所以由古典概型的概率计算公式得所求概率为610=35.故选C.调研3 五省优创名校2019届高三联考(全国I卷)数学试题)袋子中有四个小球,分别写有“美、丽、中、国”四个字,有放回地从中任取一个小球,直到“中”“国”两个字都取到就停止,用随机模拟的方法估计恰好在第三次停止的概率.利用电脑随机产生0到3之间取整数值的随机数,分别用0,1,2,3代表“中、国、美、丽”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下18组随机数:232 321 230 023 123 021 132 220 001231 130 133 231 031 320 122 103 233由此可以估计,恰好第三次就停止的概率为 A .19 B .318 C .29D .518【答案】C【解析】因为随机模拟产生18组随机数,由随机产生的随机数可知,恰好第三次就停止的有: 021,001,031,130共4个基本事件,根据古典概型概率公式可得,恰好第三次就停止的概率为418=29, 故选C.【名师点睛】本题主要考查随机数的应用以及古典概型概率公式,属于中档题. 在解答古典概型概率题时,首先求出样本空间中基本事件的总数n ,其次求出概率事件中含有多少个基本事件m ,然后根据公式P =mn 求得概率.调研4 为了解某市的交通状况,现对其6条道路进行评估,得分分别为:5,6,7,8,9,10.规定评估的平均得分与全市的总体交通状况等级如表(1)求本次评估的平均得分,并参照上表估计该市的总体交通状况等级.(2)用简单随机抽样方法从这6条道路中抽取2条,它们的得分组成一个样本,求该样本的平均数与总体的平均数之差的绝对值不超0.5的概率. 【答案】(1)7.5,等级为合格;(2)715.【解析】(1)6条道路的平均得分为16(5+6+7+8+9+10)=7.5.∴该市的总体交通状况等级为合格.(2)设A 表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”,从6条道路中抽取2条的得分组成的所有基本事件为:(5,6),(5,7),(5,8),(5,9),(5,10),(6,7),(6,8),(6,9),(6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10),共15个基本事件.事件A 包括(5,9),(5,10),(6,8),(6,9),(6,10),(7,8),(7,9)共7个基本事件, ∴P (A )=715,即该样本的平均数与总体的平均数之差的绝对值不超0.5的概率为715.【名师点睛】本题考查的知识点是古典概型,平均数,古典概型要求所有结果出现的可能性都相等,强调所有结果中每一结果出现的概率都相同.解决问题的步骤是:计算满足条件的基本事件个数,及基本事件的总个数,然后代入古典概型计算公式进行求解,属于中等题.☆技巧点拨☆求解古典概型与用样本估计总体交汇问题的模型(1)识图:能读懂已知频率分布直方图或茎叶图所隐含的信息并进行信息提取.(2)转化:对文字语言较多的题,需要根据题目信息耐心阅读,步步实现文字语言与符号语言间的转化. (3)计算:对频率分布直方图或茎叶图所反馈的信息进行提取,并结合古典概型的概率公式进行运算.题组二 古典概型与回归分析、独立性检验的交汇考查调研 5 随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,是昆虫大量活动与繁殖季节,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y 与一定范围内的温度x 有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:(1)从这5天中任选2天,记这两天药用昆虫的产卵分别为m ,n ,求事件“m ,n 均不小于25”的概率; (2)科研人员确定的研究方案是:先从这五组数据中任选2组,用剩下的3组数据建立y 关于x 的线性回归方程,再对被选取的2组数据进行检验.(ⅰ)若选取的是3月2日与30日的两组数据,请根据3月7日、15日和22日这三天的数据,求出y 关于x 的线性回归方程;(ⅱ)若由线性回归方程得到的估计数据与选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问(ⅰ)中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为()()()121niii nii x x y y b x x ∧==--=-∑∑ ,a ∧=y −b ∧⋅x .【答案】(1)310(2)(ⅰ)y ∧=52x −3,(ⅱ)可靠,见解析.【解析】(1)依题意得,m 、n 的所有情况有:{23,25}、{23,30}、{23,26}、{23,16}、{25,30}、 {25,26}、{25,16}、{30,26}、{30,16}、{26,16},共有10个;设“m 、n 均不小于25”为事件A ,则事件A 包含的基本事件有{25,30}、{25,26}、{30,26}, 所以P(A)=310,故事件A 的概率为310.(2)(ⅰ)由数据得x =12,y =27,()()315i i i x x y y =--=∑,()3212i i x x =-=∑ ,()()()312152iii ni i x x y y b x x ∧==--==-∑∑, 552712 3.22a y x ∧=-=-⨯=- 所以y 关于x 的线性回归方程为y ∧=52x −3.(ⅱ)由(ⅰ)知,y 关于x 的线性回归方程为y ∧=52x −3.当x =10时,y ∧=52×10−3=22,|22−23|<2.当x =8时,y ∧=52×8−3=17,|17−16|<2.所以,所得到的线性回归方程y ∧=52x −3是可靠的.调研6 某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1000名学生中随机抽取了 100名学生的体检表,并得到如图的频率分布直方图.(1)若直方图中后四组的频数成等差数列,试估计全年级视力在4.8以下的人数;(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次1∼50名和951∼1000名的学生进行了调查,得到上表中数据,根据表中的数据,能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)【答案】(1)610;(2)见解析.【解析】(1)设各组的频率为,由图可知,第一组有3人,第二组7人,第三组27人,因为后四组的频数成等差数列,所以后四组频数依次为27,24,21,18,所以视力在4.8以下的频数为3+7+27+24=61人.故全年级视力在4.8以下的人数约为1000×61100=610人.(2)由已知得,Κ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(45×20−5×30)250×50×75×25=12>3.841,因此在犯错误的概率不超过0.05的前提下认为视力与学习成绩有关系.调研7 某市一中毕业生有3000名,二中毕业生有2000名.为了研究语文高考成绩是否与学校有关,现采用分层抽样的方法,从中抽取100名学生,先统计了他们的成绩(折合成百分制),然后按“一中”、“二中”分为两组,再将成绩分为5组,[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到如图所示的频率分布直方图:(1)从成绩在90分(含90分)以上的学生中随机抽取2人,问至少抽到一名学生是“一中”的概率;(2)规定成绩在70分以下为“成绩不理想”,请根据已知条件构造2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“成绩理想不理想与所在学校有关”?附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.【答案】(1)910;(2)见解析.【解析】(1)由分层抽样抽取的100名学生中,一中有60名,二中有40名,所以成绩在90分以上的人中,一中有60×0.005×10=3人;二中有40×0.005×10=2人,故至少抽到一名学生是“一中”的概率为p=1−110=910.(2)2×2列联表如下:将列联表中的数据代入公式,可得:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×26−14×45)229×71×60×40≈1.1656<2.706,所以不能在犯错误的概率不超过0.1的前提下认为“成绩理想不理想与所在学校有关”.调研8 某企业生产某种产品,为了提高生产效益,通过引进先进的生产技术和管理方式进行改革,并对改革后该产品的产量x(万件)与原材料消耗量y(吨)及100件产品中合格品与不合格品数量作了记录,以便和改革前作对照分析,以下是记录的数据:表一:改革后产品的产量和相应的原材料消耗量表二:改革前后定期抽查产品的合格数与不合格数(1)请根据表一提供数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧.(2)已知改革前生产7万件产品需要6.5吨原材料,根据回归方程预测生产7万件产品能够节省多少原材料?(3)请根据表二提供的数据,判断是否有90%的把握认为“改革前后生产的产品的合格率有差异”?附参考公式与数据:1122211()()ˆ()n niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay b x =-⋅; K 2=2()()()()()n ad bc a b c d a c b d -++++;【答案】(1)线性回归方程为y ̂=0.7x +0.35;(2)见解析;(3)见解析. 【解析】(1)由表一得x̅=3+4+5+64=4.5,y ̅=2.5+3+4+4.54=3.5,422221345ii x==++∑+62=86,∴b̂=3×2.5+4×3+5×4+6×4.5−4×4.5×3.586−4×4.52=66.5−635=0.7,a ̂=3.5−0.7×4.5=0.35,所以所求线性回归方程为y ̂=0.7x +0.35. (2)当x =7时,y ̂=0.7×7+0.35=5.25, 从而能够节省6.5−5.25=1.25吨原材料. (3)由表二得K 2=200×(90×15−85×10)2100×100×175×25=87<2.706,因此,没有90%的把握认为“改革前后生产的产品的合格率有差异”.☆技巧点拨☆古典概型与回归分析、独立性检验的交汇问题的解题策略(1)古典概型的概率问题,关键是正确找出基本事件总数和所求事件包含的基本事件数,然后利用古典概型的概率计算公式计算;当基本事件总数较少时,用列举法把所有的基本事件一一列举出来,要做到不重不漏,有时可借助表格,树状图列举;同时注意判断是古典概型还是几何概型,基本事件前者是有限的,后者是无限的,两者都有等可能性.(2)求回归直线方程的一般步骤如下:①作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系;②当两变量具有线性相关关系时,求回归系数ˆˆa b、,写出回归直线方程. (3)回归直线方程ˆˆˆya bx =+中的ˆb 表示x 每增加1个单位时,ˆy 的变化量的估计值为ˆb . (4)可以利用回归直线方程ˆˆˆya bx =+预报在x 取某个值时y 的估计值. (5)由于回归直线方程中的系数ˆa和ˆb 是通过样本估计而来的,存在着误差,这种误差可能导致预报结果有偏差.(6)独立性检验是用来考察两个分类变量是否有关系,计算随机变量的观测值K 2,K 2越大,说明两个分类变量有关系的可能性越大.考点2 随机变量及其分布与统计交汇考查题组一 随机变量及其分布与用样本估计总体交汇考查调研1 某高中随机抽取部分高一学生调查其上学路上所需的时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求直方图中x 的值;(2)如果上学路上所需时间不少于1小时的学生可申请在学校住宿,若招生1200名,请估计新生中有多少名学生可以申请住宿;(3)从学校的高一学生中任选4名学生,这4名学生中上学路上所需时间少于 40分钟的人数记为 X ,求X 的分布列和数学期望.(以直方图中的频率作为概率)【答案】( 1 ) 0.0025;(2) 180;(3)见解析.【解析】( 1 )由直方图可得20×(2x +0.005+0.0175+0.0225)=1. ∴x =0.0025 .(2)新生上学所需时间不少于1小时的频率为:20×(0.005+0.0025)=0.15. ∵1200×0.15=180,∴估计1200名新生中有180名学生可以申请住宿. (3)X 的可能取值为0,1,2,3,4.由直方图可知,每位学生上学所需时间少于40分钟的概率为25,P(X =0)=(35)4=81625,P(X =1)=C 41(25)(35)3=216625, P(X =2)=C 42(25)2(35)2=216625,P(X =3)=C 43(25)3(35)=96625,P(X =4)=(25)4=16625.则X 的分布列为:故EX =0×81625+1×216625+2×216625+3×96625+4×16625=85. 即X 的数学期望为85.调研2 在十九大“建设美丽中国”的号召下,某省级生态农业示范县大力实施绿色生产方案,对某种农产品进行改良,为了检查改良效果,从中随机抽取100件作为样本,称出它们的重量(单位:克),重量分组区间为[10,20],(20,30],(30,40],(40,50],由此得到样本的重量频率分布直方图(如图). (1)求a 的值;(2)根据样本数据,估计样本中个体的重量的众数与平均值;(3)以样本数据来估计总体数据,从改良的农产品中随机抽取3个个体,其中重量在[10,20]内的个体的个数为X ,求X 的分布列和数学期望.(以直方图中的频率作为概率)【答案】(1)0.03; (2)25,29.6克; (3)35.【解析】(1)由题意,得(0.02+0.032+a +0.018)×10=1,解得a =0.03. (2)由最高矩形所对应区间中点的横坐标为25, 可估计样本个体重量的众数约为25克,而100件样本重量的平均值为x =0.2×15+0.32×25+0.3×35+0.18×45=29.6(克), 故估计样本中个体重量的平均值约为29.6克.(3)利用样本估计总体,该样本中个体的重量在[10,20]内的概率为0.2, 则X~B(3,15), X =0,1,2,3,P(X =0)=C 30×(1−15)3=64125, P(X =1)=C 31×(1−15)2×15=48125, P(X =2)=C 32×(1−15)×(15)2=12125, P(X =3)=C 33×(15)3=1125.∴X 的分布列为即E(X)=0×64125+1×48125+2×12125+3×1125=35.【名师点睛】本题考查了频率直方图下求平均数与众数和概率的计算问题,也考查了二项分布的应用问题,是中档题.题组二 随机变量及其分布与独立性检验的交汇考查调研3 心理学家发现视觉和空间能力与性别有关,某高中数学兴趣小组为了验证这个结论,从兴趣小组中抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)(1)能否据此判断有97.5%的把握认为视觉和空间能力与性别有关?(2)将以上列联表中女生选做几何题的频率作为概率,从该校1500名女生中随机选6名女生,记6名女生选做几何题的人数为X ,求X 的数学期望E(X)和方差D(X).参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】(1)由表中数据计算得K 2的观测值为k =50×(22×12−8×8)230×20×30×20=509≈5.556>5.024,∴可以判断有97.5%的把握认为视觉和空间能力与性别有关. (2)以列联表中女生选做几何题的频率作为概率,从该校1500名女生中随机选6名女生,记6名女生选做几何题的人数为X , 则X 服从二项分布X ∼B (6,25) ,根据二项分布的期望公式可得数学期望E(X)为6×25=2.4, 根据二项分布的方差公式可得方差为6×25×35=1.44 .1.(四川省成都市蓉城名校联盟2019-2020学年高三上学期第一次联考)某社会机构为了调查对手机游戏的兴趣与年龄的关系,通过问卷调查,整理数据得如下22⨯列联表:(1)根据列联表,能否有99.9%的把握认为对手机游戏的兴趣程度与年龄有关?(2)若已经从40岁以下的被调查者中用分层抽样的方式抽取了5名,现从这5名被调查者中随机选取3名,求这3名被调查者中恰有1名对手机游戏无兴趣的概率.参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)没有 99.9%的把握认为手机游戏的兴趣程度与年龄有关;(2)5. 【思路分析】(1)计算出2K 的观测值k ,根据参考数据判断出没有99.9%的把握认为手机游戏的兴趣程度与年龄有关;(2)利用列举法,结合古典概型概率计算公式,求得所求概率.【解析】(1)由题可得2K 的观测值2100(1050300)10010.8285050455511k ⨯-==<⨯⨯⨯,∴没有99.9%的把握认为手机游戏的兴趣程度与年龄有关.(2)由题得40岁以下的被调查者中用分层抽样的方式抽取的5名人员中有3名对手机游戏很有兴趣, 设为a 、b 、c ;有2名对手机游戏无兴趣,设为d 、e ,从a 、b 、c 、d ,e 中随机选取3名的基本事件有{},,a b c 、{},,a b d 、{},,a b e 、{},,a c d 、{},,a c e 、{},,a d e 、{},,b c d 、{},,b c e 、{},,b d e 、{},,c d e ,共10个.其中d ,e 恰有1个的有{},,a b d 、{},,a b e 、{},,a c d 、{},,a c e 、{},,b c d 、{},,b c e ,共6个 ∴这3名被调查者中恰有1名对手机游戏无兴趣的概率为35. 2.(辽宁省沈阳市沈河区第二中学2019年高三上学期10月月考)汽车尾气中含有一氧化碳(CO ),碳氢化合物(HC )等污染物,是环境污染的主要因素之一,汽车在使用若干年之后排放的尾气中的污染物会出现递增的现象,所以国家根据机动车使用和安全技术、排放检验状况,对达到报废标准的机动车实施强制报废.某环保组织为了解公众对机动车强制报废标准的了解情况,随机调查了100人,所得数据制成如下列联表:(1)若从这100人中任选1人,选到了解机动车强制报废标准的人的概率为35,问是否有95%的把握认为“对机动车强制报废标准是否了解与性别有关”?(2)该环保组织从相关部门获得某型号汽车的使用年限与排放的尾气中CO 浓度的数据,并制成如图所示的折线图,若该型号汽车的使用年限不超过15年,可近似认为排放的尾气中CO 浓度%y 与使用年限t 线性相关,试确定y 关于t 的回归方程,并预测该型号的汽车使用12年排放尾气中的CO 浓度是使用4年的多少倍.参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.用最小二乘法求线性回归方程系数公式:1221ni ii n i i x ynx ybx nx==-=-∑∑$,a y bx =-$$.【答案】(1)有95%的把握认为“对机动车强制报废标准是否了解与性别有关”;(2)0.07y t =$,4.2倍. 【思路分析】(1)先根据题意计算,,,a b p q 的值,然后求出出2K 的观测值,对照临界值得出结论;(2)由公式计算出ˆa和ˆb ,从而得到y 关于t 的回归方程,把12t =,代入回归方程中,可预测该型号的汽车使用12年排放尾气中的CO 浓度,从而可得答案.【解析】(1)设“从100人中任选1人,选到了解机动车强制报废标准的人”为事件A , 由已知得353()1005b P A +==,所以25a =,25b =,40p =,60q =. 所以2K的观测值2100(25352515) 4.167 3.84140605050k ⨯⨯-⨯=≈>⨯⨯⨯,故有95%的把握认为“对机动车强制报废标准是否了解与性别有关”. (2)由折线图中所给数据计算,得1(246810)65t =⨯++++=, 1(0.20.20.40.60.7)0.425y =⨯++++=,故 2.80.0740b ==$,0.420.0760a =-⨯=$,所以所求回归方程为0.07y t =$.故预测该型号的汽车使用12年排放尾气中的CO 浓度为0.84%, 因为使用4年排放尾气中的CO 浓度为0.2%,所以预测该型号汽车使用12年排放尾气中的CO 浓度是使用4年的4.2倍.【名师点睛】本题考查列联表与独立性检验的应用,以及线性回归方程的求法,解题的关键是熟练掌握公式,考查学生基本的计算能力,属于中档题.3.(2019年10月广东省广州市天河区高考数学一模)某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第七组的频率,并完成频率分布直方图;(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.【答案】(1)0.08,绘图见解析;(2)102;(3)25. 【思路分析】(1)由频率分布直方图可得:各小矩形的高之和为0.1,运算可得解;(2)由频率分布直方图中平均数的求法即可得解;(3)样本成绩属于第六组的有3人,样本成绩属于第八组的有2人,则随机抽取2名,基本事件总数为25C 10=,他们的分差的绝对值小于10分包含的基本事件个数为2232C C 4+=,再利用古典概型概率公式运算即可.【解析】(1)由频率分布直方图得第七组的频率为1(0.0040.0120.0160.0300.0200.0060.004)100.08-++++++⨯=.完成频率分布直方图如下:(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为700.00410800.01210900.016101000.030101100.02010⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+1200.006101300.008101400.00410102⨯⨯+⨯⨯+⨯⨯=.(3)样本成绩属于第六组的有0.00610503⨯⨯=人,样本成绩属于第八组的有0.00410502⨯⨯=人, 从样本成绩属于第六组和第八组的所有学生中随机抽取2名,基本事件总数25C 10n ==,他们的分差的绝对值小于10分包含的基本事件个数2232C C 4m =+=,故他们的分差的绝对值小于10分的概率42105m p n ===. 4.(安徽省蚌埠市第二中学2019-2020学年高三上学期期中)在某项娱乐活动的海选过程中评分人员需对同批次的选手进行考核并评分,并将其得分作为该选手的成绩,成绩大于等于60分的选手定为合格选手,直接参加第二轮比赛,不超过40分的选手将直接被淘汰,成绩在(40,60)内的选手可以参加复活赛,如果通过,也可以参加第二轮比赛.(1)已知成绩合格的200名参赛选手成绩的频率分布直方图如图,求a 的值及估计这200名参赛选手的成绩平均数;(2)根据已有的经验,参加复活赛的选手能够进入第二轮比赛的概率为13,假设每名选手能否通过复活赛相互独立,现有3名选手进入复活赛,记这3名选手在复活赛中通过的人数为随机变量X ,求X 的分布列和数学期望.【答案】(1)0.04a =,82;(2)见解析.【思路分析】(1)由频率分布直方图面积和为1,可求得0.04a =.取每个矩形的中点与概率乘积和求得平均数.(2)由二项分布求得分布列与数学期望.【解析】(1)由题意可得(0.010.020.03)1010.04a a +++⨯=⇒=, 估计这200名选手的成绩平均数为650.1750.4850.2950.382⨯+⨯+⨯+⨯=. (2)由题意知,X ~B (3,1/3),X 可能取值为0,1,2,3, 且3312()C ()()iiiP X i -==,所以X 的分布列为所以X 的数学期望为()313E X =⨯=.【名师点睛】本题主要考查随机变量的分布列和期望,考查独立性检验,意在考查离散型随机变量的分布列期望和独立性检验等基础知识的掌握能力,考查学生基本的运算推理能力.5.(江西省吉安市2019-2020学年高三上学期期中)据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.【答案】(1)72;(2)2.【思路分析】(1)由题意得持“应该保留”态度的人为120x+,占总人数3600的0.05,列出对应的概率等式即可算得60x=,再利用分层抽样的方法求解在持“无所谓”态度的人中抽取多少人即可;(2)由分层抽样可求得在校学生为4人,社会人士为2人,再利用超几何分布的方法列出分布列求解期望即可.【解析】(1)因为抽到持“应该保留”态度的人的概率为0.05,所以1200.053600x+=,所以60x=.所以持“无所谓”态度的人数共有3600210012060060720----=,所以应在“无所谓”态度抽取360720723600⨯=人.(2)由(1)知持“应该保留”态度的一共有180人,所以在所抽取的6人中,在校学生为12064180⨯=人,社会人士为6062180⨯=人,则第一组在校学生人数1,2,3ξ=,且124236C C1(1)C5Pξ===,214236C C3(2)C5Pξ===,304236C C1(3)C5Pξ===,故ξ的分布列为所以()1232555Eξ=⨯+⨯+⨯=.【名师点睛】本题主要考查分层抽样的一般方法与超几何分布的一般方法.同时也考查了分布列与数学期望的方法,属于中等题型.6.(江西省南昌市东湖区第十中学2019-2020学年高三上学期期中)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表:平均每天喝500ml以上为常喝,体重超过50kg为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为15.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由;(3)已知常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析;(2)有99%的把握认为肥胖与常喝碳酸饮料有关;(3)15.【思路分析】(1)根据题中不常喝碳酸饮料的肥胖人数和不肥胖人数及总人数即可完成列联表;(2)利用公式求出2K的的观测值,与临界值比较可得到把握性大小;(3)设常喝碳酸饮料的肥胖者男生为A、B、C、D,女生为E、F,列举出任选两人的所有取法,找出正好抽到一男一女的取法可得概率.【解析】(1)设常喝碳酸饮料肥胖的学生有x人,343015x+=,6x=,补充完整的22⨯列联表如下:(2)由已知数据可求得:2230(6824)8.522 6.6351020822K⨯-⨯=≈>⨯⨯⨯,因此有99%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖者男生为A、B、C、D,女生为E、F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF EF,共15种,其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种,故抽出一男一女的概率为815P=.7.(吉林省长春市2020届高三一模)环保部门要对所有的新车模型进行广泛测试,以确定它的行车里程的等级,右表是对100辆新车模型在一个耗油单位内行车里程(单位:公里)的测试结果.(1)做出上述测试结果的频率分布直方图,并指出其中位数落在哪一组;(2)用分层抽样的方法从行车里程在区间[38,40)与[40,42)的新车模型中任取5辆,并从这5辆中随机抽取2辆,求其中恰有一个新车模型行车里程在[40,42)内的概率.【答案】(1)频率分布直方图见解析,中位数在区间[36,38);(2)35.【思路分析】(1)画出频率分布直方图后,找到频率总和为0.5时对应的分组区间;(2)先利用分层抽样计算每组内抽取的辆数,然后对车辆进行标记,利用古典概型计算目标事件的概率.【解析】(1)由题意可画出频率分布直方图如图所示:。

2020高考数学分类汇编--概率统计

2020高考数学分类汇编--概率统计

2020年普通高等学校招生全国统一考试一卷理科数学5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是 A .y a bx =+ B .2y a bx =+ C .e x y a b =+ D .ln y a b x =+19.(12分)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束. 经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率. 5.D6.B7.C 8.C19.解:(1)甲连胜四场的概率为116. (2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684 ---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为11117 8168816+++=.2020年普通高等学校招生全国统一考试理科数学3.在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单配货,由于订单量大幅增加,导致订单积压,为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A.10名B.18名C.24名D.32名18.(12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据()()20,,2,1,⋯=iyxii ,其中ix和i y分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑==20160iix,∑==2011200i iy,()∑==-201280i ix x,()∑==-20129000i iyy,()()080201∑==--i i iy y x x.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本()()20,,2,1,⋯=i y x i i 的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数()()()()∑∑∑===----=ni ini i ni ii y y x x yyx x r 12121,414.12≈.2020年普通高等学校招生全国统一考试理科数学3.在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是 A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====4.Logistic 模型是常用数学模型之一,可应用于流行病学领域.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数()I t (t 的单位:天)的Logistic 模型:0.23(53)()=1e t K I t --+,其中K 为最大确诊病例数.当*()0.95I t K =时,标志着已初步遏制疫情,则t *约为(ln193)≈A .60B .63C .66D .6918.(12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 附:K3.B4.C18.解:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=.(3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.2020年普通高等学校招生全国统一考试文科数学5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是 A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+17.(12分)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:乙分厂产品等级的频数分布表(1(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务? 5.D 17.解:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A 级品的概率的估计值为400.4100=; 乙分厂加工出来的一件产品为A 级品的概率的估计值为280.28100=. (2)由数据知甲分厂加工出来的100件产品利润的频数分布表为因此甲分厂加工出来的100件产品的平均利润为65402520520752015100⨯+⨯-⨯-⨯=.由数据知乙分厂加工出来的100件产品利润的频数分布表为因此乙分厂加工出来的100件产品的平均利润为70283017034702110100⨯+⨯+⨯-⨯=.比较甲乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.2020年普通高等学校招生全国统一考试文科数学4.在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者 A .10名 B .18名C .24名D .32名18. (12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i ) (i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i ix x =-=∑(,2021)9000i iy y =-=∑(,201))800ii ix y x y =--=∑((. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=))niix y x y --∑((=1.414.4.B18.解:(1)由己知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200= 12 000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20))0.943i ix yrx y--===≈∑((.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.2020年普通高等学校招生全国统一考试文科数学3.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为A.0.01B.0.1C.1D.104.Logistic模型是常用数学模型之一,可应用于流行病学领城.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数I(t)(t的单位:天)的Logistic模型:0.23(53)()=1e tIKt--+,其中K为最大确诊病例数.当I(*t)=0.95K时,标志着已初步遏制疫情,则*t约为(ln19≈3)A.60B.63C.66D.6918.(12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,3.C4.C18.解:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.2020年普通高等学校招生全国统一考试(北京卷)数 学(18)(本小题14分)某校为举办甲乙两项不同活动,分别设计了相应的活动方案:方案一、方案二、为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率,该校女生支持方案一的概率:(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案二的概率估计值记为0p,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p,试比较0p与1p的大小.(结论不要求证明)2020年普通高等学校招生全国统一考试(江苏卷)4.将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是▲ .4.1 923.(本小题满分10分)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为X n,恰有2个黑球的概率为p n,恰有1个黑球的概率为q n.(1)求p1,q1和p2,q2;(2)求2p n+q n与2p n-1+q n-1的递推关系式和X n的数学期望E(X n)(用n表示) .23.满分10分.解:(1)113111133C C 1C C 3p =⋅=,113211133C C 2C C 3q =⋅=,11113121211111*********C C C C 1270(1)C C C C 3927p p q p q p q =⋅⋅+⋅⋅+⋅--=+=,1111111133222112211111111111133333333C C C C C C C C ()(1)C C C C C C C C q p q p q =⋅⋅+⋅+⋅⋅+⋅⋅--11216=9327q -+=.(2)当2n ≥时,1111312111111111113333C C C C 120(1)C C C C 39n n n n n n n p p q p q p q ------=⋅⋅+⋅⋅+⋅--=+,①111111113322211211111111111133333333C C C C C C C C ()(1)C C C C C C C C n n n n n q p q p q ----=⋅⋅+⋅+⋅⋅+⋅⋅--112=93n q --+,②2⨯+①②,得()1111124121222399333n n n n n n n p q p q q p q -----+=+-+=++. 从而1112(211)3n n n n p q p q ---+-+=,又111312p q -+=,所以11112()1()3331n nn n p q -+++==,*n ∈N .③由②,有1313()595n n q q --=--,又135115q -=,所以1113()1595n n q -=-+,*n ∈N . 由③,有13111()210111()()33925n n n n n p q =+=-+-+[],*n ∈N . 故311111()()109235n n n n p q --=--+,*n ∈N . n X 的概率分布则*1()0(1)121(),3n n n n n n E X p q q p n =⨯--+⨯+⨯=+∈N .2020年普通高等学校招生全国统一考试(天津卷)数学4.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A.10 B.18 C.20 D.3613.已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.4.B13.16;232020年普通高等学校招生全国统一考试5.某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是 A .62%B .56%C .46%D .42%12.信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.A .若n =1,则H (X )=0B .若n =2,则H (X )随着i p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y )19.(12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,5.C 12.AC19.解:(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得22100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯. 由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.2020年普通高等学校招生全国统一考试(浙江卷)数 学16.盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则(0)P ξ==_______,()E ξ=_______. 16.1,13。

2020版高考理数:专题(12)概率与统计ppt课件四

2020版高考理数:专题(12)概率与统计ppt课件四
6
考点四 统计与统计案例
3.系统抽样
(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后 按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种 抽样的方法叫做系统抽样. (2)特点:①系统抽样适用于总体容量较大的情况; ②系统抽样是不放回抽样;
③系统抽样中,每个个体被抽到的可能性相等,均为 (N为总体的个体数, n为抽取的样本容量,n≤N);
③若x1,x2,…,xn的方差为s2,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
14
考点四 统计与统计案例
8.线性回归方程及其应用
(1)变量间的相关关系 变量间的关系常见的有两类,一类是确定性关系,即函数关系;另一类是 变量与变量之间虽然确定存在关系,但是却不具有函数关系所要求的确定 性,它们的关系是当一变量取值一定时,另一变量的取值带有一定的随机 性的两个变量间的关系,我们把这种关系称为相关关系.
(4)茎叶图:茎叶图也是用来表示数据的一种图,茎是指中间的一列数,叶 是指从茎的旁边生长出来的数.
各种统计图表的优点与不足:
分类 频率分布表 频率分布直方图 频率分布折线图
茎叶图
优点
表示数据较确切 表示数据分布情况非常直观
能反映数据的变化趋势 一是所有的信息都可以从这个 茎叶图中得到;二是茎叶图便 于记录和表示,能够展示数据
(5)相关系数r ①|r|≤1,当r>0时,两个变量正相关;
当r<0时,两个变量负相关. ②|r|越接近于0,两个变量的线性相关关系越弱.通常当|r|>0.75时,我们认 为两个变量之间存在较强的线性相关关系.当|r|=1时,所有点均在直线上. (6)相关指数R2 用越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果 越差.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率

【600分考点-700分考法】2020版高考数学(理科):专题(12)概率与统计课件(附答案)

【600分考点-700分考法】2020版高考数学(理科):专题(12)概率与统计课件(附答案)

17
考点一 随机事件的概率、古典概型和几何概型
例3经统计,在某储蓄所一个营业窗口等候的人数及相应的概率如下表.
排队人数
0
1
2 3 4 5人及5人以上
概率
0.1 0.16 0.3 0.3 0.1
0.04
求:(1)至多2人排队等候的概率; (2)至少3人排队等候的概率.
方法二:记“至少3人排队等候”为事件H,则其对立事件为事件G,所以P(H)= 1-P(G)=0.44.
核心方法 重点突破
方法1 概率与频率关系的应用
随机事件的频率与概率的常见题型及解题策略 (1)补全或列出频率分布表:可直接依据已知条件,逐一计 数,写出频率. (2)由频率估计概率:先根据已知条件计算所求事件发生的 频数,再计算事件发生的频率,最后根据频率与概率的关 系,由频率直接估计概率. (3)由频率估计某部分的数值:可由频率估计概率,再由概 率估算某部分的数值.
【解析】在A中,至少有1件次品与至多有1件正品能同时发生,不是互斥事件,故A错误; 在B中,恰有1件次品与恰有2件正品不能同时发生,但能同时不发生,是互斥而不对立 的两个事件,故B正确; 在C中,至少有1件次品与至少有1件正品能同时发生,不是互斥事件,故C错误; 在D中,至少有1件次品与都是正品是对立事件,故D错误. 【答案】B
下列三类试验不是古典概型:(1)基本事件个数有限,但非等可能;(2)基 本事件个数无限,但等可能;(3)基本事件个数无限,也非等可能.
9
考点一 随机事件的概率、古典概型和几何概型
(4)古典概型的概率公式
①在基本事件总数为n的古典概型中,每个基本事件发生的 概率都是相等的,即每个基本事件发生的概率都是n(1). ②如果随机事件A包含的基本事件数为m,由互斥事件的概 率加法公式可得P(A)=n(m). 对于古典概型,随机事件A的概率为

2020年高考理科数学《概率与统计》题型归纳与训练及答案解析

2020年高考理科数学《概率与统计》题型归纳与训练及答案解析

2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。

2020届全国各地高考试题分类汇编14 概率、统计

2020届全国各地高考试题分类汇编14 概率、统计

等级为 2 的概率为 5 10 12 0.27 ,等级为 3 的概率为 6 7 8 0.21 ,等级为 4 的概
100
100
率为 7 2 0 0.09 ; 100
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
100 20 30035 500 45 350 100
(3) 2 2 列联表如下:
生,除一年级外其他年级学生支持方案二的概率估计值记为 p1 ,试比较 p0 与 p1 的大小.(结
论不要求证明)
【解析】(Ⅰ)该校男生支持方案一的概率为 200 1 , 200+400 3
该校女生支持方案一的概率为 300 3 ; 300+100 4
(Ⅱ)3 人中恰有 2 人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一
D. 若 n=2m,随机变量 Y 所有可能的取值为1, 2,, m ,且 P(Y j) p j p2m1 j ( j 1, 2, , m) ,
则 H(X)≤H(Y) 【答案】AC
【解析】对于 A 选项,若 n 1 ,则 i 1, p1 1,所以 H X 1 log2 1 0 ,所以 A
因此,最适合作为发芽率 y 和温度 x 的回归方程类型的是 y a b ln x .故选:D.
3.(2020•全国 1 卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者
被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一
场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直
因此,B 选项这一组的标准差最大.故选:B.
6.(2020•全国 3 卷)某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当天

全国通用2020_2022三年高考数学真题分项汇编专题15概率与统计解答题理(含答案及解析)

全国通用2020_2022三年高考数学真题分项汇编专题15概率与统计解答题理(含答案及解析)

全国通用2020_2022三年高考数学真题分项汇编:15 概率与统计(解答题)(理科专用)1.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为2.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R . (ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析(2)(i )证明见解析;(ii)R =6; 【解析】 【分析】(1)由所给数据结合公式求出K 2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i )结合已知数据求R . (1)由已知K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K 2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. (2)(i)因为R =P(B|A)P(B ̅|A)⋅P(B̅|A )P(B|A )=P(AB)P(A)⋅P(A)P(AB ̅)⋅P(A B̅)P(A )⋅P(A )P(A B ), 所以R =P(AB)P(B)⋅P(B)P(A B )⋅P(A B̅)P(B̅)⋅P(B ̅)P(AB ̅) 所以R =P(A|B)P(A |B)⋅P(A |B̅)P(A|B ̅), (ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=63.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.4.【2021年新高考1卷】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B 类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)B类.【解析】【分析】(1)通过题意分析出小明累计得分X的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答B类问题的数学期望,比较两个期望的大小即可.【详解】(1)由题可知,X的所有可能取值为0,20,100.()010.80.2P X==-=;()()200.810.60.32P X==-=;()1000.80.60.48P X==⨯=.所以X的分布列为(2)由(1)知,()00.2200.321000.4854.4E X=⨯+⨯+⨯=.若小明先回答B问题,记Y为小明的累计得分,则Y的所有可能取值为0,80,100.()010.60.4P Y==-=;()()800.610.80.12P Y==-=;()1000.80.60.48P X==⨯=.所以()00.4800.121000.4857.6E Y =⨯+⨯+⨯=. 因为54.457.6<,所以小明应选择先回答B 类问题.5.【2021年新高考2卷】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X 表示1个微生物个体繁殖下一代的个数,()(0,1,2,3)i P X i p i ===.(1)已知01230.4,0.3,0.2,0.1p p p p ====,求()E X ;(2)设p 表示该种微生物经过多代繁殖后临近灭绝的概率,p 是关于x 的方程:230123p p x p x p x x +++=的一个最小正实根,求证:当()1E X ≤时,1p =,当()1E X >时,1p <;(3)根据你的理解说明(2)问结论的实际含义. 【答案】(1)1;(2)见解析;(3)见解析. 【解析】 【分析】(1)利用公式计算可得()E X .(2)利用导数讨论函数的单调性,结合()10f =及极值点的范围可得()f x 的最小正零点. (3)利用期望的意义及根的范围可得相应的理解说明. 【详解】(1)()00.410.320.230.11E X =⨯+⨯+⨯+⨯=.(2)设()()3232101f x p x p x p x p =++-+,因为32101p p p p +++=,故()()32322030f x p x p x p p p x p =+-+++,若()1E X ≤,则123231p p p ++≤,故2302p p p +≤.()()23220332f x p x p x p p p '=+-++,因为()()20300f p p p '=-++<,()230120f p p p '=+-≤, 故()f x '有两个不同零点12,x x ,且1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<; 故()f x 在()1,x -∞,()2,x +∞上为增函数,在()12,x x 上为减函数, 若21x =,因为()f x 在()2,x +∞为增函数且()10f =,而当()20,x x ∈时,因为()f x 在()12,x x 上为减函数,故()()()210f x f x f >==,故1为230123p p x p x p x x +++=的一个最小正实根,若21>x ,因为()10f =且在()20,x 上为减函数,故1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤,则1p =.若()1E X >,则123231p p p ++>,故2302p p p +>. 此时()()20300f p p p '=-++<,()230120f p p p '=+->, 故()f x '有两个不同零点34,x x ,且3401x x <<<, 且()()34,,x x x ∈-∞+∞时,()0f x '>;()34,x x x ∈时,()0f x '<;故()f x 在()3,x -∞,()4,x +∞上为增函数,在()34,x x 上为减函数, 而()10f =,故()40f x <,又()000f p =>,故()f x 在()40,x 存在一个零点p ,且1p <.所以p 为230123p p x p x p x x +++=的一个最小正实根,此时1p <,故当()1E X >时,1p <.(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.6.【2020年新课标1卷理科】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率. 【答案】(1)116;(2)34;(3)716. 【解析】 【分析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率. 【详解】(1)记事件:M 甲连胜四场,则()411216P M ⎛⎫== ⎪⎝⎭;(2)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 则四局内结束比赛的概率为()()()()411424P P ABAB P ACAC P BCBC P BABA ⎛⎫'=+++=⨯= ⎪⎝⎭,所以,需要进行第五场比赛的概率为314P P '=-=; (3)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 记事件:M 甲赢,记事件:N 丙赢,则甲赢的基本事件包括:BCBC 、ABCBC 、ACBCB 、 BABCC 、BACBC 、BCACB 、BCABC 、BCBAC ,所以,甲赢的概率为()4511972232P M ⎛⎫⎛⎫=+⨯= ⎪ ⎪⎝⎭⎝⎭.由对称性可知,乙赢的概率和甲赢的概率相等, 所以丙赢的概率为()97123216P N =-⨯=. 【点睛】本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能力,属于中等题.7.【2020年新课标2卷理科】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi ,yi )(i =1,2,…,20),其中xi 和yi 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021)80i i x x =-=∑(,2021)9000i i y y =-=∑(,201))800ii ix y x y =--=∑((. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi ,yi )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.【答案】(1)12000;(2)0.94;(3)详见解析 【解析】 【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式20()()iix x y y r --=∑计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样. 【详解】(1)样区野生动物平均数为201111200602020i i y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20()()0.94iix x y y r --===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计. 【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.8.【2020年新课标3卷理科】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:2()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【解析】 【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率; (2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论. 【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=; (2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()21003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.9.【2020年新高考1卷(山东卷)】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:11 (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关? 附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.64;(2)答案见解析;(3)有.【解析】【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得22⨯列联表;(3)计算出2K ,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:22⨯222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善22⨯列联表,考查了独立性检验,属于中档题.。

2020年高考数学理科热点题型:概率与统计含参考答案

2020年高考数学理科热点题型:概率与统计含参考答案

概率与统计热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23. 设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i.(1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4.且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827, P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝ ⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝ ⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题4由独立重复试验,4人中恰有i 人参加甲游戏的概率P =C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键.(2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和. 【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14,P (η=1)=C 13·23·⎝ ⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝ ⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118, ∴所求概率为P (B|A )=P (AB )P (A )=11813=16.热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)·P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681.(2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29,P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为E (X )=2×59+3×29+4×81+5×81=81. 【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2 .②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×2+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X 1的数学期望为E(X1)=20×6+60×3+100×6=60(元),X 1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X 2的数学期望为E(X2)=40×6+60×3+80×6=60(元),X 2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11 .②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为X 01 2P 25815115E(X)=0×25+1×815+2×15=15=3.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=CB1CA1∪C B2C A2.P(C)=P(CB1CA1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,即P(C A1)=1620,P(CA2)=420,P(C B1)=1020,P(C B2)=820,故P(C)=1020×1620+820×420=0.48.热点四统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n∑ni =1x i =8010=8, y =1n ∑ni =1y i =2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b ^,a ^的公式进行准确的计算.【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?(2)1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).解(1)完成2×2列联表如下:K 2=100×(40×25-15×20)260×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25.由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i(i =0,1,2,3).X 的分布列为均值E (X )=np =3×5=5,方差D (X )=np (1-p )=3×25×⎝⎛⎭⎪⎫1-25=1825。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2017高考理科专题 概率与统计(解析)一、选择题1. 5个车位分别停放了,,,,,5A B C D E 辆不同的车,现将所有车开出后再按,,,,A B C D E 的次序停入这5个车位,则在A 车停入了B 车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是( ) A.38 B. 340 C. 16 D. 1122.如图是八位同学400米测试成绩的茎叶图(单位:秒),则( )A. 平均数为64B. 众数为7C. 极差为17D. 中位数为64.53.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币.若 硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两 个人站起来的概率为( ) A.516 B. 1132 C. 1532D. 12 4. 5名学生进行知识竞赛.笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”.根据以上信息,这5人的笔试名次的所有可能的种数是( ) A. 54 B. 72 C. 78 D. 965.已知5件产品中有2件次品,现逐一检测,直至能确定...所有次品为止,记检测的次数为ξ,则E ξ=( ) A. 3 B.72 C. 185D. 4 6.将编号为1,2,3,4,5,6的六个小球放入编号为1,2,3,4,5,6的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是A. 40B. 60C. 80D. 1007.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据表可得回归直线方程ˆˆˆybx a =+,其中ˆ 2.4b =, ˆˆa y bx =-,据此模型预测广告费用为9万元时,销售轿车台数为A. 17B. 18C. 19D. 20二、填空题8.有3女2男共5名志愿者要全部分到3个社区去参加志愿服务,每个社区1到2人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________. 10.从1,2,3,4,5,6,7这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________.三、解答题11.一企业从某生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到的频率分布直方图如图.(1)估计该技术指标值x 平均数x ;(2)在直方图的技术指标值分组中,以x 落入各区间的频率作为x 取该区间值的频率,若4x x ->,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格产品的个数为ξ,求ξ的数学期望E ξ.12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50万元.保险公司把职工从事的所有岗位共分为A、B、C三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率).(Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限;(Ⅱ)某企业共有职工20000人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润.13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表: 质量指标值m 185m <185205m ≤<205m ≥等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据 ,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定?(2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X 近似满足()~218,140X N ,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?14. “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附: ()()()()()22n ad bc k a b c d a c b d -=++++,()20P K k ≥ 0.10 0.05 0.025 0.0100k2.706 3.841 5.024 6.635(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有X 人,超过10000步的有Y 人,设X Y ξ=-,求ξ的分布列及数学期望.15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表: 质量指标值m 185m <185205m ≤<205m ≥等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X 近似满足()218,140X N ~,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?16.仪器经过检验合格才能出厂,初检合格率为34:若初检不合格,则需要进行调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率为45.每台仪器各项费用如表:项目生产成本检验费/次调试费出厂价金额(元)1000 100 200 3000(Ⅰ)求每台仪器能出厂的概率;(Ⅱ)求生产一台仪器所获得的利润为1600元的概率(注:利润=出厂价-生产成本-检验费-调试费);(Ⅲ)假设每台仪器是否合格相互独立,记X为生产两台仪器所获得的利润,求X的分布列和数学期望.17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。

交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.早高峰时段(T≥3 ),从淮北市交通指挥中心随机选取了一至四马路之间50个交通路段,依据交通指数数据绘制的直方图如图所示:(I)据此直方图估算交通指数T∈[4,8)时的中位数和平均数;(II)据此直方图求出早高峰一至四马路之间的3个路段至少有2个严重拥堵的概率是多少?(III)某人上班路上所用时间若畅通时为20分钟,基本畅通为30分钟,轻度拥堵为35分钟,中度拥堵为45分钟,严重拥堵为60分钟,求此人用时间的数学期望.18.为研究男女同学空间想象能力的差异,孙老师从高一年级随机选取了20名男生、20名女生,进行空间图形识别测试,得到成绩茎叶图如下,假定成绩大于等于80分的同学为“空间想象能力突出”,低于80分的同学为“空间想象能力正常”.(1)完成下面22⨯列联表,并判断是否有90%的把握认为“空间想象能力突出”与性别有关;空间想象能力突出空间想象能力正常合计男生女生合计(2)从“空间想象能力突出”的同学中随机选取男生2名、女生2名,记其中成绩超过90分的人数为ξ,求随机变量ξ的分布列和数学期望.下面公式及临界值表仅供参考:()()()()()22n ad bcXa b c d a c b d-=++++()2P X k≥0.100 0.050 0.010k2.7063.841 6.63519.校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(Ⅰ)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生数;(Ⅱ)根据抽取的180名学生的调查结果,完成下列列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 合计 男生 女生 合计附: ()()()()()22n ab bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0K0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.63510.8287.87920.共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100] 分成5组,制成如图所示频率分直方图.(Ⅰ) 求图中x的值;(Ⅱ) 已知满意度评分值在[90,100]内的男生数与女生数的比为2:1,若在满意度评分值为[90,100]的人中随机抽取4人进行座谈,设其中的女生人数为随机变量X,求X的分布列和数学期望.21.在某单位的职工食堂中,食堂每天以3元/个的价格从面包店购进面包,然后以5元/个的价格出售.如果当天卖不完,剩下的面包以1元/个的价格卖给饲料加工厂.根据以往统计资料,得到食堂每天面包需求量的频率分布直方图如下图所示.食堂某天购进了90个面包,以x (单位:个, 60110x ≤≤)表示面包的需求量, T (单位:元)表示利润.(Ⅰ)求T 关于x 的函数解析式;(Ⅱ)根据直方图估计利润T 不少于100元的概率; (III )在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中间值的概率(例如:若需求量[)60,70x ∈,则取65x =,且65x =的概率等于需求量落入[)60,70的频率),求T 的分布列和数学期望.。

相关文档
最新文档