专题09 概率统计-备战2021年高考数学(文)经典小题考前必刷 (解析版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题09 概率统计
.
平均数、中位数与众数的异同:
⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑴平均数、众数和中位数都有单位;
⑴平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑴中位数不受个别偏大或偏小数据的影响; 概率的基本性质 1、基本概念:
(1)事件的包含、并事件、交事件、相等事件
(2)若A ∩B 为不可能事件,即A ∩B=ф,那么称事件A 与事件B 互斥;
(3)若A ∩B 为不可能事件,A ∪B 为必然事件,那么称事件A 与事件B 互为对立事件;
(4)当事件A 与B 互斥时,满足加法公式:P(A ∪B)= P(A)+ P(B);若事件A 与B 为对立事件,则A ∪B 为必
然事件,所以P(A ∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)
2、概率的基本性质:
1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1; 2)当事件A 与B 互斥时,满足加法公式:P(A ∪B)= P(A)+ P(B);
3)若事件A 与B 为对立事件,则A ∪B 为必然事件,所以P(A ∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B); 4)互斥事件与对立事件的区别与联系,互斥事件是指事件A 与事件B 在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A 发生且事件B 不发生;(2)事件A 不发生且事件B 发生;(3)事件A 与事件B 同时不发生,而对立事件是指事件A 与事件B 有且仅有一个发生,其包括两种情形;(1)事件A 发生B 不发生;(2)事件B 发生事件A 不发生,对立事件互斥事件的特殊情形。
统计案例
1.线性回归方程
①变量之间的两类关系:函数关系与相关关系;
②制作散点图,判断线性相关关系
③线性回归方程:a bx y +=∧
(最小二乘法)
1
221n
i i i n
i
i x y nx y b x nx a y bx
==⎧
-⎪
⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
相关系数(判定两个变量线性相关性):∑∑∑===----=
n
i n
i i i
n
i i i
y y x x
y y x x
r 1
1
2
21
)()()
)((
注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关;
(2)||r 越接近于1,两个变量的线性相关性越强;||r 接近于0时,两个变量之间几乎不存在线性相关关系。
3.回归分析中回归效果的判定: ⑴总偏差平方和:
∑=-n
i i
y y
1
2
)(⑵残差:∧
∧-=i i i y y e ;
⑶残差平方和:2
1
)(∑=∧
-n
i yi yi ;⑷回归平方和:∑=-n
i i
y y
1
2
)(-21
)(∑=∧
-n
i yi yi ;⑸相关指数∑∑==∧
---
=n
i i i
n i i
i y y
y y R 1
2
122)()(1 。
注:①2
R 得知越大,说明残差平方和越小,则模型拟合效果越好;
②2
R 越接近于1,,则回归效果越好。
4.独立性检验(分类变量关系):
随机变量2
K 越大,说明两个分类变量,关系越强,反之,越弱。
2×2列联表
K 2=n (ad−bc )2
(a+b)(c+d)(a+c)(b+d)
难度:★★★☆☆建议用时:15分钟正确率:/15
1.(2021·全国高三专题练习(文))2019年12月12日我国出现了新型冠状病毒所感染的肺炎,新型冠状病毒的传染性极强.下图是2020年1月26号到2月17号全国/湖北/非湖北新增新型冠状病毒感染确诊病例对比图,根据图象下列判断错误的是()
A.该时段非湖北新增感染确诊病例比湖北少
B.全国新增感染确诊病例平均数先增后减
C.2.12全国新增感染确诊病例明显增加,主要是由湖北引起的
D.2.12全国新增感染确诊病例数突然猛增,不会影响该段时期全国新增病例数的中位数
【答案】B
【分析】由图可知A、C正确,2.12之前平均数先增后减,但2.12新增病例数突然猛增,使得平均数也突然增大,但不会影响中位数,选项B错误,D正确.
故选:B.
2.(2021·黑龙江哈尔滨市·哈尔滨三中高三月考(理))下列说法中正确的是()
A.若一组数据1,a,3的平均数是2,则该组数据的方差是2 3
B.线性回归直线不一定过样本中心点(,)
x y
C.若两个随机变量的线性相关越强,则相关系数r的值越接近于1
D.先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150,……的学生,这样的抽样方法是分层抽样
【答案】A
【分析】A. 若一组数据1,a ,3的平均数是2,则2a =,该组数据的方差是
()()()222
1212223233s ⎡⎤=-+-+-=⎣
⎦,故正确;
B. 线性回归直线一定过样本中心点(,)x y ,故错误;
C.若两个随机变量的线性相关越强,则相关系数r 的绝对值越接近于1,故错误;
D.先把高三年级的2000名学生编号:1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m ,然后抽取编号为m +50,m +100,m +150,……的学生,这样的抽样方法是系统抽样,故错误; 故选:A
3.(2021·安徽六安市·六安一中高三月考(文))蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x (每分钟鸣叫的次数)与气温y (单位:⑴)存在着较强的线性相关关系.某地观测人员根据
下表的观测数据,建立了y 关于x 的线性回归方程ˆ0.25y
x k =+
则当蟋蟀每分钟鸣叫60次时,该地当时的气温预报值为( ) A .33⑴ B .34⑴
C .35⑴
D .35.5⑴
【答案】C
【分析】由题意,得40x =,30y =,则0.25300.254020k y x =-=-⨯=; 当60x =时,35y =. 故选:C.
4.(2021·全国高三专题练习(文))人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是( )
A .人口数逐次增加,第二次增幅最大
B .第六次普查人数最多,第四次增幅最小
C .第六次普查人数最多,第三次增幅最大
D .人口数逐次增加,从第二次开始增幅减小
【答案】C
【分析】A.人口数逐次增加,第三次增幅最大,故错误; B.第六次普查人数最多,第六次增幅最小,故错误; C.第六次普查人数最多,第三次增幅最大,故正确; D.人口数逐次增加,从第三次开始增幅减小,故错误; 故选:C
5.(2021·全国高三专题练习(文))已知数据12,,
,n x x x 的平均数为x ,方差为2s ,则123x +,
223x +,…,23n x +的平均数和方差分别为( )
A .x 和2s
B .23x +和24s
C .23x +和2s
D .23x +和24129s s ++
【答案】B
【分析】因为数据12,,
,n x x x 的平均数为x ,方差为2s ,
所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s 故选:B
6.(2021·全国高三专题练习(文))在区间[]10,10-内任取一数x ,则()2log 33x -≤成立的概率为( )
A .
35
B .
34
C .
25
D .
14
【答案】C
【分析】解:由()2log 33x -≤,得:038x <-≤, 解得:53x -≤<, 故所求的概率为()()352
10105
--=--.
故选:C.
7.(2021·湖南长沙市·长沙一中高三月考)两个具有线性相关关系的变量的一组数据()11,x y ,()22,x y ,…
(),n n x y ,下列说法错误的是( )
A .相关系数r 越接近1,变量,x y 相关性越强
B .落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C .相关指数2R 越小,残差平方和越大,即模型的拟合效果越差
D .若x 表示女大学生的身高,y 表示体重则20.64R ≈表示女大学生的身高解释了64%的体重变化 【答案】B
【分析】:对于A. 根据相关系数r 越接近1,变量相关性越强,故正确;
对于B. 回归直线方程拟合效果的强弱是由相关指数2R 或相关系数r 判定,故不正确; 对于C. 相关指数2R 越小,残差平方和越大,效果越差,故正确;
对于D. 根据2R 的实际意义可得,20.64R ≈表示女大学生的身高解释了64%的体重变化,故正确; 故选:B
8.(2021·河南信阳市·高三月考(文))疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:
附表及公式:
2
2
()()()()()
n ad bc K a b c d a c b d -=
++++,n a b c d =+++.
现从试验动物中任取一只,取得“注射疫苗”的概率为5
,则下列判断错误的是( ) A .注射疫苗发病的动物数为10
B .从该试验未注射疫苗的动物中任取一只,发病的概率为23
C .能在犯错概率不超过0.001的前提下,认为疫苗有效
D .该疫苗的有效率为75% 【答案】D
【分析】由题知:注射疫苗动物共40只,未注射为60只, 补充列联表,
由此可得A 、B 正确.
计算得:2
2
100(20104030)16.6710.82860405050
K ⨯⨯-⨯==>⨯⨯⨯,
故能在犯错概率不超过0.001的前提下认为疫苗有效.C 正确,D 错误. 故选:D .
9.(2021·江西赣州市·高三期末(文))对具有线性相关关系的变量x ,y ,有一组观测数据(),(1,2,,8)i i x y i =⋅⋅⋅,其回归直线方程是4y x a =-+,且1282x x x ++⋅⋅⋅+=,12832y y y ++⋅⋅⋅+=-,则实数a 的值为( ) A .-5
B .-24
C .5
D .-3
【答案】D 解:根据题意知,1282x x x ++⋯+=,12832y y y ++⋯+=-,
∴11284
x =⨯=,
()1
3248
y =⨯-=-,
∴回归直线4y x a =-+过样本中心点1
(,4)4-,
∴1444
a -=-⨯+,
即实数3a
=-.
故选:D .
10.(2021·四川高三月考(文))2020年春季.新冠肺炎疫情在全球范围内相维爆发.因为政治制度、文化背景等因素的不同.各个国家疫情防控的效果具有明显差异.右图是西方某国在60天内感染新冠肺炎的累计病例人数y (万人)与时间t (天)的散点图.则下列最适宜作为此模型的回归方程的类型是( )
A .y a bx =+
B .y a =+
C .x y a be =+
D .ln y a b x =+
【答案】C 【分析】
根据散点图,对A 、B 、C 、D 进行分析.
【详解】
根据散点图,可以看出,三点大致分布在一条“指数”函数曲线附近,
选项A 对应的“直线型”的拟合函数;选项B 对应的“幂函数型”的拟合函数;选项D 对应的“对数型”的拟合函数; 故选:C
11.(2021·陕西西安市·西安中学高三月考(文))设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,,n ),用最小二乘法建立的回归方程为y =0.85x
-85.71.
①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );
③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则其体重必为58.79 kg . 则上述判断不正确的个数是( ) A .1 B .2
C .3
D .4
【答案】A
【分析】对选项A ,因为0.850>,所以y 与x 具有正的线性相关关系,故A 正确; 对选项B ,回归直线过样本中心()
,x y ,故B 正确; 对选项C ,因为回归方程为0.8585.71y x =-, 所以身高增加1cm ,则其体重约增加0.85kg ,故C 正确. 对选项D ,170x =时,0.8517085.7158.79y =⨯-=, 但这是预测值,不可断定其体重为58.79kg ,故D 错误. 故选:A
12.(2021·内蒙古包头市·高三期末(文))对具有线性相关关系的变量x 和y ,测得一组数据如下表:若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为( )
A . 6.517y x =+
B . 6.518y x =+
C . 6.527.5y x =+
D . 6.517.5y x =+
【答案】D 【分析】因为245683040605070
5,5055
x y ++++++++=
===,
所以样本中心为:()5,50,
设回归直线方程为 6.5y x a =+,又直线过样本中心, 解得17.5a =,
所以这条回归直线方程为 6.517.5y x =+ 故选:D
13.(2021·江西高三其他模拟(文))江西省重点中学协作体于2020年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是( )
A .得分在[40,60)之间的共有40人
B .从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5
C .这100名参赛者得分的中位数为65
D .可求得0.005a = 【答案】C
【分析】由频率分布直方图,可得
A 中,得分在[40,60)之间共有[1(0.030.020.01)10]10040-++⨯⨯=人,所以A 正确;
B 中,从100名参赛者中随机选取1人,
其得分在[60,80)中的概率为(0.030.02)100.5+⨯=,所以B 正确;
D 中,由频率分布直方图的性质,可得(0.010.0350.030 2.0200.010)101a +++++⨯=,
解得0.005a =,所以D 正确.
C 中,前2个小矩形面积之和为0.4,前3个小矩形面积之和为0.7,所以中位数在[60,70],这100名参赛者得分的中位数为0.50.4601063.30.3-+
⨯≈,所以C 不正确; 故选:C.
14.(2021·全国高三月考(文)) 2.5PM 是评估空气质量的一个重要指标,我国 2.5PM 标准采用世卫组织设定的最宽限值,即 2.5PM 月均值在335μg m 以下空气质量为一级,在33575μg m 之间空气质量为二级,在375μg m 以上空气质量为超标.某地区2020年1月至12月的 2.5PM 月均值(单位:3μg m )的统计数据如图所示,则下列叙述不正确的是( )
A .该地区一年中空气质量超标的月份只有1个月
B .该地区一年中 2.5PM 月均值2月到7月的方差比8月到11月的方差大
C .该地区上半年中 2.5PM 月均值的平均数约为61.83
D .该地区从2月份到7月份 2.5PM 值持续增加
【答案】D
【分析】对于A 项,该地区一年中空气质量超标的月份只有6月份,故A 正确;
对于B 项,由折线图中数据可知,2月到7月相比8月到11月数据较为分散,则2月到7月的方差比8月到11月的方差大,故B 正确;
对于C 项,55455665688261.836
+++++≈,故C 正确; 对于D 项,该地区从2月份到7月份 2.5PM 值先增加后减小,故D 错误;
故选:D
15.(2021·山东高三专题练习)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.如图是2018年9月到2019年2月这半年中,某个关键词的搜索指数变化的走势图.
根据该走势图,下列结论正确的是( )
A .这半年中,网民对该关键词相关的信息关注度呈周期性变化
B .这半年中,网民对该关键词相关的信息关注度不断减弱
C .从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差
D .从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值
【答案】D
【详解】
对于A ,并无周期变化,故A 错,
对于B ,并不是不断减弱,中间有增强.故B 错,
对于C ,10月份的波动大小大于11月份,所以方差要大.故C 错,
对于D ,由图可知,12月起到1月份有下降的趋势,所以去年12月份的平均值大于今年1月份的平均值.故
D 正确,
故选:D .
16.(2021·河南信阳市·高三期末(文))已知sin y x =,在区间[],ππ-上任取一个实数x ,则y ≥12
-的概率为( )
A .712
B .23
C .34
D .56
【答案】B 【分析】
1sin ,[,]2
y x x ππ=≥-∈-, 5[,][,]66
x ππππ∴∈--⋃-, 则满足12
y ≥-的概率为: 5()()26
6()3P ππππππ---+--==--. 故选:B.
17.(2021·全国高三专题练习(文))中国古代几何中的勾股容圆,是阐述直角三角形中内切圆问题.此类问题最早见于《九章算术》“勾股”章,该章第16题为:“今有勾八步,股十五步,间勾中容圆,径几何?”意思是“直角三角形的两条直角边分别为8和15,则其内切圆直径是多少?”若向上述直角三角形内随机抛掷100颗米粒(大小忽略不计,取3π=),落在三角形内切圆内的米粒数大约为( )
A .55
B .50
C .45
D .40 【答案】C
17=,设三角形内切圆的半径为r ,面积为S , 利用等面积法可知()118158151722
S r =⨯⨯=⨯++,解得:3r =, 向该直角三角形内随机抛掷100颗米粒,设落在三角形内切圆内的米粒数大约为x , 则利用几何概型可知:2π311008152x ⨯=⨯⨯,解得:2π31004518152
x ⨯⨯==⨯⨯颗. 所以落在三角形内切圆内的米粒数大约为45.
故选:C。