人教A版2021届高考数学二轮复习(理)讲义及题型归纳(基础):概率与统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率与统计
一、考纲解读
1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究
1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲
(一).条件概率与独立事件
(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=
P B A ()()
P AB P A 。
(2)若()=P B A P B (),即()=()()P AB P A P B ,称A 与B 为相互独立事件。
A 与
B 相互独立,
即A 发生与否对B 的发生与否无影响,反之亦然。
即,A B 相互独立,则有公式()=()()P AB P A P B 。
(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A
在其中一次实验中发生的概率为()P A p = ,则()()1n k
k k
n n
P k C p p -=- .
(二).离散型随机变量分布列、期望、方差及其性质
(1)离散型随机变量ξ的分布列(如表13-1所示).
表13-1
①()11,i p i n i N θ*≤≤≤≤∈ ; ②121n p p p ++
= .
(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+. (3)D ξ表示ξ的方差:()()()2
2
2
1122=---n n E p E p E p D ξξξξξξξ++
+,反映随机
变量ξ取值的波动性。
D ξ越小表明随机变量越稳定,反之越不稳定。
若随机变量
ξη,满足=a b ηξ+
,则2=D a D ηξ。
(三).几种特殊的分布列、期望、方差
(1)两点分布(又称0,1分布)
E ξ=p ,D ξ=()1p p - .
(2)二项分布:若在一次实验中事件发生的概率为p ()01p <<,则在n 次独立
重复实验中恰好发生k 次概率()=p k ξ= ()
1n k
k k
n C p p --()0,1,2,,k n =⋯,称ξ服
从参数为,n p 的二项分布,记作ξ ~(),B n p ,E ξ=np ,D ξ=()1p p -. (3)几何分布:若在一次实验中事件发生的概率为()01p p << ,则在n 次独立重复实验中,在第k 次首次发生的概率为()()
1
1k p k p p -=- ,
1,2,k =⋯, 1
=E p
ξ。
(4)超几何分布:总数为N 的两类物品,其中一类为M 件,从N 中取n 件恰含
M 中的m 件,0,1,2,m k =⋯ ,其中k 为M 与n 的较小者,()=P m ξ=m n m M N M
n
N
C C C --,称ξ 服从参数为,,N M n 的超几何分布,记作ξ ~(),,H N M n ,此时有公式
=
E nM
N
ξ。
(四).正态分布
(1)若X 是正态随机变量,其概率密度曲线的函数表达式为
(
)()2
2
2x f x μσ--
=
,x R ∈ (其中,μσ是参数,且0σ>,μ-∞<<+∞)。
其图像如图13-7所示,有以下性质: ①曲线在x 轴上方,并且关于直线x μ=对称;
②曲线在x μ=处处于最高点,并且此处向左右两边延伸时,逐渐降低,呈现“中间高,两边低”的形状;
③曲线的形状由σ确定,σ越大,曲线越“矮胖”,σ越小,曲线越“高瘦”; ④()f x 图像与x 轴之间的面积为1.
(2)E ξ=μ ,D ξ=2σ ,记作ξ ~()2,N μσ.
当0,1μσ==时, ξ服从标准正态分布,记作ξ ~()0,1N .
(3)ξ ~()2,N μσ,则ξ在(),μσμσ-+, ()2,2μσμσ-+,()3,3μσμσ-+上取值的概率分别为68.3%,95.4%,99.7%,这叫做正态分布的3σ原则。
四、解答题总结
1.某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,
(4)(6)P X P X =<=,则p = A .0.7
B .0.6
C .0.4
D .0.3
2.设01p <<,随机变量ξ的分布列是
则当p 在(0,1)内增大时,
A .()D ξ减小
B .()D ξ增大
C .()
D ξ先减小后增大
D .()D ξ先增大后减小
3.已知随机变量i ξ满足(1)i i P p ξ==,(0)1i i P p ξ==-,i =1,2.
若121
02
p p <<<
,则 A .1()E ξ<2()E ξ,1()D ξ<2()D ξ B .1()E ξ<2()E ξ,1()D ξ>2()D ξ C .1()E ξ>2()E ξ,1()D ξ<2()D ξ
D .1()
E ξ>2()E ξ,1()D ξ>2()D ξ
4.已知甲盒中仅有1个球且为红球,乙盒中有个红球和个篮球,从乙盒中随机抽取个球放入甲盒中. (a )放入个球后,甲盒中含有红球的个数记为;
(b )放入个球后,从甲盒中取1个球是红球的概率记为.则 A . B . C . D .
答案
1.B 【解析】由题意知,该群体的10位成员使用移动支付的概率分布符合二项分布,所以10(1) 2.4DX p p =-=,所以0.6p =或0.4p =.
由(4)(6)P X P X =<=,得4466
6410
10C (1)C (1)p p p p -<-,即22(1)p p -<,所以m n ()3,3m n ≥≥()1,2i i =i ()1,2i
i ξ
=i ()1,2i p i =()()1212,p p E E ξξ><()()1212,p p E E ξξ<>()()1212,p p E E ξξ>>()()1212,p p E E ξξ<<
0.5p >,所以0.6p =.故选B .
以当p 在(0,1)内增大时,()D ξ先增大后减小.故选D . 3.A 【解析】由题意可得
由两点分布11()E p ξ=,22()E p ξ=;111()(1)D p p ξ=-,222()(1)D p p ξ=-,
∵2
2212211212
1()()(1)(1)()()D D p p p p p p p p ξξ-=---=--- 2121()(1)p p p p =---
∴1()E ξ<2()E ξ,1()D ξ<2()D ξ,选A .
统计与统计案例
一、考纲解读
1. 理解随机抽样的必要性和重要性。
2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。
4. 理解样本数据标准差的意义和作用,会计算数据标准差。
5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。
(1)独立性检验
了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。
(2)回归分析
了解回归分析的基本思想、方法及其简单应用。
二、命题趋势探究
1. 本节内容是高考必考内容,以选择题、填空题为主。
2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。
(1)(2)有结合趋势,考题难度中下。
3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。
三、知识点精讲
(一).抽样方法
三种抽样方式的对比,如表17所示。
(二).样本分析
(1)样本平均值:1
1n
i i x x n ==∑。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:()2
21
1n
i i s x x n ==-∑。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
(三).频率分布直方图的解读
(1)频率分布直方图的绘制 ①由频率分布表求出每组频数n i ; ②求出每组频率i
i n P N
=
(n 为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:aX b ax b +=+,s 2(aX +b )=a 2s 2(X )。
(四).线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。
对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+的求法为
()()()1
1
2
221
1
n n
i i i i
i i n
n i i i i x x y y x y
nx y
b x x x nx
a y bx
====⎧
---⎪
⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑
其中,11n i i x x n ==∑,1
1n
i i y y n ==∑,(x ,y )称为样本点的中心。
步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两
个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关。
(五).独立性
独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。
步骤为列出2⨯2列联表(如表18所示),求出()()()()()
2
2
n ad bc K a b c d a c b d -=++++,并判
断:
表18
若K2>10.8281212
若10.828≥K2>6.635,有99%把握称“A取A1或A2”对“B取B1,B2”有关系;
若6.635≥K2>3.841,有95%把握称“A取A1或A2”对“B取B1,B2”有关系;
若K2≤3.841,没有把握称A与B相关。
四、解答题总结
1.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
建设前经济收入构成比例建设后经济收入构成比例
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
2.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A .月接待游客量逐月增加
B .年接待游客量逐年增加
C .各年的月接待游客量高峰期大致在7,8月份
D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳
3.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.
4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A .56
B .60
C .120
D .140
[17.5,30]
5.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图。
图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃。
下面叙述不正确的是
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均气温高于20℃的月份有5个
6.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为
A.167 B.137 C.123 D.93
7.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是.
A .逐年比较,2008年减少二氧化硫排放量的效果最显著
B .2007年我国治理二氧化硫排放显现成效
C .2006年以来我国二氧化硫年排放量呈减少趋势
D .2006年以来我国二氧化硫年排放量与年份正相关
8.若样本数据1x ,2x ,⋅⋅⋅,10x 的标准差为8,则数据121x -,221x -,⋅⋅⋅,1021x -的标准差为
A .8
B .15
C .16
D .
9.为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为
A .50
B .40
C .25
D .20
10.已知某地区中小学生人数和近视情况分别如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是
A .200,20
B .100,20
C .200,10
D .100,10
11.对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则
A .123p p p =<
B .231p p p =<
C .132p p p =<
D .123p p p ==
12.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是
A .简单随机抽样
B .按性别分层抽样
C .按学段分层抽样
D .系统抽样
13.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为6组:
[40,50), [50,60), [60,70), [70,80), [80,90), [90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为
A .588
B .480
C .450
D .120
14.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以表示:
则7个剩余分数的方差为
A .
B .
C .36 D
15.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是
A .46,45,56
B .46,45,53
C .47,45,56
D .45,47,53 答案:
1.A 【解析】通解 设建设前经济收入为a ,则建设后经济收入为2a ,则由饼图
可得建设前种植收入为0.6a ,其他收入为0.04a ,养殖收入为0.3a .建设后种植收入为0.74a ,其他收入为0.1a ,养殖收入为0.6a ,养殖收入与第三产业收入的总和为1.16a ,所以新农村建设后,种植收入减少是错误的.故选
A .
优解 因为0.60.372<⨯,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.故选A .
2.A 【解析】由折线图,7月份后月接待游客量减少,A 错误;选A .
x 9 4 0 1 0 x 9 18 7 7
1169367
6 1
7 85 0 0 1 1 4 7 9
4 5 5 5 7 7 8 8 9
3 1 2
4 4 8 9
2 0 2
3 3
1 2 5
4.D 【解析】由频率分布直方图可知,这200名学生每周的自习时间不少于22.5
小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D .
5.D 【解析】由图可知0℃在虚线框内,所以各月的平均最低气温都在0℃以上,A 正确;由图可知七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为10℃,基本相同,C 正确;由图可知平均最高气温高于20℃的月份不是5个,D 不正确,故选D .
6.C 【解析】由扇形统计图可得,该校女教师人数为11070150(160%)137⨯+⨯-=.
7.D 【解析】根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化碳年
排放量与年份负相关,选项D 错误.
差
,而数据,,,的方差,
10.A 【解析】所抽人数为(350020004500)2%200++⨯=,近视人数分别为小
学生350010%350⨯=,初中生450030%1350⨯=,高中生
200050%1000⨯=,∴抽取的高中生近视人数为10002%20⨯=.选A .
11.D 【解析】根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样64DX =121x -221x -⋅⋅⋅1021x -22(21)2264D X DX -==⨯
12.C 【解析】因该地区小学、初中、高中三个学段学生的视力情况有较大差异,
故最合理的抽样方法是按学段分层抽样,故选C .
13.B 【解析】由图知道60分以上人员的频率为后4项频率的和,由图知道
,故分数在60以上的人数为600×0.8=480人.
14.B 【解析】由图可知去掉的两个数是87,99,所以8790291294+⨯+⨯+
90917x ++=⨯,4x =.
极差为68-12=56.所以选A.
(0.030.0250.0150.01)*100.8P =+++=。