深度剖析超几何分布和二项分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考数学2021年$月
深度咅慚趨几何分布和二顶分布
■江苏省天一中学周海军
概率统计是高中数学的重要知识模块#
近几年来在高考中考查的比例越来越高,基
本以两道小题加一道解答题的形式出现,试
题富有时代气息,通过创设源于社会生活中
的真实情境,考查同学们的阅读、识图、计算、
表达等能力,考查的重心是数据分析能力和
数学运算能力。
在概率中,二项分布、超几何分布是出现
频率较高的两种概率模型,很多同学在学习
的过程中容易产生混淆,经常有同学问二项
分布与超几何分布到底怎么区分。
要弄清楚
两者的关系,我们先来看看人教版新课标教
材选修2—$给出的概念:
超几何分布:一般地,在含有M件次品
的N件产品中,任取九件,其中恰有X件次
品,那么+Q,-<)=C C C—3(<=0,1,2,…,
C n
B)#其中B=min{32},且2&N,M&N,
n,3,N+N*。
如果随机变量X的分布列具有表1的
形式,则称随机变量X服从超几何分布,记
为X〜H53N)。
表1
X01…B
P
厂0厂2—0
J3「N—3c3c n—3…C3C n—3
C N C N C N
二项分布:在n次独立重复试验中,用X
表示事件A发生的次数,设每次试验中事件A发生的概率为。
,则P(X=k)=C n p k(1—p)n—k(@=0,1,2,…,n),此时称随机变量X 服从二项分布,记为X〜B21),并称p为成功概率。
从定义通过实践我们可以提炼出两者的关系:
相同点:超几何分布和二项分布都是离散型分布。
区别:(1)超几何分布需要知道总体的容量,而二项分布不需要;
))超几何分布是“不放回%由取,而二项分布是“有放回%由取(独立重复);
($)当总体的容量非常大时,超几何分布近似于二项分布。
一、超几何分布模型
超几何分布特点:超几何分布是离散型分布,需要知道总体的容量,并且是“不放回”抽取。
!!(2020年广东模拟)台风“山竹”对我国多个省市的财产造成重大损害,据统计,直接经济损失达52亿元。
某志愿者组织调査了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:'0,2000(,(2000,4000(,(4000,6000(,,6000,8000(,(8000,10000((单位:元),得到如图1所示的频率分布直方图#
图1
(1)试根据频率分布直方图估计该地区每个农户的平均损失(同一组中的数据用该组区间的中点值代替);
()台风后该志愿者组织与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户中损失超过4000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8000元的农户数为X,求X的分布列和数学期望。
解析:(1)记每个农户的平均损失为)
)2
高考数学2021年3月
元,贝[J e=100000.3+300000.4+5000
00.18+700000.06+900000.06=
3360(元)
由频率分布直方图,可得损失超过
1000元的农户共有(0.00009+0.00003+
0.00003*02000050=15(户),损失超过8000
元的农户共有0.0000302000050=3(户*,随
机抽取2户,则X的可能取值为0,1,2
所以P(X_0)_c|2/6_||;
C12C112
P("—F
c02c21
PX■—P#
所以X的分布列为表2&
表2
X012
P 22121
353535
4
在选历史的条件下,选地理的概率#
5
(1)求该校学生最终选地理的概率#
(2)该校甲贝乙,丙三人中选地理的人数
设为随机变量X#
①求随机变量X=2的概率+
②求X的概率分布列及数学期望#
解析:(1)设该校学生最终选地理为事件
32147
A,则P(!*=403%405=10故该校
7
学生最终选地理的概率:
(2)①由题意可知,X〜B
PX"巩7*441
1000
②由于X〜B则P(X=0)
3\3=27+
10)=1000;
991919
故E(X*FX22+1012%20—=-P C X_1)_C1
189
1000
b评:(D由频率分布直方图给出的信息,借助于数学期望公式计算每个农户的平均损失(注意同一组中的数据用该组区间的中b值代替);(2)根据频率分布直方图计算随机变量X的可能取值,再求X的分布列和数学期望。
这里抽取的农户是"不放回”的抽取,且每个被抽到的概率都相等,因此计算随机变量X的每个取值的概率时应是古典概型的概率,其概率模型是典型的超几何分布%
二、二项分布模型
二项分布特点:二项分布是离散型分布贝不需要知道总体的容量,并且是“有放回”抽取(独立重复*#
!"某省实行的“高考方案:3+1+ 2”模式,其中统考科目「3”指语文、数学、外语3门科目,不分文理+1指首先在物理、历史2门科目中选择1门指再从思想政治、地理、化学、生物4门科目中选择2门#
3
根据统计选物理的学生占整个学生的—;并PX"Y6)
/3\1=441
2且在选物理的条件下,选择地理的概率为3+
\10)=1000
7\23343
PX n(id00
所以X的分布列为表3:
表3
X0123
P
27189441343
1000100010001000
所以E(X)_n J&_307_21
b评:该例题涉及的知识b有独立事件概率乘法公式、二项分布概率分布列%第(1)问利用独立事件的概率乘法公式可求得事件“该校学生最终选地理的概率)第(2)问利用第(1)问的结果,结合题意,可k判断出变量X服从二项分布(属于“有放S”的抽取),即X〜B(,7),利用独立重复试验的概率公式可求得随机变量X=2的概率;借助二项分布可求得随机变量X的分布列,并由此可计算出随机变量X的数学期望%
13
中孝生皋捏化
高考数学2021年3月
三、超几何分布近似于二项分布模型
!#2020年5月某校在“数学文化节%中组织全体同学进行数学解题和文化竞赛,从全体同学中随机抽取16名同学的分数,分别为84,93,88,90,70,89,96,87,73, 95,89,92,86,84,95,87,若分数不低于90分,则该同学等级为“优秀%
(1)求从这16人中随机选取3人,至少有1人等级为“优秀”的概率+
(2)现以这16人的样本数据来估计整个学校的总体数据,若从该校(人数很多)任选3人,记X为抽到等级为“优秀”的人数,求X 的概率分布列和数学期望#
(同学们先自己解答一下,可能会有更大的收获)
错解!1)由题知,抽取的16人中,等级为“优秀”的有6人,其他的有10人#设“从这16人中随机选取3人,至少有1人等级为
C$11
优秀”为事件A,则P(A)=1—詁°=百#(2)X的可能取值为0,12,3#
所以P C X=0)=/6/0=$+
P C X=1)C6C^,=27 c$6=56
P C X=2)=CM
C$6
15
56 c$c001
PX=3)=—=28#
所以X的分布列为表4:
表4
X0123
P
327151 14565628
3,27,15
0x iz+1x56+2f+
所以EQX)
丄=9
28=8
错解分析:第(2)问的选人问题是不放回抽样问题,按照定义先考虑超几何分布,但是题目中又明确给出“以这16人的样本数据来估计整个学校的总体数据,从整个学校(人数很多)任选3人%,说明不是从16人中任选3人,所以可以近似看作3次独立重复试验,应该按照二项分布去求解,而不能按照超几何分布去处理#
正解!1)由题知,抽取的16人中,等级为“优秀”的有6人,其他的有10人#设“从这16人中随机选取3人,至少有1人等级为
C$11
优秀”为事件A,则P(A)=1—/°-亘#(2)X的可能取值为0,1,2,3,则X〜
所以p(x=0)=
(5)3=12
P(=1)=C$($)/5\2=225
(8丿=512
PCX=2)=C3($)/5C_135
(8丿=512
P(=3)=
($)27512
所以X的分布列为表5:
表5
X0123
P
12522513527
512512512512
39
所以E(、X\=np=3x飞=飞
b评:从以上解题过程我们可发现,错解中的期望值与正解中的期望值相等,好多同学都觉得不可思议,怎么会出现相同的结果呢?其实这还是由于超几何分布与二项分布是有联系的,看它们的期望公式:8X〜
n3
H(n,3N)时,E(X"=—;8X〜B(n, p)时,EQX"=np%8超几何分布中的N—
3
+时,n~—p,可以把超几何分布中的不放回抽样问题,近似看作有放回抽样问题,所以8N—+兀时,可以把超几何分布近似看作二项分布%由此可知,8问题中涉W"用样本数据来估计总体数据)很大)非常大”等字眼时,表明试验可视为独立重复试验,进而判G是否服从二项分布%
(责任编辑王福华)
)4。