超几何分布与二项分布的小区别
超几何分布和二项分布

超几何分布和二项分布超几何分布和二项分布是概率论中两种重要的离散型概率分布。
它们都在描述了离散型随机变量的分布规律,但在具体的描述和应用上有一定的区别。
本文将分别介绍超几何分布和二项分布的定义、特点、性质和应用,并对两者之间的关系和区别进行详细的比较分析。
一、超几何分布的定义、特点和性质超几何分布是描述了一种从有限个物件中抽出样本不放回地抽取成功次数的概率分布。
具体来说,超几何分布描述了在总体中有M个成功物件和N-M个失败物件时,从总体中抽取n个物件,其中成功物件的个数X的分布概率。
其概率质量函数为:P(X=k) = (M choose k) * (N-M choose n-k) / (N choose n),其中(M choose k)表示从M个物件中抽取k个物件的组合数。
超几何分布的特点有以下几点:1.超几何分布是离散型概率分布,其取值只能是非负整数。
2.超几何分布的期望值和方差分别为E(X) = n * M/N, Var(X) =n * M/N * (N-M)/N * (N-n)/(N-1)。
3.超几何分布的分布形状随着总体大小和成功物件的比例而改变,当总体很大时,超几何分布近似于二项分布。
超几何分布在实际应用中有着广泛的应用。
例如在质量抽样、抽样调查、生物统计学等领域,常常需要进行不放回地从总体中抽取物件的情况,而超几何分布恰好可以描述这类情况下随机变量的分布规律。
二、二项分布的定义、特点和性质二项分布是描述了n次独立重复的伯努利试验中成功次数的概率分布。
具体来说,二项分布描述了n次重复试验中成功的次数X的概率分布。
其概率质量函数为:P(X=k) = (n choose k) * p^k * (1-p)^(n-k),其中(n choose k)表示从n次试验中成功k次的组合数。
二项分布的特点有以下几点:1.二项分布是离散型概率分布,其取值只能是非负整数。
2.二项分布的期望值和方差分别为E(X) = np, Var(X) = np(1-p)。
二项分布与超几何分布的区别

(1)从中每次取出1个球然后放回,连续抽取三次,求取到红球 次数X的分布列和数学期望。 3k k k 解:由已知X~B(3,0.4), PX k C3 0.4 1 0.4 , (k 0,1,2,3)
X 所以,X的分布列为: p
0
1
2
3
27 54 36 8 E X 3 0.4 1.2 125 125 125 125
k n- k P(X=k)=Ck p (1 - p ) ,k=0,1,2,…,n. n
则称随机变量 X 服从参数为 n、p 的二项分布,记 作 X~B(n,p),并称 p 为成功概率.
2.超几何分布
一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其 中恰有 X 件次品,则事件{X=k}发生的概率为
E X 3 0.6 1.8
0
1
2
3
8 36 54 27 125 125 125 125
变式:(3)把(2)改为:若随机在样本不赞成高考改革的家长中 抽取3个,记这3个家长中是城镇户口的人数为Y,试求Y的分布列 及数学期望E(Y). k 3 k C15 C10 解:由已知Y服从超几何分布, PY k , (k 0,1,2,3) 3 C25 所以,Y的分布列为: Y
2018届南宁市摸底考试18题
摸底考试18题第(1)问
(2)用样本的频率估计概率,若随机在全省不赞成高考改革的家 长中抽取3个,记这3个家长中是城镇户口的人数为X,试求X的分 布列及数学期望E(X). 用样本的频率估计概率应怎样理解? 概率定义:对于给定的随机事件A,如果随着试验次数的增加,事 件A发生的频率稳定在某个常数上,把这个常数记作P(A),称为 事件A的概率。 在样本中,不赞成高考改革的家长中是城镇户口的频率为0.6,因 此,估计全省从不赞成高考改革的家长中随机抽取1个,他是城镇 户口的概率为0.6,抽取3个,即进行3次独立重复试验,所以, X~(n,p)
超几何分布与二项分布的联系与区别

在苏教版《数学选修2-3》的课本中,第二章《概率》的2。
2节和2.4节分别介绍了两种离散型随机变量的概率分布,超几何分布(hyper—geometric distribution)与二项分布(binomial distribution)。
通过实例,让学生认识模型所刻画的随机变量的共同特点,从而建立新的模型, 并能运用两模型解决一些实际问题。
然而在教学过程中,却发现学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,学生对这两模型的定义不能很好的理解,一遇到含“取"或“摸"的题型,就认为是超几何分布,不加分析,随便滥用公式。
事实上, 超几何分布和二项分布确实有着密切的联系,但也有明显的区别.课本对于超几何分布的定义是这样的:一般的,若一个随机变量X的分布列为,其中,则称X服从超几何分布,记为.其概率分布表为:对于二项分布的定义是这样的:若随机变量X的分布列为,其中则称X服从参数为n,p的二项分布,记为。
其概率分布表为:超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量X的取值都从0连续变化到l,对应概率和N,n,l三个值密切相关……可见两种分布之间有着密切的联系。
课本中对超几何分布的模型建立是这样的:若有N件产品,其中M件是废品,无返回地任意抽取n件,则其中恰有的废品件数X是服从超几何分布的.而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有N件产品,其中M件是废品,有返回的任意抽取n件,则其中恰有的废品件数X是服从二项分布的。
在这里,两种分布的差别就在于“有”与“无”的差别,只要将概率模型中的“无”改为“有”,或将“有"改为“无”,就可以实现两种分布之间的转化。
“返回”和“不返回"就是两种分布转换的关键.如在2。
如何快速识别“二项分布”与“超几何分布”

如何快速识别“二项分布”与“超几何分布”在离散型变量综合题型中,如何快速地识别“二项分布”与“超几何分布”两种分布列的区分应按下述步骤进行快速识别:(一)从抽样方法来区分。
若在题干中出现明显的“放回抽样”、“不放回抽样”、“一次性抽取几件”、“n次独立重复试验”等字眼时,“放回抽样”、“n次独立重复试验”对应“二项分布”,“不放回抽样”对应“超几何分布”,“一次性抽取几件”可以理解为“不放回地抽取一件,连续抽取几次”,这样就对应“超几何分布”了。
(二)若是没有明显的字眼特征,则第二步马上应“从抽取产品的总数N和其中所含次品的件数M是否明确来区分”注意:题中若出现“用频率估计概率”、“以样本推断总体”等字眼时,应判断为“总体数N不确定”,适用“二项分布”。
这是因为:“用频率估计概率”本身“概率”就是发生的可能性大小,具有不确定性,“以样本推断总体”中的“推断”就是“估计、大概”的意思,具有不确定性。
例:某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取10件进行抽样检验,检测出有两件次品.(1)从这10件产品中随机抽取3件,其中次品件数为X,求X分布列和期望;(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y,求Y 分布列和期望;(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z,求Z分布列和期望.分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。
第(2)问是从一箱产品中抽取,产品的总体N=100是明白的,但其中有多少件次品M是不明白的,有的同学按照样本可认为M=20,但违背了题目中的“用频率估计概率”这一前提,或者说没有理解这句话的含义,本质上就是概率的定义没有理解。
按照概率定义,“用频率估计概率”这一前提应理解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回抽1件3次,因为每次的概率都是0.2,因而,可以看成独立重复实验,该随机变量的分布为二项分布。
二项分布与超几何分布的区别

二项分布与超几何分布
的区别
Company number【1089WT-1898YT-1W8CB-9UUT-92108】
二项分布与超几何分布的区别:
定义:若有N 件产品,其中M 件是废品,无返回...
地任意抽取n 件,则其中恰有的废品件数X 是服从超几何分布的。
概率为()k n K M N M n N
C C P X k C --==. 若有N 件产品,其中M 件是废品,有.返回..
地任意抽取n 件,则其中恰有的废品件数X 是服从二项分布的。
概率为()()1n k k k n P X k C p p -==-,其中M p N
=. 区别:(1)二项分布是做相同的n 次试验(n 次独立重复试验),
(2)当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布。
在废品为确定数M 的足够多的产品中,任意抽取n 个(由于产品个数N 无限多,无返回与有返回无区别,故可看作n 次独立重复试验)中含有k 个废品的概率当然服从二项分布。
在这里,超几何分布转化为二项分布的条件是①产品个数应无限多,否则无返回地抽取n 件产品是不能看作n 次独立试验的.②在产品个数N 无限增加的过程中,废品数应按相应的“比例”增大,否则上述事实也是不成立的。
(3)实际上,在以样本估计总体时,从样本中无返回地任意抽取n 件,当然废品件数X 服从超几何分布的;而从总体中无返回地任意抽取n 件,理想认为....
废品件数X 服从二项分布的。
二项分布和超几何分布

二项分布和超几何分布二项分布和超几何分布是统计学中比较常见的两个概率分布,它们都是很重要的知识点,被应用在许多领域,尤其是生物和药物研究等统计分析中。
在本文中,我们将对这两个概率分布进行介绍和比较,包括定义、性质、应用、关系以及如何求解这两个概率分布。
一、二项分布二项分布是一种偏态分布,也被称为二项概率分布,它以独立的事件进行描述,用来描述一个独立的试验或该试验的结果。
它形成了一种定义精确的概率模型,用来对实际问题进行分析、预测和解决。
二项分布中有两个参数,即n(试验次数)和p(每次试验成功的概率)。
假设有一个试验,该试验有n次,每次试验成功的概率为p,则最终成功的次数X服从二项分布:X~B(n,p)。
其性质如下:(1)二项分布的期望值E[X] = np。
(2)二项分布的方差 D[X]= npq=np(1-p)。
(3)当n趋于无穷大,p趋于某一定值时,此时X服从泊松分布。
(4)二项分布的n和p均大于0,当n=1时,二项分布即成为伯努利分布。
二项分布的应用非常广泛,常被应用在质量控制、生物学、总体调查中。
比如,在质量检验中,二项分布被应用在检验样本中不良品率检验;在生物学中,可以用二项分布研究DNA分子的突变率;在总体调查中,也可用二项分布来描述一个样本是否属于某一总体。
求解二项分布的方法:一般通过概率计算和抽样模拟的方法。
概率计算方法是对二项分布概率的精确计算,即在已知成功的概率p和试验次数n的情况下,可以精确算出在n次试验中成功m次出现的概率。
而抽样模拟方法是通过实际模拟事件,用实际上发生的次数来估计概率,为此可以用计算机模拟,从而统计概率出现的次数。
二、超几何分布超几何分布也称为无限取样分布,是一种古典的概率分布,用来描述一系列独立事件中指定类型的成功次数的分布情况。
它和二项分布很相似,但它的背后的模型是不同的。
超几何分布有三个参数,即n(试验次数)、N(总体样本数)和p(每次试验成功的概率)。
超几何分布与二项分布的辨析

超几何分布与二项分布的辨析作者:赵宇来源:《新教育时代·学生版》2017年第28期摘要:本节内容是《超几何分布与二项分布的辨析》的一节课,通过老师的指导,我从中学会如何判断超几何分布与二项分布,体会到它门两者的区别。
这是我的学习的一点心得,本文主要介绍超几何分布与二项分布的辨析,希望能够给读者一些启迪。
关键词:关键是判断超几何分布与二项分布判断一个随机变量是否服从超几何分布,关键是要看随机变量是否满足超几何分布的特征:一个总体(共有个)内含有两种不同的事物、,任取个,其中恰有个.符合该条件的即可断定是超几何分布,按照超几何分布的分布列:()进行处理就可以了。
二项分布必须同时满足以下两个条件:①在一次试验中试验结果只有与这两个,且事件发生的概率为,事件发生的概率为;②试验可以独立重复地进行,即每次重复做一次试验,事件发生的概率都是同一常数,事件发生的概率为.下面我通过几个例子说明一下两者的区别题型一:超几何分布例1.有10件零件,其中有4件次品。
规定每次从这些零件中随机抽取3件进行测试,求抽出次品数x的分布列及数学期望。
解析:由题可知可能取值为0,1,2,3.点评:这是一道超几何分布的题目,学生在做的时候容易把它看到是二项分布问题,把事件发生的概率看做是0.4。
题型二:二项分布例2、袋中有6个白球、2个黑球,从中随机连续抽取3次,每次取一个球,求:(1)有放回抽样时,取到黑球的个数X的分布列和数学期望;(2)无放回抽样时,取到黑球的个数Y的分布列和数学期望解:(1)有放回抽样时,随机变量X的可能取值为0、1、2、3,由于每次取到黑球的概率均为,因此,3次取球可以看成3次独立重复试验,则(2)无放回抽样时,随机变量Y的可能取值为0、1、2.超几何分布和二项分布的区别:1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。
关于二项分布与超几何分布问题区别举例

关于“二项分布”与“超几何分布”问题举例一.基本概念1.超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件?X=k ?发生的概率为:P(X=k)= n N k n MN k M C C C --⋅,k= 0,1,2,3,??,m ;其中,m =min ?M,n ?,且n ? N , M ? N . n,M,N ? N?为超几何分布;如果一个变量X 的分布列为超几何分布列,则称随几变量X 服从超几何分布.其中,EX= n ?M N2.二项分布在n次独立重复试验中,设事件A发生的次数为X,在每次试验中,事件A发生的概率为P,那么在n次独立重复试中,事件A恰好发生k次的概率为:P(X=k)= C n k p k(1-p)n-k(k=0,1,2,3,?,n),此时称随机变量X服从二项分布.记作:X ? B(n,p),EX= np3.“二项分布”与“超几何分布”的联系与区别(1)“二项分布”所满足的条件✍每次试验中,事件发生的概率是相同的;是一种放回抽样.✍各次试验中的事件是相互独立的;✍每次试验只有两种结果,事件要么发生,要么不发生;✍随机变量是这n次独立重复试验中事件发生的次数.(2)“超几何分布”的本质:在每次试验中某一事件发生的概率不相同,是不放回抽样,“当样本容量很大时,超几何分布近似于二项分布;共同点:每次试验只有两种可能的结果:成功或失败。
不同点:1、超几何分布是不放回抽取,二项分布是放回抽取;2、超几何分布需要知道总体的容量,二项分布不需要知道总体容量,但需要知道“成功率”;联系:当产品的总数很大时,超几何分布近似于二项分布。
因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.二.典型例题例1:袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求:(1)有放回抽样时,取到黑球的个数X的分布列;(2)不放回抽样时,取到黑球的个数Y的分布列.解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均为15,3次取球可以看成3次独立重复试验,则1~35X B ⎛⎫ ⎪⎝⎭,. 03031464(0)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭∴;12131448(1)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭; 21231412(2)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭;3033141(3)55125P X C ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭. 因此,X 的分布列为(2).不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有:03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101(2)15C C P YC ===.因此,Y 的分布列为例2.在10件产品中,有3件一等品,4件二等品,3件三等品,从这10件产品中任取3件,求:(1) 取出的3件产品中一等品件数多于二等品件数的概率.(2) 记:X 表示“取出的3件产品中一等品件数多于二等品件数的数量”,求X 的分布列并求EX;分析:由题可知:从10件产品中分别任取两次得到“一等品”或“二等品”的概率是不相等的,因此是一种不放回抽样;随机变量X服从超几何分布.解:(1) 记A1:取出3件一等品;A2:取出2件一等品;A3:取出1件一等品,二件三等品.A1、A2、A3互斥,P(A1)=C33 C103=1120, P(A2)=C32?C71C103=740,P(A3)= C31?C72C103=340; 所以,P =P(A1)+ P(A2)+ P(A3)= 31 120.(2)X=0,1,2,3; X服从超几何分布,所以P(X=0)= P(一件一等品,一件二等品,一件三等品)=310131413C C C C = 310 ; P(X=1)=P (二件一等品,一件二等品) = 3101423C C C = 110 ; P(X=2)=P(三件一等品,一件二等品)= 3101433C C C = 130; P(X=3)= P (三件一等品,零件二等品)= 3100433C C C= 1120; EX = nM N = 3 310= 0.9 说明:谨防错误地认为随机变量X 服从二项分布,即:X B(3, 31 120).例3.从某高中学校随机抽取16名学生,经校医检查得到每位学生的视力,其中“好视力”4人,以这16人的样本数据来估计整个学校的整体数据,若从该校(人数很多)任选3人,记X表示抽到“好视力”学生的人数,求X的分布列及数学期望.分析:本题就是从“该校(人数很多)任选3人”,由此得到“好视力”人数X,若每次从该校任取一名学生为“好视力”这一事件的概率显然是相等的,因为该校“人数很多”相当于“有放回抽样”,因此,随机变量X服从“二项分布”而不是“超几何分布”.解:由题可知:X= 0,1,2,3;由样本估计总体,每次任取一人为“好视力”的概率为: P = 416 = 14 ,则X B(3,14 );P(X=0)= C 30( 14 )0(1- 14)3-0 = 2764; P(X=1)= C 31( 14 )1(1- 14)3-1 = 2764 ;P(X=2)= C 32( 14 )2(1- 14 )3-2 = 964 ;P(X=3)= C 33( 14 )3(1- 14 )3-3 = 164;EX = 3×14 = 34. 说明:假设问题变为:“从16名学生中任取3名,记X 表示抽到“好视力”学生的人数,求X 的分布列及数学期望”.那么X 服从“超几何分布”,即:P(X=k)= 3163124C C C k k ,(X=0,1,2,3),其中,数学期望值不变,即为:EX= 3×416 = 34 .。
二项分布与超几何分布知识点

二项分布与超几何分布知识点
二项分布与超几何分布都是概率论中的重要分布,下面为你介绍两者的知识点:
- 定义不同:
- 超几何分布:描述的是不放回抽样问题。
- 二项分布:描述的是放回抽样问题。
- 概率计算不同:
- 超几何分布中的概率计算实质上是古典概型问题。
- 二项分布中的概率计算实质上是相互独立事件的概率问题。
- 联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布。
二项分布和超几何分布在概率论中有广泛的应用,包括试验设计、数据分析和决策制定等。
如果你想了解更多相关内容,可以继续向我提问。
如何快速识别“二项分布”与“超几何分布”

如何快速识别“二项分布”与“超几何分布”二项分布和超几何分布都是概率论中常见的离散概率分布。
尽管它们可能在一些方面相似,但它们在定义、应用和特性上存在一些明显的区别。
下面将介绍如何快速识别这两种分布。
首先,我们需要了解二项分布和超几何分布的定义。
二项分布是指在一系列相互独立的重复试验中,每次试验只有两个可能的结果,成功和失败。
每次试验中成功的概率为p,失败的概率为1-p。
试验的次数固定为n次。
二项分布描述的是在给定试验次数和成功概率的情况下,成功次数的概率分布。
超几何分布是指从一个有限总体中抽取固定数量的样本,且每次抽样都是无放回抽样。
总体中成功的个数为M,总体中失败的个数为N-M。
样本的大小为n,成功的个数为k。
超几何分布描述的是在给定总体大小、成功个数和样本大小的情况下,成功次数的概率分布。
根据定义,我们可以看出二项分布和超几何分布在试验方式上的不同:-二项分布是有放回抽样的结果,即每次试验之间是相互独立的。
例如,我们可以使用一枚硬币进行多次投掷,每次投掷只能出现正面或反面的结果。
-超几何分布是无放回抽样的结果,即每次试验之间是相关的。
例如,我们从一批产品中取出其中几个进行质检,一旦一个产品被选中,它就不再参与后续的抽样。
1.参数设置:-二项分布有两个参数:试验次数n和成功概率p。
-超几何分布有三个参数:总体大小N,成功个数M和抽样大小n。
2.应用领域:-二项分布通常适用于描述重复试验中一个事件发生的概率,如硬币抛掷和赌博游戏等。
-超几何分布通常适用于描述从有限总体中抽取样本的成功次数,如质量控制和调查调研等。
3.概率计算:-二项分布的概率计算可以使用二项式定理或计算器进行计算。
-超几何分布的概率计算需要使用超几何分布的概率质量函数。
4.概率特性:-二项分布的期望值和方差可以通过试验次数和成功概率计算得到。
-超几何分布的期望值和方差可以通过总体大小、成功个数和抽样大小计算得到。
所以,通过参数设置、应用领域、概率计算和概率特性等方面可以快速识别二项分布和超几何分布。
超几何分布与二项分布的区别与联系-二项分布与超几何分布的区别

吉林教育·教学7/2013二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
【数学】超几何分布与二项分布的区别与联系

二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决。
在实际应用中,如何理解它们的关联性同时又能区分两个概率模型呢?本文笔者就此问题予以阐述。
一、超几何分布与二项分布的定义1.一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为P (X=k)=C M k C n-m n-kC Nn,k=0,1,2,…,m其中m=min {M,n},且n ≤N ,M ≤N ,n ,M ,N ∈N*。
其分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
2.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验。
在n 次独立重复试验中,设事件A 发生的次数X ,在每次试验事件A 发生的概率为p,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为P (X=k)=C n k P k(1-p )n-k,k=0,1,2,…,n 。
此时称随机变量X 服从二项分布,记作X ~B (n ,p),并称p 为成功概率。
二、超几何分布与二项分布的区别从它们的定义不难看出超几何分布研究的是试验后的结果(不研究试验中先后取的顺序),并且是无放回的抽取;二项分布研究的是既有研究先后发生的顺序又有试验结果,并且是有放回的抽取。
超几何分布是无放回的抽取,即每做一次试验,下一次再发生同一事件A 的概率已经发生了变化,即每次发生的概率都不相等。
实质上,超几何分布是古典概型的一种特例。
二项分布是有放回的抽取,每做一次试验,发生同一事件A 的概率都相同。
这就是二者之间的区别。
本文笔者举例说明:例1:在装有4个黑球6个白球的袋子中,任取2个,试求:(1)不放回地抽取,取到黑球数X 的分布列;(2)有放回地抽取,取到黑球数的分布列。
解:(1)是不放回地抽取,X 服从超几何分布。
从10个球中任取2球的结果数为C 102,从10个球中任取2个,其中恰有k 个黑球的结果数为C 4k C 62-k,那么从10个球中任取2个,其中恰有k 个黑球的概率为P (X=k )=C 4k C 62-kC 102,k=0,1,2。
如何快速识别“二项分布”与“超几何分布”

在离散型变量综合题型中,如何快速地识别“二项分布”与“超几何分布”两种分布列的区分应按下述步骤进行快速识别:(一)从抽样方法来区分。
若在题干中出现明显的“放回抽样”、“不放回抽样”、“一次性抽取几件”、“n次独立重复试验”等字眼时,“放回抽样”、“n次独立重复试验”对应“二项分布”,“不放回抽样”对应“超几何分布”,“一次性抽取几件”可以理解为“不放回地抽取一件,连续抽取几次”,这样就对应“超几何分布”了。
(二)若是没有明显的字眼特征,则第二步马上应“从抽取产品的总数N和其中所含次品的件数M是否明确来区分”注意:题中若出现“用频率估计概率”、“以样本推断总体”等字眼时,应判断为“总体数N不确定”,适用“二项分布”。
这是因为:“用频率估计概率”本身“概率”就是发生的可能性大小,具有不确定性,“以样本推断总体”中的“推断”就是“估计、大概”的意思,具有不确定性。
例:某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取10件进行抽样检验,检测出有两件次品.(1)从这10件产品中随机抽取3件,其中次品件数为X,求X分布列和期望;(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数为Y,求Y分布列和期望;(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z,求Z分布列和期望.分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为超几何分布。
第(2)问是从一箱产品中抽取,产品的总体N=100是明确的,但其中有多少件次品M是不明确的,有的同学根据样本可认为M=20,但违背了题目中的“用频率估计概率”这一条件,或者说没有理解这句话的含义,本质上就是概率的定义没有理解。
根据概率定义,“用频率估计概率”这一条件应理解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回抽1件3次,由于每次的概率都是0.2,因此,可以看成独立重复实验,该随机变量的分布为二项分布。
超几何分布和二项分布的联系和区别

超几何分布和二项分布的联系和区别开滦一中张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处!一、两者的定义是不同的教材中的定义:(一)超几何分布的定义在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=nNk-nM-NkMCCC,,2,1,0k=, m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N,称随机变量X服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n次试验,且各次试验试验的结果相互独立,称为n次独立重复试验,其中A(i=1,2,…,n)是第ⅰ次试验结果,则P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)2)二项分布在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为P,则P(X=k)=k nk pp--)1(C kn(k=0,1,2,…,n),此时称随机变量X服从二项分布,记作X~B(n,p),并称P为成功概率。
1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=nNk-n M -N k M C C C , ,2,1,0k =, m, 二项分布:在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发生的概率为P,则P(X=k)=kn k p p --)1(C k n (k=0,1,2,…,n), 温馨提示:当题目中出现“用样本数据估计XXX 的总体数据”时,均为二项分布问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超几何分布与二项分布的小区别
【摘要】超几何分布和二项分布有着密切的联系,但也有明显的区别。
超几何分布和二项分布都是离散型分布,超几何分布是不放回抽取,而二项分布是放回抽取(独立重复),当总体的容量非常大时,超几何分布近似于二项分布……
【关键词】超几何分布二项分布区别与联系
在高中新课标数学的教材中,分别介绍了两种离散型随机变量的概率分布,超几何分布(hyper-geometric distribution)与二项分布(binomial distribution)。
通过实例,让学生认识模型所刻画的随机变量的共同特点,从而建立新的模型,并能运用两模型解决一些实际问题。
然而在教学过程中,却发现学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,学生对这两模型的定义不能很好的理解,一遇到含“取”或“摸”的题型,就认为是超几何分布,不加分析,随便滥用公式,导致经常出错。
事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别。
教材对于超几何分布的定义是这样的:一般的,若一个随机变量x的分布列为p(x=k)= ,其中k=0,1,2,3,…l,l=min(n,m),则称x服从超几何分布,记为x-h(n,m,n)。
其概率分布表为:对于二项分布的定义是这样的:若随机变量x的分布列为p(x=k)=cknpk(1-p)n-k,其中0<p<1,p+q=1,k=1,2,…,n则称x服从参数为n,p的二项分布,记为x-b(n,p)。
其概率分布表为:
(l=min(n,m))
超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量x的取值都从0连续变化到l(l=min(n,m)),对应概率和n,n,l三个值密切相关……可见两种分布之间有着密切的联系。
教材中对超几何分布的模型建立是这样的:若有n件产品,其中m件是废品,无返回地任意抽取n件,则其中恰有的废品件数x是服从超几何分布的。
而对二项分布则使用比较容易理解的射击问题来建立模型。
若将但超几何分布的概率模型改成:若有n件产品,其中m件是废品,有返回的任意抽取n件,则其中恰有的废品件数x是服从二项分布的。
在这里,两种分布的差别就在于“有”与“无”的差别,只要将概率模型中的“无”改为“有”,或将“有”改为“无”,就可以实现两种分布之间的转化。
“返回”和“不返回”就是两种分布转换的关键。
如在教材中有这样一个例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率。
本题采用的解法是摸出球中的红球个数x服从超几何分布,但是如果将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球个数x 将不再服从超几何分布,而是服从二项分布。
我们分别来计算两种分布所对应的概率:
从概率分布表中可以发现两种不同的分布其对应的概率相差并
不打,若将题中数据扩大为100个红球,200个白球,其他条件不变再求相应概率。
这时发现发现两种不同的分布其对应的概率之间的差距进一步
缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说。
lim =cknpk(1-p)n-k下面我们对以上猜想作出证明:
产品个数n无限大,设废品率为p,则 =p,
= -
= ···
因为n,k确定,所以
=(1-p)k
=1,
故 =cknpk(1-p)n-k
以上的证明与我们的直观判断相吻合:在废品为确定数m的足够多的产品中,任意抽取n个(由于产品个数n无限多,无返回与有返回无区别,故可看作n次独立试验)中含有k个废品的概率当然服从二项分布。
在这里,超几何分布转化为二项分布的条件是(1)产品个数应无限多,否则无返回地抽取n件产品是不能看作n次独立试验的.(2)在产品个数n无限增加的过程中,废品数应按相应
的“比例”增大,否则上述事实也是不成立的。
对于超几何分布的数学期望,e(x)=n 二项分布的数学期望e (x)=np,当我们将“不返回”改为“返回”时, =p,两种分布的数学期望相等,方差之间没有相等关系。
超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?
事实上超几何分布的数学期望,方差d(x)当limn→ =p,limn →n =np,limn→ =np(1-p)这两个极限值分别是二项分布的数学期望与方差。
需要指明的是这一性质并非只为超几何分布与二项分布之间所具有,一般地,如果随机变量依分布收敛于随机变量,则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。
这样超几何分布与二项分布达到了统一。
一般说来,有返回抽样与无返回抽样计算的概率是不同的,特别在抽取对象数目不大时更是如此。
但当被抽取的对象数目较大时,有返回抽样与无返回抽样所计算的概率相差不大,人们在实际工作中常利用这一点,把抽取对象数量较大时的无返回抽样(例如破坏性试验发射炮弹;产品的寿命试验等),当作有返回来处理。
那么,除了在有无“返回”上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?
设想n件产品装在一个大袋中,其中m件为废品,无返回地从中抽取n件,那么其中废品件数 x服从超几何分布。
现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个
小袋,无返回地从中任取一件产品,则这样任取n件,其中废品件数x就不再服从超几何分布,而应服从的二项分布了。
事实上,我们把摸到正品袋中的产品看作“成功”,摸到废品袋中的产品看作“失败”,则“成功”与“失败”的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布去刻划其概率分布列。
p(x=k)=ckn()k()n-k=ckn()n,(k<min (m,n-m)),从这一点上讲,两种分布仅“一袋之隔”。
将正品和废品隔离,则超几何分布将成为二项分布。
超几何分布和二项分布这两种离散型随机变量的概率分布表面上看来风马牛不相及,但通过研究我们发现这两种分布可以通过有无“返回”,隔离正品和次品等方法,样本容量大小来互相转换。
总之,超几何分布和二项分布都是离散型分布,超几何分布是不放回抽样而二项分布是放回抽样(独立重复),超几何分布有分隔而二项分布无分隔,当样本总体的容量非常大时超几何分布近似于二项分布。