二项分布 通俗解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二项分布通俗解释
一个事件必然出现,就说它100%要出现。100%=1,所以100%出现的含义就是出现的概率P=1。即必然事件的出现概率为1。
如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5 。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1 ,即二者必居其一。
如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是 0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即 0.25+0.25=2×0.25=0.5 。它们的合计值仍然是1。列成表就是:
两个正面的概率一正一反的概
率
两个反面的概
率
0.252×0.25=0.50.25
注意到代数学中 (a+b)^2=a^2+2ab+b^2, 而在a=0.5,b=0.5时,有 1^2=(0.5+0.5)^2=0.25+2×0.5×0.5+0.25=1。这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。
顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。例如n=3时,有(注意0.5×0.5×0.5=0.125)1^3=(0.5+0.5)^3=0.125+3×0.125+3×0.125+0.125 =
0.125+0.375+0.375+0.125 = 1。
3个正面的概率2正1反的概
率
1正2反的概
率
3个反面的概
率
0.1250.3750.3750.125
二项式展开的牛顿公式表示为:
(a+b)^n=a^n + … + [n!/m!(n-m)!][a^(n-m)b^m]+ … + b^n (其中m=1,2,……n-1)。
即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。
如果a,b并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。所以对于仅有A,B两个结局的随机事件,如果A事件出现概率为p,B事件的出现概率为1-p,那么在n次随机实验中A事件出现n-m次、B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的):P=[n!/m!(n-m)!][p^(n-m) (1-p)^m] (其中m=0,1,……,n)
注意到上面公式的对称性,它也可以写为 P=[n!/m!(n-m)!][p^m (1-p)^(n-m)]。它就是所谓二项分布概型的随机事件的出现概率公式,也是牛顿二项式展开在变量为对应概率值的情况下的通项。
二项分布 - 正文
概率论中最常用的一种离散型概率分布。若随机变量X 取整数值k 的概率为
式中n 是给定的正整数;是从n 个对象中任意选取k 个的组合数,则称X 的分布为二项分布,记作B (n ,p )。它的命名来源于b (k ;n ,p)恰好是【(1-p)+p 】n 的二项式展开的第k +1项。
从不合格品率为p 的产品中独立地抽出n 个(每次抽一个,抽出后又放回),其中恰有k 个不合格品的概率就是b (k ;n ,p);统计学由此建立检验产品质量的方案。类似的例子在生产实践和科学试验中是常见的。将这类问题模型化,假设每一次试验只有两个可能结果:A 以及它的对立事件A c ,出现A 的概率为P (A )=p ,出现A c 的概率则为 1-p 。这种只有两个可能结果的随机试验称为伯努利试验,将这种试验独立地重复进行n 次所组成的随机试验称为n 重伯努利试验,其中A 出现的次数X 是一个服从二项分布B (n ,p)的随机变量。
若随机变量服从二项分布B (n ,p),则它的数学期望为n p,方差为n p(1-p),特征函数为(1-p+pe it )n ,母函数为(1-p+p s )n 。当k 由0依次增大到n 时,b (k ;n ,p)先增大后减小,当k =【(n +1)p 】(记号【α】表示不超过实数α的最大整数)时,b (k ;n ,p)取最大值;若(n +1)p 是整数,则k 在(n +1)p-1及(n +1)p 处都使b (k ;n ,p)取最大值(见图
)。
如果X i服从B(n i,p),i=1,2,…n,而且X1,X2,…,X n独立,则服从。如果X n服从B(n,p),则对任何实数α
有
式中
这说明,若p固定,当n充分大时,B(n,p)近似于正态分布。这个渐近公式最早由A.棣莫弗就p =1/2的情形加以证明,而后由P.-S.拉普拉斯加以推广,常称为棣莫弗-拉普拉斯中心极限定理。S.-D.泊松又
证明了:若则
这说明,当p很小而n较大时,B(n,p)可以用泊松分布近似。
正是这两个定理揭示了概率论中最重要的正态分布和泊松分布的意义,对概率论的发展有着深远的影响。
此外,多重伯努利试验中在出现第r个A以前A不出现的试验次数的
概率分布就是负二项分布,又称帕斯卡分布。特别当r=1时,就是几何分布。如果每次试验的可能结果多于两个,则二项分布就推广为多项分布。
二项分布 - 应用条件
1.各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡等,属于两分类资料。
2.已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π,实际工作中要求π是从大量观察中获得比较稳定的数值。
二项分布公式
3.n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。如要求疾病无传染性、无家族性等。
二项分布 - 分布区别
两点分布又称伯努利分布
两点分布的分布列就是
x 0 1
P 1-p p
不论题目有什么区别,只有两种可能,要么是这种结果要么是那种结果,通俗点,要么成功要么失败