5几种常见概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Today: 2020/3/5
注意,二项分布的应用条件也是波松分布的 应用条件。比如二项分布要求n 次试验是相互独 立的,这也是波松分布的要求。然而一些具有传 染性的罕见疾病的发病数,因为首例发生之后可 成为传染源,会影响到后续病例的发生,所以不 符合波松分布的应用条件。对于在单位时间、单 位面积或单位容积内,所观察的事物由于某些原 因分布不随机时,如细菌在牛奶中成集落存在时 ,亦不呈波松分布。
(一)定义 设随机变量X所有可能取的值为零和正
整数:0,1,2,…,n,且有
C Pn (X = k) = Pn (k) =
k pkqn-k , k = 0,1,2.....,n
n
(其中p>0,q>0,p+q=1),则称随机变量X服从参
数为n和p的二项分布,记为 x ~ B(n, p)
(二)二项分布的性质
二、波松分布的概率计算
由(4-23)式可知,波松分布的概率计算,依 赖于参数 λ的确定,只要参数λ确定了 ,把k=0,1 ,2,… 代入(4-23)式即可求得各项的概率。 但是 在大多数服从波松分布的实例中,分布参数λ往往 是未知的,只能从所观察的随机样本中计算出相 应的样本平均数作为 λ 的 估计值,将其代替(423)式中的λ,计算出 k = 0,1,2,… 时的各项 概率。
P6(3) = C36(0.85)3(0.15)6-3 = 20(0.85)3(0.15)3 = 0.04145344 P6(4) = C64(0.85)4(0.15)6-4 =15(0.85)4(0.15)2 = 0.17617711
P6(5) = C56(0.85)5(0.15)6-5 = 6(0.85)5(0.15)1 = 0.39933478
Today: 2020/3/5
第三节 正态分布 normal distribution
一、正态分布的定义及其特征
(一)定义 若连续性随机变量X的概率分布密度
函数为:
f(x) =
1
-
e
(x -μ)2 2σ2
,-∞<
x
<
+∞,σ
>
0
σ 2π
其中,µ为平均数,σ2 为方差,则称随机变量
χ服从正态分布,记为χ~(µ,σ2).相应的概率分布函
泊松分布是用来描述和分析稀有事件即小概率事件 分布规律的函数。
在生物、医学研究中,服从波松分布的随机变量是 常见的。如, 一定种群中某种患病率很低的非传染性 疾病患病数或死亡数, 种群中遗传的畸形怪胎数, 每 升饮水中大肠杆菌数,计数器小方格中血球数, 单位 空间中某些野生动物或昆虫数等,都是服从波松分布的。
k 0
把上面各项概率乘以总观察窝数(n=200)即得各 项按波松分布的理论窝数。 波松分布与相应的频
率分布列于表4-4中。
Today: 2020/3/5
表4-4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊松分 布计算的概率相比较 ,发现畸形仔猪的频率 分布与 λ=0.51 的 波松分布是吻合得很好的 。 这进一步说明了畸形仔猪数是服从波松分布的 。
特征
Today: 2020/3/5
正态分布有两个参数,即平源自文库
均数µ和标准差σ。µ是位置参 数,σ是变异度参数。
分布密度曲线与横轴所夹的 面积为1,即:
由计算可知 , 注射 A 疫苗无效的概率为 0.0352,比B疫苗无效的概率0.1671小得多。因 此,可以认为A疫苗是有效的,但不能认为B 疫苗也是有效的。
Today: 2020/3/5 (二)应用条件(三个)
n个观察单位的观察结果互相独立; ❖ 各观察单位只具有互相对立的一种结果,如
阳性或阴性,生存或死亡等,属于二项分类 资料。 已知发生某一结果(如死亡) 的概率为p,其对 立结果的概率则为1-P=q,实际中要求p 是 从大量观察中获得的比较稳定的数值。
Today: 2020/3/5
一、泊松分布的意义 (一)定义
若随机变量X(X=k)只取零和正整数值, 且其概率分布为
P(X= k) = λk e-λ k = 0,1, ;λ > 0;e = 2.则718称2 X服
k!
从参数为λ的泊松分布,记为X~P(λ)。 (二)特征 μ=σ2=λ
Today: 2020/3/5
Today: 2020/3/5
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的 各种可能情况的概率。
这个问题属于贝努里模型(?),其 n = 6 中 p = 0.85,q =1- 0.,85=孵0.化156枚种蛋孵出的小鸡数x 服从二项分布 .其B(中6,0x.8的5) 可能取值为0,1,2, 3,4,5,6。
教学要求:
掌握正态分布、二项分布、泊松分布的概 率计算方法及应用
Today: 2020/3/5
第一节 二项分布(Binomial distribution)
一、贝努利试验及其概率公式
(一)独立试验和贝努利试验 对于n次独立的试验,如果
每次试验结果出现且只出现对立事件 A与 A之一; ❖在每次试验中出现A的概率是常数p(0<p<1),因 而出现对立事件 A的概率是1-p=q,
S2 =0.51
s2 fk2 ( fk)2 / n n 1 (12002 6212 15 22 232 1 42 102 2) / 200
200 1 0.52
x x=0.51,S2=0.52,这两个数是相当接近的 , 因此
可以认为畸形仔猪数服从波松分布。
Today: 2020/3/5
λ是波松分布所依赖的唯一参数。 λ值愈小 分布愈偏倚,随着λ的增大 ,分 布趋于对称。当 λ= 20时分布接近于正态分布;当λ=50时, 可以 认 为波松分布呈正态分布。 所以在实际工作中, 当 λ≥20时就可以用正态分布来近似地处理波松分 布的问题。
Today: 2020/3/5
Today: 2020/3/5
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ、标准差σ与参数n、p有如下关系:
当试验结果以事件A发生次数k表示时
μ = np
σ = npq
❖当试验结果以事件A发生的频率k/n表示时,
μp = p
σp = (pq) /n
p 也称率的标准误。
则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验。
(二)二项分布的概率
Today: 2020/3/5
在n重贝努利试验中,事件A发生x次的概率恰好
是(q+p)n二项展开式中的第x+1项,因此将
C Pn (k) =
k pkqn-k ,k =称0,1作,2...二..,n项概率公式。
n
二、二项分布的意义及其性质
数为
F(x) = 1
e x
-(x-μ) 2 2σ2
σ 2 π -∞
(二)特征 正态分布密度曲线是以χ=µ
为对称轴的单峰、对称的悬 钟形; f(x)在χ=µ处达到极大值,极 大值为 f(μ)= 1
σ 2π
f(x)是非负数,以x轴为渐进 线;
Today: 2020/3/5
正态分布 密度函数曲线
假设疫苗A完全无效,那么注射后的家畜感染的 概率仍为20%,则15 头家畜中染病头数x=0的概 率为
p(x 0) C105 0.2000.8015 0.0352
Today: 2020/3/5
同理,如果疫苗B完全无效,则15头家畜中 最多有1头感染的概率为
p(x 1) C105 0.200.815 C115 0.210.814 0.1671
Today: 2020/3/5
第五章 常见概率分布律
难度级:
内容提要
Today: 2020/3/5
第一节 二项分布
第二节 泊松分布
第三节 正态分布
第四节 其他概率分布律
Today: 2020/3/5
教学重点:
1. 正态分布、二项分布、泊松分布的概率 计算方法及应用;
2. 正态分布标准化的方法 3. 正态分布表、t值表的用法
Today: 2020/3/5
二项分布是一种离散型随机变量的概率分布,由
n和p两个参数决定,参数n称为离散参数,只能取
正整数;p是连续参数,取值为0与1之间的任何数
值。
二项分布具有概率分布的一切性质,即:
P(X = k) = P(n (kk=) 0≥,10,2,…,n)
∑ ❖ 二项分布n 的Ckn概pk率qn- 之k和= (等q +于p1)n,=即1 :
【例4.14】 为监测饮用水的污染情况, 现检验某 社区每毫升饮用水中细菌数 , 共得400个记录如下 :
试分析饮用水中细菌数的分布是否服从波松分布 。若服从,按波松分布计算每毫升水中细菌数的概 率及理论次数并将頻率分布与波松分布作直观比较 。
Today: 2020/3/5
x 经计算得每毫升水中平均细菌数 =0.500,
Today: 2020/3/5
要观察到这类事件,样本含量n必须很大 。在生 物、医学研究中,服从泊松分布的随机变量是常 见的。
此外,由于泊松分布是描述小概率事件的,因 而二项分布中当p很小n很大时,可用泊松分布
Today: 2020/3/5
第二节 泊松分布 Possion distribution
其中:
Today: 2020/3/5
P6 (0) = C06 (0.85)0 (0.15)6 = (0.15)6 = 0.00001139
P6(1) = C16(0.85)1(0.15)6-1 = 6(0.85)1(0.15)5 = 0.00038728
P6(2) = C62(0.85)2(0.15)6-2 =15(0.85)2(0.15)4 = 0.00548648
x 方差S2=0.496。两者很接近, 故可认为每毫升 x 水中细菌数服从波松分布。以 =0.500代替(
4-23)式中的λ,得 P(x k ) 0.5k e 0.5
k! 计算结果如表4—5所示。
(k=0,1,2…)
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相 当吻合的 , 进一步说明用波松分布描述单位容积( 或面积)中细菌数的分布是适宜的。
P(x=1)=0.511/(1!×1.6653)=0.3063
P(x=2)=0.512/(2!×1.6653)=0.0781
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
4
P(x 4) 1 p(x k) 1 0.9999 0.0001
P6 (6) = C66 (0.85)6 (0.15)6-0 = (0.85)6 = 0.37714952
思考:求 至少孵出3只小鸡的概率是多少? ❖ 孵出的小鸡数在2-5只之间的概率是多大?
Today: 2020/3/5
【例4.10】 设在家畜中感染某种疾病的概率为20 %,现有两种疫苗,用疫苗A 注射了15头家畜后 无一感染,用疫苗B 注射 15头家畜后有1头感染 。设各头家畜没有相互传染疾病的可能,问:应 该如何评价这两种疫苗?
k=0
二项分布的性质
Today: 2020/3/5
m
P(X ≤m) = Pn (k ≤m) =
C
k n
p
k
q
n
k
k=0
n
P(X ≥m) = Pn (k ≥m) = Ckn pkqn-k
k=m
P(m1 ≤X ≤m2 ) Pn (m1 ≤k ≤m2 )
m2
Cnk pk qn-k (m1 ≤m2 ) k m1
【例4.13】 调查某种猪场闭锁育种群仔猪畸形 数,共记录200窝, 畸形仔猪数的分布情况如 表4-3所示。试判断畸形仔猪数是否服从波松 分布。
表4-3 畸形仔猪数统计分布Today: 2020/3/5
样本均数和方差S2计算结果如下:
x =Σfk/n
=(120×0+62×1 +15×2+2×3+1×4)/200
Today: 2020/3/5 如【例4.13】中已判断畸形仔猪数服从波松
分布,并已算出样本平均数=0.51。将0.51代替
公式(4-23)中的λ得:
P( x k ) 0.51k e 0.51 k!
(k=0,1,2,…)
因为e-0.51=1.6653,所以畸形仔猪数各项的概
率为:
P(x=0)=0.510/(0!×1.6653)=0.6005