几种常见概率分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正整数;p是连续参数,取值为0与1之间的任何数
值。
二项分布具有概率分布的一切性质,即:
( k=0,1,2,…,n) P(X = k) = P n (k) ≥0
n 二项分布的概率之和等于 1n ,即: k k n-k
∑C p q
n k =0
= (q +p) = 1
二项分布的性质
k n k P (X ≤m) = Pn (k ≤m) = C k p q n k =0 n m
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p
p 也称率的标准误。
σ p = (pq) /n
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的
P (X ≥m) = Pn (k ≥m) =
k =m
k k n -k C np q
P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1 k k n-k C n p q (m1 ≤m2 ) m2
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ 、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
0 .5 P( x k ) e 0 .5 k!
k
x
(k=0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相
当吻合的 , 进一步说明用波松分布描述单位容积(
或面积)中细菌数的分布是适宜的。
注意,二项分布的应用条件也是波松分 布的应用条件。比如二项分布要求n 次试验是 相互独立的,这也是波松分布的要求。然而一 些具有传染性的罕见疾病的发病数,因为首例 发生之后可成为传染源,会影响到后续病例的 发生,所以不符合波松分布的应用条件。对于 在单位时间、单位面积或单位容积内,所观察 的事物由于某些原因分布不随机时,如细菌在 牛奶中成集落存在时,亦不呈波松分布。
1 F(x) = σ 2π
x
-∞
e
-
(x -μ) 2 2σ2
(二)特征
正态分布密度曲线是以χ =µ
为对称轴的单峰、对称的悬
钟形; f(x)在χ =µ 处达到极大值,极 大值为
f (μ) = 1 σ 2π
f(x)是非负数,以x轴为渐进 线;
正态分布
密度函数曲线
特征
正态分布有两个参数,即平 均数µ 和标准差σ 。µ 是位置参 数,σ 是变异度参数。 分布密度曲线与横轴所夹的 面积为1,即:
形数,共记录200窝, 畸形仔猪数的分布 情况如表4-3所示。试判断畸形仔猪数是否 服从波松分布。
表4-3 畸形仔猪数统计分布
x
样本均数和方差S2计算结果如下:
=Σfk/n
=(120×0+62×1
+15×2+2×3+1×4)/200 S2 =0.51
s2
n 1 2 (120 02 6212 15 22 2 32 1 42 102 ) / 200 200 1
表4-4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊松 分布计算的概率相比较 ,发现畸形仔猪的 频率分布与 λ=0.51 的 波松分布是吻合得很 好的 。这进一步说明了畸形仔猪数是服从 波松分布的。
【例4.14】 为监测饮用水的污染情况, 现检验某 社区每毫升饮用水中细菌数 , 共得400个记录如下 :
此外,由于泊松分布是描述小概率事件的,因
而二项分布中当p很小n很大时,可用泊松分布
第二节
泊松分布 Possion distribution
泊松分布是用来描述和分析稀有事件即小概率事件 分布规律的函数。
在生物、医学研究中,服从波松分布的随机变量是 常见的。如, 一定种群中某种患病率很低的非传染性 疾病患病数或死亡数, 种群中遗传的畸形怪胎数, 每 升饮水中大肠杆菌数,计数器小方格中血球数, 单位 空间中某些野生动物或昆虫数等,都是服从波松分布的。
(二)二项分布的概率 在n重贝努利试验中,事件A发生x次的概率恰好 是(q+p)n二项展开式中的第x+1项,因此将
Pn (k) =
C
k k n-k p q , k = 0,1,2....., n n
称作二项概率公式。
二、二项分布的意义及其性质 (一)定义 设随机变量X所有可能取的值为零和正 整数:0,1,2,…,n,且有
思考:求
至少孵出3只小鸡的概率是多少? 孵出的小鸡数在2-5只之间的概率是多大?
【例4.10】 设在家畜中感染某种疾病的概率为20
%,现有两种疫苗,用疫苗A 注射了15头家畜后
无一感染,用疫苗B 注射 15头家畜后有1头感染。
设各头家畜没有相互传染疾病的可能,问:应该
如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的 概率仍为20%,则15 头家畜中染病头数x=0的概 率为
1 (μ)= e σ 2π
(0, 1)
μ2 - 2
μ 1 , Φ(μ) = e σ 2π ∞
一、泊松分布的意义
(一)定义
若随机变量X(X=k)只取零和正整数值, 且其概率分布为 从参数为λ 的泊松分布,记为X~P(λ )。 (二)特征 μ =σ2=λ
λ k -λ P(X = k) = e k = 0,1,; λ > 0; e = 2.7182 则称 X 服 k!
【例4.13】 调查某种猪场闭锁育种群仔猪畸
如【例4.13】中已判断畸形仔猪数服从波 松分布,并已算出样本平均数=0.51。将 0.51代替公式(4-23)中的 λ得: k
0.51 P( x k ) e 0.51 k!
(k=0,1,2,…)
因为e-0.51=1.6653,所以畸形仔猪数各项的 概率为: P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
(二)应用条件(三个)
n个观察单位的观察结果互相独立; 各观察单位只具有互相对立的一种结果,如 阳性或阴性,生存或死亡等,属于二项分类
资料。
已知发生某一结果(如死亡) 的概率为p,其对 立结果的概率则为1-P=q,实际中要求p 是 从大量观察中获得的比较稳定的数值。
要观察到这类事件,样本含量n必须很大 。在生 物、医学研究中,服从泊松分布的随机变量是常 见的。
Pn (X = k) = Pn (k) =
(其中p>0,q>0,p+q=1),则称随机变量X服从参 数为n和p的二项分布,记为
Cn
k
pk q n-k , k = 0,1,2....., n
x ~ B(n, p)
(二)二项分布的性质 二项分布是一种离散型随机变量的概率分布,由
n和p两个参数决定,参数n称为离散参数,只能取
1 6-1 P6 (1) = C1 = 6(0.85)1(0.15)5 = 0.00038728 6 (0.85) (0.15)
2 P6 (2) = C6 (0.85) 2 (0.15) 6-2 = 15(0.85) 2 (0.15) 4 = 0.00548648
3 6-3 3 3 P6 (3) = C3 ( 0 . 85 ) ( 0 . 15 ) = 20 ( 0 . 85 ) ( 0 . 15 ) = 0.04145344 6
第三节
正态分布 normal distribution
若连续性随机变量X的概率分布密度
f(x) = 1 σ 2π
(x-μ)2 - 2 2 σ e ,-∞< x < +∞ ,σ > 0
一、正态分布的定义及其特征
(一)定义
函数为:
其中,µ 为平均数,σ2 为方差,则称随机变量 χ服从正态分布,记为χ~(µ ,σ2).相应的概率分布函 数为
p( x 0)
0 0 15 C15 0.20 0.80
0.0352
同理,如果疫苗B完全无效,则15头家 畜中最多有1头感染的概率为
0 1 p( x 1) C15 0.2 0 0.815 C15 0.210.814 0.1671
由计算可知 , 注射 A 疫苗无效的概率 为0.0352,比B疫苗无效的概率0.1671小 得多。因此,可以认为A疫苗是有效的,但 不能认为B疫苗也是有效的。
正态分布 密度函数曲线
(x -μ) 2 2σ2
- 1 P (- < x < +∞ )= e -∞ σ 2π +∞
dx = 1
特征
σ相同而μ 不同的三个正态总体
μ相同而σ不同的三个正态总体
二、标准正态分布standard normal distribution
(一)定义 称µ =0, σ 2=1的正态分布为标准正态分布。 标准正态分布的概率密度函数及分布函数如下:
2 2 fk ( fk ) /n
0.52
xx =0.51,S2=0.52,这两个数是相当接近的 , 因此
可以认为畸形仔猪数服从波松分布。
λ是波松分布所依赖的唯一参数。 λ值愈小
分布愈偏倚,随着λ的增大 ,分 布趋于对称。当
λ= 20时分布接近于正态分布;当λ=50时, 可以 认 为波松分布呈正态分布。 所以在实际工作中, 当 λ≥20时就可以用正态分布来近似地处理波松分 布的问题。
二、波松分布的概率计算
由(4-23)式可知,波松分布的概率计算,依 赖于参数 λ的确定,只要参数λ确定了 ,把k=0,1, 2,… 代入(4-23)式即可求得各项的概率。 但是在 大多数服从波松分布的实例中,分布参数λ往往是 未知的,只能从所观察的随机样本中计算出相应 的样本平均数作为 λ 的 估计值,将其代替(4-23) 式中的λ,计算出 k = 0,1,2,… 时的各项概率。
4 P6 (4) = C6 (0.85) 4 (0.15) 6-4 = 15(0.85) 4 (0.15) 2 = 0.17617711
5 6-5 P6 (5) = C5 = 6(0.85)5 (0.15)1 = 0.39933478 6 (0.85) (0.15)
6 6-0 P6 (6) = C6 = (0.85) 6 = 0.37714952 6 (0.85) (0.15)
试分析饮用水中细菌数的分布是否服从波松分布 。若服从,按波松分布计算每毫升水中细菌数的概 率及理论次数并将頻率分布与波松分布作直观比较 。
经计算得每毫升水中平均细菌数 x =0.500,方差S2=0.496。两者很接近, 故可
x 认为每毫升水中细菌数服从波松分布。以
=0.500代替(4-23)式中的λ,得
第一节
二项分布(Binomial distribution) 一、贝努利试验及其概率公式
(一)独立试验和贝努利试验 对于n次独立的试验,如果
每次试验结果出现且只出现对立事件 A 与 A 之一;
在Hale Waihona Puke 次试验中出现A的概率是常数p(0<p<1),因
而出现对立事件 A的概率是1-p=q,
则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验。
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
P( x 4) 1
p( x k ) 1 0.9999 0.0001
k 0
4
把上面各项概率乘以总观察窝数(n=200)即得各 项按波松分布的理论窝数。 波松分布与相应的频 率分布列于表4-4中。
第五章
常见概率分布律
难度级:
内容提要
第一节 二项分布
第二节 泊松分布
第三节 正态分布
第四节 其他概率分布律
教学重点:
1. 正态分布、二项分布、泊松分布的概率 计算方法及应用; 2. 正态分布标准化的方法
3. 正态分布表、t值表的用法
教学要求:
掌握正态分布、二项分布、泊松分布的概 率计算方法及应用
各种可能情况的概率。
这个问题属于贝努里模型(?),其 中 服从二项分布 3,4,5,6。
n=6
,孵化 p = 0.85,q = 1 - 0.85 = 0.15 6枚种蛋孵出的小鸡数x
B(6,0x .85 ) .其中 的可能取值为 0,1,2,
其中:
0 6 6 P6 (0) = C0 ( 0 . 85 ) ( 0 . 15 ) = ( 0 . 15 ) = 0.00001139 6
值。
二项分布具有概率分布的一切性质,即:
( k=0,1,2,…,n) P(X = k) = P n (k) ≥0
n 二项分布的概率之和等于 1n ,即: k k n-k
∑C p q
n k =0
= (q +p) = 1
二项分布的性质
k n k P (X ≤m) = Pn (k ≤m) = C k p q n k =0 n m
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p
p 也称率的标准误。
σ p = (pq) /n
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的
P (X ≥m) = Pn (k ≥m) =
k =m
k k n -k C np q
P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1 k k n-k C n p q (m1 ≤m2 ) m2
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ 、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
0 .5 P( x k ) e 0 .5 k!
k
x
(k=0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相
当吻合的 , 进一步说明用波松分布描述单位容积(
或面积)中细菌数的分布是适宜的。
注意,二项分布的应用条件也是波松分 布的应用条件。比如二项分布要求n 次试验是 相互独立的,这也是波松分布的要求。然而一 些具有传染性的罕见疾病的发病数,因为首例 发生之后可成为传染源,会影响到后续病例的 发生,所以不符合波松分布的应用条件。对于 在单位时间、单位面积或单位容积内,所观察 的事物由于某些原因分布不随机时,如细菌在 牛奶中成集落存在时,亦不呈波松分布。
1 F(x) = σ 2π
x
-∞
e
-
(x -μ) 2 2σ2
(二)特征
正态分布密度曲线是以χ =µ
为对称轴的单峰、对称的悬
钟形; f(x)在χ =µ 处达到极大值,极 大值为
f (μ) = 1 σ 2π
f(x)是非负数,以x轴为渐进 线;
正态分布
密度函数曲线
特征
正态分布有两个参数,即平 均数µ 和标准差σ 。µ 是位置参 数,σ 是变异度参数。 分布密度曲线与横轴所夹的 面积为1,即:
形数,共记录200窝, 畸形仔猪数的分布 情况如表4-3所示。试判断畸形仔猪数是否 服从波松分布。
表4-3 畸形仔猪数统计分布
x
样本均数和方差S2计算结果如下:
=Σfk/n
=(120×0+62×1
+15×2+2×3+1×4)/200 S2 =0.51
s2
n 1 2 (120 02 6212 15 22 2 32 1 42 102 ) / 200 200 1
表4-4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊松 分布计算的概率相比较 ,发现畸形仔猪的 频率分布与 λ=0.51 的 波松分布是吻合得很 好的 。这进一步说明了畸形仔猪数是服从 波松分布的。
【例4.14】 为监测饮用水的污染情况, 现检验某 社区每毫升饮用水中细菌数 , 共得400个记录如下 :
此外,由于泊松分布是描述小概率事件的,因
而二项分布中当p很小n很大时,可用泊松分布
第二节
泊松分布 Possion distribution
泊松分布是用来描述和分析稀有事件即小概率事件 分布规律的函数。
在生物、医学研究中,服从波松分布的随机变量是 常见的。如, 一定种群中某种患病率很低的非传染性 疾病患病数或死亡数, 种群中遗传的畸形怪胎数, 每 升饮水中大肠杆菌数,计数器小方格中血球数, 单位 空间中某些野生动物或昆虫数等,都是服从波松分布的。
(二)二项分布的概率 在n重贝努利试验中,事件A发生x次的概率恰好 是(q+p)n二项展开式中的第x+1项,因此将
Pn (k) =
C
k k n-k p q , k = 0,1,2....., n n
称作二项概率公式。
二、二项分布的意义及其性质 (一)定义 设随机变量X所有可能取的值为零和正 整数:0,1,2,…,n,且有
思考:求
至少孵出3只小鸡的概率是多少? 孵出的小鸡数在2-5只之间的概率是多大?
【例4.10】 设在家畜中感染某种疾病的概率为20
%,现有两种疫苗,用疫苗A 注射了15头家畜后
无一感染,用疫苗B 注射 15头家畜后有1头感染。
设各头家畜没有相互传染疾病的可能,问:应该
如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的 概率仍为20%,则15 头家畜中染病头数x=0的概 率为
1 (μ)= e σ 2π
(0, 1)
μ2 - 2
μ 1 , Φ(μ) = e σ 2π ∞
一、泊松分布的意义
(一)定义
若随机变量X(X=k)只取零和正整数值, 且其概率分布为 从参数为λ 的泊松分布,记为X~P(λ )。 (二)特征 μ =σ2=λ
λ k -λ P(X = k) = e k = 0,1,; λ > 0; e = 2.7182 则称 X 服 k!
【例4.13】 调查某种猪场闭锁育种群仔猪畸
如【例4.13】中已判断畸形仔猪数服从波 松分布,并已算出样本平均数=0.51。将 0.51代替公式(4-23)中的 λ得: k
0.51 P( x k ) e 0.51 k!
(k=0,1,2,…)
因为e-0.51=1.6653,所以畸形仔猪数各项的 概率为: P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
(二)应用条件(三个)
n个观察单位的观察结果互相独立; 各观察单位只具有互相对立的一种结果,如 阳性或阴性,生存或死亡等,属于二项分类
资料。
已知发生某一结果(如死亡) 的概率为p,其对 立结果的概率则为1-P=q,实际中要求p 是 从大量观察中获得的比较稳定的数值。
要观察到这类事件,样本含量n必须很大 。在生 物、医学研究中,服从泊松分布的随机变量是常 见的。
Pn (X = k) = Pn (k) =
(其中p>0,q>0,p+q=1),则称随机变量X服从参 数为n和p的二项分布,记为
Cn
k
pk q n-k , k = 0,1,2....., n
x ~ B(n, p)
(二)二项分布的性质 二项分布是一种离散型随机变量的概率分布,由
n和p两个参数决定,参数n称为离散参数,只能取
1 6-1 P6 (1) = C1 = 6(0.85)1(0.15)5 = 0.00038728 6 (0.85) (0.15)
2 P6 (2) = C6 (0.85) 2 (0.15) 6-2 = 15(0.85) 2 (0.15) 4 = 0.00548648
3 6-3 3 3 P6 (3) = C3 ( 0 . 85 ) ( 0 . 15 ) = 20 ( 0 . 85 ) ( 0 . 15 ) = 0.04145344 6
第三节
正态分布 normal distribution
若连续性随机变量X的概率分布密度
f(x) = 1 σ 2π
(x-μ)2 - 2 2 σ e ,-∞< x < +∞ ,σ > 0
一、正态分布的定义及其特征
(一)定义
函数为:
其中,µ 为平均数,σ2 为方差,则称随机变量 χ服从正态分布,记为χ~(µ ,σ2).相应的概率分布函 数为
p( x 0)
0 0 15 C15 0.20 0.80
0.0352
同理,如果疫苗B完全无效,则15头家 畜中最多有1头感染的概率为
0 1 p( x 1) C15 0.2 0 0.815 C15 0.210.814 0.1671
由计算可知 , 注射 A 疫苗无效的概率 为0.0352,比B疫苗无效的概率0.1671小 得多。因此,可以认为A疫苗是有效的,但 不能认为B疫苗也是有效的。
正态分布 密度函数曲线
(x -μ) 2 2σ2
- 1 P (- < x < +∞ )= e -∞ σ 2π +∞
dx = 1
特征
σ相同而μ 不同的三个正态总体
μ相同而σ不同的三个正态总体
二、标准正态分布standard normal distribution
(一)定义 称µ =0, σ 2=1的正态分布为标准正态分布。 标准正态分布的概率密度函数及分布函数如下:
2 2 fk ( fk ) /n
0.52
xx =0.51,S2=0.52,这两个数是相当接近的 , 因此
可以认为畸形仔猪数服从波松分布。
λ是波松分布所依赖的唯一参数。 λ值愈小
分布愈偏倚,随着λ的增大 ,分 布趋于对称。当
λ= 20时分布接近于正态分布;当λ=50时, 可以 认 为波松分布呈正态分布。 所以在实际工作中, 当 λ≥20时就可以用正态分布来近似地处理波松分 布的问题。
二、波松分布的概率计算
由(4-23)式可知,波松分布的概率计算,依 赖于参数 λ的确定,只要参数λ确定了 ,把k=0,1, 2,… 代入(4-23)式即可求得各项的概率。 但是在 大多数服从波松分布的实例中,分布参数λ往往是 未知的,只能从所观察的随机样本中计算出相应 的样本平均数作为 λ 的 估计值,将其代替(4-23) 式中的λ,计算出 k = 0,1,2,… 时的各项概率。
4 P6 (4) = C6 (0.85) 4 (0.15) 6-4 = 15(0.85) 4 (0.15) 2 = 0.17617711
5 6-5 P6 (5) = C5 = 6(0.85)5 (0.15)1 = 0.39933478 6 (0.85) (0.15)
6 6-0 P6 (6) = C6 = (0.85) 6 = 0.37714952 6 (0.85) (0.15)
试分析饮用水中细菌数的分布是否服从波松分布 。若服从,按波松分布计算每毫升水中细菌数的概 率及理论次数并将頻率分布与波松分布作直观比较 。
经计算得每毫升水中平均细菌数 x =0.500,方差S2=0.496。两者很接近, 故可
x 认为每毫升水中细菌数服从波松分布。以
=0.500代替(4-23)式中的λ,得
第一节
二项分布(Binomial distribution) 一、贝努利试验及其概率公式
(一)独立试验和贝努利试验 对于n次独立的试验,如果
每次试验结果出现且只出现对立事件 A 与 A 之一;
在Hale Waihona Puke 次试验中出现A的概率是常数p(0<p<1),因
而出现对立事件 A的概率是1-p=q,
则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验。
P(x=3)=0.513/(3!×1.6653)=0.0133
P(x=4)=0.514/(4!×1.6653)=0.0017
P( x 4) 1
p( x k ) 1 0.9999 0.0001
k 0
4
把上面各项概率乘以总观察窝数(n=200)即得各 项按波松分布的理论窝数。 波松分布与相应的频 率分布列于表4-4中。
第五章
常见概率分布律
难度级:
内容提要
第一节 二项分布
第二节 泊松分布
第三节 正态分布
第四节 其他概率分布律
教学重点:
1. 正态分布、二项分布、泊松分布的概率 计算方法及应用; 2. 正态分布标准化的方法
3. 正态分布表、t值表的用法
教学要求:
掌握正态分布、二项分布、泊松分布的概 率计算方法及应用
各种可能情况的概率。
这个问题属于贝努里模型(?),其 中 服从二项分布 3,4,5,6。
n=6
,孵化 p = 0.85,q = 1 - 0.85 = 0.15 6枚种蛋孵出的小鸡数x
B(6,0x .85 ) .其中 的可能取值为 0,1,2,
其中:
0 6 6 P6 (0) = C0 ( 0 . 85 ) ( 0 . 15 ) = ( 0 . 15 ) = 0.00001139 6