第三章 几种常见的概率分布律

合集下载

第三章几种常见的概率分布律解读

第三章几种常见的概率分布律解读
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。
(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1) (1) 2 (1)2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
P(2) C42 2 (1)42
** 由此类推到一般情形,在n此贝努利试验中, 共获得x次成功的概率是
P(x) Cnx x (1 )nx
概率
X的概率分布图为
二项分布
0.4
0.35
0.3
0.25
0.2 0.15
0.1
0.05
0
0
1
2
3
4
获得正面的次数x
注意:
0.5时,分布对称; 0.5时,分布偏斜:
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
• 平均数 E( X ) n
定义 n
证明: E( X ) P(x)x x0
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C42种:
ssff sfsf sffs fssf fsfs ffss
注意:C42是从四个位置选取两个位置的组合方式。
依据计算公式Cnx
n! x!(n
, x)!
C42
4! 2!2!
4 3 21=6 21 21
每种方式发生的概率为:

几种常见的概率分布率

几种常见的概率分布率

点数(x)
率(f)
μx P (x)= e –μ . x!
N × P (x)
0
57
0
P(0)=e-3.87 ×3.870/0!=0.0209 54.5072
1
203
203 P(0)=e-3.87 ×3.871/1!=0.0807 210.4656
2
283
766 P(0)=e-3.87 ×3.872/2!=0.1562 407.3696
3
525
1575 P(0)=e-3.87 ×3.873/3!=0.2015 525.5120
4
532
2128 P(0)=e-3.87 ×3.874/4!=0.1949 508.2992
5
408
2040 P(0)=e-3.87 ×3.875/5!=0.1509 393.5472
6
273
1638 P(0)=e-3.87 ×3.876/6!=0.0973 253.7584
几种常见的概率分布率
几种常见的概率分布率

几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
nk
x------在n次抽样中某一种类型的个体数.
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数.

几种常见的概率分布律

几种常见的概率分布律

的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16

ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为

ϕ
3
(1

ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。

生物统计学 几种常见的概率分布律

生物统计学 几种常见的概率分布律

非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9

概率分布函数

概率分布函数

第三章 几种重要的概率分布
例 4 一页书上印刷错误的个数 X 是一个离散型随机变量,它服从参数 为 的泊松分布,一本书共有 300 页,有 21 个印刷错误,求任取 1 页 书上没有印刷错误的概率。 21 7 解:由于 300 页中有 21 个印刷错误,从而平均每页有 个印刷
300 100 7 错误,即离散型随机变量 X 的数学期望 E ( X ) , 100 又由于离散型随机变量 X 服从参数为 的泊松分布,因此数学期望
由概率加法公式得:
n
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m m nm 且 b(m; n, p) Cn p q ( p q) n 1 n
概率 b(m; n, p) 实际上是二项式 ( p q) n 的展开式中的通项公式。
2 2
返回主目录
第三章 几种重要的概率分布
小结与提问: 本次课,我们介绍了贝努里概型与二项公式、二项分布。 二项分布是离散型随机变量的概率分布中的重要分布,我们 应掌握二项分布及其概率计算,能够将实际问题归结为贝努
里概型,然后用二项分布计算有关事件的概率、数学期望与
方差。。 课外作业:P150 习题三 3.01,3.02,3.03,3.04,3.05
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m 0
m 0
称为概率计算的二项公式。
返回主目录
第三章 几种重要的概率分布
二、二项分布
定义 如果随机变量 X 的概率分布为
i PX i C n p i q n i
(0 p 1, p q 1)

第三章第二次课 几种常见的理论分布

第三章第二次课 几种常见的理论分布

第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。

第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。

难点:二项分布的概率函数特征,正态分布的特征。

一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。

对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。

在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。

在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。

先取n =4,k =2来讨论。

在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。

由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。

概率论第三章第3,4节条件分布,独立性

概率论第三章第3,4节条件分布,独立性
1,2,
P X m, Y n q n2 p2 , n 2,3,; m 1,2,n 1
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
§3条件分布
例3 设某班车起点站上车人数 X 服从参数为 ( 0) 的泊松分布,每位乘客在中途下车的概率为 p(0 p 1),
1 f ( x, y) , x y x, f ( y | x ) 当0 x 1, Y | X 2x f X ( x) 其它。 0,
1 P{ X , Y 0} 1 2 ( 3) P{ X | Y 0} 2 P{Y 0} y
1 1 (1 ) 2 3 2 2 1 4 1 1 2
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
§3条件分布
P{ X x , y Y y } FX |Y ( x | y ) lim 0 P{ y Y y }
F ( x , y ) lim [F ( x, y ) F ( x, y )]/ 2 y 0 d lim [ F ( y ) F ( y )] / 2 Y Y FY ( y ) 0 dy y x x f ( u, v )dudv f ( u, y )du y . fY ( y) fY ( y)
n 2
2
第三章 随机变量及其分布
§3条件分布
在 X= m 条件下随机变量Y 的条件分布律为
当m=1,2,3,… 时,
P{Y n | X m}
P{ X m ,Y n} P{ X m }
p 2 q n 2 n m 1 pq , m 1 pq

4 第三章 几种常见的概率分布律

4 第三章 几种常见的概率分布律

φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y

(
y )2 2 2

2
24
F(y) 1
1 2

y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k

2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2

4. 第三章 几种常见的概率分布律

4. 第三章 几种常见的概率分布律

3.4 正态分布

两头少,中间多,两侧对称
正态分布曲线
μ
22

正态分布的密度函数和分布函数

对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2

x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n

将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15

于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n

即需要72代
0 n 0 n

d 几种常见的概率分布律

d  几种常见的概率分布律

三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2

几种常见的分布

几种常见的分布

服从正态分布 N (, 2 ) 的随机变量
X的概率密度是
f (x)
1
e ,
(
x )2 2 2
x
2
X的分布函数P(X≤x)是怎样的呢?
设X~ N (, 2 ) , X的分布函数是
F(x) 1
x
e

(
t )2 2 2
dt
,
x
2
对于连续型随机变量,一般是给出 它的概率密度函数.
一、正态分布的定义
若r.v X的概率密度为
f (x)
1
e ,
(
x ) 2 2
2
x
2
其中 和 2 都是常数, 任意, >0, 则称X服从参数为 和 2的正态分布.
记作 X ~ N (, 2)
f (x)所确定的曲线叫作正态曲线.
P( X k) e k , k0,1,2, ,
k!
其中λ >0 是常数, 则称 X 服从参数为λ 的 泊松分布, 记作X~P(λ ).
泊松分布的图形特点:X~P(λ )
二、二项分布与泊松分布
历史上,泊松分布是作为二项分布的近 似,于1837年由法国数学家泊松引入的.
近数十年来,泊松分布日益显示 其重要性, 成为概率论中最重要的几 个分布之一.
f (x)
1
e ,
(
x )2 2 2
x
2
用求导的方法可以证明, x=μσ
为f (x)的两个拐点的横坐标.
这是高等数学的内容,如果忘记了,课下 再复习一下.
根据对密度函数的分析,也可初步画出正 态分布的概率密度曲线图.
用上海99年年降雨量的数据画出了 频率直方图.

几种常见的概率分布率

几种常见的概率分布率
u
❖对于一般正态分布,要先进行标准化,再查表;
标准化的公式为: u = x -
u
=
x-
=
9.2 10
5
= 0.42
正态分布 σ= 10
标准正态分布 σ=1
μ=5 9.2
x
μ=0 0.42 u
例3.7 查标准正态分布u=-0.82 及u=1.15时的F(u)的值 例3.8 随机变量u服从正态分布N(0,1),问随机变量u的值落
在生物统计学中,正态分布占有极其重要的地位。许多生物学 现象所产生的数据,都服从正态分布。
一、 正态分布(x—N (μ,σ2))的密度函数与分布函数
➢ 正态分布的规律是数据分布集
中在平均数附近,并且在平均
数的两侧成对称分布。正态分
布密度函数的图像,称为正态
曲线。
➢ 密度函数: f (x) =
1
正态曲线
p(x)
=
cnx
px (1-
p)n-x
=
n! x!(n -
x)!
p x (1-
p)n-x
= n(n -1)(n - 2)(n - x 1) px (1- p)n-x
=
1(1-
1
)(1-
x! x -1)
(np) x
(1-
p)n-x
(将系数的分子分母同乘以nx)
n
n
x!
= x (1- p)n-x
=
x!
2
=
1
概率函数内的λ ,不但是它的平均数,而且是
它的方差。
λ很大时, γ1和γ2则接近于0,这时的泊松分布近
似于正态分布。
三、 泊松分布应用实例
例3.5 在麦田中,平均每10m2有一株杂草,问每 100m2麦田中,有0株、1株、2株、…杂草的概率 是多少?

第三章 常见的概率分布率

第三章 常见的概率分布率
1头感染。设各头家畜没有相互传染疾病的 可能,问:应该如何评价这两种疫苗?
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则

几种常见概率分布

几种常见概率分布

[例]我们调查了200个奶牛场,统计各场某10年内出现的怪
胎(如缺皮症,全身无毛等)的头数,然后以怪胎头数把200 个奶牛场分类,统计每类中奶牛场数目,结果如下:
10年内母牛产怪胎次数 0 1 2 3 4 总 计 (m)
奶牛场数(f)
对立事件A 的概率是1-p=q,
则称这一串重复的独立试验为n重贝努利试验,简称贝努 利试验。
(二)二项分布的概率
在贝努利试验中,事件A发生x次的概率恰好等(q+p) n二项展开式中的第x+1项,因此也将
C Pn (x)
x n
p
x
q
n
x
,
称x 作0二,1,项2.概...率., n公式。
二、二项分布的意义及其性质
二项分布 n= 10, p= 0.1
(二)二项分布的性质
二项分布是一种离散型随机变量的概率分布,由n和 p两个参数决定,参数n称为离散参数,只能取正整 数;p是连续参数,取值为0与1之间的任何数值。 二项分布具有概率分布的一切性质,即:
P( X x) P(n (xx)=00,1,2,…,n)
(一)定义 设随机变量X所有可能取的值为零和正整数:
0,1,2,…,n,且有
C Pn ( X x) Pn (x)
x p qx nx , x 0,1, 2....., n
n
(其中p>0,q>0,p+q=1),则称随机变量X服从参数为n和p
的二项分布,记为x ~ B(n, p)
二项分布 n= 10, p= 0.5
P6 (6) C66 (0.85)6 (0.15)60 (0.85)6 0.37714952
思考:求
至少孵出3只小鸡的概率是多少?

3章几种常见的分布

3章几种常见的分布
当gamma分布的形状系数k为正整数时,gamma分布可看作k个独立的指数分布 之和,当k趋向于较大数值时,分布近似于正态分布。
在Gamma分布中:k=n(正整数)时的gamma分布可以看作n个独立的k=1的 gamma分布(即指数分布)之和,按照中心极限定理,独立同分布随机变量 之和趋于正态分布。
几种常见的分布
2019/5/27
1
分类
连续型随机分布
◆ 正态分布、均匀分布、指数分布、对数正态分布、柯西分布、 Gamma分布、瑞利分布、韦伯分布、三角形分布
离散型随机分布
◆ 二项分布、几何分布、超几何分布、泊松分布
三大抽样分布
◆ 卡方分布、F分布、t分布
分布之间的关系
2019/5/27
应用:在自然情况下,均匀分布极为罕见。在实际问题中,当我们无法区分在 区间内取值的随机变量取不同值的可能性有何不同时,我们就可以假定随机变 量服从区间上的均匀分布。
2019/5/27
4
三、指数分布(Exponential distribution)
应用:主要用于描述独立事件发生的时间间隔。自然界中有很多种“寿命”可 以用指数分布来描述,如电子元件的寿命、动物的寿命、电话的通话时间、服 务系统的服务时间等。
定义:已知一个事件在伯努利试验中每次的出现概率是p,在一连串伯努利 试验中,一件事件刚好在第r + k次试验出现第r次的概率。
2019/5/27
取r = 1,负二项分布等于几 何分布。其概率质量函数 为
13
十二、几何分布
定义:在第 n 次伯努利实验,才得到第一次成功的机率。更详细的说是:n 次伯努利试验,前 n-1 次皆失败,第 n 次才成功的概率。
应用:泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某 一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台 的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷 陷数,显微镜下单位分区内的细菌分布方分布

几种常见概率分布

几种常见概率分布
正整数;p是连续参数,取值为0与1之间的任何数
值。
二项分布具有概率分布的一切性质,即:

( k=0,1,2,…,n) P(X = k) = P n (k) ≥0
n 二项分布的概率之和等于 1n ,即: k k n-k
∑C p q
n k =0
= (q +p) = 1
二项分布的性质

k n k P (X ≤m) = Pn (k ≤m) = C k p q n k =0 n m
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p
p 也称率的标准误。
σ p = (pq) /n
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的

P (X ≥m) = Pn (k ≥m) =
k =m
k k n -k C np q

P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1 k k n-k C n p q (m1 ≤m2 ) m2
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ 、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
0 .5 P( x k ) e 0 .5 k!
k
x
(k=0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相
当吻合的 , 进一步说明用波松分布描述单位容积(
或面积)中细菌数的分布是适宜的。

生物统计学(第3版)杜荣骞 课后习题答案 第三章 几种常见的概率分布律

生物统计学(第3版)杜荣骞 课后习题答案 第三章  几种常见的概率分布律

第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。

()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为0.218 75。

3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+ 表型共有1+5+10+10+5+1 = 32种。

(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。

3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。

第三章 概率与概率分布 华中农业大学生物统计学讲义

第三章 概率与概率分布 华中农业大学生物统计学讲义

该试验样本空间由10个等可能的基本事件构成,即n=10,而事 件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一 个,事件A便发生。
P(A)=3/10=0.3
P(B)=5/10=0.5
12 3 4 5
6
7
8 9 10
一、概率基本概念
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3
P(A)=3/10=0.3
12 3 4 5
6
7
8
9 10
一、概率基本概念
B= “一次取5个球,其中有2个红球的概率” 10个球中任意取5个,其可能结果有C105个基本事件,即n= C105 事件B =5个球中有2个红球,则B包含的基本事件数m= C32 C73
P(B) = C32 C73 / C105 = 0.417
2、在一定条件下可能发生也可能不 发生。
(二)频率(frequency)
一、概率基本概念
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
例:
一、概率基本概念
设样本空间有n个等可能的基本事件所构成,其中事件A包 含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。
古典概率(classical probability) 先验概率(prior probability)
一、概率基本概念
1 2 3 4 5 6 7 8 9 10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数

常见的概率分布

常见的概率分布

常见的概率分布离散分布0-1分布(伯努利分布)它的分布律为:\[P\{X=k\}=p^k(1-p)^{1-k}, k=0,1, (0<p<1)\]0-1分布记作:\(X \sim b(1,p)\)期望:\(E(X)=p\)⽅差:\(D(X)=p(1-p)\)常⽤的场景:新⽣婴⼉性别的登记,招⽣考试的录取,产品的是否合格,硬币的正反⾯。

⼆项分布⼆项分布为\(n\)重伯努利实验的概率分布。

分布律为:\[P\{X=k\}=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k},k=0,1,2,...,n,(0<p<1)\]\[\sum\limits_{k=0}^{n}P\{X=k\}=\sum\limits_{k=0}^{n}\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}=(p+1-p)^n=1\]⼆项分布记作:\( X \sim b(n,p)\)期望:\(E(X)=np\)⽅差:\(D(X)=np(1-p)\)常⽤的场景:⽐如⼀个⼈射击\(n\)次,其中\(k\)次命中的概率,抽查50台设备,其中10台出故障的概率等等。

从下⾯的图中,我们可以看到命中次数先增加,到了3达到最⼤,之后⼜逐渐减少,⼀般来说,对于固定的\(n,p\),都具有这⼀性质。

(1)当\((n+1)p\)不为整数时,⼆项概率\(P\{X=k\}\)在\(k=[(n+1)p]\)时达到最⼤值;(2)当\((n+1)p\)为整数时,⼆项概率\(P\{X=k\}\)在\(k=(n+1)p,k=(n+1)p-1\)时达到最⼤值。

%每轮射击10次,命中概率0.3,射击10000轮,x中返回的是每轮中命中的次数x=binornd(10,0.3,10000,1);%bin的数⽬为10hist(x,10);N=100;p=0.4;k=0:N;%事件发⽣k次的概率pdf=binopdf(k,N,p);%事件发⽣不⼤于k次的概率cdf=binocdf(k,N,p);plotyy(k,pdf,k,cdf);grid on;多项分布多项式分布是⼆项式分布的扩展,在多项式分布所代表的实验中,⼀次实验会有多个互斥结果,⽽⼆项式分布所代表的实验中,⼀次实验只有两个互斥结果。

生物统计学:几种常见的概率分布律

生物统计学:几种常见的概率分布律

头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)
的随机变量。于是窝产10头仔猪中有7头是白色的概率
为:
10! P ( x 7) C 0.75 0.25 0.75 7 0.253 0.2503 7!3!
7 10 7 3
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
1-p=q,则称这一串重复的独立试验为n重贝努利试验,
简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离 散型随机变量,如孵n枚种蛋的出雏数、n头病 畜治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。 在n重贝努利试验中,事件 A 可能发生0,1, 2,…,n次,现在我们来求事件A恰好发生 k(0≤k≤n)次的概率Pn(k)。
四、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变 量之平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
μ=np
(3-5)
(3-6)
npq
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差
一、波松分布的意义
若随机变量x(x=k)只取零和正整数值0,1, 2,…,且其概率分布为
k , k=0,1,…… (3-10) P( x k ) e k!
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 几种常见的概率分布律
二项分布
泊松分布 离散型变量 超几何分布 负二项分布 连续型变量
正态分布 指数分布
第一节 二项分布
(Binomial Distribution)
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果,并
且发生每种结果的概率是一定的。
根据题意, n 2000 , 0 . 70 。
平均数 n 2000 2000 0 . 7 0 . 3 20 . 4

二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 Y 为所抽取的3件产品中的次品数,则根据二项分 布公式有
y 1 • Y的分布函数 F ( y ) P ( Y y ) f ( y ) d y e
2
d y

正态分布曲线的主要特征:
(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是 x=μ (2)曲线是非负函数,以x轴为渐近线,分布从-∞到∞ (3)曲线在x=μ±σ处各有一个拐点,即在[μ-σ, μ+σ]范 围内是上凸,其余是下凸。 (4)曲线有两个参数:μ和σ。 μ代表平均数,σ代表 标准差, μ和σ一起决定曲线的位置和形状。 μ越大, 则曲线沿x轴越向右移动;反之向左。 σ是变异度参 数, σ愈大则曲线愈“胖”;反之则愈瘦。
2. 泊松分布的概率函数与特征数
泊松分布变量 Y 只取零和正整数: 0,1,2… ,其概率 函数为
P(y)

y
y!
e

其中 0 , e2 . 7182 是自然对数底数。
注意: P ( y ) 怎么得到的呢?泊松分 布可以用二项分布 n , 0 , y !
y y y n y n 的情形来近似。在这种 情形下 C ( 1 ) e , 证明见 46 页 n
这说明每穴种6粒种子,几乎肯定出苗。
4 二项分布的概率分布表和概率分布图
除以P(y)表示,二项分布也可通过表或图来直观显示。
例如,抛硬币4次,获得的正面数记为Y,则Y服从二项 分布。Y的概率分布表为 Y P(y)
n 4 , 0 . 5 ,
0 0 4 P ( 0 ) C . 5 0 . 5 0 . 062 40

数学期望与方差
计算程序: P ( Y ) =hypgeomdist ( y , n , M ,
N)
例子

四川卧龙大熊猫自然保护区共有野生大熊猫 100只,其中10 只做了标记。某小组去调查研究大熊猫的生活习性,随机观 察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?

解:依题意有N=100,M=10,n=15,y=5,求p(5)
10 ! 7 3 0.75 0.25 7 ! 3 ! 0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为 0.67 。现任取 6 粒种子种1穴中,问这穴至少有1粒种子出苗的概率 是多少?
解:根据题意,这是一 个二项分布的问题。 视出苗为成功 n 6 , = 0 . 67 。 设出苗的种子数为 y , 则 y 服从二项分布。
P ( 至少有 1 粒出苗 ) = P ( y 1 ) P ( y 1 ) P ( y 2 ) P ( y 6 )
1 1 5 2 2 4 6 6 0 C 0 . 67 0 . 33 C 0 . 67 0 . 33 C 0 . 67 0 . 33 6 6 6
2 2 3 2 P Y 2 C ( 0 . 05 ) ( 0 . 95 ) 0 . 0071 3
二项分布的程序计算方法

二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排列 组合数C n m 计算函数Combin(m,n)
p ( 5 ) =hypgeomdist ( y , n , M , N ) =hypgeomdist

(5,15,10,100)=0.00569
第三节 正态分布
(Normal Distribution)
正态分布是一种最重要的连续型变量的概率分布。
• 在生物科学研究里,有许多变量是服从或近似 服从正态分布的,如水稻产量、小麦株高、玉 米百粒重等; • 许多统计分析方法是以正态分布为基础的。 • 不少随机变量的概率分布在样本容量增大时趋于 正态分布。 因此,在统计学里,正态分布无论在理论研究上还是在实际
第二节 泊松分布
(Poisson Distribution)
1. 在什么情形下应用泊松分布
泊松分布是一种用来描述一定的空间或时间里稀有事件发生次 数的概率分布。 服从泊松分布的变量的一些例子: • 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 • 畜群中遗传的畸形怪胎数 • 单位空间内某些野生动物或昆虫数 • 每升饮水中的大肠杆菌数
2 2 4 2 P ( 2 ) C ( 1 ) 4
* *由此类推到一般情形, 在 n 此贝努利试验中,共 得 y 次成功的概率是
y y n y P (y ) C ( 1 ) n
关于 P ( y ) C ( 1 ) 的讨论:
y y n n y
y y n y n ( 1 )从形式上来说, C ( 1 ) 是二项式 [ ( 1 )] 展开 n
5 二项分布变量的平均数和标准差

平均数
E ( Y ) n
Var ( X ) n ( 1 )
2

方差和标准差
n ( 1 )
例三,某树种幼苗成材率为70%,现种植2000 株,问成材幼苗数的平均值和标准差是多少?
解:设 2000 株幼苗的成材数为 Y ,则 Y 服从二项
大约有 100 P ( X 3 ) 100 0 . 4232 42 . 32 ( 张 )
程序计算
Poisson(y,µ,true or false)

超几何分布

适用范围:多次完全相同并且相互独立的重 复试验,如果在有限总体中不重复抽样,抽 样成功的次数Y的概率分布服从超几何分布, 如福利彩票
σ=0.5 σ=1 σ=2
(5)曲线下和x轴所夹的总面积为1
2 标准正态分布

定义:μ=0,σ=1时的正态分布称为标准正态分布。 标准正态分布变量记为U,写作 U~N(0,1)。
1 密度函数: ( u ) e 2
2. 二项分布的常用符号
n:贝努利试验的次数(或 样本含量)
y :在 n 次试验中事件 A 出现的次数,即二项分 布变量 Y 的取值
:事件 A 发生的概率 ( 每次试验都是恒定的 )
1 - :事件 A 发生的概率
p ( y ):Y 的概率函数即 P ( Y y )
F ( y ) P ( Y y ) p ( y i)
0 . 0157 0 . 0799 0 . 0905 0 . 9987 另外一种方法:
P ( 至少有 1 粒出苗 ) = 1 - P ( 没有出苗 ) = 1 P ( y 0 )
0 0 6 1 C 0 . 67 0 . 33 1 0 . 0013 0 . 9987 6
的第 y 1 项,所以有“二项分布 ”这个名称。
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子 二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪 的概率。
解:根据题意,这是一 个二项分布的问题, 3 视白猪为成功,有 n 10 , = 0 .75 , y7 。 4
7 7 1 7 0 P ( y 7 ) P ( 7 ) C 0 . 75 ( 1 0 . 75 ) 10

泊松分布的平均数
= E ( X )

泊松分布的方差和标准差
= Var ( X )
2


例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告, 平均每张样片可以观察到3个微粒,问在一次观察中看到3个 微粒的概率是多大?少于3个微粒的概率是多少?若观察100 张片子,大约有多少张片子看到的微粒数少于3个?
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了 n 次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量Y;Y称为二项分布变量,Y的概率分布 称为二项分布。 Y的可能取值为0,1,2,…,n。所以Y是个离散型变量。
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数Y服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为Y,则Y服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数Y服从二项分布。 (4)n头病畜治疗后的治愈数Y,Y服从二项分布。 (5)n尾鱼苗的成活数Y,Y服从二项分布。
0
1 2 3 4
0.062
0.250 0.375 0.250 0.062
Y的概率分布图为
二项分布 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 获得正面的次数y 3 4
注意:
0.5时,分布对称; 0.5时,分布偏斜:
概率
0.5时,正偏 0.5时,负偏
应用中均占有重要的地位。
相关文档
最新文档