几种常见的概率分布律
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进行抽样,样本总和数 k (0≤k≤n))的概率分布。
P(k ) = Cnk pk qn−k
某实验中小白鼠染毒后死亡概率P,则生存概率为1-P 。 对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(P2)、甲死乙生 (P(1-P))、乙死甲生((1-P)P)或甲乙均生( (1-P)2),概率相加得
P2 + P(1-P) + (1-P)P + (1-P)2 = [P + (1-P)]2 依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得
bbrr的家兔,只有ϕ n 项不含bbrr的家兔。因此,n值可以由ϕ n =1-0.99求
出。由
ϕn
=
⎛ 15 ⎜⎝ 16
⎞n ⎟⎠
=
0.01
得 n (lg15 − lg16) = lg 0.01, −0.02803n = −2.0000
所以 n=71.4
另外,以0.1%的风险至少得到一个黑色长毛兔(B_R_)所需F2代的数目。
p (mmmfffffff ) = ϕ3 (1− ϕ )7
显然,这不是抽中3只雄性动物的唯一方式,从10次抽样中抽到3只雄性动物
的组合数有 C130 。因此
p (3) = C130ϕ 3 (1− ϕ )7
对于任意n和x有通式
p ( x) = Cnxϕ x (1− ϕ )n−x , x = 0, 1, 2, ", n
n
= ∑p( x) x=0
• 因为 ϕ + (1−ϕ ) = 1 ,所以
•
n
∑
p
(
x)
=
⎡⎣ϕ
+
(1 − ϕ
)⎤⎦n
=1
x=0
• 根据二项分布的概率函数式,可以求出雄性动物出现各种只 数的概率。如 x = 0, 1, 2, 3只的概率分别为:
p(0)
=
10!
0!(10 −
⎛
0)!⎜⎝
1 2
⎞0 ⎟⎠
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
偏斜度和峭度与和的大小有关。
当 ϕ 相同时,随n增加,γ1 和 γ 2逐渐接近于0。或当n相同时, ϕ 越接近于0.5, γ1 和 γ 2 越接近于0。正态分布的 γ1 =0, γ 2 =0。所以,随样本数增加,二项分布 渐接近于正态分布,特别是越接近于0.5附近时,这种接近来得更快。
• 例: 遗传学中,若两个纯合亲本杂交(RR×rr),F1代自 交,其F2的基因型分离比(1RR : 2Rr : 1rr)是一个二项分布 问题。在F2代中R基因出现的概率 ϕ = 1/ 2 ,r 基因出现的概 率 1−ϕ = 1/ 2 ,对于一对因子n = 2。展开二项式,
⎡⎣ϕ + (1− ϕ )⎤⎦2 = ϕ 2 + 2ϕ (1− ϕ ) + (1− ϕ )2
系数分子分母同乘以 nx ,则 :
p
(
x)
=
(1)
⎛⎜⎝1
−
1 n
⎞⎟⎠" ⎛⎜⎝1 −
x
−1 n
⎞ ⎟⎠
(
nϕ
)x
(1−
x!
ϕ
)n−x
当时n → ∞ ,系数极限为1,且 nϕ = μ ,
p(x)
=
μx
x!
(1− ϕ )n−x
=
μx
x!
⎡⎢⎣(1
−
ϕ
)− 1 ϕ
⎤ −ϕ ( n− x ) ⎥⎦
p( x) = μx e−μ
⎛ ⎜⎝
1 2
⎞ ⎟⎠
=
1 16
。
而三显一隐这种情况总的概率为
4。
16
• ϕ 2 (1−ϕ )2 等的情况与上述类似,不再一一叙述。
例: 用棕色正常毛(bbRR)家兔与黑色短毛兔(BBrr) 杂交。杂种F1为黑 色正常毛长的家兔(BrRr),F1雌兔与F1雄兔近亲交配,F2期望产生9/16 黑色正常毛,3/16黑色短毛,3/16棕色正常毛,1/16棕色短毛家兔。即
第三章 几种常见的概率分布律
概率计算比较复杂,生物统计中所用的概率计算主要利用变数的分布进行。
§3.1 二项分布
3.1.1 二项分布的概率函数
说明结果只有两种情况的n次实验中 发生某种结果为x次的概率分布
在生物学、医学领域,二项分布可以描述很多现象,是一种重要的理论
分布,在分类资料的统计推断中有非常广泛的应用 。
应用基本情况:在一随机试验中,每次都有两种互不相容
的可能结果,如有效(事件A )和无效(事件 A )等。独立地 将试验重复n次,求在n次试验中,一种结果出现x次的概率?
应用条件:每一种结果在每次试验中都有恒定的概率,试
验之间是独立的。
二项分布(binomial distribution)
二项分布是指在μ=p的二项总体中,以样本容量n
显然,在10次试验中,抽到雄性动物的只数是一随机变 量,记为X(其可能值为0, 1,…, 10)。现在要求X=3和X≤3 的概率。
先规定一组符号: n —— 试验次数(或样本含量)
—— 在次试验中事件出现的次数
ϕ —— 事件 A 发生的概率(每次试验是恒定的)
1− ϕ —— 事件 A 发生的概率
p ( x) —— X 的概率函数—— P ( X = x) F ( x) = P ( X ≤ x) = ∑ p ( xi )
近似法进行样本率与总体率,两个样本率比较的u检验。
若p接近0.5,n很大,二项 概率分布趋于正态分布。
§3.2 泊松分布
3.2.1 泊松分布的概率函数
描述一定空间(长度、面积和体积)或 时间间隔内点子散布状况的理想化模 型. 是二项分布n很大而P很小时的特 殊形式,是二分类资料在n次实验中 发生x次某种结果的概率分布。
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
Cn0 Pn + Cn1 P(1-P)n-1 + ... + Cnx Px(1-P)n-x + ... + Cnn (1-P)x = [P + (1-P)]n
其中n为样本含量,即事件发生总数,x为某事件出现次数,
因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x 次的概率分布。其概率密度为:
x!
=
μx
x!eμ
,
x = 0,
1,
2,
"
1
e =lim(1+ z)z x→∞
lim(1−ϕ)−ϕ1 =e
ϕ→0
3.2.2 服从泊松分布的随机变量的特征数
平均数 :泊松分布概率函数中的 μ就是泊松分布的平均数 μ 。
方差 :泊松分布的一个特点是在概率函数内的 μ ,它不但是平
均数,而且是它的方差。
• 如若不然,第一次抽到的是雄性,那么第二次抽到 雄性的概率是49/99,而抽到雌性的概率是50/99。第 一次试验的结果影响到第二次试验中各事件发生的 概率。两次试验非独立(非放回式抽样)。
放回式抽样,适合于二项分布。 非放回式抽样,适合于超几何分布。
用放回式抽样共进行10试验,问其中包括3只雄性动物的概率 是多少?包括3只及3只以下的概率是多少?
偏斜度 :
γ1 =
1
μ
峭度 :
γ
2
=
1
μ
Poisson分布的性质:
(1) Poisson分布均数与方差相等; (2) Poisson分布均数µ较小时呈偏态分布,µ≥20 时近似正态分布; (3) n很大,P很小,nP = µ 为常数时二项分布趋 近于Poisson分布;
(4) n个独立的Poisson分布相加仍符合Poisson分布
xi ≤ xwenku.baidu.com
x
x
上例中,共做10次抽样,n=10,在10次抽样中,雄性出现3次,x=3,每次 抽到雄性的概率是0.50。p (3)为10次抽样中抽中3只雄性动物的概率,F
(3)为10次抽样中,抽中3只和3只以下雄性动物的概率。根据以上给出
的 n , 和 ϕ 求出p (3)和F (3)。
假设前三次抽中的都是雄性(m),由于抽样间是独立的,每次抽到雄 性动物的概率均为,抽到雌性(f)的概率均为。故
=
⎛ ⎜⎝
1 2
⎞2 ⎟⎠
+
2
⎛ ⎜⎝
1 2
⎞ ⎟⎠
⎛ ⎜⎝
1 2
⎞ ⎟⎠
+
⎛ ⎜⎝
1 2
⎞2 ⎟⎠
=1+2+1 444
即
1 RR : 2 Rr : 1 rr
4 44
如果考虑两对独立因子,如黄圆豌豆YYRR和绿皱豌豆yyrr杂交,F1为
YyRr,F2的因子是自由组合的。其中Y和R在F2代中出现的概率均为 ϕ ,y
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
= 0.1718751
3.1.2 服从二项分布的随机变量的特征数
平均数 μ = nϕ 。 当以比率表示时,μ = ϕ 。
方差 σ 2 = nϕ (1−ϕ ) 。当以比率表示时,σ 2 = ϕ (1−ϕ ) 。
n
偏斜度 峭度
γ1 =
1− 2ϕ
nϕ (1−ϕ )
γ
2
=
nϕ
1
(1 − ϕ
)
−
6 n
二项分布的图形特征如下:
9 B _ R _ : 3 B _ rr : 3 bbR _ : 1 bbrr
16
16
16
16
问需多少F2代(n事件总和)才能以99%的概率(累积)得到一棕色短毛兔? (可以从0~x只)。 解 在含有n只家兔的后代群体中,bbrr家兔出现x只的概率可由 ⎡⎣ϕ + (1−ϕ )⎤⎦n求
出,其中 ϕ 为非bbrr家兔的概率为15/16,(1−ϕ )为bbrr家兔的概率为 1/16。在 ⎡⎣ϕ + (1−ϕ )⎤⎦n 展开式中,所有含 (1−ϕ ) 的项都相应地含一个或多个
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
P(x) = Cnx Px(1-P)n-x, x = 0,1,...,n。
• 例3.1 从雌雄各半的100只动物中做一抽样试验,每
次抽取一只,记录性别并放回,再做下一次抽取。 这时,不论前一次抽取的动物性别如何,下一次抽 取到雄性或雌性的概率仍为50/100。前一次试验结 果并不影响到下一次试验中各种事件发生的概率。 因此,这前后两次试验是独立的(放回式抽样)。
和r基因出现的概率均为 (1−ϕ ) ,ϕ = 1−ϕ = 1 ,对于两对因子n=4。展
开二项式,
2
⎡⎣ϕ + (1−ϕ )⎤⎦4
= ϕ 4 + 4ϕ3 (1−ϕ ) + 6ϕ 2 (1−ϕ )2 + 4ϕ (1−ϕ )3 + (1− ϕ )4
由于ϕ 代表显性基因出现的概率,所以表示四个都是显形基因(YYRR)
当 μ 很大时,γ1 和 γ 2 则接近于0,
这时的泊松分布近似正态分布。
泊松分布的应用
主要用于符合泊松分类资料率的区间估计和假设检验。
¾ 当µ≥20时,根据正态近似的原理,对总体均数进行95%的区间估 计。 ¾ 通过直接计算Poisson分布的累计概率进行单侧假设检验。 ¾ 在符合正态近似条件时,也可用u检验进行样本率与总体率,两个 样本率比较的假设检验。
= 0.0439453
( ) p
(3)
=
10!
3!(10 −
⎛
3)!⎜⎝
1 2
⎞3 ⎟⎠
⎛ ⎜⎝
1 2
⎞7 ⎟⎠
= 120
2−10
= 0.1171876
• 抽到3只和3只以下雄性动物的概率
F (3) = p (0) + p (1) + p (2) + p (3)
( ) ( ) ( ) = 2−10 +10 2−10 + 45 2−10 +120 2−10 ( ) = 176 2−10
在二项分布中,当某事件出现的概率特别小( ϕ → 0 ),而
样本含量又很大(n → ∞)且 nϕ = μ 时,二项分布就变成泊
松分布。因此,其概率函数可由二项分布概率函数推导出
来:
p(x)
=
n!
x!(n −
x)!ϕ x
(1 − ϕ )n−x
=
n (n −1)"(n −
x!
x + 1) ϕ x
(1 − ϕ )n−x
可以由
⎛7 ⎝⎜ 16
⎞n ⎠⎟
=
0.001
求出。因为F2代的分离比是7/16非B_R_对9/16 B_R_。
二项分布的应用
主要用于符合二项分布分类资料的区间估计和假设检验。
¾ 当总体率P接近0.5,阳性数x较小时,可直接计算二项分 布的累计概率进行单侧的假设检验。 ¾ 当P = 0.5或n较大,nP及n(1-P)均大于等于5时,可用正态
P(k ) = Cnk pk qn−k
某实验中小白鼠染毒后死亡概率P,则生存概率为1-P 。 对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(P2)、甲死乙生 (P(1-P))、乙死甲生((1-P)P)或甲乙均生( (1-P)2),概率相加得
P2 + P(1-P) + (1-P)P + (1-P)2 = [P + (1-P)]2 依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得
bbrr的家兔,只有ϕ n 项不含bbrr的家兔。因此,n值可以由ϕ n =1-0.99求
出。由
ϕn
=
⎛ 15 ⎜⎝ 16
⎞n ⎟⎠
=
0.01
得 n (lg15 − lg16) = lg 0.01, −0.02803n = −2.0000
所以 n=71.4
另外,以0.1%的风险至少得到一个黑色长毛兔(B_R_)所需F2代的数目。
p (mmmfffffff ) = ϕ3 (1− ϕ )7
显然,这不是抽中3只雄性动物的唯一方式,从10次抽样中抽到3只雄性动物
的组合数有 C130 。因此
p (3) = C130ϕ 3 (1− ϕ )7
对于任意n和x有通式
p ( x) = Cnxϕ x (1− ϕ )n−x , x = 0, 1, 2, ", n
n
= ∑p( x) x=0
• 因为 ϕ + (1−ϕ ) = 1 ,所以
•
n
∑
p
(
x)
=
⎡⎣ϕ
+
(1 − ϕ
)⎤⎦n
=1
x=0
• 根据二项分布的概率函数式,可以求出雄性动物出现各种只 数的概率。如 x = 0, 1, 2, 3只的概率分别为:
p(0)
=
10!
0!(10 −
⎛
0)!⎜⎝
1 2
⎞0 ⎟⎠
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
偏斜度和峭度与和的大小有关。
当 ϕ 相同时,随n增加,γ1 和 γ 2逐渐接近于0。或当n相同时, ϕ 越接近于0.5, γ1 和 γ 2 越接近于0。正态分布的 γ1 =0, γ 2 =0。所以,随样本数增加,二项分布 渐接近于正态分布,特别是越接近于0.5附近时,这种接近来得更快。
• 例: 遗传学中,若两个纯合亲本杂交(RR×rr),F1代自 交,其F2的基因型分离比(1RR : 2Rr : 1rr)是一个二项分布 问题。在F2代中R基因出现的概率 ϕ = 1/ 2 ,r 基因出现的概 率 1−ϕ = 1/ 2 ,对于一对因子n = 2。展开二项式,
⎡⎣ϕ + (1− ϕ )⎤⎦2 = ϕ 2 + 2ϕ (1− ϕ ) + (1− ϕ )2
系数分子分母同乘以 nx ,则 :
p
(
x)
=
(1)
⎛⎜⎝1
−
1 n
⎞⎟⎠" ⎛⎜⎝1 −
x
−1 n
⎞ ⎟⎠
(
nϕ
)x
(1−
x!
ϕ
)n−x
当时n → ∞ ,系数极限为1,且 nϕ = μ ,
p(x)
=
μx
x!
(1− ϕ )n−x
=
μx
x!
⎡⎢⎣(1
−
ϕ
)− 1 ϕ
⎤ −ϕ ( n− x ) ⎥⎦
p( x) = μx e−μ
⎛ ⎜⎝
1 2
⎞ ⎟⎠
=
1 16
。
而三显一隐这种情况总的概率为
4。
16
• ϕ 2 (1−ϕ )2 等的情况与上述类似,不再一一叙述。
例: 用棕色正常毛(bbRR)家兔与黑色短毛兔(BBrr) 杂交。杂种F1为黑 色正常毛长的家兔(BrRr),F1雌兔与F1雄兔近亲交配,F2期望产生9/16 黑色正常毛,3/16黑色短毛,3/16棕色正常毛,1/16棕色短毛家兔。即
第三章 几种常见的概率分布律
概率计算比较复杂,生物统计中所用的概率计算主要利用变数的分布进行。
§3.1 二项分布
3.1.1 二项分布的概率函数
说明结果只有两种情况的n次实验中 发生某种结果为x次的概率分布
在生物学、医学领域,二项分布可以描述很多现象,是一种重要的理论
分布,在分类资料的统计推断中有非常广泛的应用 。
应用基本情况:在一随机试验中,每次都有两种互不相容
的可能结果,如有效(事件A )和无效(事件 A )等。独立地 将试验重复n次,求在n次试验中,一种结果出现x次的概率?
应用条件:每一种结果在每次试验中都有恒定的概率,试
验之间是独立的。
二项分布(binomial distribution)
二项分布是指在μ=p的二项总体中,以样本容量n
显然,在10次试验中,抽到雄性动物的只数是一随机变 量,记为X(其可能值为0, 1,…, 10)。现在要求X=3和X≤3 的概率。
先规定一组符号: n —— 试验次数(或样本含量)
—— 在次试验中事件出现的次数
ϕ —— 事件 A 发生的概率(每次试验是恒定的)
1− ϕ —— 事件 A 发生的概率
p ( x) —— X 的概率函数—— P ( X = x) F ( x) = P ( X ≤ x) = ∑ p ( xi )
近似法进行样本率与总体率,两个样本率比较的u检验。
若p接近0.5,n很大,二项 概率分布趋于正态分布。
§3.2 泊松分布
3.2.1 泊松分布的概率函数
描述一定空间(长度、面积和体积)或 时间间隔内点子散布状况的理想化模 型. 是二项分布n很大而P很小时的特 殊形式,是二分类资料在n次实验中 发生x次某种结果的概率分布。
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
Cn0 Pn + Cn1 P(1-P)n-1 + ... + Cnx Px(1-P)n-x + ... + Cnn (1-P)x = [P + (1-P)]n
其中n为样本含量,即事件发生总数,x为某事件出现次数,
因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x 次的概率分布。其概率密度为:
x!
=
μx
x!eμ
,
x = 0,
1,
2,
"
1
e =lim(1+ z)z x→∞
lim(1−ϕ)−ϕ1 =e
ϕ→0
3.2.2 服从泊松分布的随机变量的特征数
平均数 :泊松分布概率函数中的 μ就是泊松分布的平均数 μ 。
方差 :泊松分布的一个特点是在概率函数内的 μ ,它不但是平
均数,而且是它的方差。
• 如若不然,第一次抽到的是雄性,那么第二次抽到 雄性的概率是49/99,而抽到雌性的概率是50/99。第 一次试验的结果影响到第二次试验中各事件发生的 概率。两次试验非独立(非放回式抽样)。
放回式抽样,适合于二项分布。 非放回式抽样,适合于超几何分布。
用放回式抽样共进行10试验,问其中包括3只雄性动物的概率 是多少?包括3只及3只以下的概率是多少?
偏斜度 :
γ1 =
1
μ
峭度 :
γ
2
=
1
μ
Poisson分布的性质:
(1) Poisson分布均数与方差相等; (2) Poisson分布均数µ较小时呈偏态分布,µ≥20 时近似正态分布; (3) n很大,P很小,nP = µ 为常数时二项分布趋 近于Poisson分布;
(4) n个独立的Poisson分布相加仍符合Poisson分布
xi ≤ xwenku.baidu.com
x
x
上例中,共做10次抽样,n=10,在10次抽样中,雄性出现3次,x=3,每次 抽到雄性的概率是0.50。p (3)为10次抽样中抽中3只雄性动物的概率,F
(3)为10次抽样中,抽中3只和3只以下雄性动物的概率。根据以上给出
的 n , 和 ϕ 求出p (3)和F (3)。
假设前三次抽中的都是雄性(m),由于抽样间是独立的,每次抽到雄 性动物的概率均为,抽到雌性(f)的概率均为。故
=
⎛ ⎜⎝
1 2
⎞2 ⎟⎠
+
2
⎛ ⎜⎝
1 2
⎞ ⎟⎠
⎛ ⎜⎝
1 2
⎞ ⎟⎠
+
⎛ ⎜⎝
1 2
⎞2 ⎟⎠
=1+2+1 444
即
1 RR : 2 Rr : 1 rr
4 44
如果考虑两对独立因子,如黄圆豌豆YYRR和绿皱豌豆yyrr杂交,F1为
YyRr,F2的因子是自由组合的。其中Y和R在F2代中出现的概率均为 ϕ ,y
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
= 0.1718751
3.1.2 服从二项分布的随机变量的特征数
平均数 μ = nϕ 。 当以比率表示时,μ = ϕ 。
方差 σ 2 = nϕ (1−ϕ ) 。当以比率表示时,σ 2 = ϕ (1−ϕ ) 。
n
偏斜度 峭度
γ1 =
1− 2ϕ
nϕ (1−ϕ )
γ
2
=
nϕ
1
(1 − ϕ
)
−
6 n
二项分布的图形特征如下:
9 B _ R _ : 3 B _ rr : 3 bbR _ : 1 bbrr
16
16
16
16
问需多少F2代(n事件总和)才能以99%的概率(累积)得到一棕色短毛兔? (可以从0~x只)。 解 在含有n只家兔的后代群体中,bbrr家兔出现x只的概率可由 ⎡⎣ϕ + (1−ϕ )⎤⎦n求
出,其中 ϕ 为非bbrr家兔的概率为15/16,(1−ϕ )为bbrr家兔的概率为 1/16。在 ⎡⎣ϕ + (1−ϕ )⎤⎦n 展开式中,所有含 (1−ϕ ) 的项都相应地含一个或多个
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
P(x) = Cnx Px(1-P)n-x, x = 0,1,...,n。
• 例3.1 从雌雄各半的100只动物中做一抽样试验,每
次抽取一只,记录性别并放回,再做下一次抽取。 这时,不论前一次抽取的动物性别如何,下一次抽 取到雄性或雌性的概率仍为50/100。前一次试验结 果并不影响到下一次试验中各种事件发生的概率。 因此,这前后两次试验是独立的(放回式抽样)。
和r基因出现的概率均为 (1−ϕ ) ,ϕ = 1−ϕ = 1 ,对于两对因子n=4。展
开二项式,
2
⎡⎣ϕ + (1−ϕ )⎤⎦4
= ϕ 4 + 4ϕ3 (1−ϕ ) + 6ϕ 2 (1−ϕ )2 + 4ϕ (1−ϕ )3 + (1− ϕ )4
由于ϕ 代表显性基因出现的概率,所以表示四个都是显形基因(YYRR)
当 μ 很大时,γ1 和 γ 2 则接近于0,
这时的泊松分布近似正态分布。
泊松分布的应用
主要用于符合泊松分类资料率的区间估计和假设检验。
¾ 当µ≥20时,根据正态近似的原理,对总体均数进行95%的区间估 计。 ¾ 通过直接计算Poisson分布的累计概率进行单侧假设检验。 ¾ 在符合正态近似条件时,也可用u检验进行样本率与总体率,两个 样本率比较的假设检验。
= 0.0439453
( ) p
(3)
=
10!
3!(10 −
⎛
3)!⎜⎝
1 2
⎞3 ⎟⎠
⎛ ⎜⎝
1 2
⎞7 ⎟⎠
= 120
2−10
= 0.1171876
• 抽到3只和3只以下雄性动物的概率
F (3) = p (0) + p (1) + p (2) + p (3)
( ) ( ) ( ) = 2−10 +10 2−10 + 45 2−10 +120 2−10 ( ) = 176 2−10
在二项分布中,当某事件出现的概率特别小( ϕ → 0 ),而
样本含量又很大(n → ∞)且 nϕ = μ 时,二项分布就变成泊
松分布。因此,其概率函数可由二项分布概率函数推导出
来:
p(x)
=
n!
x!(n −
x)!ϕ x
(1 − ϕ )n−x
=
n (n −1)"(n −
x!
x + 1) ϕ x
(1 − ϕ )n−x
可以由
⎛7 ⎝⎜ 16
⎞n ⎠⎟
=
0.001
求出。因为F2代的分离比是7/16非B_R_对9/16 B_R_。
二项分布的应用
主要用于符合二项分布分类资料的区间估计和假设检验。
¾ 当总体率P接近0.5,阳性数x较小时,可直接计算二项分 布的累计概率进行单侧的假设检验。 ¾ 当P = 0.5或n较大,nP及n(1-P)均大于等于5时,可用正态