第三章几种常见的概率分布律解读
几种常见的概率分布律
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
概率分布函数
第三章 几种重要的概率分布
例 4 一页书上印刷错误的个数 X 是一个离散型随机变量,它服从参数 为 的泊松分布,一本书共有 300 页,有 21 个印刷错误,求任取 1 页 书上没有印刷错误的概率。 21 7 解:由于 300 页中有 21 个印刷错误,从而平均每页有 个印刷
300 100 7 错误,即离散型随机变量 X 的数学期望 E ( X ) , 100 又由于离散型随机变量 X 服从参数为 的泊松分布,因此数学期望
由概率加法公式得:
n
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m m nm 且 b(m; n, p) Cn p q ( p q) n 1 n
概率 b(m; n, p) 实际上是二项式 ( p q) n 的展开式中的通项公式。
2 2
返回主目录
第三章 几种重要的概率分布
小结与提问: 本次课,我们介绍了贝努里概型与二项公式、二项分布。 二项分布是离散型随机变量的概率分布中的重要分布,我们 应掌握二项分布及其概率计算,能够将实际问题归结为贝努
里概型,然后用二项分布计算有关事件的概率、数学期望与
方差。。 课外作业:P150 习题三 3.01,3.02,3.03,3.04,3.05
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m 0
m 0
称为概率计算的二项公式。
返回主目录
第三章 几种重要的概率分布
二、二项分布
定义 如果随机变量 X 的概率分布为
i PX i C n p i q n i
(0 p 1, p q 1)
第三章第二次课 几种常见的理论分布
第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。
第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。
难点:二项分布的概率函数特征,正态分布的特征。
一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。
对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。
在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。
在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。
先取n =4,k =2来讨论。
在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。
概率论第三章第3,4节条件分布,独立性
P X m, Y n q n2 p2 , n 2,3,; m 1,2,n 1
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
§3条件分布
例3 设某班车起点站上车人数 X 服从参数为 ( 0) 的泊松分布,每位乘客在中途下车的概率为 p(0 p 1),
1 f ( x, y) , x y x, f ( y | x ) 当0 x 1, Y | X 2x f X ( x) 其它。 0,
1 P{ X , Y 0} 1 2 ( 3) P{ X | Y 0} 2 P{Y 0} y
1 1 (1 ) 2 3 2 2 1 4 1 1 2
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
§3条件分布
P{ X x , y Y y } FX |Y ( x | y ) lim 0 P{ y Y y }
F ( x , y ) lim [F ( x, y ) F ( x, y )]/ 2 y 0 d lim [ F ( y ) F ( y )] / 2 Y Y FY ( y ) 0 dy y x x f ( u, v )dudv f ( u, y )du y . fY ( y) fY ( y)
n 2
2
第三章 随机变量及其分布
§3条件分布
在 X= m 条件下随机变量Y 的条件分布律为
当m=1,2,3,… 时,
P{Y n | X m}
P{ X m ,Y n} P{ X m }
p 2 q n 2 n m 1 pq , m 1 pq
4 第三章 几种常见的概率分布律
φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y
(
y )2 2 2
2
24
F(y) 1
1 2
y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k
2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2
理解概率分布函数常见分布公式详解
理解概率分布函数常见分布公式详解概率分布函数(Probability Distribution Function,简称PDF)是描述随机变量取值概率分布的函数,常用于统计学和概率论中。
在统计学中,常见的概率分布函数有众多的公式。
本文将详细解释几种常见的概率分布函数公式,包括均匀分布、正态分布、指数分布和泊松分布。
一、均匀分布均匀分布是最简单的概率分布函数之一,它在一个有限区间内的取值是均匀分布的。
均匀分布的概率密度函数公式为:f(x) = 1 / (b - a),a ≤ x ≤ b其中,a和b分别是区间的上下界。
均匀分布的期望值(均值)为(a + b)/ 2,方差为(b - a)^2 / 12。
二、正态分布正态分布是自然界和社会现象中常见的概率分布函数。
它在统计学中有着重要的地位。
正态分布的概率密度函数(Probability Density Function,简称PDF)公式为:f(x) = (1 / (σ * √(2π))) * exp(-((x - μ)^2/(2σ^2)))其中,μ是期望值(均值),σ是标准差。
正态分布的期望值和方差分别为μ和σ^2。
三、指数分布指数分布是描述事件发生的时间间隔的概率分布函数,常用于可靠性工程和排队论中。
指数分布的概率密度函数公式为:f(x) = λ * exp(-λx),x ≥ 0其中,λ是事件发生率。
指数分布的期望值为1 / λ,方差为1 / λ^2。
四、泊松分布泊松分布是描述单位时间或空间内事件发生次数的概率分布函数,常用于描述稀有事件的发生情况。
泊松分布的概率质量函数(Probability Mass Function,简称PMF)公式为:P(X = k) = (λ^k * exp(-λ)) / k!其中,λ是单位时间或空间内事件的平均发生率。
泊松分布的期望值和方差均为λ。
以上是几种常见的概率分布函数公式的详细解释。
这些概率分布函数在不同领域的应用非常广泛,能够描述和解释各种随机现象的概率分布情况。
几种常见的概率分布率分解课件
均匀分布的定 义
均匀分布是一种概率分布,其特点是随机变量在一定区间内取值的可能性是等可 能的。
在数学表达上,如果一个随机变量X服从某个区间[a, b]上的均匀分布,则其概率 密度函数f(x)可以表示为f(x)=1b−a,当x∈[a,b]时,f(x)=0,当x∉[a,b]时。
均匀分布的特点
均匀分布的期望值E(X)和方差Var(X) 分别为(a+b)/2和(b-a)^2/12。
泊松分布在生活中的应用
02
01
03
在物理学中,泊松分布用于描述放射性衰变过程中粒 子发射的次数。
在统计学中,泊松分布常用于二项分布的近似,当试 验次数很大而事件发生的概率很小时。
在计算机科学中,泊松分布在处理网络流量和计算机 系统中的任务调度等问题时非常有用。
04
二项分布
二项分布的定义
总结词
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试 验中成功的次数。
指数分布的期望值和方差是有限的,分别为1/λ和1/λ^2,其中λ是概率密度函数的 参数。
指数分布在生活中的应用
指数分布在可靠性工程中广泛应 用,用于描述产品寿命、故障间
隔时间等。
在排队论中,指数分布用于描述 顾客到达和服务时间等随机变量。
在保险精算中,指数分布用于计 算保费和准备金。
06
均匀分布
几种常见的概率分布率分解课 件
CONTENCT
录
• 概率分布率概述 • 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
概率分布率概述
概率分布率的定 义
概率分布率
表示随机变量取值的概率规律。
定义方式
对于离散随机变量,概率分布律为P(X=xi)=pi,i=1,2,3...;对于连续随机变量, 概率分布函数为P(a≤X≤b)=∫[a,b]f(x)dx,其中f(x)为概率密度函数。
16种常见概率分布概率密度函数意义及其应用
16种常见概率分布概率密度函数意义及其应用概率分布是统计学中一个重要的概念,用于描述随机变量在各个取值上的概率分布情况。
常见的概率分布有16种,它们分别是均匀分布、伯努利分布、二项分布、几何分布、泊松分布、正态分布、指数分布、负二项分布、超几何分布、Gumbel分布、Weibull分布、伽马分布、Beta分布、对数正态分布、卡方分布和三角分布。
以下将逐一介绍这些概率分布的概率密度函数、意义及其应用。
1. 均匀分布(Uniform Distribution):概率密度函数为f(x)=1/(b-a),意义是在一个区间内所有的取值具有相同的概率,应用有随机数生成、模拟实验等。
2. 伯努利分布(Bernoulli Distribution):概率密度函数为P(x)=p^x*(1-p)^(1-x),意义是在两种可能结果中,成功或失败的概率分布,应用有二分类问题的建模。
3. 二项分布(Binomial Distribution):概率密度函数为P(x)=C(n,x)*p^x*(1-p)^(n-x),意义是在n次独立重复试验中,成功次数为x的概率分布,应用有二分类问题中的n次重复试验。
4. 几何分布(Geometric Distribution):概率密度函数为P(x)=p*(1-p)^(x-1),意义是独立重复试验中,第x次成功所需的试验次数的概率分布,应用有描述一连串同样试验中第一次获得成功之前所需的试验次数。
5. 泊松分布(Poisson Distribution):概率密度函数为P(x)=(e^(-λ)*λ^x)/x!,意义是在给定时间或空间内事件发生的次数的概率分布,应用有描述单位时间或单位空间内的事件计数问题。
6. 正态分布(Normal Distribution):概率密度函数为P(x) = (1 / sqrt(2πσ^2)) * e^(-(x-μ)^2 / (2σ^2)),意义是描述连续变量的概率分布,应用广泛,例如测量误差、人口身高等。
几种常见的概率分布
几种常见的概率分布一、 离散型概率分布1. 二项分布n 次独立的贝努利实验,其实验结果的分布(一种结果出现x 次的概率是多少的分布)即为二项分布应用二项分布的重要条件是:每一种实验结果在每次实验中都有恒定的概率,各实验之间是重复独立的平均数: (Y)np X E μ==方差与标准差:2(1)X np P σ=- ;X σ=特例:(0-1)分布若随机变量X 的分布律为1(x k)p (1p)k k p -==- k=0,1;0<p<1,则称X 服从参数p 的(0-1)分布2. 泊松分布泊松分布是一种用来描述一定的空间与时间里稀有事件发生次数的概率分布泊松分布变量x 只取零与正整数:0、1、2…..其概率函数为:泊松分布的平均数:(x)E μμ==泊松分布的方差与标准差:2σμ= 、σ=3. 超几何分布P(X=k)=k n k M N M n NC C C -- 记X~(N ,M ,n ) P=M N期望:E(X)=np方差:D(X)=np(1-p)1N n N -- 适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重复抽样,抽样成功的次数X 的概率分布服从超几何分布,如福利彩票二、 连续型概率分布1. 均匀分布若随机变量X 具有概率密度函数则称X 在区间(a ,b )上服从均匀分布,记为X ~ U(a ,b) 在区间(a ,b )上服从均匀分布的随机变量X 的分布函数为 2指数分布若随机变量X 具有概率密度函数,0(x)0,0x e x f x λλ-⎧≥=⎨<⎩ 其中0λ>是常数,则称X 服从以λ 为参数的指数分布,记作~()X E λ ,X 的分布函数为3.正态分布正态随机变量X 的概率密度函数的形式如下:式中,μ 为随机变量X 的均值;2δ 为随机变量X 的方差。
通常对具有均值μ,方差为2δ的正态概率分布,记为N (μ,2δ)。
于是有正态随机变量X~N (μ,2δ)。
分布律的定义
分布律的定义分布律是概率论中经常使用的一个概念,用于描述随机变量的各个取值的概率分布规律。
它是一个离散随机变量或连续随机变量所有可能取值和其相应概率之间的关系。
对于一个离散随机变量,其概率分布律定义如下:设随机变量X的取值为x₁,x₂,...,xₙ,对应的概率为P(X=x₁),P(X=x₂),...,P(X=xₙ),则概率分布律为:P(X=x₁)=p₁, P(X=x₂)=p₂, ..., P(X=xₙ)=pₙ其中,p₁,p₂,...,pₙ为非负数且满足概率的基本性质:0≤pᵢ≤1,∑pᵢ=1。
对于一个连续随机变量,其概率分布律则由概率密度函数f(x)来定义。
概率分布律满足以下性质:1. 非负性:对于任意的x,概率密度函数f(x)≥0。
2. 归一性:∫f(x)dx=1,其中积分范围为该随机变量所有可能的取值区间。
除了概率分布律,我们还可以通过分布函数来描述随机变量的概率分布。
分布函数是概率分布律的累积分布函数形式,定义如下:F(x) = P(X≤x)其中,F(x)表示随机变量X小于等于x的概率。
对于离散随机变量,分布函数可写为:F(x) = ∑P(X=xi) (xi≤x)对于连续随机变量,分布函数可写为:F(x) = ∫f(t)dt (t≤x)概率密度函数和分布函数是相互关联的,对于连续随机变量,我们可以通过概率密度函数来计算分布函数,即:F(x) = ∫f(t)dt (-∞<t<x)随机变量的概率分布律可以通过观测、实验或模型推导获得。
常见的概率分布律包括伯努利分布、二项分布、泊松分布、正态分布等。
不同的概率分布律具有不同的特性和应用场景,了解和掌握不同概率分布律的性质和使用方法,对于概率论的研究和实际问题的解决都具有重要意义。
总结起来,分布律是用来描述随机变量的取值和相应概率之间的关系的,对于离散随机变量,利用概率分布律可以计算各个取值的概率;对于连续随机变量,利用概率密度函数和分布函数可以计算取值在某个区间内的概率。
d 几种常见的概率分布律
三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2
第三章 常见的概率分布率
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则
几种常见概率分布
值。
二项分布具有概率分布的一切性质,即:
( k=0,1,2,…,n) P(X = k) = P n (k) ≥0
n 二项分布的概率之和等于 1n ,即: k k n-k
∑C p q
n k =0
= (q +p) = 1
二项分布的性质
k n k P (X ≤m) = Pn (k ≤m) = C k p q n k =0 n m
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p
p 也称率的标准误。
σ p = (pq) /n
四、二项分布的概率计算及其应用条件
(一)概率计算 直接利用二项概率公式 [例6] 有一批种蛋,其孵化率为0.85,今在该批 种蛋中任选6枚进行孵化,试给出孵化出小鸡的
P (X ≥m) = Pn (k ≥m) =
k =m
k k n -k C np q
P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1 k k n-k C n p q (m1 ≤m2 ) m2
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ 、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
0 .5 P( x k ) e 0 .5 k!
k
x
(k=0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布是相
当吻合的 , 进一步说明用波松分布描述单位容积(
或面积)中细菌数的分布是适宜的。
三几种常见概率分布律
平均数 n 2000 0.70 1400 标准差 n(1) 20000.70.3 20.49
二项分布
(实例)
【例】已知100件产品中有5件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率
4
P(y 7) P(7) C170 0.75 7 (1 0.75)107 10! 0.757 0.253 7!3! 0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为0.67。现任取6 粒种子种1穴中,问这穴至少有1粒种子出苗的概率 是多少?
0.9987 另外一种方法:
P(至少有1粒出苗)=1-P(没有出苗)=1 P(y 0)
1
C
0 6
0.67
0
0.336
1
0.0013
0.9987
这说明每穴种6粒种子,几乎肯定出苗。
4 二项分布的概率分布表和概率分布图
除以P(y)表示,二项分布也可通过表或图来直观显示。
例如,抛硬币4次,获得的正面数记为Y,则Y服从二项 分布。Y的概率分布表为
0.5时,正偏
4
0.5时,负偏
5 二项分布变量的平均数和标准差
❖ 平均数 E(Y) n
❖ 方差和标准差
2 Var( X ) n(1)
n(1)
例三,某树种幼苗成材率为70%,现种植2000 株,问成材幼苗数的平均值和标准差是多少?
解:设2000 株幼苗的成材数为 Y,则Y服从二项分布。
在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
生物统计学(第3版)杜荣骞 课后习题答案 第三章 几种常见的概率分布律
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为0.218 75。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+ 表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
生物统计学:几种常见的概率分布律
头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)
的随机变量。于是窝产10头仔猪中有7头是白色的概率
为:
10! P ( x 7) C 0.75 0.25 0.75 7 0.253 0.2503 7!3!
7 10 7 3
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
1-p=q,则称这一串重复的独立试验为n重贝努利试验,
简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离 散型随机变量,如孵n枚种蛋的出雏数、n头病 畜治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。 在n重贝努利试验中,事件 A 可能发生0,1, 2,…,n次,现在我们来求事件A恰好发生 k(0≤k≤n)次的概率Pn(k)。
四、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变 量之平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
μ=np
(3-5)
(3-6)
npq
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差
一、波松分布的意义
若随机变量x(x=k)只取零和正整数值0,1, 2,…,且其概率分布为
k , k=0,1,…… (3-10) P( x k ) e k!
几种常见的概率分布率-(1)分解
➢ 标准正态分布的偏斜度γ1和峭度γ2均为零。
以下一些特征值很重要:
-3 -2 -1
1 23
68.27%
95.45%
99.73%
P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973
4.822),求:
(1)X<161cm的概率; (2)X>164cm的概率; (3)152<X<162的概率。
x-
=
161 - 156.2 4.82
=
1.00
x
=
164 - 156.2 4.82
=
1.62
x
=
152 - 156.2 4.82
=
-0.87
x
=
162 - 156.2 4.82
=
1.20
四、 正态分布的单侧分位数和双侧分位数
x
[(1-
-1
p) ]p - p(n-x)
(当n→∞时,系数的极限为1,且nφ =μ)Βιβλιοθήκη x!= x e-x!
1
-1
e = lim (1 z) z,lim (1 - p) p = e
z0
p0
二、 服从泊松分布的随机变量的特征数
➢ 平均数:μ=λ ➢ 方差: σ2 = λ
➢ 偏斜度: 1=
1
➢
峭度:
标轴从-∞到u所夹的面积,该曲线下的面积即表示随机 变量U 落入区间(-∞,u)的概率;
➢ 标准正态分布查表常用的几个关系式:
• P(0<U <u1)=F(u1)-0.5 • P(U >u1)=F(-u1)=1-F(u1) • P(∣U∣>u1)=2F(-u1) • P(∣U∣<u1)=1- 2F(-u1) • P(u1<U <u2)=F(u2)-F(u1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。
(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1) (1) 2 (1)2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
P(2) C42 2 (1)42
** 由此类推到一般情形,在n此贝努利试验中, 共获得x次成功的概率是
P(x) Cnx x (1 )nx
概率
X的概率分布图为
二项分布
0.4
0.35
0.3
0.25
0.2 0.15
0.1
0.05
0
0
1
2
3
4
获得正面的次数x
注意:
0.5时,分布对称; 0.5时,分布偏斜:
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
• 平均数 E( X ) n
定义 n
证明: E( X ) P(x)x x0
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C42种:
ssff sfsf sffs fssf fsfs ffss
注意:C42是从四个位置选取两个位置的组合方式。
依据计算公式Cnx
n! x!(n
, x)!
C42
4! 2!2!
4 3 21=6 21 21
每种方式发生的概率为:
n
n! x (1 )nx x
x0 x!(n x)!
n
n! x (1 )nx x
x1 x!(n x)!
n
n!
x (1 )nx
x1 (x 1)!(n x)!
tx1 n1
n!
t1(1 )n1t
t0 t!(n 1 t)!
n1
n
(n 1)! t (1 )n1t
t0 t!(n 1 t)!
在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了n次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量X;X称为二项分布变量,X的概率分布 称为二项分布。
X的可能取值为0,1,2,…,n。所以X是个离散型变量。
离散变量二项分布 泊松分布 Nhomakorabea几何分布
连续变量
正态分布 指数分布
负二项分布
第一节 二项分布
(Binomial Distribution)
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果, 并且发生每种结果的概率是一定的。
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女
第三章 几种常见的概率分布律
回顾一下,在上一章里讲了变量及其概率分布的一 般概念。
• 离散变量用概率函数来研究,概率函数定义了这个变量取
每个值的概率;
• 连续变量用密度函数(一条曲线)来研究,通过这条曲线我们
可以求得变量在某个特定区间取值的概率。
在这一章里,我们将介绍一些在实际研究中应用最 广的变量类型及其概率分布。
关于P(x) Cnx x (1 )nx的讨论:
(1)从形式上来说,Cnx x (1)nx是二项式[ (1)]n 展开
的第x 1项,所以有“二项分布”这个名称。
[ (1 )]n Cn0 0 (1 )n Cn11(1 )n1 Cnx x (1 )nx Cnn n (1 )0
n
n
(2) P(x) Cnx x (1)nx [ (1)]n 1n 1
x0
x0
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传 理论,子二代中白猪与黑猪的比率为3:1。求窝产 仔10头,有7头白猪的概率。
解:根据题意,这是一 个二项分布的问题,
视白猪为成功,有 n 10, = 3 0.75,x 7。
4
P(x 7) P(7) C170 0.757 (1 0.75)107
2. 二项分布的常用记号
n : 贝努利试验的次数 ;
x : 二项分布变量X的取值,即总共获得“成功”的次数;
: 一次贝努利试验中获得 “成功”的概率;
1- : 显然是一次试验中获得 “失败”的概率; P(x) : 总共获得 x次“成功”的概率。
3. 二项分布的概率函数P(x)
• 怎样得到P(x)?
P(至少有1粒出苗)=P(x 1) P(x 1) P(x 2) P(x 6)
C610.6710.335 C62 0.6720.334 C66 0.6760.330 0.0157 0.0799 0.0905 0.9987 另外一种方法: P(至少有1粒出苗)=1-P(没有出苗)=1 P(x 0) 1 C60 0.6700.336 1 0.0013 0.9987
这说明每穴种6粒种子,几乎肯定出苗。
4 二项分布的概率分布表和概率分布图
除以P(x)表示,二项分布也可通过表或图来直观显示。 例如,抛硬币4次,获得的正面数记为X,则X服从二项 分布。X的概率分布表为
x
P(x)
0
0.062
1
0.250
2
0.375
3
0.250
4
0.062
n 4, 0.5,
P(0) C40 0.500.54 0.062
n[ (1)]n1
n
• 方差和标准差
2 Var( X ) n(1) n(1)
证明: 2 Var( X ) E( X 2 ) [E( X )]2
定义 n
E( X 2 ) P(x)x2 x0
n
n! x (1 )nx x2
x0 x!(n x)!
n
n! x (1 )nx[( x2 x) x]
10! 0.757 0.253 7!3!
0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为0.67。现任取6粒 种子种1穴中,问这穴至少有1粒种子出苗的概率是 多少?
解:根据题意,这是一个二项分布的问题。视出苗为成功,有n 6, =0.67。
设出苗的种子数为x,则x服从二项分布。