第三章 几种常见的概率分布律
几种常见的概率分布率
点数(x)
率(f)
μx P (x)= e –μ . x!
N × P (x)
0
57
0
P(0)=e-3.87 ×3.870/0!=0.0209 54.5072
1
203
203 P(0)=e-3.87 ×3.871/1!=0.0807 210.4656
2
283
766 P(0)=e-3.87 ×3.872/2!=0.1562 407.3696
3
525
1575 P(0)=e-3.87 ×3.873/3!=0.2015 525.5120
4
532
2128 P(0)=e-3.87 ×3.874/4!=0.1949 508.2992
5
408
2040 P(0)=e-3.87 ×3.875/5!=0.1509 393.5472
6
273
1638 P(0)=e-3.87 ×3.876/6!=0.0973 253.7584
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
几种常见的概率分布率
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
nk
x------在n次抽样中某一种类型的个体数.
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数.
几种常见的概率分布律
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
第3章 几种常见的概率分布律
m
3. P(x m) Pn (k m)
C
k n
p k q nk
(3-2)
kn0
4. P(x m) Pn (k m)
Cnk p k q nk
(3-3)
k m
m2
5. P(m1 x m2 ) pn (m1 k m2 )
C
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得 P(x k ) 0.5k e 0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布 是相当吻合的 , 进一步说明用波松分布描述单 位容积(或面积)中细菌数的分布是适宜的。
k n
p k q nk
k m1
(m1<m2) (3-4)
二项分布由n和p两个参数决定: 1. 当p值较小且n不大时,分布是偏倚的。但随
着n的增大 ,分布逐渐趋于对称; 2. 当 p 值 趋于 0.5 时 ,分布趋于对称; 3. 对于固定的n及p,当k增加时,Pn(k)先随之
增加并达到其极大值,以后又下降。
如【例3.6】中已判断畸形仔猪数服从波松 分布,并已算出样本平均数=0.51。将0.51代替 公式(3-10)中的λ得:
P( x k ) 0.51k e 0.51 (k=0, 1, 2, …)
k!
因为e-0.51=1.6653,所以畸形仔猪数各项的概 率为:
P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
第三章几种常见的概率分布律
二项分布的程序计算方法
❖ 二项分布函数Binomdist(k,n,p,false/true)
❖ 某数阶乘的计算函数Fact
❖ 从给定元素数目m的集合中抽取若干n元素的排列
组合数C
n m
计算函数Combin(m,n)
n
n
(2) P(y) Cny y (1 )ny [ (1 )]n 1n 1
y0
y0
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子 二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪 的概率。
解:根据题意,这是一 个二项分布的问题,
视白猪为成功,有 n 10, = 3 0.75,y 7。
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女
在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了n次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量Y;Y称为二项分布变量,Y的概率分布 称为二项分布。
每种方式发生的概率为:
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1 ) (1 ) 2 (1 )2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得y 2次成功的概率为
P(2) C42 2 (1 )42
** 由此类推到一般情形,在n此贝努利试验中,共获得 y次成功的概率是
2. 二项分布的常用符号
n :贝努利试验的次数(或样本含量) y :在n次试验中事件 A出现的次数,即二项分 布变量Y的取值
概率分布函数
第三章 几种重要的概率分布
例 4 一页书上印刷错误的个数 X 是一个离散型随机变量,它服从参数 为 的泊松分布,一本书共有 300 页,有 21 个印刷错误,求任取 1 页 书上没有印刷错误的概率。 21 7 解:由于 300 页中有 21 个印刷错误,从而平均每页有 个印刷
300 100 7 错误,即离散型随机变量 X 的数学期望 E ( X ) , 100 又由于离散型随机变量 X 服从参数为 的泊松分布,因此数学期望
由概率加法公式得:
n
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m m nm 且 b(m; n, p) Cn p q ( p q) n 1 n
概率 b(m; n, p) 实际上是二项式 ( p q) n 的展开式中的通项公式。
2 2
返回主目录
第三章 几种重要的概率分布
小结与提问: 本次课,我们介绍了贝努里概型与二项公式、二项分布。 二项分布是离散型随机变量的概率分布中的重要分布,我们 应掌握二项分布及其概率计算,能够将实际问题归结为贝努
里概型,然后用二项分布计算有关事件的概率、数学期望与
方差。。 课外作业:P150 习题三 3.01,3.02,3.03,3.04,3.05
m m nm b(m; n, p) C n p q , 其中m 0,1,2,, n; q 1 p
m 0
m 0
称为概率计算的二项公式。
返回主目录
第三章 几种重要的概率分布
二、二项分布
定义 如果随机变量 X 的概率分布为
i PX i C n p i q n i
(0 p 1, p q 1)
第三章第二次课 几种常见的理论分布
第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。
第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。
难点:二项分布的概率函数特征,正态分布的特征。
一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。
对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。
在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。
在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。
先取n =4,k =2来讨论。
在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。
4 第三章 几种常见的概率分布律
φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y
(
y )2 2 2
2
24
F(y) 1
1 2
y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k
2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2
第3章 几种常见的概率分布律
服从
U
110k 2
,
110k 2
的
r.v.
随机变量
期望
区间(a,b)上的 均匀分布
f
(
x)
b
1
a
,
0,
a x b, 其它
ab 2
方差
区间(a,b)上 的均匀分布
f
(x)
b
1
a
,
0,
a x b, (b a)2 其它 12
(2) 指数分布 若 X 的d.f. 为
ex , x 0
(2) 二项分布 n 重Bernoulli 试验中, X 是事件A 在 n 次试 验中发生的次数 , P (A) = p ,则
Pn (k) P( X k) Cnk pk (1 p)nk , k 0,1,, n
称 X 服从参数为n, p 的二项分布,记作
X ~ B(n, p)
0–1 分布是 n = 1 的二项分布
其期望和方差都是
在某个时段内:
① 大卖场的顾客数;
应 用
② 市级医院急诊病人数; ③ 某地区拨错号的电话呼唤次数; ④ 某地区发生的交通事故的次数.
场 ⑤ 放射性物质发出的 粒子数;
合 ⑥ 一匹布上的疵点个数;
⑦ 一个容器中的细菌数;
⑧ 一本书一页中的印刷错误数;
都可以看作是源源不断出现的随机 质点流 , 若它们满足一定的条件, 则称为 Poisson 流, 在 长为 t 的时间内出现的质
Show[fn1,fn3]
小
0.5 0.4
大 0.3 0.2 0.1
-6
几何意义 数据意义
-5 -4 -3 -2 -1
大小与曲线陡峭程度成反比 大小与数据分散程度成正比
4. 第三章 几种常见的概率分布律
3.4 正态分布
两头少,中间多,两侧对称
正态分布曲线
μ
22
正态分布的密度函数和分布函数
对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2
x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n
将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15
于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n
即需要72代
0 n 0 n
d 几种常见的概率分布律
三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2
第章几种常见的概率分布律
3
4
12 36 0.218750 7.000000
4
12
48 192 0.273437 8.749984
5
6
30 150 0.218750 7.000000
6
5
30 180 0.109375 3.500000
7
2
14 98 0.031250 1.000000
8
0
0 0 0.003906 0.124992
总数
14.04.2020
N=32
139 665 0.999999 31.99968
.
16
3.1.3 二项分布应用实例
样本平均数、总体平均数;样本方差、总体方
差如下:
x
fx
139
4.343750
N 32
n
8
1 2
4.000000
2
fx2
fx
665 1392
s2
N
32 1.974798
在Cumulative后填入0(或FALSE),表示计算成功次
14.04.2020 数恰好等于指定数值的. 概率;填入1(或TRUE)表 14
3.1.3 二项分布应用实例
例1 以杂合基因型Wvwv的小鼠为父本,隐性纯合 子小鼠wvwv为母本杂交(wv波浪毛,Wv直毛), 后代两种基因型的数目应各占一半。实验只选8只 的,多于8只和少于8只的都淘汰。利用下面的公式 或者Excel 可以计算直毛后代出现的概率:
第2步:在Excel表格界面中,直接点击“f(x)”(插入函数)命 令
第3步:在复选框“函数分类”中点击“统计”选项,在 “函数名”
中点击“BINOMDIST”选项,然后确定
概率论第三章-边缘分布
P{ X xi } P{ X xi , (Y y j )}
P{ X xi , Y y j }
j 1
j 1
,i 1 , 2 ,
记做 pi
同理 P{Y y j }
p
i 1
ij
, j 1 , 2 , 记做 p j
o
1
x
注:联合分布 书69页:例5,6
维正态分布; ② 边缘分布与ρ无关,说明了由边缘分布不能确 定联合分布。
0 1/4 0 1/4 1/2
1 0 1/2 0 1/2
1/4
三、连续型随机变量的边缘概率密度
若 是二维连续型随机变量, 其概率密度为
f ( x , y ) , 则:
FX ( x) F ( x , ) f X (x)
同理
x
f (u , v) dv du
0 1/2
1 1/2
pi · 1/4
且P{XY=0}=1,求(X,Y)的分布律 解、 P{XY≠0}=0= P{X≠0, Y≠0} Y X =P{X=-1, Y=1}+ P{X=1, Y=1} 从而P{X=-1, Y=1}=P{X=1, Y=1}=0 -1 0 1 pi · p· j 1/4 1/2
y
解:
的概率密度为
0 1
y=x x
当0 x 1 当 x other
f X (x) f ( x , y )dy 0 2 dy 2 x
f X ( x) 0
x
f X ( x)
例2. 上服从均匀分布, 密度 和 的概率密度为
生物统计学答案第三章
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为 0.21875。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P 它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
第三章 常见的概率分布率
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则
概率论常见的几种分布
概率论常见的几种分布常见的概率论分布有:均匀分布、正态分布、泊松分布和指数分布。
1. 均匀分布均匀分布是指在一段区间内,各个取值的概率是相等的。
比如在一个骰子的例子中,每个面出现的概率是相等的,为1/6。
均匀分布在实际应用中常用于随机数生成、样本抽取等场景。
2. 正态分布正态分布又被称为高斯分布,是最常见的概率分布之一。
正态分布的特点是呈钟形曲线,数据集中在均值周围,并且具有对称性。
正态分布在自然界中广泛存在,比如人的身高、体重等都近似服从正态分布。
在统计学和数据分析中,正态分布的应用非常广泛,例如在建模、假设检验和置信区间估计等方面。
3. 泊松分布泊松分布是一种离散概率分布,描述了在一段时间或空间内,某事件发生的次数的概率分布。
泊松分布的特点是事件之间是独立的,并且事件发生的平均速率是恒定的。
泊松分布在实际应用中常用于描述稀有事件的发生概率,比如电话呼叫中心的接听次数、交通事故的发生次数等。
4. 指数分布指数分布是描述连续随机变量的概率分布,用于描述时间间隔的概率分布。
指数分布的特点是事件之间是独立的,并且事件发生的速率是恒定的。
指数分布在实际应用中常用于描述如等待时间、寿命等连续性事件的概率分布。
这四种分布在概率论和统计学中都有广泛的应用。
它们分别适用于不同的场景和问题,能够帮助人们理解和分析数据。
在实际应用中,我们常常需要通过对数据进行建模和分析来确定数据的分布类型,从而更好地理解数据的特征和规律。
除了这四种常见的分布外,还有其他许多概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种分布都有其独特的特点和应用领域。
在实际应用中,选择合适的分布模型对数据进行建模和分析是非常重要的,可以帮助我们更好地理解数据,做出准确的推断和预测。
概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
每种分布都有其特点和应用场景,在实际问题中选择合适的分布模型对数据进行建模和分析是非常重要的。
通过对数据的分布进行研究,我们能够更好地理解数据的规律和特征,为决策提供科学依据。
几种常见的概率分布率-(1)分解
➢ 标准正态分布的偏斜度γ1和峭度γ2均为零。
以下一些特征值很重要:
-3 -2 -1
1 23
68.27%
95.45%
99.73%
P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973
4.822),求:
(1)X<161cm的概率; (2)X>164cm的概率; (3)152<X<162的概率。
x-
=
161 - 156.2 4.82
=
1.00
x
=
164 - 156.2 4.82
=
1.62
x
=
152 - 156.2 4.82
=
-0.87
x
=
162 - 156.2 4.82
=
1.20
四、 正态分布的单侧分位数和双侧分位数
x
[(1-
-1
p) ]p - p(n-x)
(当n→∞时,系数的极限为1,且nφ =μ)Βιβλιοθήκη x!= x e-x!
1
-1
e = lim (1 z) z,lim (1 - p) p = e
z0
p0
二、 服从泊松分布的随机变量的特征数
➢ 平均数:μ=λ ➢ 方差: σ2 = λ
➢ 偏斜度: 1=
1
➢
峭度:
标轴从-∞到u所夹的面积,该曲线下的面积即表示随机 变量U 落入区间(-∞,u)的概率;
➢ 标准正态分布查表常用的几个关系式:
• P(0<U <u1)=F(u1)-0.5 • P(U >u1)=F(-u1)=1-F(u1) • P(∣U∣>u1)=2F(-u1) • P(∣U∣<u1)=1- 2F(-u1) • P(u1<U <u2)=F(u2)-F(u1)
3章几种常见的分布
在Gamma分布中:k=n(正整数)时的gamma分布可以看作n个独立的k=1的 gamma分布(即指数分布)之和,按照中心极限定理,独立同分布随机变量 之和趋于正态分布。
几种常见的分布
2019/5/27
1
分类
连续型随机分布
◆ 正态分布、均匀分布、指数分布、对数正态分布、柯西分布、 Gamma分布、瑞利分布、韦伯分布、三角形分布
离散型随机分布
◆ 二项分布、几何分布、超几何分布、泊松分布
三大抽样分布
◆ 卡方分布、F分布、t分布
分布之间的关系
2019/5/27
应用:在自然情况下,均匀分布极为罕见。在实际问题中,当我们无法区分在 区间内取值的随机变量取不同值的可能性有何不同时,我们就可以假定随机变 量服从区间上的均匀分布。
2019/5/27
4
三、指数分布(Exponential distribution)
应用:主要用于描述独立事件发生的时间间隔。自然界中有很多种“寿命”可 以用指数分布来描述,如电子元件的寿命、动物的寿命、电话的通话时间、服 务系统的服务时间等。
定义:已知一个事件在伯努利试验中每次的出现概率是p,在一连串伯努利 试验中,一件事件刚好在第r + k次试验出现第r次的概率。
2019/5/27
取r = 1,负二项分布等于几 何分布。其概率质量函数 为
13
十二、几何分布
定义:在第 n 次伯努利实验,才得到第一次成功的机率。更详细的说是:n 次伯努利试验,前 n-1 次皆失败,第 n 次才成功的概率。
应用:泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某 一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台 的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷 陷数,显微镜下单位分区内的细菌分布方分布
生物统计学:几种常见的概率分布律
头仔猪中白色的为x头,则x为服从二项分布B(10,0.75)
的随机变量。于是窝产10头仔猪中有7头是白色的概率
为:
10! P ( x 7) C 0.75 0.25 0.75 7 0.253 0.2503 7!3!
7 10 7 3
【例3.2】 设在家畜中感染某种疾病的概率为20%,现有两 种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能, 问:应该如何评价这两种疫苗? 假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20 %,则15 头家畜中染病头数x=0的概率为
1-p=q,则称这一串重复的独立试验为n重贝努利试验,
简称贝努利试验(Bernoulli trials)。
在生物学研究中,我们经常碰到的一类离 散型随机变量,如孵n枚种蛋的出雏数、n头病 畜治疗后的治愈数、n 尾鱼苗的成活数等,可用 贝努利试验来概括。 在n重贝努利试验中,事件 A 可能发生0,1, 2,…,n次,现在我们来求事件A恰好发生 k(0≤k≤n)次的概率Pn(k)。
四、二项分布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变 量之平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
μ=np
(3-5)
(3-6)
npq
【例3.4】求【例3.3】平均死亡猪数及死 亡数的标准差。
以p=0.2,n=5代入 (3-5)和(3-6) 式得: 平均死亡猪数 μ=5×0.20=1.0(头) 标准差
一、波松分布的意义
若随机变量x(x=k)只取零和正整数值0,1, 2,…,且其概率分布为
k , k=0,1,…… (3-10) P( x k ) e k!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在4次贝努利试验里,获得 2次成功的方式有 C42种:
ssff sfsf sffs fssf fsfs ffss
注意:C42是从四个位置选取两个位置的组合方式。
依据计算公式Cnx
n! x!(n
, x)!
C42
4! 2!2!
4 3 21=6 21 21
tx1 n1
n!
t1(1 )n1t
t0 t!(n 1 t)!
2. 二项分布的常用记号
n : 贝努利试验的次数 ;
x : 二项分布变量X的取值,即总共获得“成功”的次数;
: 一次贝努利试验中获得 “成功”的概率;
1- : 显然是一次试验中获得 “失败”的概率; P(x) : 总共获得 x次“成功”的概率。
3. 二项分布的概率函数P(x)
• 怎样得到P(x)?
这说明每穴种6粒种子,几乎肯定出苗。
4 二项分布的概率分布表和概率分布图
除以P(x)表示,二项分布也可通过表或图来直观显示。 例如,抛硬币4次,获得的正面数记为X,则X服从二项 分布。X的概率分布表为
x
P(x)
0
0.062
1
0.250
2
0.375
3
0.250
4
0.062
n 4, 0.5,
第三章 几种常见的概率分布律
回顾一下,在上一章里讲了变量及其概率分布的一 般概念。
• 离散变量用概率函数来研究,概率函数定义了这个变量取
每个值的概率;
• 连续变量用密度函数(一条曲线)来研究,通过这条曲线我们
可以求得变量在某个特定区间取值的概率。
在这一章里,我们将介绍一些在实际研究中应用最 广的变量类型及其概率分布。
• 平均数 E( X ) n
定义 n
证明: E( X ) P(x)x x0
n
n! x (1 )nx x
x0 x!(n x)!
n
n! x (1 )nx x
x1 x!(n x)!
n
n!
x (1 )nx
x1 (x 1)!(n x)!
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。
(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
解:根据题意,这是一个二项分布的问题。视出苗为成功,有n 6, =0.67。
设出苗的种子数为x,则x服从二项分布。
P(至少有1粒出苗)=P(x 1) P(x 1) P(x 2) P(x 6)
C610.6710.335 C62 0.6720.334 C66 0.6760.330 0.0157 0.0799 0.0905 0.9987 另外一种方法: P(至少有1粒出苗)=1-P(没有出苗)=1 P(x 0) 1 C60 0.6700.336 1 0.0013 0.9987
在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了n次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量X;X称为二项分布变量,X的概率分布 称为二项分布。
X的可能取值为0,1,2,…,n。所以X是个离散型变量。
每种方式发生的概率为:
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1) (1) 2 (1)2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
P(2) C42 2 (1)42
** 由此类推到一般情形,在n此贝努利试验中, 共获得x次成功的概率是
离散变量
二项分布 泊松分布 超几何分布
连续变量
正态分布 指数分布
负二项分布
第一节 二项分布
(Binomial Distribution)
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果, 并且发生每种结果的概率是一定的。
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女
n
n
(2) P(x) Cnx x (1)nx [ (1)]n 1n 1
x0
x0
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传 理论,子二代中白猪与黑猪的比率为3:1。求窝产 仔10头,有7头白猪的概率。
解:根据题意,这是一 个二项分布的问题,
视白猪为成功,有 n 10, = 3 0.75,x 7。
P(x) Cnx x (1 )nx
关于P(x) Cnx x (1 )nx的讨论:
(1)从形式上来说,Cnx x (1)nx是二项式[ (1)]n 展开
的第x 1项,所以有“二项分布”这个名称。
[ (1 )]n Cn0 0 (1 )n Cn11(1 )n1 Cnx x (1 )nx Cnn n (1 )0
P(0) C40 0.500.54 0.062
概率
X的概率分布图为
二项分布
0.4
0.35
0.3
0.25
0.2 0.15
ቤተ መጻሕፍቲ ባይዱ
0.1
0.05
0
0
1
2
3
4
获得正面的次数x
注意:
0.5时,分布对称; 0.5时,分布偏斜:
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
4
P(x 7) P(7) C170 0.757 (1 0.75)107
10! 0.757 0.253 7!3!
0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为0.67。现任取6粒 种子种1穴中,问这穴至少有1粒种子出苗的概率是 多少?