第三章 几种常见的概率分布率资料讲解
第三章几种常见的概率分布律解读
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。
(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。 (5)n尾鱼苗的成活数X,X服从二项分布。
乘法法则
P(ssff) P(s)P(s)Pf()P(f) (1) (1) 2 (1)2
其它5种方式发生的概率也是如此。
因此,在n 4次试验中取得x 2次成功的概率为
P(2) C42 2 (1)42
** 由此类推到一般情形,在n此贝努利试验中, 共获得x次成功的概率是
P(x) Cnx x (1 )nx
概率
X的概率分布图为
二项分布
0.4
0.35
0.3
0.25
0.2 0.15
0.1
0.05
0
0
1
2
3
4
获得正面的次数x
注意:
0.5时,分布对称; 0.5时,分布偏斜:
0.5时,正偏 0.5时,负偏
5 二项分布变量的平均数和标准差
• 平均数 E( X ) n
定义 n
证明: E( X ) P(x)x x0
以n=4,x=2为例,欲求P(x=2)=?。
在4次贝努利试验里,获得 2次成功的方式有 C42种:
ssff sfsf sffs fssf fsfs ffss
注意:C42是从四个位置选取两个位置的组合方式。
依据计算公式Cnx
n! x!(n
, x)!
C42
4! 2!2!
4 3 21=6 21 21
每种方式发生的概率为:
几种常见的概率分布律
的概率,其值为 ϕ4
=
⎛ ⎜⎝
1 2
⎞4 ⎟⎠
=1 16
。
ϕ 3 (1 − ϕ ) 表示有三个显性基因和一个隐性基因组合出现的概率。其中
显形基因有三个,隐性基因一个,该项的系数表示这样的组合共有四种。
它们是RRYy,RRyY,RrYY和rRYY。这四种组合的概率均为
•
ϕ
3
(1
−
ϕ
)
=
⎛ ⎜⎝
1 2
⎞3 ⎟⎠
上式正是二项式展开式的第x+1项,因此产生理论分布中“二项分布”这一名 称。故该式称为二项分布的概率函数。
• 二项展开式,
⎡⎣ϕ +(1−ϕ)⎤⎦n =Cn0ϕ0 (1−ϕ)n +Cn1ϕ1 (1−ϕ)n−1 +"+Cnxϕx (1−ϕ)n−x +"+Cnnϕn (1−ϕ)0 = p(0) + p(1) + p(2) +"+ p( x) +"+ p(n)
⎛ ⎜⎝
1 2
⎞10 ⎟⎠
=
2−10
=
0.0009766
( ) p(1)
=
10! ⎛
1!(10 −1)!⎜⎝
1 2
⎞1 ⎟⎠
⎛ ⎜⎝
1 2
⎞9 ⎟⎠
=
10
2−10
= 0.0097656
( ) p(2) =
10! ⎛ 1 ⎞2 ⎛ 1 ⎞8
2!(10 − 2)!⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
= 45
2−10
(1) 二项分布图形的形状取决于P 和 n 的大小; (2) 当P = 0.5时,无论 n 的大小, 均为对称分布; (3) 当P ≠ 0.5,n 较小时为偏态分 布,n 较大时逼近正态分布。
《几种常见的分布》课件
性质
总结词
二项分布具有可加性、可分解性和独立性等性质。
详细描述
二项分布的可加性是指,如果两个独立的随机试验分别服从参数为n1和p1的B(n1,p1)和参数为n2和p2的 B(n2,p2),则这两个试验的和服从参数为n1+n2和p的B(n1+n2,p)。可分解性是指,如果一个随机试验服从参数 为n和p的B(n,p),则可以将其分解为若干个独立的伯努利试验的和。独立性是指,如果一个随机试验服从参数为 n和p的B(n,p),则可以将其分解为若干个独立的二项分布的和。
应用场景
总结词
二项分布在统计学、生物学、医学等领 域有广泛的应用。
VS
详细描述
在统计学中,二项分布在样本比例、成功 率等问题的研究中有着重要的应用。在生 物学中,二项分布可以用于描述生物种群 遗传学中的基因频率变化等问题。在医学 中,二项分布可以用于描述疾病的发病率 、流行病学中的病例数等问题。此外,二 项分布还在金融、保险等领域数,表示在一定区间内随机事件发生的可能性是恒 定的。
均匀分布的期望值和方差取决于区间的长度,而不是具体的取值。
应用场景
均匀分布在现实生活中广泛存在,如 测量误差、随机试验中的随机误差等 。
在概率论中,均匀分布是概率空间的 基本构成元素之一,用于描述随机变 量的取值范围和概率关系。
在统计学中,泊松分布常用于 计数数据分析和生存分析等领 域。
在计算机科学中,泊松分布在 算法设计和数据结构分析中有 广泛应用。
03
二项分布
定义
总结词
二项分布是一种离散概率分布,描述的是在n次独立重复的伯努利试验中成功 的次数。
详细描述
二项分布适用于描述那些只有两种可能结果的随机试验,例如抛硬币、射击等 。在n次独立重复的伯努利试验中,成功的次数服从参数为n和p的二项分布, 记作B(n,p)。
第3章 几种常见的概率分布律
m
3. P(x m) Pn (k m)
C
k n
p k q nk
(3-2)
kn0
4. P(x m) Pn (k m)
Cnk p k q nk
(3-3)
k m
m2
5. P(m1 x m2 ) pn (m1 k m2 )
C
x 中细菌数服从波松分布。以=0.500代替 (3-10)
式中的λ,得 P(x k ) 0.5k e 0.5 (k=0, 1, 2, …) k!
计算结果如表3-3所示。
表3-3 细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分布 是相当吻合的 , 进一步说明用波松分布描述单 位容积(或面积)中细菌数的分布是适宜的。
k n
p k q nk
k m1
(m1<m2) (3-4)
二项分布由n和p两个参数决定: 1. 当p值较小且n不大时,分布是偏倚的。但随
着n的增大 ,分布逐渐趋于对称; 2. 当 p 值 趋于 0.5 时 ,分布趋于对称; 3. 对于固定的n及p,当k增加时,Pn(k)先随之
增加并达到其极大值,以后又下降。
如【例3.6】中已判断畸形仔猪数服从波松 分布,并已算出样本平均数=0.51。将0.51代替 公式(3-10)中的λ得:
P( x k ) 0.51k e 0.51 (k=0, 1, 2, …)
k!
因为e-0.51=1.6653,所以畸形仔猪数各项的概 率为:
P(x=0)=0.510/(0!×1.6653)=0.6005 P(x=1)=0.511/(1!×1.6653)=0.3063 P(x=2)=0.512/(2!×1.6653)=0.0781
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
第三章第二次课 几种常见的理论分布
第三章第二次课: 回顾概率基础知识,通过离散型和连续型随机变量的概率分布引出本次讲授内容。
第二节几种常见的理论分布重点:掌握正态分布、二项分布、泊松分布的定义、特点和概率计算。
难点:二项分布的概率函数特征,正态分布的特征。
一、二 项 分 布一)、贝努利试验及其概率公式将某随机试验重复进行n 次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n 次试验是独立的。
对于n 次独立的试验,如果每次试验结果出现且只出现对立事件A 与A 之一,在每次试验中出现A 的概率是常数p (0<p <1),因而出现对立事件A 的概率是1-p=q ,则称这一串重复的独立试验为n 重贝努利试验,简称贝努利试验(Bernoulli trials )。
在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。
在n 重贝努利试验中,事件A 可能发生0,1,2,…,n 次,现在我们来求事件A 恰好发生k (0≤k ≤n )次的概率P n (k)。
先取n =4,k =2来讨论。
在4次试验中,事件A 发生2次的方式有以下24C 种: 21A A 43A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A 4321A A A A其中A k (k =1,2,3,4)表示事件A 在第k 次试验发生;k A (k =1,2,3,4)表示事件A 在第k 次试验不发生。
由于试验是独立的,按概率的乘法法则,于是有 P (21A A 43A A )=P (4321A A A A )=…= P (4321A A A A )= P (1A )·P (2A )·P (3A )·P (4A )=242-qp又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A 恰好发生2次的概率为)2(4P = P (21A A 43A A )+P (4321A A A A )+…+ P (4321A A A A )=24C 242-qp一般,在n 重贝努利试验中,事件A 恰好发生k (0≤k ≤n)次的概率为)(k P n =kn C kn k qp - k =0,1,2…,n (3-14)若把(4-14)式与二项展开式∑=-=+nk kn k k n nqp C p q 0)(相比较就可以发现,在n 重贝努利试验中,事件A 发生k 次的概率恰好等于np q )(+ 展开式中的第k +1项,所以也把(4-14)式称作二项概率公式。
概率论常见的几种分布
概率论常见的几种分布常见的几种概率分布概率论是研究随机现象的数学理论,其中涉及到许多常见的概率分布。
概率分布描述了随机变量在不同取值上的概率分布情况。
本文将介绍几种常见的概率分布,包括均匀分布、正态分布、泊松分布和指数分布。
一、均匀分布均匀分布是最简单的概率分布之一,也被称为矩形分布。
在均匀分布中,随机变量在一定的取值范围内的概率是相等的。
例如,抛一枚公正的硬币,正面朝上和反面朝上的概率都是1/2。
均匀分布通常用于模拟随机数发生器的输出,或者在一定范围内随机选择一个数值。
二、正态分布正态分布是最重要的概率分布之一,也被称为高斯分布。
在正态分布中,随机变量在取值范围内的概率密度函数呈钟形曲线状。
正态分布具有许多重要的性质,例如均值、标准差等。
正态分布在自然界和社会科学中广泛应用,例如身高、体重、考试成绩等都符合正态分布。
三、泊松分布泊松分布描述了单位时间或空间内事件发生的次数的概率分布情况。
泊松分布的特点是,事件之间相互独立且平均发生率恒定。
泊松分布通常用于描述稀有事件的发生情况,例如单位时间内的电话呼叫次数、单位面积内的交通事故次数等。
四、指数分布指数分布描述了连续随机变量首次达到某一值的时间间隔的概率分布情况。
指数分布的特点是,事件之间相互独立且事件发生的概率与时间间隔成反比。
指数分布通常用于模拟随机事件的发生时间间隔,例如单位时间内的电话呼叫间隔、单位距离内的交通事故间隔等。
除了上述几种常见的概率分布外,还有许多其他概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种概率分布都有其特定的应用场景和数学性质,对于不同的问题可以选择适合的概率分布进行建模和分析。
总结起来,概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
这些分布在各自的领域有着广泛的应用,可以帮助我们理解和解决许多随机现象和问题。
对于研究概率论和统计学的人来说,熟悉这些常见的概率分布是非常重要的。
几种常见的概率分布率分解课件
均匀分布的定 义
均匀分布是一种概率分布,其特点是随机变量在一定区间内取值的可能性是等可 能的。
在数学表达上,如果一个随机变量X服从某个区间[a, b]上的均匀分布,则其概率 密度函数f(x)可以表示为f(x)=1b−a,当x∈[a,b]时,f(x)=0,当x∉[a,b]时。
均匀分布的特点
均匀分布的期望值E(X)和方差Var(X) 分别为(a+b)/2和(b-a)^2/12。
泊松分布在生活中的应用
02
01
03
在物理学中,泊松分布用于描述放射性衰变过程中粒 子发射的次数。
在统计学中,泊松分布常用于二项分布的近似,当试 验次数很大而事件发生的概率很小时。
在计算机科学中,泊松分布在处理网络流量和计算机 系统中的任务调度等问题时非常有用。
04
二项分布
二项分布的定义
总结词
二项分布是一种离散概率分布,描述了在n次独立重复的伯努利试 验中成功的次数。
指数分布的期望值和方差是有限的,分别为1/λ和1/λ^2,其中λ是概率密度函数的 参数。
指数分布在生活中的应用
指数分布在可靠性工程中广泛应 用,用于描述产品寿命、故障间
隔时间等。
在排队论中,指数分布用于描述 顾客到达和服务时间等随机变量。
在保险精算中,指数分布用于计 算保费和准备金。
06
均匀分布
几种常见的概率分布率分解课 件
CONTENCT
录
• 概率分布率概述 • 正态分布 • 泊松分布 • 二项分布 • 指数分布 • 均匀分布
01
概率分布率概述
概率分布率的定 义
概率分布率
表示随机变量取值的概率规律。
定义方式
对于离散随机变量,概率分布律为P(X=xi)=pi,i=1,2,3...;对于连续随机变量, 概率分布函数为P(a≤X≤b)=∫[a,b]f(x)dx,其中f(x)为概率密度函数。
第3章 几种常见的概率分布律
服从
U
110k 2
,
110k 2
的
r.v.
随机变量
期望
区间(a,b)上的 均匀分布
f
(
x)
b
1
a
,
0,
a x b, 其它
ab 2
方差
区间(a,b)上 的均匀分布
f
(x)
b
1
a
,
0,
a x b, (b a)2 其它 12
(2) 指数分布 若 X 的d.f. 为
ex , x 0
(2) 二项分布 n 重Bernoulli 试验中, X 是事件A 在 n 次试 验中发生的次数 , P (A) = p ,则
Pn (k) P( X k) Cnk pk (1 p)nk , k 0,1,, n
称 X 服从参数为n, p 的二项分布,记作
X ~ B(n, p)
0–1 分布是 n = 1 的二项分布
其期望和方差都是
在某个时段内:
① 大卖场的顾客数;
应 用
② 市级医院急诊病人数; ③ 某地区拨错号的电话呼唤次数; ④ 某地区发生的交通事故的次数.
场 ⑤ 放射性物质发出的 粒子数;
合 ⑥ 一匹布上的疵点个数;
⑦ 一个容器中的细菌数;
⑧ 一本书一页中的印刷错误数;
都可以看作是源源不断出现的随机 质点流 , 若它们满足一定的条件, 则称为 Poisson 流, 在 长为 t 的时间内出现的质
Show[fn1,fn3]
小
0.5 0.4
大 0.3 0.2 0.1
-6
几何意义 数据意义
-5 -4 -3 -2 -1
大小与曲线陡峭程度成反比 大小与数据分散程度成正比
d 几种常见的概率分布律
三、服从二项分布的随机变量的特征数
平均数: μ=nφ
方差: σ2=nφ(1-φ)
随着样本含量的增加,偏斜度和峭度趋 向于0,二项分布逐渐接近于正态分布。
四、二项分布应用实例
例:3.2 例:3.3 例:3.4
【例3.4】
用 棕 色 正 常 毛 (bbRR) 的 家 兔 和 黑 色 短 毛 (BBrr)兔杂交,杂种F1为黑色正常毛长的 家兔,F1雌、雄兔近亲交配,问最少需要 多少只F2代的家兔,才能以99%的概率至 少得到一只棕色短毛兔?
二、二项分布概率函数表达式:
p( y) Cny y (1)ny , y 0,1,2,, n
n=试验次数(或样本含量) y=在n次试验中事件A出现的次数 φ=事件A发生的概率(每次试验都是恒定的) 1-φ=事件A的对立事件发生的概率 p(y)=Y的概率函数=P(Y=y)
例:3.1
从雌雄各半的100只动物中做一抽样试验。第一次从这100只动 物中随机抽取一只,记下性别后放回,再做第二次抽取。共 做了10次抽样,计算抽中3只和3只以下雄性动物的概率。
(5)曲线和X坐标轴所夹的面积等于1。 (6)正态分布表查出的φ(u)的值表示随机变量
U落入区间(-∞, u)的概率。 (7)累积分布函数图形的特点是围绕点
(0, 0.5)对称。 (8)正态分布的偏斜度γ1=0 ,峭度γ2=0。
5. 一些重要值
68.27%
68.27%
95.00%
95.00%
99.00%
解: n=10 y=3,2,1,0 φ=1/2 p( y) Cny y (1)ny
p(3) 10! ( 1 )3 ( 1 )7 120 (210 ) 0.1171876 3!(10 3)! 2 2
第章几种常见的概率分布律
3
4
12 36 0.218750 7.000000
4
12
48 192 0.273437 8.749984
5
6
30 150 0.218750 7.000000
6
5
30 180 0.109375 3.500000
7
2
14 98 0.031250 1.000000
8
0
0 0 0.003906 0.124992
总数
14.04.2020
N=32
139 665 0.999999 31.99968
.
16
3.1.3 二项分布应用实例
样本平均数、总体平均数;样本方差、总体方
差如下:
x
fx
139
4.343750
N 32
n
8
1 2
4.000000
2
fx2
fx
665 1392
s2
N
32 1.974798
在Cumulative后填入0(或FALSE),表示计算成功次
14.04.2020 数恰好等于指定数值的. 概率;填入1(或TRUE)表 14
3.1.3 二项分布应用实例
例1 以杂合基因型Wvwv的小鼠为父本,隐性纯合 子小鼠wvwv为母本杂交(wv波浪毛,Wv直毛), 后代两种基因型的数目应各占一半。实验只选8只 的,多于8只和少于8只的都淘汰。利用下面的公式 或者Excel 可以计算直毛后代出现的概率:
第2步:在Excel表格界面中,直接点击“f(x)”(插入函数)命 令
第3步:在复选框“函数分类”中点击“统计”选项,在 “函数名”
中点击“BINOMDIST”选项,然后确定
第三章 常见的概率分布率
(--)二项分布的生物学应用:
1.预测后代分离比及基因组合。 例1、4对独立基因自由组合,后代3个显性 基因5个隐性基因概率?
2 推断所需群体和样本大小
例1、小麦自然变异概率φ=0.0045 (1)调查100株,获两株或两株以上变异株
例4
豌豆红花纯合基因AA,白花纯合基 因aa,杂交后F2后代 红花:白花 =3:1 , 每次随机观察4株。共观 察100次,则红花0株,1株,2株, 3株,4株的次数各多少?
例5
设在家畜中感染某种疾病的概率为20%,
现有两种疫苗,用疫苗A 注射了15头家畜 后无一感染,用疫苗B 注射 15头家畜后有
第三章 几种常见的概率分布律
3.1 二项分布-----离散型概率分布 率(binomial distribution) 例1、某射击手命中概率0.9,连续 射四次,恰好命中0、1、2、3、4 的概率。
3.1.1二项分布的概率函数
如果在一次试验中某事件发生的概率为φ, 那么在n次实验中(独立重复试验)恰好发 生x次的概率。
σ/√n –平均数的标准误差 (standard error of mean )
μ x = μ ,σ x =σ2/n
例1
小麦株高服从正态分布μ =110cm, σ=10cm.
现随机抽一株 问 (1)x>112cm的概率? (2)抽取n=36的样本,则样本的平均数株 高X>112cm的概率? (3)抽取n=100的样本, X>112cm的概率
拐点落在 -处
拐点落在 一个处
以平均数和标准差不同的正态分布系列曲线
正态分布
68-95-99.7规则
概率分布律
概率分布律
概率分布律是概率论中的重要概念之一,指的是随机变量取值的分布规律。
在统计学、物理学、工程学等领域中,概率分布律也被广泛应用。
本文将介绍常见的概率分布律,并分析其特点和应用。
1. 二项分布律
二项分布律是指在n次独立重复试验中,成功事件发生的次数服从的分布律。
其中,每次试验中成功事件发生的概率为p,失败事件发生的概率为q=1-p。
二项分布律在实际应用中非常广泛,例如模拟股票涨跌、判断产品合格率等。
2. 泊松分布律
泊松分布律是指在一定时间或空间内,某事件发生的次数服从的分布律。
例如,在一定时间内电话呼叫次数、车辆通过次数等。
泊松分布律具有简单、实用的特点,在实际应用中得到广泛使用。
3. 正态分布律
正态分布律又称高斯分布律,是指随机变量服从正态分布的分布律。
正态分布律具有对称性、可重复性、中心极限定理等特点,可以用于描述很多自然现象,例如身高、体重、考试成绩等。
4. 均匀分布律
均匀分布律是指随机变量服从均匀分布的分布律。
均匀分布律具有等可能性、无记忆性等特点,在实际应用中广泛用于随机抽样、随机游走等。
5. 指数分布律
指数分布律是指随机变量服从指数分布的分布律。
指数分布律具有无记忆性、反指数增长等特点,可以用于描述等待时间、寿命等。
以上是常见的概率分布律,每种分布律都有其独特的特点和应用场景。
在实际应用中,需要根据具体问题选择合适的概率分布律,以准确地描述随机变量的分布规律。
同时,在使用概率分布律时,也需要注意分布律的参数选择、数据的采集方法等问题,以保证分析结果的准确性。
几种常见的概率分布率-(1)分解
➢ 标准正态分布的偏斜度γ1和峭度γ2均为零。
以下一些特征值很重要:
-3 -2 -1
1 23
68.27%
95.45%
99.73%
P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973
4.822),求:
(1)X<161cm的概率; (2)X>164cm的概率; (3)152<X<162的概率。
x-
=
161 - 156.2 4.82
=
1.00
x
=
164 - 156.2 4.82
=
1.62
x
=
152 - 156.2 4.82
=
-0.87
x
=
162 - 156.2 4.82
=
1.20
四、 正态分布的单侧分位数和双侧分位数
x
[(1-
-1
p) ]p - p(n-x)
(当n→∞时,系数的极限为1,且nφ =μ)Βιβλιοθήκη x!= x e-x!
1
-1
e = lim (1 z) z,lim (1 - p) p = e
z0
p0
二、 服从泊松分布的随机变量的特征数
➢ 平均数:μ=λ ➢ 方差: σ2 = λ
➢ 偏斜度: 1=
1
➢
峭度:
标轴从-∞到u所夹的面积,该曲线下的面积即表示随机 变量U 落入区间(-∞,u)的概率;
➢ 标准正态分布查表常用的几个关系式:
• P(0<U <u1)=F(u1)-0.5 • P(U >u1)=F(-u1)=1-F(u1) • P(∣U∣>u1)=2F(-u1) • P(∣U∣<u1)=1- 2F(-u1) • P(u1<U <u2)=F(u2)-F(u1)
3章几种常见的分布
在Gamma分布中:k=n(正整数)时的gamma分布可以看作n个独立的k=1的 gamma分布(即指数分布)之和,按照中心极限定理,独立同分布随机变量 之和趋于正态分布。
几种常见的分布
2019/5/27
1
分类
连续型随机分布
◆ 正态分布、均匀分布、指数分布、对数正态分布、柯西分布、 Gamma分布、瑞利分布、韦伯分布、三角形分布
离散型随机分布
◆ 二项分布、几何分布、超几何分布、泊松分布
三大抽样分布
◆ 卡方分布、F分布、t分布
分布之间的关系
2019/5/27
应用:在自然情况下,均匀分布极为罕见。在实际问题中,当我们无法区分在 区间内取值的随机变量取不同值的可能性有何不同时,我们就可以假定随机变 量服从区间上的均匀分布。
2019/5/27
4
三、指数分布(Exponential distribution)
应用:主要用于描述独立事件发生的时间间隔。自然界中有很多种“寿命”可 以用指数分布来描述,如电子元件的寿命、动物的寿命、电话的通话时间、服 务系统的服务时间等。
定义:已知一个事件在伯努利试验中每次的出现概率是p,在一连串伯努利 试验中,一件事件刚好在第r + k次试验出现第r次的概率。
2019/5/27
取r = 1,负二项分布等于几 何分布。其概率质量函数 为
13
十二、几何分布
定义:在第 n 次伯努利实验,才得到第一次成功的机率。更详细的说是:n 次伯努利试验,前 n-1 次皆失败,第 n 次才成功的概率。
应用:泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某 一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台 的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷 陷数,显微镜下单位分区内的细菌分布方分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3).μ = n p 大小适中,恰好为e-μ.即:与自然数e的负指数为宜.
4).样本平均数就是总体平均数.X = μ.
5).平均数等于方差.X = δ2
6).偏斜度: γ1 = 1/√ n
7).峭度: γ2 = 1/μ
4.Poisson 分布的应用:
例:麦田内杂草的分布:调查已知每10平方米有一株杂草.
x
k!
m1.m2.e-m2
=[
x
][
m0!k2. P1 +
m12 1!
.P0
]
=0.5797/2 ×(1/1×0.3090 +1.2161/1×0.533)
=0.2775
第四项:=0.2024 第五项:=0.1345 第六项:=0.0843
第七项:=0.0503 第八项:=0.0288 第九项:=0.0178
重新捕捉到500只金丝燕,其中有24只带有标记.问:该山区金丝燕的群体数目?
解: K = 100 n = 500 x = 24
^ n k 100×500
.
N = x = 24 = 2083
2020/10/16
5. 负二项分布:negative binomial distribution
P (x) =CK-1x-1 p k q x-k 六、 核心分布----以某一中心作放射状分布,中央概率 p大,外围概率p逐渐减小
u=-2 到+2
面积=0.9543
u=-3 到+3
面积=0.9973
u=-1.96到+1.96 面积=0.95
u=-2.576到+2.576 面积=0.99
2020/10/16
X±1δ=68.27%
X±1.96δ=95%
X±2.576δ=99% ±
h. γ1=0
γ2=0
例: 高粱”三尺三”的株高服成正态分布N(X =156.2,δ=4.82).
以上的计算已列成表格,应用时可根据需要由t值,自由度查 概率;也可以由概率,自由度查t值.
2020/10/16
μ= N
n k (N-K)(N-n)
S2 = N2(N-1) ^ nk N= x
N------^群体大小的估计. K------加有标记的个体数. n------第二次抽样抽中的个体数. x------在含有为n的样本中加有标记的个体数.
例:某野外实习队用网捕捉到金丝燕100只,做好标记后仍放回大自然,一月后
∫∫∫( + ∂P V ∂x
+∂Q ∂y
) d∂∂Rzx d y d z
= ∫∫[P c o s ( n, x) +Q c o s (n, y) +R c o s (n, z) ]d s S
= ∫∫[P d y d z + Q d z d x + R d x d y] S
这个公式具有立体感,意思是:P Q R函数的累计积分为V的空间区域. z
1
则: φ (μ) = √2л×1 e-(μ-0)2/2×12 = √2л . e-μ2/2 (μ=0 , <μ <∞,δ=1)
表示 μ 变量区间范围内事件发生的概率. 而整个u分布的概率为:
1 φ (u) = √2п ∫u-∞ e-u2/2 d u
4). 正态分布的性质:
a.在μ=0 时,分布函数 φ (μ) 值最大.
=0.533
第二项:
[ m1.m2.e-m2 ] ∑[ mk2 .P(x-k-1)]
P (x) =
x
k!
=[(0.8943×1.2161×2.7183-1.2161)1]×(1.2161)0/0!×p0
=0.3090
第三项:
[ m1.m2.e-m2 ] ∑[ mk2 .P(x-k-1)]
P (x) =
b. μ不论是向正方远离或是向负方远离,e 的指数都变成一个绝对值愈来愈大
的负数因此, φ (μ) 减小
c.曲线纵坐标两侧对称 φ (μ) = φ (-μ)
d.曲线在μ=-1 μ= 1 处有两个拐点.
e.曲线和横坐标轴所夹的面积是1.
f. 分布函数曲线旋转180度仍然对称
g. u=-1 到 +1
面积=0.6827
问:100平方米有0株,1株,2株,3株…10株杂草的概率?
2020/10/16
2020/10/16
2020/10/16
五、 超几何分布: P (x) =
nk
C x n C n -x N-K C nN
x------- 0, 1, 2, 3, …n N------总体中的个体数. K------两种类型中某一种类型的个体数. n------非放回式抽样的次数. x------在n次抽样中某一种类型的个体数.
同样:把样本看作一个整体, 则: ∑f (x) =1
故: 式中任一项出现的概率为:
μx
μ----平均数
P (x) = e-μ x!
x ----第x项为自然数 :1,2,3,…
e ----常数 =2.718281…
3.Poisson分布的特征:
1).小概率事件.P ≦ 0.1.
2).n
∞,越大越好,但事实上不可能,因此,所得的分布是个近似分布.
∑f x2 -(∑f x)2/N
δ= √
N-1
3676500-(22110)2/140
=√
140-1
X – u x -157.93
U = δ = 36.4
然后查表,计算区间概率。
36.4(g)
5).正态分布的单侧分位数:
注意:检查资料是否符合正态分布,只要检查三个数据:
1. X± 1δ 是否占样本频率的68.27%. (如:上例: X±1δ=70.71%
3). U1= 4.82 =1.20 U2= 4.82 =-0.87 P(152<x<162) =φ(U1)-φ(U2) =φ(1.2)-φ(-0.87) =0.88493-0.19215 =0.69278
2020/10/16
2020/10/16
∑f x 22110
X = N = 140 = 157.93 (g)
P (x) =[
m1.m2.e-m2 x
]. ∑[
mk2 k!
.P(x-k-1)]
式中:
X2
m1= S2-X
S2-X m2= X
x------第x项 k------第x-1项 n------总项数(即实验次数)
例:茶葶子属植物在林地上的分布:
2020/10/16
2020/10/16
第一项: P (0) = e –m1 ( 1 –e –m2) = 2.7183-0.8943×(1-2.7183-1.2161)
n s2
Z = z2 ( x, y)
2020/10/16
y n s1
Z =z1 (x, y) x
既然一个空间是各个位点函数的累计积分,那么,一个曲面也必然是各个微
分区间函数的积分.
即: S
S1 + S2 + S3 +…….S x
∫ 则:
S=
x
-∞
(函数)
S1 S2
S
S3
Sx
2020/10/16
2020/10/16
3). 标准正态分布 a. 平均数μ与正态分布的关系:
(μ的负正与x轴的左右摆动)
μ<0
0
b. 标准差与正态分布的关系:
0μ=0
标准差越小,曲线越陡,数据越集中 标准差越大,曲线越平坦,数据越分散
2020/10/16
0
μ>0
定义: 当μ =0 δ =1 时的正态分布称为标准正态分布.
代入公式:
1
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2020/10/16
2. 普阿松分布:----小概率事件( p≦ 0.1)符合普阿松式分布.
求: 1).X<161厘米的概率.
2). X>164厘米的概率.
3).X在152厘米到162厘米之间的概率.
2020/10/16
x-μ 161-156.2 解:1). U= δ = 4.82 =1
P (x<161) =φ(u) =φ(1) =0.84134
2). x-μ 164-156.2 U= δ = 4.82 =1.62 P (x>164) =1-φ(u) =1-φ(1.62) =1-0.94738=0.05262 162-156.2 152-156.2
连续型随机变量(continuous random variable)—取值为 某一区间内有限或无限的任何值.
离散型随机变量(discret random variable)—取值为有限, 或可数无穷个孤立的数值.
2020/10/16
2020/10/16
2020/10/16
2020/10/16
∑(x-x)2
∑( x-x)2
=√ n-1 = √ n(n-1)
n
2020/10/16
t分布与t值
2 [(r-1)/2]!
1
Y c =√γ . [(r-2)/2]! . (1+t2/r)[(r+1)/2] 式中:Y c……对应于γ=n-1.
k个等大的样本γ=k(n-1)
当总体标准差已知时: x - μ U= δ/√n
当总体标准差未知时: x-μ t= s /√n