4常用概率分布
第四章 常见概率分布之二项分布和波松分布

样本均数和方差S2计算结果如下:
x =Σfk/n
=(120×0+62×1
+15×2+2×3+1×4)/200
=0.51
上一张 下一张 主 页 退 出
s2
fk 2 ( fk ) 2 / n
n 1 2 2 2 2 2 2 (120 0 62 1 15 2 2 3 1 4 102 ) / 200 200 1
即得各项按波松分布的理论窝数。 波松分布与
相应的频率分布列于表4—7中。
上一张 下一张 主 页 退 出
表4—4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊 松分布计算的概率相比较 ,发现畸形仔猪的频 率分布与 λ=0.51 的 波松分布是吻合得很好 的 。这进一步说明了畸形仔猪数是服从波松分 布的。
上一张 下一张 主 页 退 出
【例4.14】 为监测饮用水的污染情况, 现 检验某社区每毫升饮用水中细菌数 , 共得400 个记录如下:
0 1 p( x 1) C15 0.2 0 0.815 C15 0.210.814 0.1671
由计算可知 , 注射 A 疫苗无效的概率为 0.0352,比B疫苗无效的概率0.1671小得多。 因此,可以认为A疫苗是有效的,但不能认为B 疫苗也是有效的。
上一张 下一张 主 页
退 出
【例4.11】 仔猪黄痢病在常规治疗下死亡率 为20%,求5 头病猪治疗后死亡头数各可能值相 应的概率。 设5头病猪中死亡头数为x,则x服从二项分
作中,当 λ≥20时就可以用正态分布来近 似地处理波松分布的问题。
二、波松分布的概率计算
波松分布的概率计算,依赖于参数 λ的确定, 只要参数λ确定了 ,把k=0,1,2,… 代入 (4-23)式即可求得各项的概率。 但是在大多数 服从波松分布的实例中,分布参数λ往往是未知 的,只能从所观察的随机样本中计算出相应的样 本平均数作为 λ 的 估计值,将其代替(4-23) 式中的λ,计算出 k = 0,1,2,… 时的各项 概率。
16种常见概率分布概率密度函数、意义及其应用

目录1. 均匀分布 (1)2. 正态分布(高斯分布) (2)3. 指数分布 (2)4. Beta分布(:分布) (2)5. Gamm 分布 (3)6. 倒Gamm分布 (4)7. 威布尔分布(Weibull分布、韦伯分布、韦布尔分布) (5)8. Pareto 分布 (6)9. Cauchy分布(柯西分布、柯西-洛伦兹分布) (7)210. 分布(卡方分布) (7)8 11. t分布................................................9 12. F分布 ...............................................10 13. 二项分布............................................10 14. 泊松分布(Poisson 分布).............................11 15. 对数正态分布........................................1. 均匀分布均匀分布X ~U(a,b)是无信息的,可作为无信息变量的先验分布。
2. 正态分布(高斯分布)当影响一个变量的因素众多,且影响微弱、都不占据主导地位时,这个变量 很可能服从正态分布,记作X~N (」f 2)。
正态分布为方差已知的正态分布N (*2)的参数」的共轭先验分布。
1 空f (x ): —— e 2-J2 兀 o'E(X), Var(X) _ c 23. 指数分布指数分布X ~Exp ( )是指要等到一个随机事件发生,需要经历多久时间。
其 中,.0为尺度参数。
指数分布的无记忆性:Plx s t|X = P{X t}。
f (X )二 y oiE(X) 一4. Beta 分布(一:分布)f (X )二 E(X)Var(X)=(b-a)2 12Var(X)二1~2Beta 分布记为X 〜Be(a,b),其中Beta(1,1)等于均匀分布,其概率密度函数 可凸也可凹。
第四章_常用概率分布(第7版)

150
3) P X 20
x 20
P( X x ) 1 P X x 0.4880
x 0
150
19
Poisson分布
1)Poisson分布的概念
Poisson分布可以看作是发生的概率(或未发生的概
率1-)很小,而观察例数n很大时的二项分布。除二项
100! 99 0.4 5 1 0.4 6.48 10 16 5!95! 100! 100 40 60 40 P(X 40) C 100 π 40 1 π 0.4 40 1 0.4 0.0812 40!60! 100! 100 80 20 80 P(X 80) C 100 π 80 1 π 0.4 80 1 0.4 2.86 10 16 80!20!
π 1 π 0.13 0.87 0.027 n 150
۩二项分布的的应用
累积概率计算
分三种情况:P(X≤x1); P(X≥x2); P(x1≤X≤x2)
若X~B(n,),上述三种累积概率的计算公式分别为:
k k P X x1 P X k C n 1 k 0 k 0 x1 x1 n k
100 5
二项分布的特征
we'll keep the fixed at 0.5, and vary the sample size n:
Cited from /boost_doc/libs/math/…/dists/binomial_dist.html
Poisson分布的概率函数图举例:
P(x) 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 14 16 18 20 22 x λ =1
4 第三章 几种常见的概率分布律

φ-事件A发生的概率(每次试验都是恒定的)
1-φ- 事件 A 发生的概率 p(y)-y的概率函数=P(Y=y)
F(y)= P(Y≤y)=
p( yi )
yi y
5
例3.1 从雌雄各半的100只动物中,每次抽一只, 做放回式抽样,若抽样试验共进行10次,问其中 包括0,1,2,3只雄性动物的概率是多少?包括 3只及3只以下的概率是多少?
1
e dz y
(
y )2 2 2
2
24
F(y) 1
1 2
y
25
正态分布的特性
当y=μ时,f(y)有最大值,正态分布曲线是以平均数 为中心的分布。
当y不论向哪个方向远离μ时, f(y)的值都减小,但永 远不会等于0,正态分布以y轴为渐近线, y的取值区 间(-∞,+∞)。
36
标准正态分布的概率计算
如:设y服从标准正态分布,求概率 P(y>0.3) 。 解:标准正态分布关于y=0对称,所以
P(y>0.3)=P(y<-0.3)= (0.30) 0.3821
37
标准正态分布的概率计算
例:设y服从标准正态分布,求概率P(-1.83 <y <0.3) 。
解:即求标准正态分布曲线下在(-1.83,-0.30)范围 内的面积
k,
k
1,
k
2,
...
20
第四节 正态分布
第四节 正态分布
正态分布:两头少,中间多,两侧对称。 一、正态分布的密度函数和累积分布函数
正态分布密度函数
f (y)
1
e
(
y )2 2 2
常用概率分布-医学统计学

标准正态分布的µ=0,σ=1,则 µ±σ相当于区间(-1,1), µ±1.96σ相当于区间(-1.96,1.96), µ±2.58σ的区间相当于区间(-2.58,2.58)。
区间(-1,1)的面积:1-2Φ(-1)=1-2×0.1587=0.6826=68.26% 区间(-1.96,1.96)的面积:1-2Φ(-1.96)=1-2×0.0250=0.9500=95% 区间(-2.58,2.58)的面积:1-2Φ(-2.58)=1-2×0.0049=0.9902=99.02%
在单位空间中某种昆虫或野生动物数的分布,粉尘在
观察容积内的分布,放射性物质在单位时间内放射出
质点数的分布等。Poisson分布一般记作
。
Poisson分布作为二项分布的一种极限情况
Poisson分布可以看作是发生的概率π 很小,而观
察例数很大时的二项分布。除要符合二项分布的三个
基本条件外,Poisson分布还要求π或1-π接近于0和1。 有些情况π和n都难以确定,只能以观察单位(时间、
例 3 某年某市调查了 200例正常成人血铅含量 (μg/100g)如下,试估计该市成人血铅含量的95%医 学参考值范围。
分析:血铅的分布为偏态分布,且血铅含量只以 过高为异常,要用百分位数法制定单侧上限。
二、质量控制 为了控制实验中的检测误差,常用 ±2S作上
下但的警影随响机戒某因线一素,指很以标多, ±3S作为上下控制线。这里的2S和 3如S可果该视指为标1的.96随S 和2.58S的约数。其依据是正常情况下 检机误测波差动,误属则差于往是随往服机符从正态分布的。
概率 密度
正态分布的密度函数,即正态曲线的方程为 -∞<X<+∞
均数为0,标准差为1的正态分布,这种正态分布 称为标准正态分布。
4. 第三章 几种常见的概率分布律

3.4 正态分布
两头少,中间多,两侧对称
正态分布曲线
μ
22
正态分布的密度函数和分布函数
对于平均数是μ ,标准差是σ的正态分布,其密 度函数为
1 f x e 2
x 2
2 2
, x , 0
以符号N(μ ,σ2)表示平均数为μ ,标准差为 σ的正态分布
20
结果如下:
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
有x颗杂草的概率 p(x) = 10x/x!e10
有小于等 于x颗杂草 的概率 (累加)
有多于于等于x 颗杂草的概率 (1-上一个数 值的累计)
p(x) 0.0005 0.0023 0.0076 0.0189 0.0378 0.0631 0.0901 0.1126 0.1251 0.1251 0.1137 0.0948 0.0729 0.0521 0.0347
n p x 1 1 x 0
8
n
将x=0,1,2,3代入二项分布概率函数,可得出出 现0,1,2,3只雄性动物的概率。
P(0)= 0.0009766
P(1)= 0.0097656
P(2)= 0.0439453Biblioteka P(3)= 0.1171876
抽到3只和3只以下雄性动物的概率为:
15
于是:
15 n C (1 ) ( ) 0.01 16 n(lg15-lg16)= lg0.01 -0.02803n =-2.00000 n =71.4
n n n 0 n
即需要72代
0 n 0 n
常用概率分布

有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。
(卫生统计学)第四章 常用概率分布

第二节 Poisson分布的概念与特征
一、Poisson分布概念与特征
若某一随机变量X的取值为0,1,2,…,且X=k 的概率为:
P(X k) k e
k!
记作 X~P( λ )
其中 自然数e≈2.7182; λ 是大于0的常数,称X服从以λ 为参数的Poisson分布。
Poisson分布主要用于描述在单位时间(空间)内稀有事件的发生数。例如:放 射性物质在单位时间内的放射次数、单位容积内充分摇匀的水中的细菌数、染色 体异变数等。
350 300 250 200
人数
150 100
50 0
109 111 113 115 117 119 121 123 125 127 129 131 133 135 137 139 141 143
不同参数µ和σ下的正态分布曲线
正态分布函数
1.Gauss函数 (Gauss, 1777~1855 德国人)
某地正常成人心率(次/分)的频率分布
频数 1 5 12 13 26 31
组段 75~ 80~ 85~ 90~ 95~ 100~105
频数 24 15 9 7 5 2
心率频数分布
35
30
25
20
人数
15
10
5
0
45
50
55
60
65
70
75
80
85
90
95 100~105
正态曲线
例4-10 某地1986年120名8岁男孩身高频数图
百分位数法
例4-13
282名正常人尿汞值(g/L)测量结果
尿汞值 0~ 8.0~
16.0~ 24.0~ 32.0~ 40~ 48.0~ 56.0~ 64.0~72.0
常用概率分布间简介

其中 c 为常数,解方程(1)得
f ( ) c f ( )
f
(
)
k
e
1 2
c
2
,
k
为常数.
为使 f ( ) 为概率密度函数,
f
( )d
1,
即
k
e
1 2
c
2
dy
1
故必须 c 0 ,不妨令 c 1 ( 0 ),代入(2)解得 2
k 1 , 2 Biblioteka 于是f ( ) 1
2
e2 2 , R ,
2
这是均值为 0,方差为 2 的正态分布的概率密度函数.
.
X
~
N(0, 2)
,
则Y
X2
~
Ga(
1 2
,
1 2
2
)
.
(1) (2)
Ga( n , 1) 2(n) . 22
m
Xi ~ N(0,1) , i 1,2,,n 且相互独立 , 则 X
X
2 i
~
2(n) .
i 1
⒊ 相当误差(比率)的概率分布
m
设
Xi
~
N(0, 2 ) ,i
1,2,, m,m 1,,m n且相互独立,则
i 1
二、随机误差的概率分布
⒈ 高斯随机误差模型 随机变量的高斯分解
可观测的指标
X
不可观测的随机干扰
指标的标准值(生产控制参数,理论均值)
原始测量误差的概率分布
由棣莫弗提出,高斯推证,拉普拉斯再证,原始测量误差的概率分布为:
~ N (0 , 2 )
高斯的推证要点如下:
设测量误差 X 的密度函数为 f ( ) ,由“最大后验概率”的原则得
卫生统计学七版 第四章常用概率分布

该地健康女性血红蛋白的95%医学参考值范围在 137.39~97.41之间。
2、质量控制图 随机误差服从正态分布,而系统误差 则不服从正态分布。
例4 10
如果某地居民脑血管疾 病的患病率为 150/ 10万,
那么调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 有 多大?至少有 3人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 为0.809, 至少有3人患脑血管疾病的概率 为0.191 。
那么调查该地 1000 名居民中有2人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
2 1 . 5 P( X 2) e 1.5 0.251 2!
调查该地 1000 名居民中有2人患脑血管疾病的概率 为25.1%。
2、累积概率计算
稀有事件发生次数至多为k次的概率为:
2、累积概率计算 二项分布出现阳性次数最多为k次的概率:
二项分布出现阳性次数至少为k次的概率:
二项分布出现阳性次数至少为k次至至多为K次的概率(k<K):
n! P(k X K ) P( X ) X (1 ) n X k X k X !( n X )!
K K
(1) 百分位数法 适用范围:偏态分布的资料。
双侧界值:P 和P 2.5 97.5 单侧上界:P 95 单侧下界:P 5
(2) 正态分布法 适用范围:正态或近似正态分布的资料。
生物统计附实验设计课件 第四章 常用概率分布

第一节 随机事件与概率
1. 随机事件 随机试验: 科学研究中,有一类试验可以在相同条件 下重复进行,每次试验存在多种可能的结果,而究竟 出现哪种结果在试验之前不能肯定,这类试验称为随 机试验。随机试验的结果重复性越好,结果越可靠。 随机事件: 随机试验的每一种可能结果,在一定条件 下可能发生,也可能不发生,称为随机事件,用A、B、 C等表示。
F(-0.5)=0.69146-0.30854=0.3829 (F值查附表) 由于合格与不合格为对立事件,所以任一扇贝 不合格的概率P=1-0.3829=0.6171
常用概率分布
若记随机变量X的取值落入(-∞,������)的概率为 F(x),则。
������
������ ����� =
������ ������ ������������, 称������ ������ 为连续型随机变量������
−∞
的分布函数。分布函数和密度函数为积分与微分的 关系。它具有两条性质: 1)F(x)为单调不减函数, 右连续,即������������ <������������ 时,F(������������ )<F(������������ ); 2)F(−∞)=0, F(+∞)=1。 计算落入[a, b]的x值概率,用分布函数表示为: ������ ������ ������ P(a≦x≦b)= ������ ������ ������ ������������ = −∞ ������ ������ ������������ − −∞ ������(������) ������������ = F(b)-F(a)
概率的乘法法则 对于两事件A、B,若P(A)>0,则有P(AB)=P(A)P(B/A); 若P(B)>0,则有P(AB)=P(B)P(A/B),其中P(B/A)是指 事件A发生条件下事件B的条件概率。 若事件A与事件B相互独立,则有P(AB)=P(A)P(B)
概率论常见的几种分布

概率论常见的几种分布常见的概率论分布有:均匀分布、正态分布、泊松分布和指数分布。
1. 均匀分布均匀分布是指在一段区间内,各个取值的概率是相等的。
比如在一个骰子的例子中,每个面出现的概率是相等的,为1/6。
均匀分布在实际应用中常用于随机数生成、样本抽取等场景。
2. 正态分布正态分布又被称为高斯分布,是最常见的概率分布之一。
正态分布的特点是呈钟形曲线,数据集中在均值周围,并且具有对称性。
正态分布在自然界中广泛存在,比如人的身高、体重等都近似服从正态分布。
在统计学和数据分析中,正态分布的应用非常广泛,例如在建模、假设检验和置信区间估计等方面。
3. 泊松分布泊松分布是一种离散概率分布,描述了在一段时间或空间内,某事件发生的次数的概率分布。
泊松分布的特点是事件之间是独立的,并且事件发生的平均速率是恒定的。
泊松分布在实际应用中常用于描述稀有事件的发生概率,比如电话呼叫中心的接听次数、交通事故的发生次数等。
4. 指数分布指数分布是描述连续随机变量的概率分布,用于描述时间间隔的概率分布。
指数分布的特点是事件之间是独立的,并且事件发生的速率是恒定的。
指数分布在实际应用中常用于描述如等待时间、寿命等连续性事件的概率分布。
这四种分布在概率论和统计学中都有广泛的应用。
它们分别适用于不同的场景和问题,能够帮助人们理解和分析数据。
在实际应用中,我们常常需要通过对数据进行建模和分析来确定数据的分布类型,从而更好地理解数据的特征和规律。
除了这四种常见的分布外,还有其他许多概率分布,例如二项分布、伽玛分布、贝塔分布等。
每种分布都有其独特的特点和应用领域。
在实际应用中,选择合适的分布模型对数据进行建模和分析是非常重要的,可以帮助我们更好地理解数据,做出准确的推断和预测。
概率论中常见的几种分布包括均匀分布、正态分布、泊松分布和指数分布。
每种分布都有其特点和应用场景,在实际问题中选择合适的分布模型对数据进行建模和分析是非常重要的。
通过对数据的分布进行研究,我们能够更好地理解数据的规律和特征,为决策提供科学依据。
第4章 几种常见的概率分布

6. 正态分布的单双侧临界值
面积为,已知 上侧临界值 P(U> u )= α ,下侧临界值 P (U <- u )= α (附表 3 上侧临界值)
若将一定曲线下面积α,平分到两侧尾区,则每侧曲线下面积为α/2,
即 P(
U U 2
)=
α,
U 这时的
U
2
称为α的双侧临界值。
面积为,已知
u 称为的上侧临界值。 附表3 (256页)给出了u的值。
N(0,1)
x=0 时,φ(x) 达到最大值
(1) 关于点(0,0.5)对称,该点也
是它的拐点
(2)x 取值离原点越远,φ (x) 值越小 (2) 曲线以 y = 0 和 y = 1 为渐近线;
(3)关于 y 轴对称,即φ(x)= φ (- x)
(3) Ф(1.960)-Ф(-1.960) = 0.95
种变量有它各自的概率而组成一个分布。这个分布就叫做二项概率分布,或简称二项分布
(binomial distribution) 由此得到计算二项分布任何一项概率的通式为:p(x) =Cnx φ
x(1- φ)n-x
二项分布是一种离散型随机变量的概率分布
性质
n
Cnx x (1 )nx 1
x0
m
一指定时间范围内或在指定的面积或体积内某一事件出现的个体数的分布 泊松分布是一种离散型随机变量的概率分布
实例 调查某种猪场闭锁育种群仔猪畸形数,共记录 200 窝, 畸形仔猪数的分布情况如下表所
示。试判断畸形仔猪数是否服从泊松分布。 畸形仔猪数统计分布
解:根据泊松分布的平均数与方差相等这一特征,若畸形仔猪数服从泊松分布,则由观察数 据计算的平均数和方差就近于相等。样本均数和方差 S2 计算结果如下:
常用的概率分布类型及其特征

常用的概率分布类型及其特征3.1 二点分布和均匀分布1、两点分布许多随机事件只有两个结果。
如抽检产品的结果合格或不合格;产品或者可靠的工作,或者失效。
描述这类随机事件变量只有两个取值,一般取0和1。
它服从的分布称两点分布。
其概率分布为:其中 Pk=P〔*=*k〕,表示*取*k值的概率:0≤P≤1。
*的期望 E〔*〕=P*的方差 D〔*〕=P〔1—P〕2、均匀分布如果连续随机变量*的概率密度函数f〔*〕在有限的区间[a,b]上等于一个常数,则*服从的分布为均匀分布。
其概率分布为:*的期望 E〔*〕=〔a+b〕/2*的方差 D〔*〕=〔b-a〕2/123.2 抽样检验中应用的分布3.2.1 超几何分布假设有一批产品,总数为N,其中不合格数为d,从这批产品中随机地抽出n 件作为被检样品,样品中的不合格数*服从的分布称超几何分布。
*的分布概率为:*=0,1,……*的期望 E〔*〕=nd/N*的方差 D〔*〕=〔〔nd/N〕〔〔N-d〕/N〕〔〔N-n〕/N〕〕〔1/2〕3.2.2 二项分布超几何分布的概率公式可以写成阶乘的形式,共有9个阶乘,因而计算起来十分繁琐。
二项分布就可以看成是超几何分布的一个简化。
假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数*服从的分布为二项分布。
*的概率分布为:0<p<1*=0,1,……,n*的期望 E〔*〕=np*的方差 D〔*〕=np〔1-p〕3.2.3 泊松分布泊松分布比二项分布更重要。
我们从产品受冲击〔指瞬时高电压、高环境应力、高负载应力等〕而失效的事实引入泊松分布。
假设产品只有经过一定的冲击次数后,产品才失效,又设这些冲击满足三个条件:〔1〕、两个不相重叠的时间间隔产品所受冲击次数相互独立;〔2〕、在充分小的时间间隔发生两次或更屡次冲击的时机可忽略不计;〔3〕、在单位时间发生冲击的平均次数λ〔λ>0〕不随时间变化,即在时间间隔Δt平均发生λΔt次冲击,它和Δt 的起点无关。
常见概率分布表(超全总结)

指数分布 (负指数分布)
Γ(1, ������)
������ > 0
������
������ 2
注:指数分布是Γ分布的特殊情况
n
2n
χ2 分布
������ 2 (������)
������ ≥ 1
f(x) = {
2n⁄2 Γ(������⁄2) 0 ,
������ ≥ 1
������ > 0
均匀分布
U(a, b)
a<b
K=0,1,2,… 1 , ������ < ������ < ������ f(x) = {������ − ������ 0, 其它 f(x) = 1 f(x) = {√2������������������ 1 √2������������ ������ ������ −(������−������)
非中心χ 分布
2
������ f(x) = {
������+������ −( 2 ) ∞
������ (������, ��� 0
2������⁄2
������ 2+������−1 ������������ ∑ ������ , (������ > 0) 2������ ������=0 Γ (2 + ������) 2 ������! 0 , 其它
逆高斯分布
N (μ, λ)
−1
λ, μ > 0
Γ分布
连 续 型
(伽玛分布)
Γ(������, ������)
������, ������ > 0
1 ������ ������−1 ������ −������⁄������ , ������ > 0 f(x) = {������ ������ Γ(������) 0 , 其它 1 −������ ������ ������ , ������ > 0 f(x) = { ������ 0 , 其它 1 ������ 2 −1 ������ −2 , ������ > 0 其它
常用的概率分布类型及其特征

常用的概率分布类型及其特征概率分布是用来描述随机变量的取值的概率的函数。
不同的概率分布具有不同的特征和应用范围。
以下是常用的概率分布类型及其特征。
1. 伯努利分布(Bernoulli Distribution):伯努利分布是最简单的概率分布之一,它描述了只有两个可能结果的离散随机变量的概率分布。
例如,抛一枚硬币的结果可以是正面或反面。
伯努利分布的特征是它的均值和方差分别等于成功的概率(p)和失败的概率(1-p)。
2. 二项分布(Binomial Distribution):二项分布是一种描述离散随机变量成功次数的概率分布。
它描述了在n次独立试验中成功的次数。
例如,投掷一枚硬币n次,成功的次数即为正面出现的次数。
二项分布的特征是它的均值等于试验次数乘以成功概率,方差等于试验次数乘以成功概率乘以失败概率。
3. 泊松分布(Poisson Distribution):泊松分布适用于描述单位时间内独立事件发生的次数的概率分布。
例如,在一小时内到达一些公共汽车站的乘客数。
泊松分布的特征是它的均值和方差相等,并且与单位时间内事件发生的频率(λ)相关。
4. 正态分布(Normal Distribution):正态分布是最常见的概率分布之一,它以钟形曲线表示。
正态分布适用于连续变量,例如身高、体重等。
正态分布的特征是它的均值和方差决定了曲线的位置和形状。
均值决定了曲线的中心,而方差决定了曲线的宽窄。
5. 卡方分布(Chi-Square Distribution):卡方分布适用于描述随机变量和它的平方之和的概率分布。
它在统计推断中经常用于检验统计模型的拟合优度。
卡方分布的特征是它的自由度决定了分布的形状。
6. t分布(Student's t-Distribution):t分布适用于样本容量较小,总体标准差未知的情况。
t分布的特征是它的形状比正态分布更扁平,更厚尾。
7. F分布(F-Distribution):F分布适用于进行方差分析等统计推断问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P) + ≥ 20) P((0X P(12+ P(=) ∑P(X ))=1− ∑P( ( X ) P ( X≥ ) ) =2 P( X =1− ∑PX ) ∑
x=20 0
n! π X (1−π )n−X P( X ≤ 2) = ∑P( X ) = ∑ ! x=0 x=0 X!(n − X )
1 19
2.
二项分布的均数和标准差
对于任何一个二项分布B(X;n,π), 如果每次试验出现“阳性”结果的概率 均为π ,则在n次独立重复实验中,出现 阳性次数X的总体均数为 = nπ µ 方差为 标准差为
σ 2 = nπ (1− π )
σ = nπ (1−π )
例
实验白鼠3 实验白鼠3只,白鼠用药后死亡的死亡
治疗结果为有限和无效两类 有效概率均为0.6 有效概率均为0.6 每个患者是否有效不受其他病例的影响
n=3
X n X
x=2
n−X
π=0.6
P( X ) = C π (1−π )
P(2) = C2 3
π (1 − π )
2
3−2
3! 3−2 0.62 (1 − 0.6) = 0.432 = 2!(3 − 2)!
P( X ) = e
P(0) = e−0.5 P( ) = e−0.5 1
P(2) = e−0.5
−λ
λ
X
X!
0.50 = 0.607 0 !
至多有2名感染的概率为: 至多有2名感染的概率为: 至少有2名感染的概率为: 至少有2名感染的概率为: 2 2 至少有20名感染的概率为: 20名感染的概率为 至少有20名感染的概率为:
nn
0 150! P(0 +x=2 150 150! 149 ( 0.13 + ==1−[0.130)1−P(1))+ P(3) +....P(19)]13) 0.131 1− 0. 0 1149 ! ==!150!P 0 + P 1 ] ≈1 ! 10.4879 −! [ 150 148 + 0.132(1− 0.13) 2! ! 148 = 2.31×10−7
()
()
第四章
第一节 第二节 第三节
常用概率分布
二项分布 Poisson分布 Poisson分布 正态分布
一、Poisson分布的概念 Poisson分布的概念 二、Poisson分布的特征 分布的特征 Poisson分布的应用 三、 Poisson分布的应用
Poisson分布的概念 1. Poisson分布的概念 Poisson分布也是一种离散型分布, Poisson分布也是一种离散型分布,用 分布也是一种离散型分布 以描述罕见事件发生次数的概率分布。 以描述罕见事件发生次数的概率分布。 Poisson分布也可用于研究单位时间内 Poisson分布也可用于研究单位时间内 (或单位空间、容积内)某罕见事件发生次 或单位空间、容积内) 数的分布。 数的分布。 Poisson分布一般记作 Poisson分布一般记作 P( λ)。
或
P( X ≥1) =1− P(0) =1− 0.064 = 0.936
一、二项分布的概念 二、二项分布的特征 二项分布的特征 三、二项分布的应用
1.
二项分布的图形特征
n,π是二项分布的两个参数,所以二 是二项分布的两个参数, 项分布的形状取决于n 可以看出π= 项分布的形状取决于n,π。可以看出π= 0.5时分布对称 近似对称分布。 时分布对称, 0.5时分布对称,近似对称分布。π ≠0.5 分布呈偏态,特别是n较小时, 时,分布呈偏态,特别是n较小时, π偏离 0.5越远 分布的对称性越差, 越远, 0.5越远,分布的对称性越差,但只要不接 随着n 的增大, 近1和0时,随着n 的增大,分布逐渐逼近正 态。
Poisson分布作为二项分布的一种极限情况 Poisson分布作为二项分布的一种极限情况
Poisson分布可以看作是发生的概率π 很小, Poisson分布可以看作是发生的概率π 很小,而 分布可以看作是发生的概率 观察例数很大时的二项分布。 观察例数很大时的二项分布。除要符合二项分布的三 个基本条件外,Poisson分布还要求π 个基本条件外,Poisson分布还要求π或1-π接近于0 分布还要求 接近于0 和1。
第五版) 卫生统计学(第五版)
流行病学与卫生统计学教研室
第四章
第一节 第二节 第三节
常用概率分布
二项分布 Poisson分布 Poisson分布 正态分布
一、二项分布的概念 二、二项分布的特征 二项分布的特征 三、二项分布的应用
(一)成败型实验(Bernoulli实验) 成败型实验(Bernoulli实验) 实验 将我们关心的事件A出现称为成功, 将我们关心的事件A出现称为成功, 不出现称为失败,这类试验就称为成不出现称为失败,这类试验就称为成-败 型实验。指定性资料中的二项分类实验。 型实验。指定性资料中的二项分类实验。
二项分布的概率函数P(X)为 二项分布的概率函数P(X)为: P(X)
P( X ) = C π
X n X
(1−π )
n−X
其中X=0,1,2…,n。 其中X=0, , 。 X=0 n,π是二项分布的两个参数 。
C
X n
n ! = X!(n − x)!
n
对于任何二项分布, 对于任何二项分布,总有 ∑P( X ) = 1 x=0
概率π=0.6, 概率π=0.6,则3只白鼠中死亡鼠数X的总体 π=0.6 只白鼠中死亡鼠数X 均数
µ = nπ
= 3×0.6 = 1.8(只) 1.8(
σ 2 = nπ (1−π )
= 3×0.6×0.4 = 0.72 只 ( )
方差为 标准差为
σ = nπ (1−π )
= 3×0.6×0.4 = 0.85(只 )
n =150,π = 0.067 0.067(1− 0.067) σp = = 0.02 150
一、二项分布的概念 二、二项分布的特征 二项分布的特征 三、二项分布的应用
(一)
概率估计
如果某地钩虫感染率为13%,随机 例4-5 如果某地钩虫感染率为 , (二 人 其中有10人感染钩虫的概 观察当地150人,其中有 人感染钩虫的概 观察当地 )单侧累计概率计算 率有多大? 率有多大
如果以率表示,将阳性结果的频率记为
X 则P的总体均数 p= n π (1−π ) 2 σp = 总体方差为
µp = π
总体标准差为 式中
σp =
π (1−π )
n
n
σ p是频率p的标准误,反映阳性频
率的抽样误差的大小。
例4-4 如果某地钩虫感染率为6.7%,随 机观察当地150人,样本钩虫感染率为p, 求p的抽样误差。
2例有效的概率是0..432 例有效的概率是0..432
一例以上有效的概率为: 一例以上有效的概率为:
P( X ≥1) = P(1) + P(2) + P(3) 3 ! 3 ! 3− 1 3−2 ( 0.611− 0.6) + 0.62 (1− 0.6) 1 (3 −1)! ! 2 (3 − 2)! ! 3 ! 3−3 + 0.63 (1− 0.6) = 0.288 + 0.432 + 0.216 3 (3 − 3)! ! = 0.936 =
表7.1
死亡数 X 0 1 未死亡数 3-X 3 2
3只白鼠各种试验结果及其发生概率 3只白鼠各种试验结果及其发生概率
试验结果 试验结果概率
3 π 1 P( X ) = k ( −π )3−k k
X取值概率
甲 生 死 生 生
乙 生 生 死 生 死 生 死 死
丙 生
(1- 互 不(1-π)3事 件 相容 独立事件的乘 π(1-π)(1- 生 π(1-π)(1-π) 的加法定理 法定理 生 死 生 死 死 死 (1-π)π(1-π) (1-π)π(1- (1-π)(1- (1-π)(1-π)π ππ(1- ππ(1-π) π(1- π(1-π)π (1- (1-π)ππ πππ
成-败型(Bernoulli)实验序列: 败型(Bernoulli)实验序列:
一个袋子里有5个乒乓球,其中2 一个袋子里有5个乒乓球,其中2个黄 球,3个白球,进行摸球实验,每次摸一个 个白球,进行摸球实验, 球,然后放回再摸。 然后放回再摸。
三个条件
每次实验只能是两个互斥的结果之一
相同的实验条件下阳性事件发生概率相同
举例 设实验白鼠共3只,要求它们同种属、 同性别、体重相近,且他们有相同的死亡 概率,记事件“白鼠用药后死亡 白鼠用药后死亡”为A, 相应死亡概率为π。记事件“白鼠用药后 不死亡”为 ,相应不死亡概率为1-π。 A 设实验后3只白鼠中死亡的白鼠数为X,则 X的可能取值为0,1,2和3,则死亡鼠数 为X的概率分布即表现为二项分布。
各次实验独立(各次的实验结果互不影响) 各次实验独立(各次的实验结果互不影响)
(二)二项分布的概率函数
二项分布是指在只能产生两种可能结 二项分布 若从阳性率为π 若从阳性率为π的总体中随机抽取大小 果(如“阳性”或“阴性”)之一的n次 的样本,则出现“阳性”数为X 为n的样本,则出现“阳性”数为X的概率 分布即呈现二项分布, 分布即呈现二项分布,记作 B(X;n,π) 独立重复实验中,当每次实验的“阳性” B(n,π)。 或B(n,π)。 概率保持不变时,出现“阳性”的次 X=0,1,2,…,n的一种概率分布。
3 P(0) = 0 ( − π )3 π 1 0 3 P( ) = 1 ( − π ) 2 1 π 1 1
21ຫໍສະໝຸດ 死 死 生 3 P(2) = 2 ( − π )1 π 1 2
3
0