第四章常用概率分布

合集下载

4.5 正态分布的应用

4.5 正态分布的应用

第四章 常用概率分布五、正态分布的应用正态分布的应用1. 确定医学参考值范围n参考值范围(reference range):指特定的“正常”人群的解 剖、生理、生化指标及组织代谢产物含量等数据中大多数 个体的取值所在的范围。

正态分布的应用 n制定参考值范围的步骤:1. 选择足够数量的正常人作为调查对象。

2. 样本含量足够大。

3. 确定取单侧还是取双侧正常值范围。

4. 选择适当的百分界限。

5. 选择适当的计算方法。

n估计医学参考值范围的方法:1. 正态近似法:适用于正态分布或近似正态分布的资料。

2. 百分位数法:适用于偏态分布资料。

过高异常 过高异常过低异常 过低异常例1 某地调查120名健康女性血红蛋白,直方图显示,其分 布近似于正态分布,得均数为117.4g/L ,标准差为10.2g/L , 试估计该地正常女性血红蛋白的95%医学参考值范围。

分析:正常人的血红蛋白过高过低均为异常,要制定双侧正 常值范围。

该指标的95%医学参考值范围为97.41~137.39(g/L )1.96117.4 1.9610.297.41~137.39X S ±=±´=例 1­A 某年某市调查了200例正常成人血铅含量(μg/100g) 如下,试估计该市成人血铅含量的95%医学参考值范围。

分析:血铅的分布为偏峰分布,且血铅含量只以 过高为异常,要用百分位数法制定单侧上限。

( ) ( ) 95 5.%3820095%18938.7/100 7L x iP L n x f g gf m =+-å=+´-=正态分布的应用2. 质量控制图n控制图基本原理:如果某一波动仅仅由个体差异或随机测 量误差所致,那么观察结果服从正态分布。

2. 质量控制图控制图共有7条水平线,中心线位于总体均数μ处,警戒限位于处,控制限位于 处,此外还有2条位于 处。

如果总体均数和总体标准差未知,也可用样本估计值代 替,这时,7条水平线分别位于 、 、 和 处。

第四章 常见概率分布之二项分布和波松分布

第四章  常见概率分布之二项分布和波松分布

样本均数和方差S2计算结果如下:
x =Σfk/n
=(120×0+62×1
+15×2+2×3+1×4)/200
=0.51
上一张 下一张 主 页 退 出
s2
fk 2 ( fk ) 2 / n
n 1 2 2 2 2 2 2 (120 0 62 1 15 2 2 3 1 4 102 ) / 200 200 1
即得各项按波松分布的理论窝数。 波松分布与
相应的频率分布列于表4—7中。
上一张 下一张 主 页 退 出
表4—4 畸形仔猪数的波松分布
将实际计算得的频率与根据λ=0.51的泊 松分布计算的概率相比较 ,发现畸形仔猪的频 率分布与 λ=0.51 的 波松分布是吻合得很好 的 。这进一步说明了畸形仔猪数是服从波松分 布的。
上一张 下一张 主 页 退 出
【例4.14】 为监测饮用水的污染情况, 现 检验某社区每毫升饮用水中细菌数 , 共得400 个记录如下:
0 1 p( x 1) C15 0.2 0 0.815 C15 0.210.814 0.1671
由计算可知 , 注射 A 疫苗无效的概率为 0.0352,比B疫苗无效的概率0.1671小得多。 因此,可以认为A疫苗是有效的,但不能认为B 疫苗也是有效的。
上一张 下一张 主 页
退 出
【例4.11】 仔猪黄痢病在常规治疗下死亡率 为20%,求5 头病猪治疗后死亡头数各可能值相 应的概率。 设5头病猪中死亡头数为x,则x服从二项分
作中,当 λ≥20时就可以用正态分布来近 似地处理波松分布的问题。
二、波松分布的概率计算
波松分布的概率计算,依赖于参数 λ的确定, 只要参数λ确定了 ,把k=0,1,2,… 代入 (4-23)式即可求得各项的概率。 但是在大多数 服从波松分布的实例中,分布参数λ往往是未知 的,只能从所观察的随机样本中计算出相应的样 本平均数作为 λ 的 估计值,将其代替(4-23) 式中的λ,计算出 k = 0,1,2,… 时的各项 概率。

第四章_常用概率分布(第7版)

第四章_常用概率分布(第7版)
x2
150
3) P X 20
x 20
P( X x ) 1 P X x 0.4880
x 0
150
19
Poisson分布
1)Poisson分布的概念
Poisson分布可以看作是发生的概率(或未发生的概
率1-)很小,而观察例数n很大时的二项分布。除二项

100! 99 0.4 5 1 0.4 6.48 10 16 5!95! 100! 100 40 60 40 P(X 40) C 100 π 40 1 π 0.4 40 1 0.4 0.0812 40!60! 100! 100 80 20 80 P(X 80) C 100 π 80 1 π 0.4 80 1 0.4 2.86 10 16 80!20!
π 1 π 0.13 0.87 0.027 n 150
۩二项分布的的应用
累积概率计算
分三种情况:P(X≤x1); P(X≥x2); P(x1≤X≤x2)
若X~B(n,),上述三种累积概率的计算公式分别为:
k k P X x1 P X k C n 1 k 0 k 0 x1 x1 n k
100 5
二项分布的特征
we'll keep the fixed at 0.5, and vary the sample size n:
Cited from /boost_doc/libs/math/…/dists/binomial_dist.html
Poisson分布的概率函数图举例:
P(x) 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 12 14 16 18 20 22 x λ =1

(卫生统计学)第四章 常用概率分布

(卫生统计学)第四章 常用概率分布

第二节 Poisson分布的概念与特征
一、Poisson分布概念与特征
若某一随机变量X的取值为0,1,2,…,且X=k 的概率为:
P(X k) k e
k!
记作 X~P( λ )
其中 自然数e≈2.7182; λ 是大于0的常数,称X服从以λ 为参数的Poisson分布。
Poisson分布主要用于描述在单位时间(空间)内稀有事件的发生数。例如:放 射性物质在单位时间内的放射次数、单位容积内充分摇匀的水中的细菌数、染色 体异变数等。
350 300 250 200
人数
150 100
50 0
109 111 113 115 117 119 121 123 125 127 129 131 133 135 137 139 141 143
不同参数µ和σ下的正态分布曲线
正态分布函数
1.Gauss函数 (Gauss, 1777~1855 德国人)
某地正常成人心率(次/分)的频率分布
频数 1 5 12 13 26 31
组段 75~ 80~ 85~ 90~ 95~ 100~105
频数 24 15 9 7 5 2
心率频数分布
35
30
25
20
人数
15
10
5
0
45
50
55
60
65
70
75
80
85
90
95 100~105
正态曲线
例4-10 某地1986年120名8岁男孩身高频数图
百分位数法
例4-13
282名正常人尿汞值(g/L)测量结果
尿汞值 0~ 8.0~
16.0~ 24.0~ 32.0~ 40~ 48.0~ 56.0~ 64.0~72.0

标准正态分布

标准正态分布
P(|u|≥u1)=2Φ(-u1)
P(|u|<u1==1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)
10
计算

已知u~N(0,1),试求:
(1) P(u<-1.64)=?
(2) P (u≥2.58)=?
(3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
(standard normal distribution)
(u )
(u )
1 2
1 2
e
u
e

u2 2
1 2 u 2
du
随机变量u服从标准正态分布,记作u~
N(0,1)
7
标准正态分布
对于任何一个服从正态分布N(μ,σ2)的随机
变量x,都可以通过标准化变换 u=(x-μ)/σ
P(|u|≥3)=1-0.9973=0.0027
P(|u|≥1.96)=1-0.95=0.05 P(|u|≥2.58)=1-0.99=0.01
14
由表4—2可见,实际频率与理论概率相当接近,说明126 头基础母羊体重资料的频率分布接近正态分布,从而可推 断基础母羊体重这一随机变量很可能是服从正态分布的
= 1, ..., n)为相互独 立,都服从标准正态分布,则定义: 2 i zi2 , i = 1, ..., n 变量2服从自由度等于n卡方分布(chi – square distribution)。
19
卡方分布曲线
图4-1 不同自由度下的2分布
图4-2 2分布的 上侧和下侧分位数 示意图
P(x<μ-1.96σ)=P(x>μ+1.96σ)=0.025

第四章常用概率分布学习指导(定)详解

第四章常用概率分布学习指导(定)详解

第四章 常用概率分布[教学要求]了解:质量控制的意义、原理和方法 熟悉:三个常用概率分布的特征。

掌握:掌握三个常用概率分布的概念;二项分布及Poisson 分布的概率函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算。

[重点难点]第一节 二项分布一、二项分布的概念与特征基本概念:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。

二项分布的概率函数:Xn X X n C X P --=)1()(ππ二项分布的特征:二项分布图的形态取决于与n ,高峰在=n 处。

当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。

二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n 如果将出现阳性结果的频率记为 nX p =则p 的总体均数为 πμ=p 标准差为二、二项分布的应用二项分布出现阳性的次数至多为k 次的概率为np )1(ππσ-=∑∑==-==≤kX kX XX eX P k X P 0!)()(λλ出现阳性的次数至少为k 次的概率为第二节 Poisson 分布的概念与特征一、Poisson 分布的概念与特征基本概念:Poisson 分布可以看作是每个观察对象阳性结果的发生概率很小,而观察例数n 很大时的二项分布。

除二项分布的三个基本条件以外,Poisson 分布还要求 接近于0。

有些情况和n 都难以确定,只能以观察单位(时间、空间、面积等)内某种稀有事件的发生数X 来近似。

Poisson 分布的概率函数:式中,πλn =为Poisson 分布的总体均数,X 为观察单位内某稀有事件的发生次数,e 为自然对数的底,λ为常数,约等于2.71828。

Poisson 分布的特征Poisson 分布当总体均数λ值小于5时为偏峰,λ愈小分布愈偏,随着λ增大,分布趋向对称。

卫生统计学七版 第四章常用概率分布

卫生统计学七版 第四章常用概率分布
上限: X 1.96s 117.4 1.9610.2 137.39( g / l ) 下限: X 1.96s 117.4 1.9610.2 97.41( g / l )
该地健康女性血红蛋白的95%医学参考值范围在 137.39~97.41之间。
2、质量控制图 随机误差服从正态分布,而系统误差 则不服从正态分布。
例4 10
如果某地居民脑血管疾 病的患病率为 150/ 10万,
那么调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 有 多大?至少有 3人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
调查该地 1000 名居民中至多有 2人患脑血管疾病的概率 为0.809, 至少有3人患脑血管疾病的概率 为0.191 。
那么调查该地 1000 名居民中有2人患脑血管疾病的概率 有多大?
n 1000 0.0015 1.5
2 1 . 5 P( X 2) e 1.5 0.251 2!
调查该地 1000 名居民中有2人患脑血管疾病的概率 为25.1%。
2、累积概率计算
稀有事件发生次数至多为k次的概率为:
2、累积概率计算 二项分布出现阳性次数最多为k次的概率:
二项分布出现阳性次数至少为k次的概率:
二项分布出现阳性次数至少为k次至至多为K次的概率(k<K):
n! P(k X K ) P( X ) X (1 ) n X k X k X !( n X )!
K K
(1) 百分位数法 适用范围:偏态分布的资料。
双侧界值:P 和P 2.5 97.5 单侧上界:P 95 单侧下界:P 5
(2) 正态分布法 适用范围:正态或近似正态分布的资料。

概率论与数理统计第四章_几种重要的分布

概率论与数理统计第四章_几种重要的分布
用贝努公式计算ξ的分布律下
ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0

生物统计附实验设计课件 第四章 常用概率分布

生物统计附实验设计课件 第四章  常用概率分布
第四章 常用概率分布
第一节 随机事件与概率
1. 随机事件 随机试验: 科学研究中,有一类试验可以在相同条件 下重复进行,每次试验存在多种可能的结果,而究竟 出现哪种结果在试验之前不能肯定,这类试验称为随 机试验。随机试验的结果重复性越好,结果越可靠。 随机事件: 随机试验的每一种可能结果,在一定条件 下可能发生,也可能不发生,称为随机事件,用A、B、 C等表示。
F(-0.5)=0.69146-0.30854=0.3829 (F值查附表) 由于合格与不合格为对立事件,所以任一扇贝 不合格的概率P=1-0.3829=0.6171
常用概率分布
若记随机变量X的取值落入(-∞,������)的概率为 F(x),则。
������
������ ����� =
������ ������ ������������, 称������ ������ 为连续型随机变量������
−∞
的分布函数。分布函数和密度函数为积分与微分的 关系。它具有两条性质: 1)F(x)为单调不减函数, 右连续,即������������ <������������ 时,F(������������ )<F(������������ ); 2)F(−∞)=0, F(+∞)=1。 计算落入[a, b]的x值概率,用分布函数表示为: ������ ������ ������ P(a≦x≦b)= ������ ������ ������ ������������ = −∞ ������ ������ ������������ − −∞ ������(������) ������������ = F(b)-F(a)
概率的乘法法则 对于两事件A、B,若P(A)>0,则有P(AB)=P(A)P(B/A); 若P(B)>0,则有P(AB)=P(B)P(A/B),其中P(B/A)是指 事件A发生条件下事件B的条件概率。 若事件A与事件B相互独立,则有P(AB)=P(A)P(B)

第4章 几种常见的概率分布

第4章 几种常见的概率分布

6. 正态分布的单双侧临界值
面积为,已知 上侧临界值 P(U> u )= α ,下侧临界值 P (U <- u )= α (附表 3 上侧临界值)
若将一定曲线下面积α,平分到两侧尾区,则每侧曲线下面积为α/2,
即 P(
U U 2
)=
α,
U 这时的
U
2
称为α的双侧临界值。
面积为,已知
u 称为的上侧临界值。 附表3 (256页)给出了u的值。
N(0,1)
x=0 时,φ(x) 达到最大值
(1) 关于点(0,0.5)对称,该点也
是它的拐点
(2)x 取值离原点越远,φ (x) 值越小 (2) 曲线以 y = 0 和 y = 1 为渐近线;
(3)关于 y 轴对称,即φ(x)= φ (- x)
(3) Ф(1.960)-Ф(-1.960) = 0.95
种变量有它各自的概率而组成一个分布。这个分布就叫做二项概率分布,或简称二项分布
(binomial distribution) 由此得到计算二项分布任何一项概率的通式为:p(x) =Cnx φ
x(1- φ)n-x
二项分布是一种离散型随机变量的概率分布
性质
n
Cnx x (1 )nx 1
x0
m
一指定时间范围内或在指定的面积或体积内某一事件出现的个体数的分布 泊松分布是一种离散型随机变量的概率分布
实例 调查某种猪场闭锁育种群仔猪畸形数,共记录 200 窝, 畸形仔猪数的分布情况如下表所
示。试判断畸形仔猪数是否服从泊松分布。 畸形仔猪数统计分布
解:根据泊松分布的平均数与方差相等这一特征,若畸形仔猪数服从泊松分布,则由观察数 据计算的平均数和方差就近于相等。样本均数和方差 S2 计算结果如下:

第四章 概率与概率分布

第四章   概率与概率分布

第三节 随机变量及其分布
一、 随机变量 (一) 随机变量的定义
表示随机现象观测结果的变量称为随机变量。随 机变量可用X、Y、Z……表示。 (二)随机变量的类型 1、离散型随机变量
只能取有限个或可列个孤立值的随机变量称为离 散型随机变量。 2、连续型随机变量
取值连续充满某一区间的随机变量称为连续型随 机变量。
二 、随机变量的概率分布
(一)离散型随机变量的概率分布 掌握一个离散型随机变量的概率分布规
律,必须掌握两点: 1、随机变量X所取的可能值是什么? 2、随机变量X取每一个可能值的概为多少?
p( X x1) p1, p( X x2 ) p2 , p( X xn ) pn
离散型随机变量的分布规律可用分布列 的形式来表示。
Y yi
P(Y yi ) Pi
0 0.14
1 0.22
2 0.64
离散型随机变量的概率分布具有下面两 个重要性质:
1、随机变量取任何值时,其概率都是非负 的。即 P1≥0, ≥P02 ,…… ≥0P。n 2、随机变量取遍所有可能值时,相应的概 率之和等于1,即
n
pi 1
i 1
P(-0.52<u<1.34) = P(–∞<u<1.34)- P(–∞<u<-0.52) =0.9099 - 0.3015 =0.6084
2、已知u的取值落入某一区间的概率 , 求u值。 [例13]已知P(u<x)=0.0869,求x P(u<x)=0.0869 查标准正态分布表(1) P(–∞<u<-1.36)=0.0869 即P(u<-1.36)=0.0869 X=-1.36
第二节 随机事件的概率

4.4 正态分布概念与特征

4.4 正态分布概念与特征

f (X)=
1
­ 12 æçè
X ­m s
ö ÷ ø
2
e,
s 2p
- ¥<X<+ ¥
图3 正态曲线位置、形状与μ和σ关系示意图
5
正态分布的概率密度函数(即纵向的曲线高度)
f (X)=
1
­ 12 æçè
X ­m s
ö ÷ ø
2
e,
s 2p
- ¥<X<+ ¥
图3 正态曲线位置、形状与μ和σ关系示意图
6
第四章 常用概率分布
四、正态分布的概念与特征
一、正态分布的概念
正态分布是自然界最常见的分布之一,例如测量的误差、人体许多生化 指标的测量值等等都可认为近似正态分布。此外,正态分布具有许多良好的 性质,许多理论分布在一定条件下可用正态分布近似,一些重要的分布可由 正态分布导出。可以说正态分布是统计学中最重要的分布。
准化变换,也称Z变换, Z = X - m s
标准正态分布的密度函数:
f (Z) =
1
-Z2
e2
2p
10
正态概率密度曲线下的面积
标准正态分布方程积分式(分布函数):
ò F ( z) = 1
Z
- z2
e 2 dZ
2p -¥
Φ(Z)为标准正态变量 Z的累计分布函数,反映标准正态曲线 下,横轴尺度自-∞到Z的面积,即下侧累计面积 。
X ±1.28S 区间内,即116.9cm~129.2cm。
24
正态分布的特征
1.关于 x = m 对称。即正态分布以均数为中心,左右对称。 2. 在 x = m 处取得概率密度函数的最大值,在x = m ± s 处有
拐点,表现为 钟形曲线。即正态曲线在横轴上方均数处最高。

应用统计学(第四章 概率与概率分布)

应用统计学(第四章 概率与概率分布)
(标准化),才可用正态分布表的方法求其概率
服从正态分布N(μ,σ2)的随机变量,x的取值落在区间 [x1,x2) 的概率P(x1≤x<x2),等于服从标准正态分布的随机变 量u在[(x1-μ)/σ, (x2-μ)/σ)内取值的概率。
u x
P(a u b) Φ(b) Φ(a) P( u a) 2Φ(a) P( u <a) 1 2Φ(a) P(0 u<a) Φ(a) 0.50 P(u a) 1 Φ(a) Φ(a)
1)正态分布的特征
a. x=μ 时 f(x) 值最大,密度曲线以μ为中心分布
b. x-μ绝对值相等时f(x) 相等,密度曲线以μ为中心两侧 对称
c. f(x)是非负函数,以x轴为渐近线
d.正态分布曲线由参数μ,σ 决定, μ 确定正态分 布曲线在x轴上的中心位置,σ 确定正态分布的变异度
e.正态分布曲线在x =μ±σ 处各有一个拐点,曲线通
是根据随机事件本身的特性直接计算其概率 随机事件若满足
试验的所有可能结果只有有限个,即样本空间中的基本 事件只有有限个
各个试验的可能结果出现的可能性相等,即所有基本事 件的发生是等可能的
试验的所有可能结果两两互不相容
则若样本空间由n个等可能的基本事件所构成,其中事件A 包含有m个基本事件,则事件A的概率为m/n,即 P(A)=m/n
x-
x+
b.连续型变量的概率分布
连续型随机变量的概
率分布因取值数不可数而 样本容量 n 足够大时,频率分
不能用分布律来表示
布趋于稳定,近似地看成总
体概率分布
n 无限大时
频率转化为概率 频率密度转化为概率密度 频率分布转化为概率分布 曲线为总体概率密度曲线 函数f(x)称为概率密度函数

第4章 概率及正态分布

第4章 概率及正态分布
σ2 = 总体方差 π =3.14159; e = 2.71828 x = 随机变量的取值 (-∝ < x < ∝) µ = 总体均值
正态分布的概率
概率是曲线下的面积! 概率是曲线下的面积!
ϕ (x )
P(a ≤ x ≤ b) = ∫ f (x)dx = ?
a
b
a
b
x
左右各一个标准差范围内的面积:68.27% 左右各一个标准差范围内的面积:68.27%; 左右各一个标准差范围内的面积:95.45% 左右各一个标准差范围内的面积:95.45%; 左右各一个标准差范围内的面积:99.73% 左右各一个标准差范围内的面积:99.73%;
第四节 大数定理与中心极限定理
大数定理
少量的随机现象是没有稳定性规律的; 少量的随机现象是没有稳定性规律的; 大量随机现象构成的总体,呈现的规律具有稳定性, 大量随机现象构成的总体,呈现的规律具有稳定性,有关 这一系列的定理, 大数定理; 这一系列的定理,称大数定理; 大数定理有:贝努里大数定理、切贝谢夫大数定理; 大数定理有:贝努里大数定理、切贝谢夫大数定理;P163 大数定理说明了大量现象的稳定规律:频率值趋于概率值, 大数定理说明了大量现象的稳定规律:频率值趋于概率值, 平均值趋于期望值。 平均值趋于期望值。 例如,一家一户,在自然的生育的情况下, 例如,一家一户,在自然的生育的情况下,生男生女纯属 偶然,但统计成千上万户的结果后,其性别比约为1/2将 偶然,但统计成千上万户的结果后,其性别比约为 将 是稳定的。 是稳定的。 所以,大数定理是把偶然性因素消除掉, 所以,大数定理是把偶然性因素消除掉,使共性表现出来 大数定理抽样调查的大样本( ≧ 大数定理抽样调查的大样本(n≧50)提供了理论基础 提供了理论基础

第四章__几种重要的分布

第四章__几种重要的分布

第四章 几种重要的分布在这一章,我们要介绍几种重要的分布 首先介绍离散型随机变量的分布§4.1 常用的离散型随机变量的分布一、退化分布在所有分布中,最简单的分布是退化分布,即一个随机变量X 以概率1取一常数,即 ()1P X a == 则称X 服从a 处的退化分布。

,0E X E a a D X D a ====二、0-1分布前面我们学习了贝努力试验。

对于贝努力试验,只有两个结果:成功或失败(A 和A ),如抛一枚银币(正、反);检查一件产品(合格、不合格);一次射击(命中、不命中),都可看做一个贝努力试验。

在一次试验中,设成功的概率为p ,()PA p =,()1P A p q =-=,不同的p 表示不同的贝努力试验。

如检查一批产品中,)P (合格品=0.9,()P 不合格品=0.1。

用来描述贝努力试验的随机变量分布为0-1分布,0,1代表将试验的两个结果定义为0,1.即随机变量X 只可能取0,1两个值,它的分布律为1()(1)(0,1)i iP X i p p i -==-= (0)(1)P X p ==- (1)P X p == 称XE X p = (1)D X p p =-三、二项分布由n 个相同的独立的贝努力试验组成的随机试验称为n 重贝努力试验。

如抛硬币3次,检查7个产品,打100次靶等都属于多重贝努力试验。

1.定义:在n 重贝努力试验中,每次试验事件A 发生的概率都为(01)p p ≤≤,设X 为n 次试验中事件A 发生的次数,则X 的可能取值为0,1,2,,n L()(1),0,1,,k k n k nP X k C p p k n -==-=L不难验证(1)()0P X k =≥ (2)0()1nk P X k ===∑称随机变量X 服从参数为n 和p 的二项分布,记作~(,)X B np()PX k =的值恰好是二项式n (p x +q )展开式中第1k +项kx 的系数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 常用概率分布
第四章常用概率分布
二项分布
二项分布的概念与特征 一个袋子里有5个乒乓球,其中2个黄球,
3个白球,我们进行摸球游戏,每一次摸到黄球 的概率是0.4,摸到白球的概率是0.6,这个实验 有三个特点:一是各次摸球是彼此独立的;二是 每次摸球只有二种可能的结果,或黄球或白球; 三是每次摸到黄球(或摸到白球)的概率是固定 的。具备这三点, n次中有X次摸到黄球(或白 球)的概率分布就是二项分布。
P(x≥1)=P(1)+P(2)+P(3)=0.288+0.43 2+0.216=1-P(0)=1- 0.064=0.936
也可以是P(x≥1)=1-P(0)=1- 0.064=0.936
第四章常用概率分布
二项分布
二项分布的特征 二项分布的图形特征
接近0.5时,图形是对称的;图4-1 离0.5愈远,对称性愈差,但随着n的增
大,分布趋于对称。图4-2
当n→∞时,只要不太靠近0或1, 当nP
和n(1-P)都大于5时,二项分布近似于正 态分布。
二项分布图形取决于与n,高峰=n处
第四章常用概率分布
二项分布
P(x)
0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
n=3,π=0.5
第四章常用概率分布
二项分布
例4-1 用针灸治疗头痛,假定结果不是有效 就是无效,每一例有效的概率为π,。某医 生用此方法治疗头痛患者5例,3例有效的 概率是多少? 因为每例有效的概率相同,且各例的治疗结 果彼此独立,5例患者中可以是其中的任意 3例有效
第四章常用概率分布
二项分布
医学研究中很多现象观察结果是以两 分类变量来表示的,如阳性与阴性、治愈 与未愈、生存与死亡等等。如果每个观察
二项分布
如果将出现阳性结果的频率记为
p X n
总体均数: p
标准差:
p
(1 )
n
第四章常用概率分布
二项分布
例4-4 研究者随机抽查某地150人,其中 有10人感染了钩虫,钩虫感染率为6.7%, 求此率的抽样误差。
p(1p) p(1p)
Sp
n1
n
0.06 (1 70.06 ) 7
P(x)
0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
n=10,π=0.5
图4-1 π=0.5时,不同n值对应的二项分布
第四章常用概率分布
二项分布
P(x)
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
出现阳性的次数至少为k次的概率为
n
n
P (X k ) P (X )
n !
X (1 )n X
X k
X kX !(n X )!
第四章常用概率分布
二项分布
例4-6 例4-5中某地钩虫感染率为13%, 随机抽查当地150人,其中至多有2名感染 钩虫的概率有多大?至少有2名感染钩虫的 概率有多大?至少有20名感染钩虫的概率 有多大?
Sp
0.022 0.0% 150
第四章常用概率分布
二项分布
二项分布的应用 (一)概率估计 例4-5 如果某地钩虫感染率为13%,随机
观察当地150人,其中有10人感染钩虫的 概率有多大? 从n=150,π=0.13的二项分布,由公式 (4-1)和(4-2)
第四章常用概率分布
二项分布
可以得出150人中有10人感染钩虫的概率 为
第四章常用概率分布
二项分布
根据公式(4-10)至多有2名感染钩虫的
2
2
概率为 P (X 2 )P (X )
n !
X ( 1 )n X
X 0
X 0X !(n X )!
8 .4 1 7 1 0 0 1 .8 1 0 8 0 2 .1 1 1 70
2.30 10 7
至少有2名感染钩虫的概率为
P (X 1)0 1!500 .113 00 .817 4 00 .005 1!(1 05 10 )0 !
第四章常用概率分布
二项分布
单侧累积概率计算
二项分布出现阳性的次数至多为k次的概率为
k
k
P (X k )P (X )
n !
X (1 )n X
X 0
X 0X !(n X )!
n=3,π =0.3
x
P(x)
0.5 0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x n=6,π =0.3
P(x)
0.5 0.4 0.3 0.2 0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x n=10,π =0.3
P (X 2 ) 1P 5 (X 0) 150 1!50 0 .1 X ( 1 3 0 .1 ) 13 5 X0
CX
3C
X 3
0
1
x
(1-)n-x 出现该结果概率
P(x)
0.60=1 0.4×0.4×0.4
0.064
1
3
0.6
0.4×0.4
0.288
2
3
0.6×0.6
0.4
0.432
3
1 0.6×0.6×0.
Hale Waihona Puke 0.4060.216
第四章常用概率分布
二项分布
由表4-1可知,各种可能结果出现的概率合计 为1,即P(X)=1(X=0,1,…,n)。因此, 如果欲求1例以上有效的概率可以是
P(x)
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n=20,π =0.3
x
图4-2 π=0.3时, 不同n值对应的二项分布
第四章常用概率分布
二项分布
二项分布的均数和标准差
总体均数: n
方差: 2 n(1)
标准差: n(1)
第四章常用概率分布
C n XX !(n n !X )!
第四章常用概率分布
二项分布
例4-2 临床上用针灸治疗某型头痛,有效的 概率为60%,现以该法治疗3例,其中两 例有效的概率是多大?
C 3 20.62(10.6)(32) 0.432
第四章常用概率分布
二项分布
表4-1 治疗3例可能的有效例数及其概率
有效人数 (x)
对象阳性结果的发生概率均为,阴性结果 的发生概率均为(1-);而且各个观察
对象的结果是相互独立的,那么,重复观 察n个人,发生阳性结果的次人数X的概率
分布为二项分布,记作B(X;n,π)。
第四章常用概率分布
二项分布
二项分布的概率函数P(X)可用公式(4-1) 来计算。
P ( X ) C n XX ( 1 ) n X
相关文档
最新文档