第四章常用概率分布学习指导(定)详解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 常用概率分布
[教学要求]
了解:质量控制的意义、原理和方法 熟悉:三个常用概率分布的特征。
掌握:掌握三个常用概率分布的概念;二项分布及Poisson 分布的概率
函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算。
[重点难点]
第一节 二项分布
一、二项分布的概念与特征
基本概念:如果每个观察对象阳性结果的发生概率均为
,阴性结果的发生概率
均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。 二项分布的概率函数:
X
n X X n C X P --=)1()(ππ
二项分布的特征:
二项分布图的形态取决于与n ,高峰在=n 处。当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。
二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n 如果将出现阳性结果的频率记为 n
X p =
则p 的总体均数为 πμ=p 标准差为
二、二项分布的应用
二项分布出现阳性的次数至多为k 次的概率为
n
p )
1(ππσ-=
∑∑==-==
≤k
X k
X X
X e
X P k X P 0
!
)()(λλ
出现阳性的次数至少为k 次的概率为
第二节 Poisson 分布的概念与特征
一、Poisson 分布的概念与特征
基本概念:Poisson 分布可以看作是每个观察对象阳性结果的发生概率
很小,
而观察例数n 很大时的二项分布。除二项分布的三个基本条件以外,Poisson 分布还要求 接近于0。有些情况
和n 都难以确定,只能以观察单位(时间、
空间、面积等)内某种稀有事件的发生数X 来近似。 Poisson 分布的概率函数:
式中,πλn =为Poisson 分布的总体均数,X 为观察单位内某稀有事件的发生次数,e 为自然对数的底,λ为常数,约等于2.71828。 Poisson 分布的特征
Poisson 分布当总体均数λ值小于5时为偏峰,λ愈小分布愈偏,随着λ增大,分布趋向对称。
Poisson 分布的总体均数与总体方差相等, 均为λ,且Poisson 分布的观察结果具有可加性。
特点:凡个体有传染性、聚集性,均不能视为二项分布或Poisson 分布。 三、Poisson 分布的应用
如果某稀有事件发生次数的总体均数为λ,那么发生次数至多为k 次的概率为
发生次数至少为k 次的概率为
!
)(X e
X P X
λλ
-=
∑∑==---=
=
≤k
X k
X X n X X n X n X P k X P 0
0)1()!
(!!
)()(ππ∑∑
==---==
≥n k
X n
k
X X
n X X n X n X P k X P )1()!
(!!
)()(ππ
第三节 正态分布
一、正态分布的概念
基本概念:正态分布是自然界最常见的一种分布,正态分布的特点是中间频数最多,两边频数渐少且对称。 正态分布的密度函数:
2
22)(21
)(σμπ
σ--
=
X e
X f
其中,μ为总体均数,σ为总体标准差 正态分布密度曲线的特点:
(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。
(3)曲线下面积为1。
(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。
(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”’;σ越小, 数据越集中,曲线越‘瘦高’。 二、 正态曲线下面积的分布规律
标准正态分布:总体均数为0、总体标准差为1的正态分布称为标准正态分布,用)1.0(N 表示。
对任意一个服从正态分布),(2σμN 的随机变量X ,经过如下的标准化变换 σ
μ
-=
X Z
可以转变为标准正态分布。
正态曲线下面积的分布规律由标准正态分布曲线下面积分布表给出。标准正态分布的分布函数值等于标准正态曲线下Z 值左侧的面积,记作)(z Φ。
)
1(1)(-≤-=≥k X P k X P
按正态分布规律,标准正态曲线下面积分布规律为: 单侧:P (Z -Z α)=α 或P (Z
Z α)=α
双侧:P (Z -Z α/2)+P (Z Z α/2)=α
三、正态分布的应用 (一)确定医学参考值范围
基本概念:医学参考值范围是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。
计算方法:确定医学参考值范围的方法有两种:
(1)百分位数法 双侧95%医学参考值范围是),(97525P P ,单侧范围是P 95
以下(如血铅、发汞),或P 5以上(如肺活量)。该法适用于任何分布类型的资料。
(2)正态分布法 若X 服从正态分布,医学参考值范围还可以依正态分布规律计算。正态分布资料双侧医学参考值范围一般按下式作近似估计:
S X 96.1±
其中,X 和S 分别为样本的均数和标准差
(二)二项分布、泊松分布的正态分布近似
1.二项分布的正态近似 随着n 的增大,二项分布趋于对称。理论上可以证明:当n 相当大时,只要π不太靠近0或1, 特别是当n π和n (1-π)都大于5时,二项分布近似于正态分布。
由于二项分布为离散型变量分布,为了借用连续型变量的分布函数计算概率,要对概率函数作校正。
二项分布累计概率的正态近似计算公式为: