第四章常用概率分布学习指导(定)详解
统计学概率和分布PPT课件
• 为什么会这么说呢,让我们看掷两个 骰子的试验。
§4.2 概率的运算
• 如所关心的是两骰子点数之和,则 下表包含了所有36种可能试验结果 的搭配和相应的点数和。
两骰子
第一个的点数
点数和 1 2 3 4 5 6
• 在掷10次骰子中有一半或以上的次数 得到5或6的概率又是多少呢?
• 读者很快就可能很快会得到答案。但 再复杂一些,也许就不简单了。
§4.2 概率的运算
• 我们需要了解怎样从简单的情况计算 稍微复杂情况时的概率。
• 需要读者回忆一下上中学时学过的集 合概念,比如两个集合的交和并,互 余(互补)等概念。
§4.2 概率的运算: 3.概率的乘法
• 但是由于一个人抽中,其他人就不 可能抽中,
• 所以,这三个事件不独立。刚才的 乘法规则不成立;
• 这 P会(A得时2∩到A,错3)误=P(的0A;1(∩1如/A3)错32)=误=1/9照。P搬(A乘1∩法A2规) 则=
§4.2 概率的运算: 3.概率的乘法
• 但是如果两个事件可能同时发生 时这样做就不对了。
§4.2 概率的运算: 2.概率的加法
• 假定掷骰子时,一个事件A为“得到 偶数点”(有3种可能:2、4、6点), 另一个事件B为“得到大于或等于3点” (有4种可能:3、4、5、6点);
• 这样,事件A的概率显然等于3/6=1/2, 即 P(A)=1/2 。 而 事 件 B 的 概 率 为 P(B)=4/6=2/3。
事件: 两骰子点数和
集合: 相应的试验结果(两个数字分别 表示第一和第二个骰子的点数)
集合中元素 的个数
常用概率分布
Z
p p
1
2
p c
1
p c
1 n
1
1 n
2
Z
p 1
p 2
0.5
1 n
1
1 n
2
p 1 c
p c
1 n
1
1 n
2
其 中n、n 分 别 为 两 个 样 本量的;X样、本 X分 别 为
1
2
1
2
两 组 样 本 的 阳P性为率两;组 样 本 合 并率的。阳 性 C
P=X1+X2
C n n
1
2
例6-9 用硝苯吡啶治疗高血压急症患者75例,有效 这为57例,用硝苯吡啶+卡托普利治疗同类患者69 例,66例有效。问两疗法的有效率是否相同?
C 3 20 .6 210 .6 3 20 .432
二、二项分布的特征
1。二项分布的图形特征
0 .3 8 0 .3 0
0 .2 5 0 .2 4 0 .2 3
0 .2 0
0 .2 0
0 .1 0
0 .1 0
n=3, π=0.5
n=10, π=0.5
π=0.5时, 不同n值对应的二项分布
0 .0 0
三、二项分布资料的假设检验
(一)样本率和总体率的比较
1.直接计算概率法:即按二项分布 概率函数,直接求出累积概率,与 所定检验水准比较,作出检验推断。
例 根据以往经验以常规疗法治 某病,其有效率为65%,今用新疗 法治疗该病患者20人,结果1人无 效。问新疗法是否较以往疗法为优?
H : 0 .35 0
当π≠1- π时, 呈偏态分布。当π接近 0.5时, 图形接近对称;当π离0.5愈远, 对称性越差, 但随着n的增大, 分布趋 一于般对来说称, 当。nπ当和nn(足1-π够)都大大,于且5时π,不二项太分靠布近近似0于
常用概率分布
有拐点,表现为钟形 靠近 x 处曲线下面积较为集中,两边减少,意味
着正态分布变量取值靠近 x处 的概率较大,两 边逐渐减少 正态分布的总体偏度系数和峰度系数均为0
8
正态分布曲线下面积
正态分布变量X的取值为(-∞,∞)
23
四、二项分布的图形
24
图形特点:两个轴意义,对称、偏态、与 正态分布的关系
决定图形的两个参数:n,
25
五、样本率的均数和标准差
样本率的总体均数p:
p
1 n
x
1 n
(n )
样本率的总体标准差p:
p
1 n
x
(1 )
n
样本率的标准差(标准误)Sp:
Sp
p(1 p) n
26
根据中心极限定理,在n较大,n(1- )均大于5时,二项分 布接近于正态分布。当n → ∞ , 二项分布B(n,)的极限分布 是总体均数为X = n、总体方差 X2 = n(1-)的正态分布 N(n, n(1-))。这个时候可以用正态分布N(n, n(1-)) 作近似计算。
16
确定医学参考值范围
例 估计某地健康成年女子的血红蛋白的95% 医学参考值范围
具体步骤如下: 1. 根据研究背景确定研究对象的入选标准和排
除标准。这类研究一般要求参加体检并且要 求除研究指标血红蛋白指标外,其他指标均 正常的对象。 2. 根据研究背景,确定血红蛋白过高或过低均 属于不正常(双侧范围)。
6. 如果受检指标血红蛋白呈偏态分布,则可 以用百分位数P2.5~P97.5确定95%参考值 范围,但样本量要充分大。
7. 样本量充分大是相对与指标的变异程度, 指标变异大,要求样本量大;指标变异程 度小,要求样本量可以相对小一些。
《常用概率分布》PPT课件
n=20,π=0.5
π=0.5时,不同n值对应的二项分布
n=5,π=0.3
n=10,π=0.3
n=30,π=0.3
π=0.3时,不同n值对应的二项分布
二项分布图的形态取决于π和n,高峰在µ= πn处
➢ 当π=0.5,图形是对称的; ➢ 当π≠0.5,图形不对称;π离0.5愈远,对称性愈差,
但随着n的增大,分布趋向于对称.
〔2〕其中最少有2人感染的概率有多大?
解:P(x ≥ 2)= x1=5∑02 C150x 0.13x(0.97)150-x
= 1 -(C1500 0.130 × 0.97150 +C1501 0.131 × 0.97149) ≈1
〔3〕其中最少有20人感染的概率有多大?
解:P(x ≥
150
20)=
∑C150x
第一节 二项分布及其应用
1.1 二项分布的概念和函数 1.2 二项分布的特征 1.3 二项分布的应用
一、二项分布的概念 和概率函数
摸球模型
一个袋子里有5个乒乓球,其中2个黄球、3个白球, 我们进行摸球游戏,每次摸1球,放回后再摸.先后摸 100次,请问:
⑴摸到0次黄球的概率是多大?
解:① 每次摸到白球的概率 =0.6
〔1〕至多有4人患先天性心脏病的概率是多少? 〔2〕至少有5人患先天性心脏病的概率是多少?
举例2:实验室显示某100cm2的培养皿中平均菌落数为6
个,试估计<1>该培养皿中菌落数小于3的概率,
<2>大于1个的概率.
解析:菌落长、不长
二项分布
长概率很小, n很大
Poission分布
故:
=nπ=6 (1) P(x<3)=
第四章常用概率分布学习指导(定)详解
第四章 常用概率分布[教学要求]了解:质量控制的意义、原理和方法 熟悉:三个常用概率分布的特征。
掌握:掌握三个常用概率分布的概念;二项分布及Poisson 分布的概率函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算。
[重点难点]第一节 二项分布一、二项分布的概念与特征基本概念:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。
二项分布的概率函数:Xn X X n C X P --=)1()(ππ二项分布的特征:二项分布图的形态取决于与n ,高峰在=n 处。
当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。
二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n 如果将出现阳性结果的频率记为 nX p =则p 的总体均数为 πμ=p 标准差为二、二项分布的应用二项分布出现阳性的次数至多为k 次的概率为np )1(ππσ-=∑∑==-==≤kX kX XX eX P k X P 0!)()(λλ出现阳性的次数至少为k 次的概率为第二节 Poisson 分布的概念与特征一、Poisson 分布的概念与特征基本概念:Poisson 分布可以看作是每个观察对象阳性结果的发生概率很小,而观察例数n 很大时的二项分布。
除二项分布的三个基本条件以外,Poisson 分布还要求 接近于0。
有些情况和n 都难以确定,只能以观察单位(时间、空间、面积等)内某种稀有事件的发生数X 来近似。
Poisson 分布的概率函数:式中,πλn =为Poisson 分布的总体均数,X 为观察单位内某稀有事件的发生次数,e 为自然对数的底,λ为常数,约等于2.71828。
Poisson 分布的特征Poisson 分布当总体均数λ值小于5时为偏峰,λ愈小分布愈偏,随着λ增大,分布趋向对称。
概率论与数理统计 第4章 几种重要的分布
第二章 随机变量及其分布
§1 随机变量的概念 §2 随机变量的分布 §3 二元随机变量 §4 随机变量函数的分布
第七章 参数估计
§1 估计量的优劣标准 §2 点估计 §3 区间估计
第三章 随机变量的数字特征
§1 数学期望 §2 数学期望的性质 §3 条件期望 §4 方差、协方差
第八章 假设检验
§1 假设检验的原理 §2 一个正态总体的假设检验 §3 两个正态总体的假设检验
P( k ) (1 p)k 1 p k 1, 2,...
E
1 p
D
1 p p2
(四)二项分布
做n重贝努里试验,以表示某事件A发生的 次数,则
P( k ) Ck p k q n k n k 0,1,..., n
其中0<p<1,q=1-p 称服从参数为n,p的二项分布。 简记为 : B(n,p) 由二项展开公式
n N
Nn 1 2 n 1 1 1 ... 1 n! N N N
同样地
Ck 1 N
k N1 1 2 k 1 1 1 ... 1 k! N1 N1 N1
Cn 2k N
N n k 1 2 n k 1 2 1 1 ... 1 (n k)! N 2 N 2 N2
0.9298
(六)Poisson分布 如果随机变量的概率函数为
k P (k) P( k) e k!
k 0,1, 2,...
其中 0,称服从Poisson分布。 xk x 利用级数 e ,易知 P(k) 1 k 0 k ! k 0
Poisson分布常见于稠密性问题,如: 候车室旅客数目,
P( k) Ck p k q n k n
例8 10件产品有4件是废品,任取3件,分别 用超几何分布与二项分布求取到2件废品的 概率。 解:用表示取到的废品数。 不放回抽取时,服从超几何分布
概率论与数理统计第四章_几种重要的分布
ξ
0
1
2
3
4
p 0.0016 0.0256 0.1536 0.4096 0.4096
4.2超几何分布(了解)
主要内容: (一)了解超几何分布的概念 (二)了解超几何分布的期望和方差
4.2超几何分布
例1 某班有学生20名,其中有5名女同学,今从 班上任选4名学生去参观展览,被选到的女同学数ξ
k1 (k 1)!(n k)!
n
(k 11)n! pk (1 p)nk
k1 (k 1)!(n k)!
n
(k 1)n!
n
pk (1 p)nk
n!
pk (1 p)nk
k1 (k 1)!(n k)!
k1 (k 1)!(n k)!
n
n!
n
pk (1 p)nk
n!
pk (1 p)nk
k2 (k 2)!(n k)!
解 可以取0,1,2,3这4个值。
P(
=k)=
C3k
C4k 17
C420
(k=0,1,2,3,)
列成概率分布如下
ξ
0
1
2
3
p 0.4912 0.4211 0.0842 0.0035
定义42 设N个元素分为两类,有N1个属于第一类, N2个属于第二类(N1+N2=N)。从中按不重复抽 样取n个,令ξ表示这n个中第一(或二)类元素的个数,
k1 (k 1)!(n k)!
n2
n1
n(n 1)Cnl 2 pl2 (1 p)n2l nCnj1 p j1(1 p)n1 j
l0
j0
n2
n(n 1)Cnl 2 pl2 (1 p)n2l l0
第四章 常见的几种概率分布
0.5 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
σ =0.5
σ =1 σ =2
2.正态分布特征
⑴ 曲线呈钟型,以 为对称轴左右对称。 ⑵ 在 处, 取最大值,即曲线最高。 ⑶ 正态分布有两个参数,即位置参数 和形态 参数 。 ⑷ 正态分布的标准化变换
u2 125 122.6 0.5 4.8
相当于
119 122.6 125 -0.75 0 0.5
该地当年7岁男孩身高界于119cm 到125cm范围所占的比例为46.49%。
第三节 2分布、t 分布、F分布
t分布
X ~ N( m ,2) ~
• 英国统计学家W. S. Gosset(1908)给出了统计 量t的分布规律,并称统计量
• t分布与正态分布的关系: 自由度v 较小时,t 分布 与标准正态分布相差较大,随着自由度v的增大,t 分 布曲线越来越接近于标准正态分布曲线。
• 当 时,t分布的极限分布就是标准正态分布。
单侧 双侧
• t分布的界值:
t界值示意图:
-t/2,v
t/2,
2分布
设 为相互独立的服从标准正态总体 的随机变量,统计量 为 一随机变量,且其密度函数为
的分布规律为t分布,自由度为v,记为t (v)分 布。 由于每个自由度v对应一个分布,因此t分布是一 簇分布。
自由度不同的三条t分布密度曲线
v =∞ v=5
v =1
v=1
t分布的图形特征和t界值
• 分布特征: t分布曲线是单峰的,且以t = 0左右对称。 • t分布是随自由度v而变化的一簇分布。
卫统(第四讲 常用概率分布)
总体阳性率 样本含量 n 在总体率为 的总体中随机抽样,抽取样本含量 为n的样本中,有X例为阳性的概率:
X (1 ) n X P( X ) C
X n
称X服从二项分布,记为:
X~B(n,)
二项分布的概率
发生阳性结果的人数X服从二项分布,那么发生阳 性数为X的概率为:
n=3,π =0.3
P(x) 0.5 0.4 0.3 0.2 0.1 0
0 1 2 3 4 5 6 7 8
x
n=6,π =0.3
P(x) 0.5 0.4 0.3 0.2 0.1 0
x
9 10 11 12 13 14 15
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15
n=10,π =0.3
x
n=20,π =0.3
Poisson分布
Poisson分布的应用2:累计概率计算
例4-8:如果某地新生儿先天性心脏病的 发病概率为8‰,那么该地120名新生儿中 至少有5人患先天性心脏病的概率有多大?
n 120 0.008 0.96
P( X 5) 1 P( X 4) 1 0.997 0.003
P(x)
0.4 0.3 0.2 0.1 0 0 2 4 6 8
常见概率分布类型解析
常见概率分布类型解析概率分布是描述随机变量可能取值的概率分布情况的数学模型。
在统计学和概率论中,有许多常见的概率分布类型,每种类型都有其特定的特征和应用场景。
本文将对常见的概率分布类型进行解析,帮助读者更好地理解和应用这些概率分布。
一、离散型概率分布1. 二项分布(Binomial Distribution)二项分布是最常见的离散型概率分布之一,描述了在一系列独立重复的伯努利试验中成功次数的概率分布。
其中,伯努利试验是指只有两种可能结果的随机试验,如抛硬币、投篮等。
二项分布的概率质量函数为二项式系数的形式,通常用于描述成功概率固定的多次独立重复试验的结果。
2. 泊松分布(Poisson Distribution)泊松分布是描述单位时间(或单位空间)内随机事件发生次数的概率分布。
它适用于描述在一个固定时间或空间范围内,事件发生的次数满足一定条件的情况,如电话交换机接到的电话数、一天内发生的交通事故数等。
泊松分布的概率质量函数具有简单的形式,适用于事件发生率低、事件相互独立的情况。
二、连续型概率分布1. 正态分布(Normal Distribution)正态分布是最常见的连续型概率分布,也称为高斯分布。
它具有钟形曲线,均值和标准差完全决定了分布的形状。
正态分布在自然界和社会科学中广泛应用,许多现实世界的数据都服从正态分布,如身高、体重等。
中心极限定理表明,大量独立随机变量的均值近似服从正态分布。
2. 指数分布(Exponential Distribution)指数分布是描述独立随机事件发生时间间隔的概率分布。
它常用于描述连续事件的等待时间,如客户到达间隔时间、设备故障间隔时间等。
指数分布具有无记忆性的特点,即已经等待了一段时间后,未来的等待时间与已经等待的时间长度无关。
3. 均匀分布(Uniform Distribution)均匀分布是最简单的连续型概率分布,描述了在一段区间内所有取值的概率相等的情况。
常用概率分布 PPT课件
二 、概 率 (一)概率的统计定义 研究随机试验,需了解各种随机事件 发生的可能性大小,以揭示这些事件 的内在的统计规律性。 能够刻划事件发生可能性大小的数量 指标称之为概率(probability)。事件A 的概率记为P(A)。
1.概率的统计定义
在相同条件下进行n次重复试验, 如果随机事件A发生的次数为m,那 么m/n称为随机事件A的频率 (frequency);当试验重复数n逐渐增 大时,随机事件A的频率越来越稳 定地接近某一数值p,那么就把 p称 为随机事件A的概率(probability)。
【例】编号1、2、3、…、10的十头猪 中随机抽取1头,求下列随机事件的概 率。 (1)A=“抽得一个编号≤4”; (2)B=“抽得一个编号是2的倍数”。 因为该试验样本空间由10个等可能的 基本事件构成,即n=10。所以
P(A)=mA/n=4/10=0.4 P(B)=mB/n=5/10=0.5
(二)概率的性质 1.对于任何事件A, 有0≤P(A)≤1; 2.必然事件的概率为1, 即P(Ω)=1; 3.不可能事件的概率为0, 即P(ф)=0。
(四)小概率事件实际不可能性原理
随机事件的概率表示了随机事件在 一次试验中出现的可能性大小。若 随机事件的概率很小,例如小于 0.05、0.01、0.001,称之为小概率 事件。 小概率事件虽然不是不可能事件, 但在一次试验中出现的可能性很小, 以至于实际上可以看成是不可能发 生的。
(三)概率的计算
1 .事件的相互关系 (1)和事件:事件A和事件B至少有一个发 生构成的新事件称事件A和事件B的和事 件。记作A∪B 。 (2)积事件:事件A和事件B同时发生构 成的新事件,又叫变事件,记作A∩B (3)互斥事件:A和B不可能同时存在 (或发生)即AB为不可能事件,那么称 事件A和事件B是互斥事件。A∩B =Φ
第4章 常用概率分布
1 du = 2π
∫
u2
−∞
e
1 − u2 2
1 du − 2π
∫
u1
−∞
e
1 − u2 2
du
=Φ(u2)-Φ(u1) Φ(u Φ(u Φ(u 可由附表1查得。 而Φ(u1)与Φ(u2)可由附表1查得。 Φ(u
(4(4-11)
上一张 下一张 主 页
退 出
例如, 1.7放在第一列 放在第一列0.05放 例如,u=1.75 ,1.7放在第一列0.05放 在附表1 1.7所在行与 在第一行 。 在附表1中 , 1.7所在行与 0.05 所在列相交处的数值为0.95994, 所在列相交处的数值为0.95994,即 Φ(1.75)=0.95994 Φ(u 有 时 会 遇 到 给 定 Φ(u) 值 , 例 如 Φ(u)=0.284, 反过来查u Φ(u)=0.284, 反过来查u值。这只要在附表 1中找到与 0.284 最接近的值0.2843,对应 最接近的值0.2843, 0.5, 行的第一列数 -0.5, 对应列的第一行数 值 0.07 ,即相应的u值为 u = - 0.57,即 即相应的u 0.57, Φ(Φ(-0.57)=0.284 如果要求更精确的u 如果要求更精确的u值,可用线性插值法计 算。
上一张 下一张 主 页 退 出
1 P(x1 ≤ x < x2 ) = σ 2π
∫x
x2
1
e
−
( x−µ)2 2σ 2
(4dx(4-13)
对 (4-13)式作变换u=(x-µ)/σ,得 (4-13)式作变换 =(x µ)/ 式作变换u dx=σdu, dx=σdu,故有
1 P(x1 ≤ x < x2 ) = σ 2π
教学课件第四章常用概率分布
但在相同条件下进行大量重复试验时,其 试验结果却呈现出某种固有的特定的规律性— —频率的稳定性,通常称之为随机现象的统计 规律性。
(二)随机试验与随机事件
1、随机试验 通常我们把根据某一研究 目的 , 在一定条件下对自然现象所进行的观察 或试验统称为试验(trial)。 而一个试验如果 满足下述三个特性 , 则 称 其 为 一个 随机 试验(random trial),简称试验:
例如,在编号为1、2、3、…、10 的十头猪中 随机抽取1头,有10种不同的可能结果:
“ 取 得 一 个 编 号 是 1” 、 “ 取得一个编 号是2”、…、“取得一个编号是10”,这10个事件 都是不可能再分的事件,它们都是基本事件。
由若干个基本事件组合而成的事件称为 复合事件 (compound event)。如 “取得一个编号是 2 的倍数”是一个复合事件,它由 “ 取得一个编号是 2 ”、 “ 是4”、“是6、“是8”、“是10”5个基本 事件组合而成。
因为该试验样本空间由10个等可能的基本 事件构成,即n=10,而事件A所包含的基本事 件有4个,即抽得编号为1,2,3,4中的任何 一个,事件A便发生,于是mA=4,所以
P(A)=mA/n=4/10=0.4 同理,事件B所包含的基本事件数mB=5, 即抽得编号为2,4,6,8,10中的任何一个, 事件B便发生,故
例如 为了确定抛掷一枚硬币发生正面朝上 这个事件的概率 ,历史上有人作过成千上万次 抛掷硬币的试验。在表4—1中列出了他们的试 验记录。
表4—1 抛掷一枚硬币发生正面朝上的 试验记录
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 常用概率分布[教学要求]了解:质量控制的意义、原理和方法 熟悉:三个常用概率分布的特征。
掌握:掌握三个常用概率分布的概念;二项分布及Poisson 分布的概率函数与累计概率、正态分布的分布函数的计算方法;医学参考值的计算。
[重点难点]第一节 二项分布一、二项分布的概念与特征基本概念:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。
二项分布的概率函数:Xn X X n C X P --=)1()(ππ二项分布的特征:二项分布图的形态取决于与n ,高峰在=n 处。
当接近0.5时,图形是对称的;离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。
二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n 如果将出现阳性结果的频率记为 nX p =则p 的总体均数为 πμ=p 标准差为二、二项分布的应用二项分布出现阳性的次数至多为k 次的概率为np )1(ππσ-=∑∑==-==≤kX kX XX eX P k X P 0!)()(λλ出现阳性的次数至少为k 次的概率为第二节 Poisson 分布的概念与特征一、Poisson 分布的概念与特征基本概念:Poisson 分布可以看作是每个观察对象阳性结果的发生概率很小,而观察例数n 很大时的二项分布。
除二项分布的三个基本条件以外,Poisson 分布还要求 接近于0。
有些情况和n 都难以确定,只能以观察单位(时间、空间、面积等)内某种稀有事件的发生数X 来近似。
Poisson 分布的概率函数:式中,πλn =为Poisson 分布的总体均数,X 为观察单位内某稀有事件的发生次数,e 为自然对数的底,λ为常数,约等于2.71828。
Poisson 分布的特征Poisson 分布当总体均数λ值小于5时为偏峰,λ愈小分布愈偏,随着λ增大,分布趋向对称。
Poisson 分布的总体均数与总体方差相等, 均为λ,且Poisson 分布的观察结果具有可加性。
特点:凡个体有传染性、聚集性,均不能视为二项分布或Poisson 分布。
三、Poisson 分布的应用如果某稀有事件发生次数的总体均数为λ,那么发生次数至多为k 次的概率为发生次数至少为k 次的概率为!)(X eX P Xλλ-=∑∑==---==≤kX kX X n X X n X n X P k X P 00)1()!(!!)()(ππ∑∑==---==≥n kX nkX Xn X X n X n X P k X P )1()!(!!)()(ππ第三节 正态分布一、正态分布的概念基本概念:正态分布是自然界最常见的一种分布,正态分布的特点是中间频数最多,两边频数渐少且对称。
正态分布的密度函数:222)(21)(σμπσ--=X eX f其中,μ为总体均数,σ为总体标准差 正态分布密度曲线的特点:(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。
(3)曲线下面积为1。
(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。
(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”’;σ越小, 数据越集中,曲线越‘瘦高’。
二、 正态曲线下面积的分布规律标准正态分布:总体均数为0、总体标准差为1的正态分布称为标准正态分布,用)1.0(N 表示。
对任意一个服从正态分布),(2σμN 的随机变量X ,经过如下的标准化变换 σμ-=X Z可以转变为标准正态分布。
正态曲线下面积的分布规律由标准正态分布曲线下面积分布表给出。
标准正态分布的分布函数值等于标准正态曲线下Z 值左侧的面积,记作)(z Φ。
)1(1)(-≤-=≥k X P k X P按正态分布规律,标准正态曲线下面积分布规律为: 单侧:P (Z -Z α)=α 或P (ZZ α)=α双侧:P (Z -Z α/2)+P (Z Z α/2)=α三、正态分布的应用 (一)确定医学参考值范围基本概念:医学参考值范围是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体取值所在的范围。
人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。
计算方法:确定医学参考值范围的方法有两种:(1)百分位数法 双侧95%医学参考值范围是),(97525P P ,单侧范围是P 95以下(如血铅、发汞),或P 5以上(如肺活量)。
该法适用于任何分布类型的资料。
(2)正态分布法 若X 服从正态分布,医学参考值范围还可以依正态分布规律计算。
正态分布资料双侧医学参考值范围一般按下式作近似估计:S X 96.1±其中,X 和S 分别为样本的均数和标准差(二)二项分布、泊松分布的正态分布近似1.二项分布的正态近似 随着n 的增大,二项分布趋于对称。
理论上可以证明:当n 相当大时,只要π不太靠近0或1, 特别是当n π和n (1-π)都大于5时,二项分布近似于正态分布。
由于二项分布为离散型变量分布,为了借用连续型变量的分布函数计算概率,要对概率函数作校正。
二项分布累计概率的正态近似计算公式为:∑=---+Φ≈=≤kX X n X X n n n k q p C K X P 0))1(5.0()(πππ∑=----Φ-≈=≥nkX X n X X n n n k q p C k X P ))1(5.0(1)(πππ2.Poisson 分布的正态近似随着总体均数λ的增大,Poisson 分布趋向对称。
理论上可以证明, 随着∞→λ,Poisson 分布也渐近正态分布。
一般,当20≥λ时Poisson 分布资料可按正态分布处理。
和二项分布相同,Poisson 分布也是离散型变量分布。
为了借用连续型变量的分布函数计算概率,也要对概率函数作校正。
校正后Poisson 分布的正态近似计算方法为∑=--+Φ≈=≤ki kk ei k X P 0)5.0(!)(λλλλ)5.0(1)(1)(λλ--Φ-≈〈-=≥k k X P k X P∑=---Φ--+Φ≈=≤≤21)5.0()5.0(!)(1221k k i kk k e i k X k P λλλλλλ[案例讨论参考答案]案例4-1 该案例问题在于艾滋病是传染病,观察单位在是否感染方面互不独立,不管感染人数有多么少都不能按Poisson 分布问题处理。
[电脑实验程序及结果解释]实验4-1 概率及累积概率的计算程序4-1 概率及累积概率的计算01 DATA exam6; 建立sas 数据集exam6; 02 n=150;prob=0.13;指定二项分布的n 和π; 03 p11=PROBBNML(prob,n,2); 计算至多感染2名的概率; 04 p12=1- PROBBNML (prob,n,1); 计算至少感染2名的概率; 05 p13=1- PROBBNML (prob,n,19);计算至少感染20名的概率;06 PROC PRINT; 输出数据集exam6的内容;07 DATA exam7_8; 建立数据集exam7_8;08 m=0.96; 指定Poisson分布的总体均数m;09 p21=PDF('POISSON',4,m); 计算4人患病的概率;10 p22=POISSON(m,4); 计算至多4人患病的概率;11 p23=1-POISSON(m,4); 计算至少5人患病的概率;12 PROC PRINT; 输出数据集exam7_8的内容;13 DATA exam10; 建立数据集exam10;14 mean=123.02; std=4.79; 指定正态分布的总体均数mean和标准差std;15 p31=1-CDF('NORMAL',130,mean,std); 计算身高130cm以上者占总数的百分比;16 p32=CDF('NORMAL',128,mean,std) 计算身高120cm~128cm者占总数的百分比;17 -CDF('NORMAL',120,mean,std);18 rangel=mean-PROBIT(0.9)*std; 计算80%参考值范围的下限;19 range2=mean+PROBIT(0.9)*std; 计算80%参考值范围的上限;20 PROC PRINT; RUN; 输出计算结果;运行程序;说明:改变语句行02,08行,可任意设定二项分布的n、π和Poisson分布的总体均数,09、10、11行中的人数根据需要任意设定。
运行结果:Output窗口:Obs n prob p11 p12 p131 150 0.13 .000000231 1.00000 0.48798Obs m p21 p22 p231 0.96 0.013550 0.99692 .003082683Obs mean std p31 p32 rangel range21 123.02 4.79 0.072530 0.58656 116.881 129.159实验4-2 正态近似法的计算程序4-2 正态近似法的计算03 为随机变量x1赋值;04 z1=(x1-0.5 -mean)/std; 对x1进行标准化正态变换;05 p1=1-PROBNORM(z1); 求标准正态分布中取值大于z1的概率;06 KEEP x1 p1 ; 指定数据集中只包含变量x1和p1;07 PROC PRINT; 输出当前数据集的内容;08 RUN; 运行上述程序;09 DATA norm2; 建立数据集norm2;10 mean=360 ; std=sqrt(mean); 指定Poisson分布近似的正态分布的总体均数和标准差;11 x2=400 ; 指定随机变量x2的值;12 z2=(x2-0.5-mean)/std; 对x2进行标准化正态变换;13 p2=1-PROBNORM(z2); 求取值大于z2的概率;KEEP x2 p2 ; 指定数据集中只包含变量x2和p2;说明:改变语句行02、03、10和11行,可设定任意均数、标准差和随机变量值。
运行结果:Output窗口:Obs x1 p11 20 0.5Obs x2 p21 400 0.018679实验4-3 正态分布的两个参数μ与σ的意义和作用程序4-3 正态分布的两个参数μ与σ的意义和作用14 DATA stdnorm2; 建立sas数据集stdnorm2;15 std1=0.5; std2=0.7;std3=0.9; 指定总体标准差std1、std2和std3;16 pi =3.1415926; c=1/SQRT(2*pi);17 DO u=-3 TO 3 BY 0.05; 设立循环,循环变量u从-3增加到3,每次加0.05;18 f0=c*EXP(-u**2/2); 计算u对应的正态分布N(0,1)的密度函数值f0;19 f1=c/std1*EXP(-u**2/2/std1**2); 计算u对应的正态分布N(0, std1)的密度函数值f1;20 f2=c/std2*EXP(-u**2/2/std2**2); 计算u对应的正态分布N(0, std2)的密度函数值f2;21 f3=c/std3*EXP(-u**2/2/std3**2); 计算u对应的正态分布N(0, std3)的密度函数值f3;22 OUTPUT; 将数据写入数据集;23 END; 结束循环;24 PROC GPLOT; 调用GPLOT过程绘制曲线图;25 PLOT (f0 f1 f2 f3) *u /OVERLAY ;26 RUN; 运行程序;说明:改变语句行02和15,可设定任意均数和标准差。