二项分布poisson分布的检验

合集下载

第十章 二项分布和Poisson分布及其应用

第十章 二项分布和Poisson分布及其应用

Poisson分布
• Poisson分布是描述当试验中成功的概率很小 (如0.05),而试验的次数n很大的小概率事件
出现规律性的一种离散型随机分布。 • 用于描述在单位时间(空间)内稀有事件的发生数。
医学卫生领域中服从Poisson分布指标
恶性肿瘤的死亡率 ; 放射性物质在单位时间内的放射次数; 在单位容积充分摇匀的水中的细菌数; 野外单位空间中的某种昆虫数等。
0.25
0.2
0.15
0.1
0.05
0 012 345
(b)
0.18 0.16 0.14
n =30 π =0.3
0.12
0.1
0.08
0.06
0.04
0.02
0
0 2 4 6 8 10 12 14 16 18 20
(d)
•由数理统计学的中心极限定理可知,当n较大、 不接近0也不接 近1时,二项分布B( n , )近似正态分布:
正态近似法
当n较大, p 和 1 p 均不太小,如 np 和 n(1 p) 均
大于5时,利用正态近似的原理,可作样本率p与已 知总体率的比较,检验统计量为:
Z p0 0 (1 0 ) n
例10.6 一项调查结果表明某市一般人群的艾滋病知识 知晓率为65%。现对该市吸毒人群进行调查,在150名 吸毒人员中有130人回答正确。问该市吸毒人群的艾滋 病知识知晓率是否高于一般?
X ~ N(n , n (1 ))
二项分布的应用
• 总体率的区间估计 – 查表法 – 正态近似法
• 单个样本率与总体率比较 – 直接计算概率法
– 正态近似法 • 两样本率的比较
总体率的区间估计
• 查表法:当n≤50时可查表求总体率的95%或 99%可信区间(附表7)。

二项分布及Posson分布

二项分布及Posson分布

(2)Poisson分布的性质
① Poisson分布的总体均数等于总体方差μ=σ2=λ。
② 当n很大,而π很小,且nπ=λ为常数时,二项分
布近似Poisson分布。
③ 当λ增大时,Poisson分布渐近正态分布。一般,
当λ≥20时,Poisson分布可作为正态分布处理。
④ Poisson分布具有可加性。对于服从Poisson
该函数式是二项函数[π+(1-π)]n的通项
且有:
P( X ) 1
X 0
n
2。二项分布的适用条件
若试验符合下面3个特点,则其某一试验结果
发生的次数服从二项分布,此试验称为贝努利
(Bernoulli)试验。
n次贝努利(Bernoulli)试验中研究事件
发生的次数X服从二项分布。
贝努利(Bernoulli)试验的条件: ① 每次试验只会发生两种对立的可能结果之一 ② 在相同试验条件下,每次试验出现某种结果 (如“阳性”)的概率π固定不变
样本均数与总体均数比较的检验目的 是推断样本均数所代表的总体均数λ与已 知的总体均数λ0是否相等。 可使用的检验方法有:直接计算概率 法和正态近似法
例6-13
有研究表明,一般人群精神发育
不全的发生率为3‰,今调查了有亲缘血统婚 配关系的后代25000人,发现123人精神发育不
全,问有亲缘血统婚配关系的后代其精神发育
第二节
Poisson分布
(Poisson distribution)
一、Poisson分布的概念
Poisson分布最早是由法国数学家SiméonDenis Poisson (西莫恩· 德尼· 泊松 )研究二项
分布的渐近公式是时提出来的。

二项分布与Poisson分布

二项分布与Poisson分布
0.360 0.221 0.581
px 7 1 px 8 1 p(x 8) x 9
1 C180 0.868 0.142 0.58 0.155
因此,10例患者中至少9例有效的概率为0.581,至多7例有效的概率 为0.155。
n
P( X K ) P(K ) P(K 1) P(K 2) P(n) P( X )
K
(3)至多有k例阳性的概率:
k
P( X K ) P(0) P(1) P(2) P(k) P( X )
X= 0, 1, 2, … k…n
0式
生存数 (X)
3
死亡数 (n-X)
0
2
1
1
2
0
3
甲乙 丙
生生 生 生生 死 生死 生 死生 生 生死 死 死生 死 死死 生 死死 死
每种组 每种排列的概率 合的概
px nx1 nx, x 率
0.2×0.2×0.2=0.008 0.2×0.2×0.8=0.032 0.2×0.8×0.2=0.032 0.8×0.2×0.2=0.032 0.2×0.8×0.8=0.128 0.8×0.2×0.8=0.128 0.8×0.8×0.2=0.128 0.8×0.8×0.8=0.512
他观察单位的结果。 6
三. 概率的计算:
从一个阳性率为π的总体中,随机抽取含量为n的样本,则 样本中阳性数X或阳性率p服从二项分布B ( n、π)。
(1)恰有k例阳性的概率:
P(X k) (nk ) k 1 nk
(
n k
)

n! k!(n
k )!
(2)至少有k例阳性的概率:

06二项分布及泊松分布

06二项分布及泊松分布

●Bernoulli 试验(Bernoulli T est):将感兴趣的事件A出现的试验结果称为“成功”,事件A不出现的试验结果称为“失败”,这类试验就称为Bernoulli 试验●二项分布(binomial distribution):是指在只会产生两种可能结果如阳性或阴性之一的n次独立重复试验中,当每次试验的阳性概率π保持不变时,出现阳性次数X=0,1,2,…,n的一种概率分布。

●Poisson分布(Poisson distribution):随机变量X服从Poisson分布式在足够多的n次独立试验中,X取值为1,2,…,的相应概率为…的分布。

★二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。

★二项分布的图形:当∏=0.5,二项分布图形是对称的,当∏不等于0.5,图形是偏态的,随着n增大,图形趋于对称。

当n趋于无穷大时,只有∏不太靠近0或者1,二项分布近似正态分布。

★二项分布的应用总体率的区间估计,样本率与总体率比较,两样本率的比较★Poisson 分布的应用总体均数的区间估计,样本均数与总体均数的比较,两个样本均数的比较:两个样本计数均较大时,可根据Poisson 分布的正态近似性对其进行u 检验。

★Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。

Poisson 分布,X~P(μ),X 的均数μX =μ,X的方差σ2 =μ,X的标准差σX★Poisson分布的性质1、总体均数λ与总体方差相等是泊松分布的重要特点。

2、当n增大,而∏很小,且n∏=λ总体均数时,二项分布近似泊松分布。

3、当总体均数增大时,泊松分布渐近正态分布,一般而言,总体均数》20时,泊松分布资料做为正态分布处理。

二项分布与泊松分布

二项分布与泊松分布
2、当π=0.5时,二项分布呈对称状态 ; 当n足够大,且π不太靠近0或1时,二项分布逼近
正态分布,; 当n足够大,但π很小时,如n≥100而π<0.1或π>0.9时
,二项分布近似于泊松分布。
样本率均数 样本率标准差
p
x
n
n
n
pnx
n(1)
n
(1)
n
样本率p的标准差
pnx
n(1)
n
(1)
二项分布(binomial distribution)
贝努利试验列中成功次数k的概率为: P(X=k)=Cnk πk (1-π)n-k (0<π<1) ,
k=0 , 1 , …,n, 而 Cnk πk (1-π)n-k 二 项 式 恰 好 是 牛 顿 展 开 式 ((π+(1-π)) n的项,故又称为二项分布。
二项分布与泊松分布
n重贝努利试验
在同一条件下独立重复n次试验,每次试验只 有两个可能的对立结果,A与非A , 如成功与 失败 , 其概率P(A)=π , (0< π<1) , 则称这 一系列独立重复试验为n重贝努利试验(贝努 利试验序列)。
n重贝努利试验的三个条件
(1)每次试验只有两个可能的对立结果, A与非A (2)每次试验的条件不变,即每次试验中, 结果A发生的概率P(A)=π (3)各次试验独立,即任一次试验结果与 其它次试验结果无关。
医学中Poisson分布
单位时间(空间、面积)内某稀有事件 发生次数的分布。
如研究细菌、某些血细胞、粉尘等在单 位面积或容积内计数结果的分布,放射 性物质在单位时间内放射出质点数的分 布,在单位空间中某些野生动物或昆虫 数的分布,在一定人群中某种低患病率 的非传染性疾病患病数或死亡数分布。

验证泊松分布近似二项分布的条件和结论

验证泊松分布近似二项分布的条件和结论

验证泊松分布近似二项分布的条件和结论二项分布的泊松定理:设0< p 〈1,如果p 充分小,自然数n 充分大,λ=np ,则对于每个k 〈= n ,有近似公式:b(k;n,p)≈λλ-e k k!。

通常,我们取这个n 为10。

以下,就针对n>=10的条件与结论进行验证。

在本文中,我们通过数学软件R 计算并在Matlab 上绘出相应的图形,对定理得条件和结论进行验证,为了使p 足够小,我们取p=0.09。

作出当n = 5,n =10,n =20,n =30,n =50的情况下,二项分布与泊松分布的近似情况。

在R 软件上对n = 5,n =10,n =20,n =30,n =50上分别计算:当 n =5时:> x<-0:5> y<-dbinom(x,5,0.09)> y[1] 0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255[6] 0.0000059049> z<-dpois(x,0.45)> z[1] 6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03[6] 9.805027e-05在Matlab 上作图,并用折线连结。

>> x=[0 1 2 3 4 5];>> y=[0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255 0.0000059049]; >> z=[6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03 9.805027e-05]; >> plot(x,y,'ro',x,z,'bo',x,y,'r',x,z)在R上计算y与z的差值:> y-z[1] -1.359601e-02 2.165466e-02 -3.520599e-03 -3.647129e-03 -7.909220e-04 [6] -9.214537e-05当n =10时:> x<-0:10> y<-dbinom(x,5,0.09)> y[1] 0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255 [6] 0.0000059049 0.0000000000 0.0000000000 0.0000000000 0.0000000000 [11] 0.0000000000> z<-dpois(x,0.45)> z[1] 6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03[6] 9.805027e-05 7.353770e-06 4.727424e-07 2.659176e-08 1.329588e-09 [11] 5.983146e-11在Matlab上作图,并用折线连结。

二项分布与泊松分布

二项分布与泊松分布
此例:n=50,x=10 查表得95%CI为:10%~34%。
二项分布的应用
2 正态近似法:应用条件:np及n(1−p)均≥5
p±uαsp
例:在某地随机抽取329人,做HBsAg检验,得阳性 率为8.81%,求阳性率95%置信区间。 已知:p=8.81%,n=329,故:
s p p ( 1 p ) /n 0 .0( 1 8 0 .0 8) 8 /3 1 8 2 0 .0 1 9 1 1 .5 % 5 6 6
第一节 二项分布和总体率的估计
一、二项分布 (一)二项分布的概念
在生命科学研究中,经常会遇到一些事物, 其结果可分为两个彼此对立的类型,如一个病 人的死亡与存活、动物的雌与雄、微生物培养 的阳性与阴性等,这些都可以根据某种性状的 出现与否而分为非此即彼的对立事件。这种非 此即彼事件构成的总体,就称为二项总体 (binomial population)。
二、二项分布的应用
(一 )、总体率的估计
1 查表法:附表6百分率的置信区间表直接
列出了X≤n/2的部分。其余部分可以查nx的阴性部分的QL~QU再相减得 PLand pU PL=1-QL 1-QU 例:某地调查50名儿童蛔虫感染情况,发现有10人大便
中有蛔虫卵,问儿童蛔虫感染率的95%置信区间是多少?
1份混合样本中含有k份阳性的概率为当k0时p0是说混合样品中没有1阳性样品的原始概率反映的是混合样品阴性的概率当收集的样本数量很大时全部检验费时费力可以用群检验的方法进行解决若每个标本的阳性概率为则其阴性概率为q1便是某个群m个标本均为阴性的概率一个群为阴性的群的概率而1q就为一个群阳性的概率
二项分布与泊松分布
第一节 二项分布和总体率的估计
二项分布(binomial distribution) 就是对这种只具有两种互斥结果的离散型 随机变量的规律性进行描述的一种概率分 布。由于这一种分布规律是由瑞士学者贝 努里(Bernoulli)首先发现的,又称贝努里 分布。

统计学-二项和Poisson分布

统计学-二项和Poisson分布
P (A )p ,P (A )q ,p q 1
2
Bernoulli试验和Bernoulli试验序列
重复n次,称为n重Bernoulli试验 n次实验构成的序列,称为Bernoulli试验序列。
– 特点:
每次实验只有两种可能的结果 各次实验相互独立 发生成功事件的概率不变

B(n, )
二项分布的概率 P ( x ) 可用下式计算
其中
P (x)C n xx(1)nx
Cnx

n! x!(n
x)!
X取值为0,1,2,… n
7
二项分布的条件
二项分布的条件
– 每次实验(观察)的结果只有两种可能(两分 类变量)
– 各次实验(观察)的结果相互独立 – 每个观察对象发生阳性结果的概率为π
– 它是研究“相同条条件下进行重复实验或观察” 的一种概率模型
3
例3.1 设小白鼠接受一定剂量的某种毒 物时的死亡率为80%,即对于每只小白 鼠来说,其死亡概率为0.8,生存概率为 0.2。每组各用甲乙丙三只小白鼠逐只做 实验,观察每组小白鼠的存亡情况。如 果考虑生存或死亡的顺序,则共有8种排 列方式,如果只考虑生存或死亡的数目, 则只有4种组合方式,如表3.1第(2) (3)栏所示。
17
Poisson分布的概念
常见服从Poisson分布的情况: – 均匀液体中的细菌分布 – 放射性物质单位时间内的放射次数 – 粉尘在观察容积内的分布 – 非传染性罕见疾病在人群中的分布
18
Poisson分布的形态
19
Poisson分布的形态
20
Poisson分布的特点
形态: – 离散分布
医学中的二项分布:如某病的患病率为π, 在人群中随机抽取5人,则5人中患该病的人 数服从二项分布B(5,π)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二项分布与poisson分布的z检验
检验假设为:
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z Z n 0 1 0 X n 0 p 0 n ~ N 0,1
0 1 0
~ N 0,1
二项分布与poisson分布的z检验
例6-12 某车间改革生产工艺前,测得三次粉尘浓度, 每升空气中 分别有38、29、36颗粉尘;改革工艺后, 测取两次,分别为25、18颗粉尘。问工艺改革前后 粉尘数有无差别?
38 29 36 X1 34.33, n1 3 3 25 18 X2 21.50, n2 2 2
H0 : 0 0.8 H1 : 0.8(单侧), 0.05
0.75 0.8 Z 0.968 0.8 0.2 60
二项分布与poisson分布的z检验
按ν=∞查t 临界值表: (单侧)Z0.10, ∞ =1.2816
‫׀‬Z‫ < ׀‬Z0.10,得P>0.10
艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较
低。
当n不太大时,需作连续性校正:
Z
X n 0 0.5 n 0 1 0
~ N 0,1
0.5 p 0 n ~ N 0,1 Z 0 1 0 n
二项分布与poisson分布的z检验
例6-8 某医院称治疗声带白斑的有效率为80%,今统计 前来求医的此类患者60例,其中45例治疗有效。试问该 医院宣称的疗效是否客观?
二项分布与poisson分布的z检验
H0 : 1 2 H1 : 1 2 , 0.05
Z
X1 X 2 X1 X 2 n1 n2

34.33 21.50 34.66 21.50 3 2
2.723
二项分布与poisson分布的z检验
按ν=∞,查t 临界值表: Z0.05/2, ∞ =1.96 Z > Z0.05/2,得P<0.05 按α=0.05水准,拒绝H0, 接受H1,故可认为工

二项分布与poisson分布的z检验
按ν=∞查t 临界值表: Z0.001/2, ∞ =3.2905 Z > Z0.001/2,得P<0.001 按α=0.05水准拒绝H0,接受H1,故可认为两种疗
法有效率不同。
二项分布与poisson分布的z检验
二、Poisson分布资料的z检验
当总体均数λ≥20时,Poisson分布近似正态分布。 (一)一组样本资料的z检验
当两样本观测单位数不等时:
二项分布与poisson分布的z检验
例6-11 甲、乙两检验师分别观察15名正常人末梢血 嗜碱性白细胞数量。每张血片均观察200个视野。结 果甲计数到嗜碱粒细胞26个,乙计数到29个。试问 两位检验师检查结果是否一致?
H0 : 1 2
Z X1 X 2
H1 : 1 2 , 0.05
按α=0.05水准不拒绝H0,故可认为该医院宣称的
有效率尚属客观。
二项分布与poisson分布的z检验
(二)两组独立样本资料的z检验
它的应用条件为当所比较的两组的np和n(1-p)都≥5时。
检验假设为: H0 : 1 2
H1 : 1 2
X1 X 2 pc n1 n2
二项分布与poisson分布的z检验
H 0 : 0 75 Hቤተ መጻሕፍቲ ባይዱ : 75 0.05
Z
123 0
0
123 75 5.543 75
按ν=∞,查t 临界值表:(单侧) Z0.05, ∞ =1.645 Z > Z0.05, ∞ ,得P<0.05 按α=0.05水准拒绝H0,故可认为有亲缘血统婚配 关系的后代其精神发育不全的发生率高于一般人群。
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z X 0
0
~ N 0,1
二项分布与poisson分布的z检验
(一)一组样本资料的z检验
例6-10 某地十年前计划到2000年把孕产妇死亡率降 到25/10万以下。2000年监测资料显示,该地区平均 而言,每10万例活产儿孕产妇死亡31人。问该地区 降低孕产妇死亡的目标是否达到?
二项分布与poisson分布的z检验
一、二项分布资料的z检验
(一)一组样本资料的z检验 如果二项分布的π或1-π不太小,则当n足够大时, 即n π与n(1- π)均≥5时,近似地有 X ~ N(n , n 1 )
1 P ~ N , n X P n
0 25, X 31
二项分布与poisson分布的z检验
H0 : 0 25 H1 : 25 0.05
Z
X 0
0

31 25 25
1.2
按ν=∞查t 临界值表:(单侧) Z0.10, ∞ =1.2816
Z < Z0.10,得P>0.10
按α=0.05水准不拒绝H0,故可认为该地区达到了 预定目标。
当H0成立时,检验统计量为:
Z p1 p2 1 1 pc 1 pc n n 2 1
二项分布与poisson分布的z检验
例6-9 用硝苯吡啶治疗高血压急症患者75例,有效者57 例,用硝苯吡啶+卡托普利治疗同类患者69例,66例有 效。试问两疗法的有效率是否相同?
二项分布与poisson分布的z检验
例 有研究表明,一般人群精神发育不全的发生率为 3‰,今调查了有亲缘血统婚配关系的后代25000人, 发现123人精神发育不全,问有亲缘血统婚配关系的 后代其精神发育不全者的发病率是否人高于一般人 群?
0 25000 0.003 75, X 123
57 66 57 66 p1 0.76, p2 0.95652, pc 0.85417 75 69 75 69
二项分布与poisson分布的z检验
H0 : 1 2 H1 : 1 2 , 0.05
Z
p1 p 2 1 1 p c 1 p c n n 2 1 0.76 0.95652 1 1 0.854171 0.85417 75 69 3.33799
26 29 26 29 0.40452
X1 X 2
二项分布与poisson分布的z检验
按ν=∞,查t 临界值表: Z0.5/2, ∞ =0.6745
︱Z ︱ < Z0.5/2,得P>0.5
按α=0.05水准,不拒绝H0,故尚不能认为两检验
师检查结果有差异。
二项分布与poisson分布的z检验
二项分布与poisson分布的z检验
(二)两组独立样本资料的z检验 当两总体均数都大于20时,可应用正态近似原理。
H 0 : 1 2 H1 : 1 2
当H0成立时,检验统计量为: X1 X 2 ~ N 0,1 当两样本观测单位数相等时: Z
X1 X 2
Z X1 X 2 X1 X 2 n1 n2 ~ N 0,1
相关文档
最新文档