二项分布poisson分布的检验
第十章 二项分布和Poisson分布及其应用
Poisson分布
• Poisson分布是描述当试验中成功的概率很小 (如0.05),而试验的次数n很大的小概率事件
出现规律性的一种离散型随机分布。 • 用于描述在单位时间(空间)内稀有事件的发生数。
医学卫生领域中服从Poisson分布指标
恶性肿瘤的死亡率 ; 放射性物质在单位时间内的放射次数; 在单位容积充分摇匀的水中的细菌数; 野外单位空间中的某种昆虫数等。
0.25
0.2
0.15
0.1
0.05
0 012 345
(b)
0.18 0.16 0.14
n =30 π =0.3
0.12
0.1
0.08
0.06
0.04
0.02
0
0 2 4 6 8 10 12 14 16 18 20
(d)
•由数理统计学的中心极限定理可知,当n较大、 不接近0也不接 近1时,二项分布B( n , )近似正态分布:
正态近似法
当n较大, p 和 1 p 均不太小,如 np 和 n(1 p) 均
大于5时,利用正态近似的原理,可作样本率p与已 知总体率的比较,检验统计量为:
Z p0 0 (1 0 ) n
例10.6 一项调查结果表明某市一般人群的艾滋病知识 知晓率为65%。现对该市吸毒人群进行调查,在150名 吸毒人员中有130人回答正确。问该市吸毒人群的艾滋 病知识知晓率是否高于一般?
X ~ N(n , n (1 ))
二项分布的应用
• 总体率的区间估计 – 查表法 – 正态近似法
• 单个样本率与总体率比较 – 直接计算概率法
– 正态近似法 • 两样本率的比较
总体率的区间估计
• 查表法:当n≤50时可查表求总体率的95%或 99%可信区间(附表7)。
二项分布及Posson分布
(2)Poisson分布的性质
① Poisson分布的总体均数等于总体方差μ=σ2=λ。
② 当n很大,而π很小,且nπ=λ为常数时,二项分
布近似Poisson分布。
③ 当λ增大时,Poisson分布渐近正态分布。一般,
当λ≥20时,Poisson分布可作为正态分布处理。
④ Poisson分布具有可加性。对于服从Poisson
该函数式是二项函数[π+(1-π)]n的通项
且有:
P( X ) 1
X 0
n
2。二项分布的适用条件
若试验符合下面3个特点,则其某一试验结果
发生的次数服从二项分布,此试验称为贝努利
(Bernoulli)试验。
n次贝努利(Bernoulli)试验中研究事件
发生的次数X服从二项分布。
贝努利(Bernoulli)试验的条件: ① 每次试验只会发生两种对立的可能结果之一 ② 在相同试验条件下,每次试验出现某种结果 (如“阳性”)的概率π固定不变
样本均数与总体均数比较的检验目的 是推断样本均数所代表的总体均数λ与已 知的总体均数λ0是否相等。 可使用的检验方法有:直接计算概率 法和正态近似法
例6-13
有研究表明,一般人群精神发育
不全的发生率为3‰,今调查了有亲缘血统婚 配关系的后代25000人,发现123人精神发育不
全,问有亲缘血统婚配关系的后代其精神发育
第二节
Poisson分布
(Poisson distribution)
一、Poisson分布的概念
Poisson分布最早是由法国数学家SiméonDenis Poisson (西莫恩· 德尼· 泊松 )研究二项
分布的渐近公式是时提出来的。
二项分布与poission分布
的人数X的概率分布为二项分布,记作B(n,π)。
二项分布的概率函数P(X) 公式为
P( X ) C (1 )
x n x
n x
x n
n! 其中C x !(n x)!
2013-2-2 第五章 常用概率分布 (二) 7
二项分布(binomial distribution)的概念
第五章 常用概率分布 (二)
15
四、二项分布的应用
X~B(n,π ),计算恰有k例“阳性”的概率:
P( X k ) C (1 )
K n k
n k
例5-3
如果某地钩虫感染率为13%,随机观察当地150人,
其中有10人感染钩虫的概率有多大?
150 ! P( X 10) 0.1310 0.87140 0.0055 10!(150 10)!
p 0.26 0.25 0.24 0.23 0.22 0.21 0.20 0.19 0.18 0.17 0.16 0.15 0.14 0.13 0.12 0.11 0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00 0 1 2 3 4 5 6 7 m 8 9 10 11 12 13 14 15
C (1 )
2 5 2
2013-2-2
52
第五章 常用概率分布 (二)
6
二项分布(binomial distribution)的概念
如果每个观察对象阳性结果的发生概率均为,阴性结 果的发生概率均为(1-);而且各个观察对象的结果 是相互独立的,那么,重复观察n 个人,发生阳性结果
2013-2-2
第五章 常用概率分布 (二)
二项分布与Poisson分布
px 7 1 px 8 1 p(x 8) x 9
1 C180 0.868 0.142 0.58 0.155
因此,10例患者中至少9例有效的概率为0.581,至多7例有效的概率 为0.155。
n
P( X K ) P(K ) P(K 1) P(K 2) P(n) P( X )
K
(3)至多有k例阳性的概率:
k
P( X K ) P(0) P(1) P(2) P(k) P( X )
X= 0, 1, 2, … k…n
0式
生存数 (X)
3
死亡数 (n-X)
0
2
1
1
2
0
3
甲乙 丙
生生 生 生生 死 生死 生 死生 生 生死 死 死生 死 死死 生 死死 死
每种组 每种排列的概率 合的概
px nx1 nx, x 率
0.2×0.2×0.2=0.008 0.2×0.2×0.8=0.032 0.2×0.8×0.2=0.032 0.8×0.2×0.2=0.032 0.2×0.8×0.8=0.128 0.8×0.2×0.8=0.128 0.8×0.8×0.2=0.128 0.8×0.8×0.8=0.512
他观察单位的结果。 6
三. 概率的计算:
从一个阳性率为π的总体中,随机抽取含量为n的样本,则 样本中阳性数X或阳性率p服从二项分布B ( n、π)。
(1)恰有k例阳性的概率:
P(X k) (nk ) k 1 nk
(
n k
)
n! k!(n
k )!
(2)至少有k例阳性的概率:
统计学:二项分布与泊松分布
第19页
结束
4.二项分布的数字特征
① 这里的数字特征主要指总体均数、方差、 标准差等参数。
② 随机变量X的数学期望 E(X)=μ。 ③ 即指总体均数。μ=nπ
简历
返回总目录 返回章目录 a
第20页
结束
随机变量X的方差及标准差
③ 随机变量X的方差 D(X)=σ2 ④ 随机变量X的标差为:
2 n(1)
医学本科生用
医学统计学
主讲 程 琮
泰山医学院预防医学教研室 zcheng@
简历
返回总目录 返回章目录 a
第1页
结束
The teaching plan for medical students
MEDICAL STATISTICS
Professor Cheng Cong
Dept. of Preventive Medicine Taishan Medical College
简历
返回总目录 返回章目录 a
第10页
结束
2. 则X的概率函数为:
P n(X )C n X X(1)n X
X=0,1,2,…,n
(7.1)
式中:0<π<1,C
X n
为组合数,公式(7.1)称随机变量X
服从参数为n,π的二项分布,则记为X~B(n,π)。
简历
返回总目录 返回章目录 a
第11页
结束
简历
返回总目录 返回章目录 a
第33页
结束
情形一:治疗20例病人的疗效分析
(1)建立检验假设 H0:π=π0=0.80;H1: π> π0 =0.80 单侧α=0.05
(2)计算概率值 根据二项分布有:
P ( X 1 ) P ( 1 9 ) P ( 2 9 ) C 2 1 0 ( 0 . 8 0 9 ) 1 ( 0 . 2 9 0 ) 1 C 0 2 2 ( 0 . 8 0 0 ) 2 ( 0 . 2 0 0 ) 00
06二项分布及泊松分布
●Bernoulli 试验(Bernoulli T est):将感兴趣的事件A出现的试验结果称为“成功”,事件A不出现的试验结果称为“失败”,这类试验就称为Bernoulli 试验●二项分布(binomial distribution):是指在只会产生两种可能结果如阳性或阴性之一的n次独立重复试验中,当每次试验的阳性概率π保持不变时,出现阳性次数X=0,1,2,…,n的一种概率分布。
●Poisson分布(Poisson distribution):随机变量X服从Poisson分布式在足够多的n次独立试验中,X取值为1,2,…,的相应概率为…的分布。
★二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
★二项分布的图形:当∏=0.5,二项分布图形是对称的,当∏不等于0.5,图形是偏态的,随着n增大,图形趋于对称。
当n趋于无穷大时,只有∏不太靠近0或者1,二项分布近似正态分布。
★二项分布的应用总体率的区间估计,样本率与总体率比较,两样本率的比较★Poisson 分布的应用总体均数的区间估计,样本均数与总体均数的比较,两个样本均数的比较:两个样本计数均较大时,可根据Poisson 分布的正态近似性对其进行u 检验。
★Poisson 分布成立的条件:①平稳性:X 的取值与观察单位的位置无关,只与观察单位的大小有关;②独立增量性:在某个观察单位上X 的取值与前面各观察单位上X 的取值无关;③普通性:在充分小的观察单位上X 的取值最多为1。
Poisson 分布,X~P(μ),X 的均数μX =μ,X的方差σ2 =μ,X的标准差σX★Poisson分布的性质1、总体均数λ与总体方差相等是泊松分布的重要特点。
2、当n增大,而∏很小,且n∏=λ总体均数时,二项分布近似泊松分布。
3、当总体均数增大时,泊松分布渐近正态分布,一般而言,总体均数》20时,泊松分布资料做为正态分布处理。
二项分布与泊松分布
正态分布,; 当n足够大,但π很小时,如n≥100而π<0.1或π>0.9时
,二项分布近似于泊松分布。
样本率均数 样本率标准差
p
x
n
n
n
pnx
n(1)
n
(1)
n
样本率p的标准差
pnx
n(1)
n
(1)
二项分布(binomial distribution)
贝努利试验列中成功次数k的概率为: P(X=k)=Cnk πk (1-π)n-k (0<π<1) ,
k=0 , 1 , …,n, 而 Cnk πk (1-π)n-k 二 项 式 恰 好 是 牛 顿 展 开 式 ((π+(1-π)) n的项,故又称为二项分布。
二项分布与泊松分布
n重贝努利试验
在同一条件下独立重复n次试验,每次试验只 有两个可能的对立结果,A与非A , 如成功与 失败 , 其概率P(A)=π , (0< π<1) , 则称这 一系列独立重复试验为n重贝努利试验(贝努 利试验序列)。
n重贝努利试验的三个条件
(1)每次试验只有两个可能的对立结果, A与非A (2)每次试验的条件不变,即每次试验中, 结果A发生的概率P(A)=π (3)各次试验独立,即任一次试验结果与 其它次试验结果无关。
医学中Poisson分布
单位时间(空间、面积)内某稀有事件 发生次数的分布。
如研究细菌、某些血细胞、粉尘等在单 位面积或容积内计数结果的分布,放射 性物质在单位时间内放射出质点数的分 布,在单位空间中某些野生动物或昆虫 数的分布,在一定人群中某种低患病率 的非传染性疾病患病数或死亡数分布。
验证泊松分布近似二项分布的条件和结论
验证泊松分布近似二项分布的条件和结论二项分布的泊松定理:设0< p 〈1,如果p 充分小,自然数n 充分大,λ=np ,则对于每个k 〈= n ,有近似公式:b(k;n,p)≈λλ-e k k!。
通常,我们取这个n 为10。
以下,就针对n>=10的条件与结论进行验证。
在本文中,我们通过数学软件R 计算并在Matlab 上绘出相应的图形,对定理得条件和结论进行验证,为了使p 足够小,我们取p=0.09。
作出当n = 5,n =10,n =20,n =30,n =50的情况下,二项分布与泊松分布的近似情况。
在R 软件上对n = 5,n =10,n =20,n =30,n =50上分别计算:当 n =5时:> x<-0:5> y<-dbinom(x,5,0.09)> y[1] 0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255[6] 0.0000059049> z<-dpois(x,0.45)> z[1] 6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03[6] 9.805027e-05在Matlab 上作图,并用折线连结。
>> x=[0 1 2 3 4 5];>> y=[0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255 0.0000059049]; >> z=[6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03 9.805027e-05]; >> plot(x,y,'ro',x,z,'bo',x,y,'r',x,z)在R上计算y与z的差值:> y-z[1] -1.359601e-02 2.165466e-02 -3.520599e-03 -3.647129e-03 -7.909220e-04 [6] -9.214537e-05当n =10时:> x<-0:10> y<-dbinom(x,5,0.09)> y[1] 0.6240321451 0.3085873245 0.0610392510 0.0060368490 0.0002985255 [6] 0.0000059049 0.0000000000 0.0000000000 0.0000000000 0.0000000000 [11] 0.0000000000> z<-dpois(x,0.45)> z[1] 6.376282e-01 2.869327e-01 6.455985e-02 9.683978e-03 1.089447e-03[6] 9.805027e-05 7.353770e-06 4.727424e-07 2.659176e-08 1.329588e-09 [11] 5.983146e-11在Matlab上作图,并用折线连结。
二项分布与泊松分布
二项分布的应用
2 正态近似法:应用条件:np及n(1−p)均≥5
p±uαsp
例:在某地随机抽取329人,做HBsAg检验,得阳性 率为8.81%,求阳性率95%置信区间。 已知:p=8.81%,n=329,故:
s p p ( 1 p ) /n 0 .0( 1 8 0 .0 8) 8 /3 1 8 2 0 .0 1 9 1 1 .5 % 5 6 6
第一节 二项分布和总体率的估计
一、二项分布 (一)二项分布的概念
在生命科学研究中,经常会遇到一些事物, 其结果可分为两个彼此对立的类型,如一个病 人的死亡与存活、动物的雌与雄、微生物培养 的阳性与阴性等,这些都可以根据某种性状的 出现与否而分为非此即彼的对立事件。这种非 此即彼事件构成的总体,就称为二项总体 (binomial population)。
二、二项分布的应用
(一 )、总体率的估计
1 查表法:附表6百分率的置信区间表直接
列出了X≤n/2的部分。其余部分可以查nx的阴性部分的QL~QU再相减得 PLand pU PL=1-QL 1-QU 例:某地调查50名儿童蛔虫感染情况,发现有10人大便
中有蛔虫卵,问儿童蛔虫感染率的95%置信区间是多少?
1份混合样本中含有k份阳性的概率为当k0时p0是说混合样品中没有1阳性样品的原始概率反映的是混合样品阴性的概率当收集的样本数量很大时全部检验费时费力可以用群检验的方法进行解决若每个标本的阳性概率为则其阴性概率为q1便是某个群m个标本均为阴性的概率一个群为阴性的群的概率而1q就为一个群阳性的概率
二项分布与泊松分布
第一节 二项分布和总体率的估计
二项分布(binomial distribution) 就是对这种只具有两种互斥结果的离散型 随机变量的规律性进行描述的一种概率分 布。由于这一种分布规律是由瑞士学者贝 努里(Bernoulli)首先发现的,又称贝努里 分布。
统计学-二项和Poisson分布
2
Bernoulli试验和Bernoulli试验序列
重复n次,称为n重Bernoulli试验 n次实验构成的序列,称为Bernoulli试验序列。
– 特点:
每次实验只有两种可能的结果 各次实验相互独立 发生成功事件的概率不变
作
B(n, )
二项分布的概率 P ( x ) 可用下式计算
其中
P (x)C n xx(1)nx
Cnx
n! x!(n
x)!
X取值为0,1,2,… n
7
二项分布的条件
二项分布的条件
– 每次实验(观察)的结果只有两种可能(两分 类变量)
– 各次实验(观察)的结果相互独立 – 每个观察对象发生阳性结果的概率为π
– 它是研究“相同条条件下进行重复实验或观察” 的一种概率模型
3
例3.1 设小白鼠接受一定剂量的某种毒 物时的死亡率为80%,即对于每只小白 鼠来说,其死亡概率为0.8,生存概率为 0.2。每组各用甲乙丙三只小白鼠逐只做 实验,观察每组小白鼠的存亡情况。如 果考虑生存或死亡的顺序,则共有8种排 列方式,如果只考虑生存或死亡的数目, 则只有4种组合方式,如表3.1第(2) (3)栏所示。
17
Poisson分布的概念
常见服从Poisson分布的情况: – 均匀液体中的细菌分布 – 放射性物质单位时间内的放射次数 – 粉尘在观察容积内的分布 – 非传染性罕见疾病在人群中的分布
18
Poisson分布的形态
19
Poisson分布的形态
20
Poisson分布的特点
形态: – 离散分布
医学中的二项分布:如某病的患病率为π, 在人群中随机抽取5人,则5人中患该病的人 数服从二项分布B(5,π)
医学统计学:二项分布与poisson 分布
p
(1 )
n
p 是率( p )的标准差
,又称率的标准误,它反 映率的抽样误差的大小。
当仅知道样本率时,则率 的标准差(或标准误)的 估计公式为:
Sp
p(1 p) n
6.1 二项分布(binomial distribution)
■ 二项分布的性质:
(3)二项分布的正态近似条件: n 和 n(1 ) 均大于5。
6.1 二项分布(binomial distribution)
■ 二项分布的应用:
• 总体率的估计 1.查表法
当样本含量n较小,如n≤50,特别是p很接近于0或1时,按二项分布的原理 估计总体率的可信区间。因为其计算过程较复杂,统计学家已经编制了百分 率的可信区间可直接根据样本含量n和阳性数X查出总体率的可信区间。
二项分布binomialdistribution与poisson分布poissondistribution复习中学的有关数学概念61二项分布binomialdistribution复习中学的有关数学概念61二项分布binomialdistribution贝努里试验bernoullitrial61二项分布binomialdistribution贝努里试验bernoullitrial61二项分布binomialdistribution贝努里试验bernoullitrial61二项分布binomialdistribution贝努里试验bernoullitrial61二项分布binomialdistribution贝努里试验bernoullitrial61二项分布binomialdistribution贝努里试验bernoullitrial61二二项分布binomialdistribution二项分布binomialdistribution概念
第5章二项分布与Poisson分布
20
注意: 附表3中X值只列出
n X 2
n 时, X 2
可以用 n-X 查表,然后以 100% 减去查的区间即 为所求的可信区间 例 5.6 某县抽查了 10 名人员的乙型肝炎表面 抗原( HBsAg )携带情况,阴性者 8 人,求该 县人群HbsAg阴性率的95%可信区间为 若x n/2 ,则按n-x 查表得?,然后100-? 例:上题若 X=8,则 n-x=10-8=2 查表得:3% ~ 56% 然后100-?得:44% ~ 97%
H0: 1 = 0 =0.2
H1: 1 > 0 =0.2
单侧 = 0.05
u
0.316 0.20 0.2 (1 0.2) 304
5.06
24
(3)两样本率比较(近似正态法) n1 p1、n1( 1-p1)和n2 p2、n2( 1-p2) 5时
u
p1 p2
pc (1 pc )(1 n1 1 n2 )
区间估计是根据样本提供的信息按一定的概率即可信度来估计总体率的可能范aa正态近似法正态近似法当n足够大p和1p均不太小时可通过np与n1p均大于判断样本率p近似正态分布这时可以利用正态分布理论来估计总体率的可信区间
第五章 二项分布与Poisson分布
预防医学教研室
1
目的及要求
了解二项分布(binomial distribution) 与Poisson分布( Poisson distribution)的 概念 掌握二项分布的特点、均数与标准差的计 算,Poisson分布与二项分布和正态分布的 关系;总体均数可信区间的估计、假设检 验及适用条件 重点是二项分布的应用,难点是三种分布 的区别与联系
03-2二项分布与Poisson分布的概念及特征
表现为相互独立的结果,每个个体的 观察结果只能取其中之一。
这类事物用二项分布(binomial distribution)进行描述。
例:
小白鼠接受某毒物一定计量时。其死亡率为 π=0.8,生存概率为1- π=0.2
表 所有可能结果 甲 乙 丙 (1) 生 生 生 生 生 死 生 死 生 死 生 生 生 死 死 死 生 死 死 死 生 死 死 死
2、单侧累计概率计算
则称该事件的发生服从参数为 的Poisson分布记为
X~ Poisson()。 X为单位事件或空间内某事件的发生数, P(X) 为事件数为X时的概率, e为自然对数的底
Poisson分布的方差: (2)累计概率 (3) Poisson分布的图形: (4) Poisson分布具有可加性 (5) Poisson分布是二项分布的极限形式:
n=20、π=0.2的二项分布示意图
二项分布的应用条件
1、各观察单位只能由互相对立的两种结果之一, 不允许考虑“可疑”等模糊结果,属于二分类资 料。 2、已知发生某一结果(如阴性)的概率不π变, 其对立结果的概率则为1-π,实际工作中要求π 是从大量观察中获得的比较稳定的数值。 3、n次试验在相同条件下进行,且各观察单位的 结果互相独立。即每个观察单位的观察结果不会 影响到其他观察单位的结果。 如,要求疾病无传染性、无家族聚集性等。
Poisson分布
Poisson分布的概念
医学研究中常需研究单位时间、单位空间内某 事件的发生数,如:每升水中大肠菌群数的分 布等。这类资料可用Poisson分布理论进行研 究。
Poisson分布的概念
如果某事件的发生是完全随机的,则单位空间 或单位时间内,事件发生0次、1次、2次¨¨的 概率为: P(X) =e - X=0,1,2 ¨¨
二项分布poisson分布的检验
57 66 57 66 p1 0.76, p2 0.95652, pc 0.85417 75 69 75 69
二项分布与poisson分布的z检验
H5
Z
p1 p 2 1 1 p c 1 p c n n 2 1 0.76 0.95652 1 1 0.854171 0.85417 75 69 3.33799
二项分布与poisson分布的z检验
按ν=∞查t 临界值表: Z0.001/2, ∞ =3.2905 Z > Z0.001/2,得P<0.001 按α=0.05水准拒绝H0,接受H1,故可认为两种疗
法有效率不同。
二项分布与poisson分布的z检验
二、Poisson分布资料的z检验
当总体均数λ≥20时,Poisson分布近似正态分布。 (一)一组样本资料的z检验
按α=0.05水准不拒绝H0,故可认为该医院宣称的
有效率尚属客观。
二项分布与poisson分布的z检验
(二)两组独立样本资料的z检验
它的应用条件为当所比较的两组的np和n(1-p)都≥5时。
检验假设为: H0 : 1 2
H1 : 1 2
X1 X 2 pc n1 n2
二项分布与poisson分布的z检验
H 0 : 0 75 H1 : 75 0.05
Z
123 0
0
123 75 5.543 75
按ν=∞,查t 临界值表:(单侧) Z0.05, ∞ =1.645 Z > Z0.05, ∞ ,得P<0.05 按α=0.05水准拒绝H0,故可认为有亲缘血统婚配 关系的后代其精神发育不全的发生率高于一般人群。
关于Poisson分布的检验讲解
目录承诺保证书 (I)1 引言 (1)1.1 研究背景 (1)1.2 研究方法及目的 (1)2 Poisson分布检验的步骤和基本理论 (2)2.1 检验步骤 (2)2.2 检验的基本原理 (3)3 关于Poisson分布检验的三个案例及实际研究 (7)3.1 案例分析 (7)3.2 对单位时间到来顾客数的实际研究 (13)参考文献 (18)英文摘要 (19)关于Poisson分布的检验肖秋光摘要:Poisson分布是概率论中的一种重要离散分布,在许多实际问题中都有着广泛应用.本文概括了检验样本数据是否服从泊松分布的一般方法,主要是对随机数据进行图像模拟估计和利用假设检验原理对给定的临界值进行估计.其中2χ检验是众所周知的拟合优度检验,它能适用于任意的备择假设.另外,通过三个例子进行说明,最后用该方法对实测数据进行了分析和检验,并得出了结论.χ统计量关键词:Poisson分布假设检验独立变量21 引言1.1 研究背景改革开放三十年来随着社会的发展、经济的增长,科学技术日新月异、人民拥有的物质日益丰富、感受到的文化也更加多元、社会的各种法规制度日臻成熟,无论是住房、保险、交通、旅游、高质量产品还是教育、饮食等.其结果是构成了大量的随机数据,而这些数据有没有什么规律可循呢?就需要我们对它进行研究.在现实生活中的许多数据经过人们大量的研究是服从泊松分布的.若通过观察记录得到了一组数据,它是否服从泊松分布,则需要我们对其进行检验.泊松分布是1837年由法国数学家泊松(Poisson S.D.1781--1840)首次提出的.它是概率论中的一种重要的离散型随机变量的概率分布,在理论上和实践中都有广泛的应用.如110报警台24小时接到的报警次数、一定时间内发生的意外事件次数或灾害次数、布匹上的疵点数目、放射性物质放射出的粒子数目等.1.2 研究方法及目的由于向110报警台的报警是一次次到来的;自然灾害是一次次发生的;放射性粒子是一个个射出的;进入商场的人是一个个到来的……它们都可以看成是一种于随机时刻到来的“质点流”.要对其进行研究,首先,必须收集到有效的数据.其次,由于得到的样本数据通常是实验或统计而来,因此它不能完全的反映事物的本质.我们主要对部分数据进行抽取分析,根据部分数据对全体数据做出推断及判断.因此,研究单位时间内产生的诸多随机变量有助于当事者们对各种新措施、新技术作出更为科学合理的决策.例如,商场每个时段到达的人数不一,通过调查可以确定哪个时段是人流的高峰期,可以在这个时段做一些宣传或促销产生的效益就会比其他时段高,并有效控制成本,使其用最小的投入换来最大的收益.2 Poisson 分布检验的步骤及基本理论 2.1 检验步骤 2.1.1 数据整理进行Poisson 分布的检验时,首先要对收集到的数据进行整理.假设收集到单位时间的量为n x x x x 321,,,然后把这些量按从小到大顺序排列起来,并查出其频数稍加整理制成表格如下: 表 1其中满足:i i n p x p p x x x ⨯++⨯+⨯=+++ 102110 2.1.2 用图像对样本数据进行模拟由于图形比较直观,而且样本数据在一定程度上能有效反映总体的分布规律,故可以用样本数据的图像模拟通过对比,对该分布进行初步判断.泊松分布的图形一般为左偏,但随λ数值的增大,图形趋于对称.图12.1.3 检验得出结论2.2检验的基本理论2.2.1 假设检验假设检验是对总体的分布函数形式或分布的某些参数作出某些可能的假设,然后根据所得的样本数据,对假设的正确性作出判断.假设检验的步骤:①根据问题建立原假设和备择假设原假设是设总体参数等于某一数值,而备则假设是根据研究的目的来确定:可采用双侧检验,也可采用单侧检验.确定单、双侧检验的同时,也就确定了接受域和拒绝域的位置.H为真时的抽样分布②选择适当的样本统计量,并确定以这一步是假设检验的关键,需要根据已知条件找到一个包含待检验总体参数和样本数据的已知分布,并计算出统计量的数值.③选定显著性水平α,确定临界值α应在抽样之前就确定下来,根据单、双侧检验的情况,将α放置一侧或双侧.然后根据第二步骤中所选择统计量服从的分布,查相应分布表,确定临界值.④进行判别,得出结论将第二步计算的数值与第三步得到的临界值进行比较,根据判别原则,作出结论.2.2.2最大似然估计及拟合优度2χ检验2.2.3 P 值检验所谓P 值,是指在一个假设检验问题中,利用观测值能够做出拒绝原假设选择的最小显著性水平,如果p 值小于显著性水平α,则相应的检验统计量的值落入拒绝域中.其检验规则为:若p ≥α值,则拒绝原假设0H ;若p <α值,则接受原假设0H . 2.2.4 Poisson 分布检验设总体X 服从具有参数为0>λ的泊松分布,n X X X X ,,,,321 为其样本.考虑检验问题:0H λ:010:;λλλ≠=H ,现有∏∑∏∏∏==-=--==⎭⎬⎫⎩⎨⎧=∑===ni in i i n ni ix n ni i x n i i x x ex eex x p ni ii11111)!(1ln )(ex p )!(1!);(1λλλλλλλ其中()λλln )(,,,,121==∑=b x x x x T ni i nλλn ni in e c x x x x h -===∏)(,)!(1),,,(121因此⎪⎩⎪⎨⎧<<==><=212121,02,1,,&,1),,,(cT c j c T b c c T x x x j i n ϕ则[]⎪⎩⎪⎨⎧==⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∑∑==),,,(),(),,,(21001211000n ni i n n i i x x x E M x x x x E X E ϕλαϕαλλλ 当0H 为真时,统计量∑==ni i X T 1服从参数为0λn 的泊松分布,0)(λn T E =,则02010201)(!)(!!)(!)(02201110100λλλλλλλλαn c n c n c j j n c j j e n c b e n c b e j n e j n ---∞+=--=+++=∑∑02010201)(!)(!!)(!)(02220111101000λλλλλλλλαλn c n c n c j j n c j j e n c cb e nc c b e j n j e j n j n ---∞+=--=+++=∑∑在一般情况下上述方程不易求解,但当0λ不接近于零而n 又不很小时,统计量1λλn n XU ni i∑=-=的渐进分布为正态分布)1,0(N ,则⎭⎬⎫⎩⎨⎧>-=⎭⎬⎫⎩⎨⎧-<-∑∑==n i i n i i u n X P u n X P 101000λλλλ 对一切实数u 都渐近地成立(这是因为正态分布具有对称性).因此,2121,,,c c b b 由下式确定:02020101)(!)()(!!)(202210011100λλλλλλλλαn c n c j j n c n c j j e n c b e j n e n c b e j n --∞+=---=+=+=∑∑ 3关于Poisson 分布检验的三个案例及实际研究3.1 案例分析3.1.1 论反腐败与泊松分布腐败现象作为当今社会的一种非常态,它的发生、出现引起了广大群众的关注.调查显示最近几年科级腐败正在加剧,小官受贿成隐患.据悉,某检察院工作人员对某经济较落后省的320个底层官员在一年时间内的受贿金额调查纪录如下表所示.根据这些数据(金额0表示未受贿,金额1表示受贿金额大于0小于等于1,其余类同)检验受贿金额是否服从泊送分布.表 2 1年内320个官员受贿金额(万元)统计表来源于参考文献[6]用折线图像模拟数据如下:图2从图形走势看,为左偏凸值分布,与泊松分布较为相似,可初步判定为泊松分布.在理论上,这里我们需要检验的是在一年的时间段内受贿官员的受贿金额是否服从泊送分布,所以可以假设0H :一年的时间内受贿官员的受贿金额服从泊送分布; 1H : 一年的时间内受贿官员的受贿金额不服从泊送分布; 我们知道泊送分布的概率密度函数为 !)(x e x X f x λλ-∙==,式中:λ是未知参数.如果假设为真时,可以根据本数据估计λ.由上表的数据可以的到在320个底层官员中,平均每一官员受贿的金额(万元),即0.33201019471150ˆ=⨯+⨯++⨯+⨯= λ因此,可以用λˆ作为λ的估计值,即得到为真时的概率密度函数 !3)(3x e x X f x -∙==根据该密度函数,就可以计算出在每一个官员的受贿金额为各个类别出现的概率,这些概率值可通过泊送分布表查得.例如,在一年内受贿金额为0万元的官员人数的概率是498.0)0(==X f ,受贿金额为1万元的概率是1494.0)1(==X f 等.然后用查出的概率分别乘以样本容量)320(=n n ,就可以得到各类别期望的频数.例如,在320个官员中受贿金额为0万元的期望频数是936.153200498.0=⨯.下表列出了2χ统计量的计算过程.表 3 2χ统计量的计算过程我们注意到表中,受贿金额为8,9和10万元次及以上金额的期望频数都小于5,所以将这三类归于受贿金额为7万元的合并为一类,所以合并之后的类别数8=k .这时2χ统计量为0068.5)(8122=-=∑=i ii i e e n χ需要注意的是:根据Pearson 定理,上式的2χ统计量服从自由度为1--r k 的2χ分布,其中k 时类别的个数,r 是估计的总体参数的个数.在这里1,8==r k (只估计了一个参数λ),所以自由度为61181=--=--r k .于是,当05.0=α时,查表可得592.12)6(205.0=χ.对于样本的2χ值,因为)6(205.02χχ<落在接受域中.所以接受0H ,拒绝1H ,即在一年的时间中该地区官员的受贿金额是服从泊松分布的.大家熟知当n 很大,p 很小时的二项分布趋于泊松分布.按照泊松分布的规律,一项非正常态现象的出现除了在总体中的概率很小外,其最明显的特征则是常常集中分布.通过上面检验和大量案例表明,腐败现象作为社会现象中的一种非正常态,其发生和发展呈泊松分布规律,特点是总体上的稀有性和局部的密集性加偶然性,具体表现有“前腐后继案”、“串案”、“窝案”等形式.因此治理腐败:一是要尽早发现,尽快惩前毖后;二是不能搞扩大化;三是要综合治理.其次表明,泊松分布密集出现的概率跟社会体制有关,尤其是在经济转型、社会发生变革的时期容易出现。
医学统计学课件:第九讲 二项分布和Poisson分布
S p1 p2
X1 X 2 (1 X1 X 2 )( 1 1 )
n1 n2
n1 n2 n1 n2
温州医科大学公共卫生与管理学院/附属眼视光医院
例 7 - 7 为 研 究 A 、B 两 地 学 生 的 肺 吸 虫 感 染 率 是 否 相 同 ,某 研 究
者 随 机 抽 取 8 0 名 A 地 学 生 和 8 5 名 B 地 学 生 ,查 得 感 染 人 数 A 地 2 3 ,
当二项分布中n很大,p很小时,二项分布就变
成为Poisson分布,所以Poisson分布实际上是 二项分布的极限分布。
由二项分布的概率函数可得到泊松分布的概率 函数为:
P{X x} e x
x!
x 0,1, 2,
为大于0的常数,X 服从以为
参数的Poisson分布 X ~ P( )
温州医科大学公共卫生与管理学院/附属眼视光医院
当n→∞时,只要不接近0、1,二项分布近似 正态分布。
温州医科大学公共卫生与管理学院/附属眼视光医院
温州医科大学公共卫生与管理学院/附属眼视光医院
温州医科大学公共卫生与管理学院/附属眼视光医院
温州医科大学公共卫生与管理学院/附属眼视光医院
相关程序(R软件)
op<-par(mfrow=c(2,2)) n<-c(10) p<-c(0.1) k<-seq(0,n) plot(k,dbinom(k,n,p),type='h',main='二项
分布', xlab='K',cex=1.5,cex.axis=1.5,col.axis=4) mtext(paste('N=',n),adj=0.9,side=3,line= -2,col=4) mtext(paste('P=',p),adj=0.9,side=3,line= -3.1,col=4)
二项分布和poisson分布
• 二项分布(binomial distribution):是指贝努利试验中 结果A出现次数的概率分布。
• 记为:X~B(n,)
二项分布的两个参数: – 总体率π – 样本含量n
n次贝努利试验中,阳性结果A出现的次数X具 有的概率是多少呢?
Questions?
如果在足够多的n次独立Bernoulli试验中,随机变量X
所有可能的取值为0,1,2,…,取各个取值的概率为:
X e
P(X )
, X 0,1, , n
X!
X: 单位时间(空间)某稀有事件发生数; : Poisoon分布的总体均数,=n ; P(X): 事件数为X时的概率,e为自然对数的底。
f='Arial' 'P(X)'); • axis2 length =30.0 offset=(2) order =(0 to 15 by 1) label =(h=1.2 f='Arial' 'X'); • RUN;QUIT;
二项分布的应用
• 总体率的区间估计 • u 检验
总体率的区间估计
正态近似法
例 为研究某种新补钙制剂的临床效果,观察了200名儿童, 其中100名儿童用这种新药,发现有12人患佝偻病,另 100名儿童用钙片,发现有20人患佝偻病,试问两组儿童 的佝偻病发病率有无差别?
例 为研究某职业人群颈椎病的发病的性别差异, 今随机抽取该职业人群男性120人和女性110人, 发现男性中有36人患有颈椎病,女性中有22人患 有颈椎病。试作统计推断。
P( X ) CnX X (1 )nX , X 0,1, , n
第6章-二项分布与Poisson分布
所以, X服从以n、 π 为参数的二项 分布。记为:X〜B(n、 π ).
二项分布的均数与方差
若X〜B(n、π ),则 X的均数 x=nπ X的方差2x= nπ (1-π ) X的标准差x = nπ (1-π ) 例:已知π =0.6 3只鼠中死亡鼠数X的
二项分布与Poisson分布的关系:
• 当二项分布资料中n较大时,而且发生的次数非常稀 少时(发生率很小),二项分布的概率计算可以用 Poisson分布公式近似。一般而言,稀有病例的发病 例数在相同的时段内可以近似认为服从Poisson分布。 • 例:已知饮用井水人群的肝癌的患病率为0.003。请 问现在某地调查了20000个饮用井水的人,患肝癌的 人数为9人的概率是多少
• 在医学上研究中,经常需要研究某一事件在 一定的时间(空间)内发生的次数(稀有事 件) • 变量X表示某一个事件在固定的一段时间内随 机发生的次数。如果X的总体平均发生次数为 ,则该事件发生k次的概率为:
P( X k ) e • k!
k
x=0,1,2,3…。
• 例:某市平均交通事故3起/天。问:一天 内发生2起或2起以下的交通事故的概率 是多少? • 解:总体均数=3,因此一天内发生2起 或2起以下的交通事故的概率为
P( x ) C (1 )
x n X
n X
n! X n X (1 ) x!(n x )!
P(1)=0.121061,P(0) =0.028248 P小于等于1的概率为P(1) +P(0) =0.149309>0.05
• 2.两个随机样本率的比较 • 当n足够大,n1p1,n1(1-p1),n2p2,n2(1-p2)均大 于5时
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、二项分布资料的z检验
(一)一组样本资料的z检验 如果二项分布的π或1-π不太小,则当n足够大时, 即阳性数与阴性数都大于等于5时,近似地有 X ~ N(n , n 1 )
1 P ~ N , n X P n
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z X 0
0
~ N 0,1
二项分布与poisson分布的z检验
(一)一组样本资料的z检验
例6-10 某地十年前计划到2000年把孕产妇死亡率降 到25/10万以下。2000年监测资料显示,该地区平均 而言,每10万例活产儿孕产妇死亡31人。问该地区 降低孕产妇死亡的目标是否达到?
二项分布与poisson分布的z检验
(二)两组独立样本资料的z检验 当两总体均数都大于20时,可应用正态近似原理。
H 0 : 1 2 H1 : 1 2
当H0成立时,检验统计量为: X1 X 2 ~ N 0,1 当两样本观测单位数相等时: Z
X1 X 2
Z X1 X 2 X1 X 2 n1 n2 ~ N 0,1
按α=0.05水准不拒绝H0,故可认为该医院宣称的
有效率尚属客观。
二项分布与poisson分布的z检验
(二)两组独立样本资料的z检验
它的应用条件为当所比较的两组阳性数与阴性数都大于 等于5时 检验假设为: H0 : 1 2
H1 : 1 2
X1 X 2 pc n1 n2
当H0成立时,检验统计量为:
Z p1 p2 1 1 pc 1 pc n n 2 1 , 1 1 p1 p2 0.5 n n 2 1 Z 1 1 pc 1 pc n n 2 1
H0 : 0 0.8 H1 : 0.8(单侧), 0.05
0.5 0.75 0.8 60 0.8069 Z 0.8 0.2 60
二项分布与poisson分布的z检验
按ν=∞查t 临界值表: (单侧)Z0.10, ∞ =1.2816
Z < Z0.10,得P>0.10
例6-12 某车间改革生产工艺前,测得三次粉尘浓度, 每升空气中 分别有38、29、36颗粉尘;改革工艺后, 测取两次,分别为25、18颗粉尘。问工艺改革前后 粉尘数有无差别?
38 29 36 X1 34.33, n1 3 3 25 18 X2 21.50, n2 2 2
当n不太大时,需作连续性校正:
Z
X n 0 0.5 n 0 1 0
~ N 0,1
0.5 p 0 n ~ N 0,1 Z 0 1 0 n
二项分布与poisson分布的z检验
例6-8 某医院称治疗声带白斑的有效率为80%,今统计 前来求医的此类患者60例,其中45例治疗有效。试问该 医院宣称的疗效是否客观?
二项分布与poisson分布的z检验
例 有研究表明,一般人群精神发育不全的发生率不 3‰,今调查了有亲缘血统婚配关系的后代25000人, 发现123人精神发育不全,问有亲缘血统婚配关系的 后代其精神发育不全者的发病率是否人高于一般人 群?
0 25000 0.003 75, X 123
艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较
低。
二项分布与poisson分布的z检验
H 0 : 0 75 H1 : 75 0.05
Z
123 0
0
123 75 5.543 75
按ν=∞,查t 临界值表:(单侧) Z0.05, ∞ =1.645 Z > Z0.05, ∞ ,得P<0.05 按α=0.05水准拒绝H0,故可认为有亲缘血统婚配 关系的后代其精神发育不全的发生率高于一般人群。
0 25, X 31
二项分布与poisson分布的z检验
H0 : 0 25 H1 : 25 0.05
Z
X 0
0
31 25 25
1.2
按ν=∞查t 临界值表:(单侧) Z0.10, ∞ =1.2816
Z < Z0.10,得P>0.10
按α=0.05水准不拒绝H0,故可认为该地区达到了 预定目标。
二项分布与poisson分布的z检验
H0 : 1 2 H1 : 1 2 , 0.05
Z
X1 X 2 X1 X 2 n1 n2
34.33 21.50 34.66 21.50 3 2
2.723
二项分布与poisson分布的z检验
按ν=∞,查t 临界值表: Z0.05/2, ∞ =1.96 Z > Z0.05/2,得P<0.05 按α=0.05水准,拒绝H0, 接受H1,故可认为工
当两样本观测单位数不等时:
二项分布与poisson分布的z检验
例6-11 甲、乙两检验师分别观察15名正常人末梢血 嗜碱性白细胞数量。每张血片均观察200个视野。结 果甲计数到嗜碱粒细胞26个,乙计数到29个。试问 两位检验师检查结果是否一致?
H0 : 1 2
Z X1 X 2
H1 : 1 2 , 0.05
26 29 26 29 0.40452
X1 X 2
二项分布与poisson分布的z检验
按ν=∞,查t 临界值表: Z0.5/2, ∞ =0.6745
︱Z ︱ < Z0.5/2,得P>0.5
按α=0.05水准,不拒绝H0,故尚不能认为两检验
师检查结果有差异。
二项分布与poisson分布的z检验
二项分布与poisson分布的z检验
检验假设为:
H0 : 0 H1 : 0
当H0成立时,检验统计量为:
Z Z n 0 1 0 X n 0 p 0 n ~ N 0,1
0 1 0
~ N 0,1
二项分布与poisson分布的z检验
二项分布与poisson分布的z检验
H0 : 1 2 H1 : 1 2 , 0.05
Z
p1 p 2 1 1 p c 1 p c n n 2 1 0.76 0.95652 1 1 0.854171 0.85417 75 69 3.33799
二项分布与poisson分布的z检验
例6-9 用硝苯吡啶治疗高血压急症患者75例,有效者57 例,用硝苯吡啶+卡托普利治疗同类患者69例,66例有 效。试问两疗法的有效率是否相同?
57 66 57 66 p1 0.76, p2 0.95652, pc 0.85417 75 69 75 69
二项分布与poisson分布的z检验
按ν=∞查t 临界值表: Z0.001/2, ∞ =3.2905 Z > Z0.001/2,得P<0.001 按α=0.05水准拒绝H0,接受H1,故可认为两种疗
法有效率不同。
二项分布与poisson分布的z检验
二、Poisson分布资料的z检验
)一组样本资料的z检验