二项分布及Pisson分布-

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/6/7
在n次Bernoulli试验中,出现“阳性”结果的次数为
X,则X/n为试验结果的样本率,用p表示。
p的总体均数: p
p的总体方差:
p2
(1)
n
p的总体标准差: p
(1)
n
2020/6/7
样本率p的标准差也称为率的标准误,可以用来
描述率的抽样误差的大小。率的标准误越小,则率
的抽样误差就越小。
实际工作中,总体率π往往未知,此时若用样本
率p作为总体率π的估计值,得到的是Sp,它是σp
的估计值。
Sp
p(1 p) n
2020/6/7
nj=10
治疗病人有效率70% π=0.70
2020/6/7
p1=X1/n p2=X2/n p3=X3/n p4=X4/n
... ...
p100=X100/n
2020/6/7
随机变量分为连续型和离散型,相应的概 率分布就分为连续型概率分布和离散型概率 分布。 连续型概率分布:正态分布、t分布、F分布 离散型概率分布:二项分布、Poisson分布
2020/6/7
2020/6/7
一、二项分布的概念
二项分布是指在只会产生两种可能结果(阳
性或阴性)之一的n次独立重复试验中,当每 次试验的“阳性”结果概率π保持不变时,出
2020/6/7
在生物学、医学、工业统计、保险科学及公 用事业的排队等问题中 , 泊松分布是常见的.例 如地震、火山爆发、特大洪水、交换台的电话呼 唤次数等, 都服从泊松分布.
地震
火山爆发
特大洪水
2020/6/7
在生物学、医学、工业统计、保险科学及 公用事业的排队等问题中 , 泊松分布是常见的. 例如地震、火山爆发、特大洪水、交换台的电 话呼唤次数等, 都服从泊松分布. 商场接待的顾客数 电话呼唤次数 交通事故次数
2020/6/7
(二)样本率与总体率的比较
样本率与总体率比较的检验目的是推断
样本所代表的总体率π与已知的总体率π0
是否相等。
2020/6/7
例6-4 已知某种疾病采用常规治疗的治愈
率约为45%。现随机抽取180名该疾病患者改 用新的治疗方法进行治疗,治愈117人。问新 治疗方法是否比常规疗法的效果好?
分析:以123人为观测单位,则
λ0=nπ=25000×3‰=75
2020/6/7
(三)两样本均数的比较
两样本均数比较的检验目的是推断两样本各 自所代表的总体均数是否相等。
2020/6/7
1。两样本的观察单位数相等(n1=n2)
(1)当X1+X2≥20时,计算公式u:
X1 X2 X1 X2
(2)当5<X1+X2<20时,计算公u式:X
可使用附表7求其总体均数的可信区间。
2020/6/7
例 在对市场上的纯净水进行卫生学检测时,
抽查了某品牌的纯净水样1ml,培养出4个大肠 杆菌。试估计该纯净水中平均每毫升所含大肠 杆菌数的的95%和99%的可信区间。
本例X=4。查附表7,当α取0.05时,数值为1.010.2;当α取0.01时,数值为0.6-12.6
Spp(1 n p)0 .5 5 1 (1 0 0 0 .5 5 )0 .0 4 9 7
p 1 . 9 6 S p 0 . 5 5 1 . 9 6 × 列0 表. 0 4 9 7 ( 0 . 4 5 2 6 , 0 . 6 4 7 4 )
所以,该药物治疗总体有效率的95%可信区间为: (45.26%,64.74%)
且有:
n
P(X ) 1
X 0
2020/6/7
2。二项分布的适用条件
若试验符合下面3个特点,则其某一试验结果 发生的次数服从二项分布,此试验称为贝努利 (Bernoulli)试验。
n次贝努利(Bernoulli)试验中研究事件 发生的次数X服从二项分布。
2020/6/7
贝努利(Bernoulli)试验的条件: ① 每次试验只会发生两种对立的可能结果之一 ② 在相同试验条件下,每次试验出现某种结果
X 2 .5 8 X 6 8 2 .5 8 6 8 ( 4 6 .7 2 ,8 9 .2 8 )
所以,该社区胃癌患病数的95%可信区间为: (51.84,84.16);99%可信区间为(46.72, 89.28)
2020/6/7
(二)样本均数与总体均数的比较
样本均数与总体均数比较的检验目的是
1 X1
X
2 X2
1
2020/6/7
2。两样本的观察单位数不相等(n1≠n2)
(1)当X1+X2≥20时,计算公式:u
X1 X2
X1
n
2 1
X2
n
2 2
X
(2)当5<X1+X2<20时,计算公u式:
1
X1
n
2 1
本例n=13,X=6。查附表6,当α取0.05
时,数值为19-75 所以该吻合术妇女受孕率的95%可信区间
为:(19%,75%)
2020/6/7
例 某医生用某药治疗31例脑血管梗塞患者,
其中25例有效,试求该药物治疗脑血管梗塞有 效率95%可信区间。
2020/6/7
附表6只列出了X≤n/2的部分,当X>n/2时, 可以按“阴性数”n-X查表求其总体阴性率的
若λ是整数,则P(X)在X=λ和X=λ-1处取最大值。
2020/6/7
2020/6/7
(2)Poisson分布的性质
① Poisson分布的总体均数等于总体方差μ=σ2=λ。 ② 当n很大,而π很小,且nπ=λ为常数时,二项分布
近似Poisson分布。
③ 当λ增大时,Poisson分布渐近正态分布。一般,当 λ≥20时,Poisson分布可作为正态分布处理。
P(X k) e k
k!
可以证明总有: P ( X ) 1 X 0
2020/6/7
2。服从Poisson分布的条件
在规定的单位度量中某事件(阳性事件)发生次数
为X,则X满足下列条件时,X服从Poisson分布。
① 普通性 在充分小的观测单位上X的取值最多为1
② 平稳性 X的取值只与观测单位的大小有关,而与
例6-3 在观察一种药物对某种非传染性疾病
的治疗效果时,用该药物治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估计 该药物治疗有效率的有95%可信区间。
本例 n=100,p=55/100=0.55, np=55,n(1-p)=45均大于5,可以利用正
态分布法求总体率的可信区间。
2020/6/7
用n-X=6查表得到该区间为:(8%,38%)
所以该药物有效率的95%可信区间为:(62%, 92%)
2020/6/7
2。正态近似法
当n较大,p和1-p均不太小(np以及n(1-p)均
大于5)时,可以利用正态近似法求总体率的可信 区间。
总体率的可信度为1-α的可信区间:
p u/2Sp
2020/6/7
可信区间,然后再求所需的阳性率的可信区间。 阳性率区间的下限=1-阴性率区间的上限 阳性率区间的上限=1-阴性率区间的下限
2020/6/7
例 某医生用某药治疗31例脑血管梗塞患者,
其中25例有效,试求该药物治疗脑血管梗塞有 效率95%可信区间。
本例中X=25>31/2,所以应先求出无效率的
95%可信区间。
推断样本均数所代表的总体均数λ与已知的 总体均数λ0是否相等。
可使用的检验方法有:直接计算概率法 和正态近似法
2020/6/7
例6-13 有研究表明,一般人群精神发育不
全的发生率为3‰,今调查了有亲缘血统婚配 关系的后代25000人,发现123人精神发育不 全,问有亲缘血统婚配关系的后代其精神发育 不全的发生率是否要高于一般?
(如“阳性”)的概率π固定不变
③ 重复试验是相互独立的,即任何一次试验结果 的出现不会影响其他试验出现的概率
2020/6/7
2020/6/7
3。二项分布的性质
(1)二项分布的均数与标准差
在n次Bernoulli实验中,出现“阳性”结果的次数X
的总体均数: X n
总体方差: X 2 n(1) 总体标准差: X n(1)
2020/6/7
1。Poisson分布的定义
如果随机变量X的取值为0,1,2,…,且其
取值为X的概率为
P(X ) e X
X!
则称X服从Poisson分布,记作X~P(λ) 。
一般X为单位度量中研究事件的发生数,也称样 本计数或样本均数,λ为总体均数,λ=nπ
2020/6/7
Poisson分布 的概率函数式
2020/6/7
(三)两样本率的比较
两样本率比较的检验目的是推断两样本各自所代 表的总体率是否相等。
2020/6/7
2020/6/7
2020/6/7
一、Poisson分布的概念
Poisson分布最早是由法国数学家SiméonDenis Poisson (西莫恩·德尼·泊松 )研究二项 分布的渐近公式是时提出来的。
现某一结果(如阳性结果)的次数的一种概率 分布。
2020/6/7
在医学卫生领域中,服从二项分布的试验较 常见:某种药物治疗某种非传染性疾病,疗效 分为有效与无效;动物的急性毒性试验中,观 测动物的死亡与存活;接触某种病毒性疾病的 传播媒介后,出现感染与非感染等。
2020/6/7
1。二项分布的定义
2020/6/7
④ Poisson分布具有可加性。对于服从Poisson
分布的m个独立的随机变量X1,X2,…,Xm,它们之和 也服从Poisson分布,且其均数为这m个随机变量
的均数之和。
2020/6/7
二、Poisson分布的应用
(一)总体均数的区间估计 1。查表法
对于样本计数(样本均数)X,当X≤50时,
如果随机变量X的取值为0,1,2,…,n, 且其取值为k的概率为
P (X k ) C n k k(1 )n k
则称X服从二项分布,记作X~Β(n,π) 。 其中π为随机事件发生的概率,n为试验次数
2020/6/7
二项分布的 概率函数式
P (X k ) C n k k(1 )n k
该函数式是二项函数[π+(1-π)]n的通项
观测单位的位置无关
③ 独立增量性 在某个观测单位上X的取值与其他各 观测单位上X的取值无关
2020/6/7
源自文库
3。Poisson分布的性质与图形
(1)Poisson分布的图形
Poisson分布的图形与λ有关。λ越小,分布就越 偏;随着λ增大,分布趋于对称,并且渐近正态分布。
当λ≤1时,随X的取值变大,P(X)值反而变小;当 λ>1时,随X的取值变大,P(X)值先增大后变小。
分布则接近正态分布。
2020/6/7
二、二项分布的应用
(一)总体率的区间估计 1。查表法
对于n≤50的小样本资料,可使用附表6求其
总体率的可信区间。
2020/6/7
例6-3 在对13名输卵管结扎的育龄妇女经壶
腹部-壶腹部吻合术后,观察其受孕情况,发现 有6人受孕,据此资料估计该吻合术妇女受孕率 的95%可信区间。
2020/6/7
Poisson分布作为二项分布的一种极限分布, 已发展成为描述小概率事件发生规律的一种重 要分布。常用于研究单位时间或单位空间内某 罕见事件发生次数的分布。
常见的Poisson分布现象有:每滴海水中浮游 生物数量的分布;用显微镜观察片子上每一格 子上细菌繁殖数的分布;某些野生生物或昆虫 数在单位空间中的分布;某种患病率或死亡率 很低的非传染性疾病的患病人数或死亡人数的 分布等。
所以该纯净水中平均每毫升所含大肠杆菌数的 95%可信区间为(1.0,10.2);99%可信区间为 (0.6,12.6)
2020/6/7
2。正态分布法
当X>50时,可以利用正态近似法求总体均数的
可信区间。
总体均数的可信度为1-α的可信区间:
当观察单位数n=1时: X u/2 X
当观察单位数n>1时: X n
u / 2
X n2
2020/6/7
例6-11 研究者对某社区12000名居民进行
了健康检查,发现其中有68名胃癌患者。估计 该社区每12000名居民胃癌患病数的95%和 99%可信区间。
本例X=68,满足正态近似法求总体均数可信
区间的条件。
2020/6/7
X 1 .9 6 X 6 8 1 .9 6 6 8 ( 5 1 .8 4 ,8 4 .1 6 )
100次
(2)二项分布的图形
① 二项分布的图形由n+1条线段组成,横坐标表示
研究事件发生次数,纵坐标为概率,线段长度表示 发生该次数的概率大小,所以各条线段长度之和为1
2020/6/7
2020/6/7
2020/6/7
② 二项分布的图形形状取决于π和n。当 π=0.5时,二项分布为对称分布。当π≠0.5时, 二项分布是偏态的,但随着n的增大,分布趋于 对称;当n→∞时,只要π不太靠近0或1,二项
相关文档
最新文档