二项分布及其应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) 计算检验统计量 。
本例, 0 =0.65,n=100, x=80 。
un X 0 1 n 001 8 0 0 1 0 .6 0 0 0 .5 0 6 0 .35 5 3 .14
(3) 确定P值,做出推断结论。
查表得, 0.0005<P<0.001, 按 = 0.05 水准拒绝H0,接受H1,
死 死 生 0.8 0.8 0.2 0.128
1
死 生 死 0.8 0.2 0.8 0.128
生 死 死 0.2 0.8 0.8 0.128
0
死 死 死 0.8 0.8 0.8 0.512
P(x) (5)
0.008
0.096
0.384 0.512 1.000
概率的乘法原理:几个相互独立的事件同时发生的概率等于各 事件发生概率的乘积。
(3)
(4)
生 生 生 0.2×0.2×0.2=0.008 P(0) C30(0.8)0(10.8)30 0.008
生 生 死 0.2×0.2×0.8=0.032
2
1
生 死 生 0.2×0.8×0.2=0.032 P(1) C31(0.8)1(10.8)31 0.096
死 生 生 0.2×0.8×0.2=0.032
p~N(,1)
n
此时, 总体率的可信区间可按下式进行估计:


p u s p , p u s p

2
2
其中,
sp
p1 p
n
三、二项分布的应用
(二)假设检验
1、样本率与已知总体率的比较:
(1)直接计算概率法: 例1 根据以往长期的实践,证明某常用药的治 愈率为65%。现在某种新药的临床试验中,随机观 察了10名用该新药的患者,治愈8人。问该新药的 疗效是否比传统的常用药好?
二项分布及其应用
内容提纲
二项分布的概念及应用条件 二项分布的性质 二项分布的特点 二项分布的应用
一、二项分布的概念及应用条件
举例:设小白鼠接受一定剂量的某种 毒物染毒后死亡率为80%。若每组各用 3只小白鼠(甲、乙、丙)接受该种毒 物染毒,观察各组小白鼠的存亡情况。
死亡数 x
Cnx(1)nxx Cnn(1)0n
1
p (x) C n x x1 n x
p ( 0 ) p ( 1 ) p ( n ) 1
例. 求前例中三只小白鼠死亡2只的概率。
p ( x 2 ) C 3 22 1 3 2 3 0 . 8 2 0 . 2 1 0 . 384
n
304
(3) 确定P值 , 做出推断结论。查表得, P<0.0005, 按 = 0.05
水准拒绝H0, 接受H1, 认为老年胃溃疡患者较一般患者更易发 生胃出血。
☺小贴士:注意事项
以上各例均为单侧检验, 若需进行双侧检验, 则P值为从H0
(1) 0
1
2
3 合计
表 1 3 只小白鼠染毒后的死亡只数的概率分布
生存数
排列方式
n-x
甲乙 丙
各种排列的概率
(2)
(3)
(4)
3
生 生 生 0.2 0.2 0.2 0.008
死 生 生 0.8 0.2 0.2 0.032
2
生 死 生 0.2 0.8 0.2 0.032
生 生 死 0.2 0.2 0.8 0.032
sp
p1 p
n
2、总体率的区间估计
(理论值) (估计值)
三、二项分布的应用
2、总体率的区间估计 (1)查表法——样本量较小时(n50) 例3.6 某医院皮肤科医师用某种药物治疗20
名系统性红斑狼疮患者,其中8人近期有效,求该法 近期有效率的95%可信区间。
用n=20和x=8查附表7.2百分率的可信区间得该 法近期有效率的95%可信区间为19%64%。
B( , n )。
例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验 动物染毒后结局(生存/死亡),……。
一、二项分布的概念及应用条件
2、应用条件:
① n次试验相互独立 ( n 个观察单位相互独立)。 ② 每次试验只有两种可能结果中的某一种(适用
于二分类资料)。
③ 每次试验发生某一种结果的概率 固定不变
H0成立时, 400名新生儿中染色体异常例数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该地新生儿染色体异常率不低于一般 H1: < 0,即该地新生儿染色体异常率低于一般 = 0.05
(2) 根据二项分布的分布规律,计算 P 值。
本例0=0.01,n=400,x=1,根据题意需求最多有1例染
态分布,即
ap.pro
x~N n,n1或
pa~pp.N ro,1
n
二项分布的正态近似示意图
二项分布的累计概率:
15
20
25
30
35
40
45
50
55
60
65
k1
k2
三、二项分布的应用
(一)估计总体率的可信区间
1、率的抽样误差
p
1
n
由于附表7百分率的可信区间中值只列出了x n/2的部分,当x>n/2时,应以n -x查表,再从100
中减去查得的数值即为所求可信区间。
2、总体率的区间估计
三、二项分布的应用
(2)正态近似法 当样本含量足够大,且样本率p和 1-p均不太小,一般 np与 n(1-p)均大于5时,样本率的抽样分布近似正态分布,即
生 死 死 0.2×0.8×0.8=0.128
1
2
死 生 死 0.8×0.2×0.8=0.128 P(2) C32(0.8)2(10.8)32 0.384
死 死 生 0.8×0.8×0.2=0.128
0
3
死 死 死 0.8×0.8×0.8=0.512 P(3) C33(0.8)3(10.8)33 0.512
一、二项分布的概念及应用条件
1、概念:若试验 E 只有两种相互对立的结果(A及 A ),
并且 P(A) ,PA1, 把 E 独立地重复 n
次的试验称为 n 重贝努里试验(Bernoulli trial)。 n 重贝努里试验中事件A发生的次数 x 所服从的分布 即为二项分布(binomial distribution),记为 x ~
p
1
n
(理论值)
sp p(1p)n (实际值)
(二)二项分布的累计概率
从阳性率为
的总体中随机抽取n个观察单位,则
(1)最多有k例阳性的概率为
P ( X k ) P ( 0 ) P ( 1 ) P ( k )
(2)最少有k例阳性的概率为
P ( X k ) P ( k ) P ( k 1 ) P ( n ) 1 P ( X k 1 )
(1)建立检验假设,确定检验水准
H0: = 0,即老年胃溃疡患者胃出血发生率与一般患者相同 H1: > 0,即老年胃溃疡患者胃出血发生率高于一般患者 = 0.05
(2) 计算检验统计量 。
u p0 0.31 50.2 805.05 0(10) 0.2 0(10.2)0
色体异常的概率,按二项分布的概率函数得
1
P( X 1) P( X ) (0.99)400
400!
(0.99)4001 (0.01) 0.0905
0
1!(400 1)!
(3) 做出推断结论: P >0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。
认为中西医结合疗法的疗效好于常规疗法。
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状 的占20%。现某医院观察了304例65岁以上的老年胃 溃疡患者,有96例发生胃出血症状,占31.58%。问老 年胃溃疡患者是否较一般患者更易发生胃出血?
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将 n次这种只具有两种互相对立结果中一种的随机实验成功次数的概 率分布称为二项分布。
该例题中各种组合的概率恰好等于该二项式展开式 的各项,所以将n次这种只具有两种互相对立结果 中一种的随机实验成功次数的概率分布称为二项分 布。
[1 ()]n (1 )n C n 1 (1 )n 11 C n 2 (1 )n 22 C n X (1 )n XX C n n 1 (1 )n 1n
(1)建立假设,确定检验水准。
H0: = 0,即新药治愈率与传统药物相同 H1: > 0,即新药治愈率高于传统药物 = 0.05 (2)根据二项分布的分布规律,计算 P 值。
H0成立时,随机抽查的10人中治愈人数x 的分布
PX8p(8)p(9)p(1)0
C1808(1)2C1909(1)1C110010(1)0
450.6850.352100.6950.350.6150 0.17560.507240.901346 0.26160
(3) 做出推断结论。本例P >0.05,按=0. 05的检 验水准不拒绝H0,尚不能认为新药疗效较传统药物 疗效好。
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体异 常,问该地新生儿染色体异常率是否低于一般?
概率的加法原理:几个互不相容的事件至少发生其一的概率等 于各事件发生概率的和。
3只小白鼠存亡的排列和组合方式及其概率的计算 0.8,n3
小白鼠存亡组合方 式
生存数 死亡数 (n-X) (X)
(1)
3
0
排列方式 每种排列的概率
每种组合的概率
甲乙丙
P(X) CnX X (1)nX
(2)
1、样本率与已知总体率的比较:
(2) 正态近似法: 当 n0 和 n(1-0) 均大于5时,
近似
X ~ Nn 0 , n 0 1 0
p
近似
~
N


0
,

0
1
n

0


可用正态近似法, 按下式计算检验统计量u值。
u
X n 0
n 0 1 0
[1 (0 .8 ) 0 .8 ]3 (1 0 .8 )3 C 3 1 (1 0 .8 )3 1 (0 .8 )1 C 3 2 (1 0 .8 )3 2 (0 .8 )2 (0 .8 )3
[(1)]n Cn0(1)n0 Cn1(1)n11

u p0
0(10)/n
例3 据报道,某常规疗法对某种疾病的治愈率为65%。现某 医生用中西医结合疗法治疗了100例该病患者,治愈了80人。 问该中西医结合疗法的疗效是否比常规疗法好?
当H0成立时, 100例患者中治愈人数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: > 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05
(四)二项分布的特点
1、当 0.5时,无论 n大小,其图形均呈对称分布;
2、当 0.5,且且nn小小时时 呈偏态分布;随n不断增大,逐
渐趋于对称分布;当 n 时,逼近正态分布。
实际工作中,只要n足够大,与1- 均不太小时(通常规定
n > 50 且 n5 与 n15时),可看作近似正
(三)二项分布的图形
p n=5, =0.5
n=10, =0.5
xx
n=20, =0.5
n=30, =0.5
n=5, =0.3 n=20, =0.3
n=10, =0.3 n=50, =0.3
=0.2, n=5 ==00.2.2, ,nn==2200
=0.2, n=10 =0.2, n=50
(要求各观察单位同质)。
二、二项分布的性质
(一)均数和标准差
设从概率为的总体中随机抽取样本量为n的样本,每个样
ຫໍສະໝຸດ Baidu
本的事件发生数为x,则 x ~B(,n)。可以证明:
x n
x n1
若用相对数表示,即样本率的均数和标准差分别为:
p
p
1
n
率的标准误(standard error of rate):
相关文档
最新文档