二项分布及其应用 (2)ppt课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

死 死 生 0.8 0.8 0.2 0.128
1
死 生 死 0.8 0.2 0.8 0.128
生 死 死 0.2 0.8 0.8 0.128
0
死 死 死 0.8 0.8 0.8 0.512
P(x) (5)
0.008
0.096
0.384 0.512 1.000
概率的乘法原理:几个相互独立的事件同时发生的概率等于各 事件发生概率的乘积。
80 100 0.65 3.14 100 0.65 0.35
(3) 确定P值,做出推断结论。
查表得, 0.0005<P<0.001, 按 = 0.05 水准拒绝H0,接受H1,
认为中西医结合疗法的疗效好于常规疗法。
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状 的占20%。现某医院观察了304例65岁以上的老年胃溃 疡患者,有96例发生胃出血症状,占31.58%。问老年 胃溃疡患者是否较一般患者更易发生胃出血?
中减去查得的数值即为所求可信区间。
2、总体率的区间估计
三、二项分布的应用
(2)正态近似法
当样本含量足够大,且样本率p和 1-p均不太小,一般 np与 n(1-p)均大于5时,样本率的抽样分布近似正态分布,即
p
~
N
(
,
1
)
n
此时, 总体率的可信区间可按下式进行估计:
p u s p , p u s p
例2* 据以往经验,新生儿染色体异常率一般为1%。为了解某地 新生儿染色体异常率,某医生观察了当地400名新生儿,发现有1 例染色体异常,问该地新生儿染色体异常率是否与一般人群相同?
(1)建立检验假设,确定检验水准
H0: =0,即该地新生儿染色体异常率与一般人群相同 H1: 0,即该地新生儿染色体异常率与一般人群不同 = 0.05
生 死 死 0.2×0.8×0.8=0.128
1
2
死 生 死 0.8×0.2×0.8=0.128 P(2) C32 (0.8)2 (1 0.8)32 0.384
死 死 生 0.8×0.8×0.2=0.128
0
3
死 死 死 0.8×0.8×0.8=0.512 P(3) C33 (0.8)3 (1 0.8)33 0.512
p
1
n
(理论值)
sp p(1 p) n (实际值)
(二)二项分布的累计概率
从阳性率为
的总体中随机抽取n个观察单位,则
(1)最多有k例阳性的概率为
P(X k) P(0) P(1) P(k)
(2)最少有k例阳性的概率为
P(X k) P(k) P(k 1) P(n) 1 P(X k 1)
色体异常的概率,按二项分布的概率函数得
1
P( X 1) P( X ) (0.99)400
400! (0.99)4001 (0.01) 0.0905
0
1!(400 1)!
(3) 做出推断结论: P >0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。
1、样本率与已知总体率的比较:
一、二项分布的概念及应用条件
1、概念:若试验 E 只有两种相互对立的结果(A及 A ),
并且 P(A) ,
, 把 E 独立地重复 n
次的试验称为 n 重贝努里试验(Bernoulli trial)。
n 重贝努里试验中事件A发生的次数 x 所服从的分布
即为二项分布(binomial distribution),记为 x ~
若H0成立, 由400名新生儿中染色体异常的人数服从B(0.01,400),
现有样本为x=1: p(x
1)
C
1 400
0.01 0.99 399
0.07253
比现有样本更极端(即p0.07253)的情形包括x=0,x=7,x=8,…,
x=400。故
P p(x 1) p(x 7)
1 p(2) p(3) p(4) p(5) p(6) 0.2001
该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将 n次这种只具有两种互相对立结果中一种的随机实验成功次数的概 率分布称为二项分布。
该例题中各种组合的概率恰好等于该二项式展开式 的各项,所以将n次这种只具有两种互相对立结果 中一种的随机实验成功次数的概率分布称为二项分 布。
[(1 ) ]n (1 )n Cn1(1 )n1 1 Cn2 (1 )n2 2 CnX (1 )nX X Cnn1(1 ) n1 n [(1 0.8) 0.8]3 (1 0.8)3 C31(1 0.8)31(0.8)1 C32 (1 0.8)32 (0.8)2 (0.8)3
(要求各观察单位同质)。
二、二项分布的性质
(一)均数和标准差
设从概率为的总体中随机抽取样本量为n的样本,每个样
本的事件发生数为x,则 x ~B(,n)。可以证明:
x n
x n 1
若用相对数表示,即样本率的均数和标准差分别为:
p
p
1
n
率的标准误(standard error of rate):
45 0.658 0.352 10 0.659 0.35 0.6510 0.17565 0.07249 0.01346 0.26160
(3) 做出推断结论。本例P >0.05,按=0. 05的检 验水准不拒绝H0,尚不能认为新药疗效较传统药物 疗效好。
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
2
2
其中,
sp
p1 p
n
三、二项分布的应用
(二)假设检验
1、样本率与已知总体率的比较:
(1)直接计算概率法: 例1 根据以往长期的实践,证明某常用药的治 愈率为65%。现在某种新药的临床试验中,随机观 察了10名用该新药的患者,治愈8人。问该新药的 疗效是否比传统的常用药好?
(1)建立假设,确定检验水准。
1、当 0.5 时,无论 n大小,其图形均呈对称分布;
2、当 0.5,且且nn小小时时 呈偏态分布;随n不断增大,逐
渐趋于对称分布;当 n 时,逼近正态分布。
实际工作中,只要n足够大,与1- 均不太小时(通常规定
n > 50 且 n 5 与 n1 5 时),可看作近似正
态分布,即
appro.
P >0.05,按 =0.05检验水准不拒绝H0,尚不能认为该地新生儿 染色体异常率与一般人群不同。
概率的加法原理:几个互不相容的事件至少发生其一的概率等 于各事件发生概率的和。
3只小白鼠存亡的排列和组合方式及其概率的计算 0.8, n 3
小白鼠存亡组合方 式
生存数 死亡数 (n-X) (X)
(1)
3
0
排列方式 每种排列的概率
每种组合的概率
甲乙丙
P(
X
)
C
X n
X
(1
)
n
X
(2)
(3)
(4)
(三)二项分布的图形
p n=5, =0.5
n=10, =0.5
xx
n=20, =0.5
n=30, =0.5
n=5, =0.3 n=20, =0.3
n=10, =0.3 n=50, =0.3
=0.2, n=5 ==00.2.2, ,nn==2200
=0.2, n=10 =0.2, n=50
(四)二项分布的特点
生 生 生 0.2×0.2×0.2=0.008
P (0)
C
0 3
(0.8)
0
(1
0.8)
30
Leabharlann Baidu
0.008
生 生 死 0.2×0.2×0.8=0.032
2
1
生 死 生 0.2×0.8×0.2=0.032 P(1) C31 (0.8)1 (1 0.8)31 0.096
死 生 生 0.2×0.8×0.2=0.032
H0成立时, 400名新生儿中染色体异常例数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该地新生儿染色体异常率不低于一般 H1: < 0,即该地新生儿染色体异常率低于一般 = 0.05
(2) 根据二项分布的分布规律,计算 P 值。
本例0=0.01,n=400,x=1,根据题意需求最多有1例染
(2) 正态近似法: 当 n0 和 n(1-0) 均大于5时,
近似
X ~ Nn 0 , n 0 1 0
p
近似
~
N
0
,
0
1
n
0
可用正态近似法, 按下式计算检验统计量u值。
u X n 0
n 0 1 0

u p0 0 (10 ) / n
例3 据报道,某常规疗法对某种疾病的治愈率为65%。现某 医生用中西医结合疗法治疗了100例该病患者,治愈了80人。 问该中西医结合疗法的疗效是否比常规疗法好?
2、总体率的区间估计 (1)查表法——样本量较小时(n50)
例3.6 某医院皮肤科医师用某种药物治疗20名 系统性红斑狼疮患者,其中8人近期有效,求该法近 期有效率的95%可信区间。
用n=20和x=8查附表7.2百分率的可信区间得该 法近期有效率的95%可信区间为19%64%。
由于附表7百分率的可信区间中值只列出了x n/2的部分,当x>n/2时,应以n -x查表,再从100
B( , n )。
例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验 动物染毒后结局(生存/死亡),……。
一、二项分布的概念及应用条件
2、应用条件:
① n次试验相互独立 ( n 个观察单位相互独立)。 ② 每次试验只有两种可能结果中的某一种(适用
于二分类资料)。
③ 每次试验发生某一种结果的概率 固定不变
1
2
3 合计
表 1 3 只小白鼠染毒后的死亡只数的概率分布
生存数
排列方式
n-x
甲乙 丙
各种排列的概率
(2)
(3)
(4)
3
生 生 生 0.2 0.2 0.2 0.008
死 生 生 0.8 0.2 0.2 0.032
2
生 死 生 0.2 0.8 0.2 0.032
生 生 死 0.2 0.2 0.8 0.032
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
(1)建立检验假设,确定检验水准
H0: = 0,即老年胃溃疡患者胃出血发生率与一般患者相同 H1: > 0,即老年胃溃疡患者胃出血发生率高于一般患者 = 0.05
(2) 计算检验统计量 。
u p 0 0.3158 0.20 5.05 0 (1 0 ) 0.20 (1 0.20)
n
304
(3) 确定P值 , 做出推断结论。查表得, P<0.0005, 按 = 0.05
水准拒绝H0, 接受H1, 认为老年胃溃疡患者较一般患者更易发 生胃出血。
☺小贴士:注意事项
以上各例均为单侧检验, 若需进行双侧检验, 则P值为从H0
规定的总体中抽到现有样本以及更极端(即概率小于等于现有 样本概率)情形的累计概率。
x ~ N n , n 1 或
p
appro.
~
N
,
1
n
二项分布的正态近似示意图
❖二项分布的累计概率:
15
20
25
30
35
40
45
50
55
60
65
k1
k2
三、二项分布的应用
(一)估计总体率的可信区间
1、率的抽样误差
p
1
n
p1 p
sp
n
2、总体率的区间估计
(理论值) (估计值)
三、二项分布的应用
H0: = 0,即新药治愈率与传统药物相同 H1: > 0,即新药治愈率高于传统药物 = 0.05 (2)根据二项分布的分布规律,计算 P 值。
H0成立时,随机抽查的10人中治愈人数x 的分布
PX 8 p(8) p(9) p(10)
C180 8 (1 )2 C190 9 (1 )1 C1100 10 (1 )0
二项分布及其应用
内容提纲
二项分布的概念及应用条件 二项分布的性质 二项分布的特点 二项分布的应用
一、二项分布的概念及应用条件
举例:设小白鼠接受一定剂量的某种 毒物染毒后死亡率为80%。若每组各 用3只小白鼠(甲、乙、丙)接受该 种毒物染毒,观察各组小白鼠的存亡 情况。
死亡数 x
(1) 0
[(1 ) ]n Cn0 (1 )n 0 Cn1 (1 ) n1 1
Cnx (1 )nx x Cnn (1 )0 n
1
p(x) Cnx x 1 nx
p(0) p(1) p(n) 1
例. 求前例中三只小白鼠死亡2只的概率。
p(x 2) C32 21 32 30.82 0.21 0.384
当H0成立时, 100例患者中治愈人数的概率分布
(1)建立检验假设,确定检验水准
H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: > 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05
(2) 计算检验统计量 。
本例, 0 =0.65,n=100, x=80 。
u
X n0
n0 10
相关文档
最新文档