医学统计学二项分布 课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-3-12 柏建岭讲稿 35
率的抽样分布特点
当总体率<0.5时为正偏态;当>0.5时为负
偏态,当=0.5时为对称分布。
在n较大,且率和(1- )都不太小时即n和 n(1-)均大于5,率的抽样分布近似正态分布。
2013-3-12
2013-3-12 柏建岭讲稿 26
二项分布的图形
三只小白鼠死亡的二项分布(n=3, =0.8)
2013-3-12 柏建岭讲稿 27
二项分布的图形
某毒物的50%致死剂量后5只动物死亡数的二项分布(n=5, =0.5 )
2013-3-12 柏建岭讲稿 28
二项分布的图形
0.4 P(X) 0.3 n =20 =0.5 n =5 =0.3 n =10 =0.3 n =30 =0.3
X
0 1
生存数 n-X 3
2
2 3
1 0
如果计算生与死的顺序,则共有8种排列方式;如果只计生存与 死亡的数目,则只有4种组合方式。
2013-3-12 柏建岭讲稿 7
概率的乘法法则
几个独立事件同时发生的概率,等于各独 立事件的概率之积 。 一个事件发生(的概率)对另一个事件发生 (的概率)没有影响,这两个事件就是独立事 件。
2013-3-12 柏建岭讲稿
20
二项分布的性质
如果X~B(n, ),则:
X的均数: X的方差: X的标准差:
X n n (1 )
2 X
X n (1 )
2013-3-12
柏建岭讲稿
21
二项分布的性质
若均数与标准差不用绝对数而用率表示时
1 1 p X n n n 1 2 1 2 p X n (1 ) (1 ) n n 1 1 (1 ) p X n (1 ) n n n sp p(1 p ) n
1 5 1
51
二 项 分 布
P(2) C (1 0.5)
2 5
52
(0.5) 0.31250
2
3 P(3) C5 (1 0.5)53 (0.5)3 0.31250 4 P(4) C5 (1 0.5)54 (0.5)4 0.15625 5 P(5) C5 (1 0.5)55 (0.5)5 0.03125
2013-3-12 柏建岭讲稿 12
出现每一种可能结果的概率是多少?
3只小白鼠2死1生的概率 P1=0.20.80.8=0.128 P2=0.80.20.8=0.128 P=0.384 P3=0.80.80.2=0.128 3只小白鼠均死亡的概率 P=0.80.80.8=0.512
• 例已知某种动物关于某毒物的50%致
死剂量(LD50),现有5只这样的动物注 射了该剂量,试分别计算死亡动物数X
=0,l,2,3,4,5的概率。
2013-3-12
柏建岭讲稿
19
二项分布的概率
0 P(0) C5 (1 0.5)50 (0.5)0 0.03125
P(1) C (1 0.5) (0.5) 0.15625
B={数字6朝上},则P(B)=1/6
求A或者B发生的概率?
P(A+B) = P(A)+ P(B) =1/6+1/6=1/3
2013-3-12 柏建岭讲稿 11
出现每一种可能结果的概率是多少?
3只小白鼠均生存的概率 P=0.20.20.2=0.008 3只小白鼠2生1死的概率 P1=0.20.20.8=0.032 P2=0.20.80.2=0.032 P=0.096 P3=0.80.20.2=0.032
2013-3-12 柏建岭讲稿 9
概率的加法法则
互不相容事件和的概率等于各事件的概率 之和。 不可能同时发生的事件是互不相容事件, 又称互斥事件。
2013-3-12
柏建岭讲稿
10
例子
投掷一枚质地均匀的馓子,求“数字4朝上” 或“数字6朝上”的概率?
已知: A={数字4朝上},则P(A)=1/6
P ( X k ) P( X ) 1 P( X k 1)
k n
n X P( X 1) P( X ) X 1 1
其中,X=0,1,2,…,k,…,n。
2013-3-12 柏建岭讲稿 24
二项分布的累计概率
• 例 据以往经验,用某药治疗小儿上呼吸道 感染、支气管炎,有效率为85%,今有5个 患者用该药治疗,问:①最多1人有效的概 率为多少?②至少3人有效的概率为多少?
2013-3-12
柏建岭讲稿
8
例子
甲、乙射击命中目标的概率分别是1/2与1/3, 求甲、乙各射击一次,同时命中目标的概 率是多少? 已知: A={甲命中目标},则P(A)=1/2 B={乙命中目标},则P(B)=1/3 求A、B同时发生的概率P(AB)? P (AB) = P(A) * P(B) = 1/2 * 1/3 = 1/6
2013-3-12
柏建岭讲稿
25
• 本例 =0.85,l- =0.15,n =5,依题意, • 最多1人有效的概率为: 1 P(X 1) P(0) P(1) 0.155 C5 (0.15)51 0.85 0.002227501
• 至少3人有效的概率为: P(X≥3)=P(3)+P(4)+P(5)
2013-3-12
Page 17
柏建岭讲稿
17
如已知n=3,=0.8,则恰有1例阳性的概 率P(1)为:
P(1)
1 n 1 1 C n (1 )
3! 31 1 (1 0.8) 0.8 0.096 1! (3 1)!
2013-3-12
柏建岭讲稿
18
二项分布的概率
2013-3-12
柏建岭讲稿
16
二项分布的定义
从阳性率为的总体中随机抽取含量为n的 样本,恰有X例阳性的概率为:
P ( X ) C (1 )
X n n X
, X 0,1, 2,, n
X
则称X服从参数为的二项分布(Binomial Distribution),记为:X~B(n,)。其中参数 常常是未知的,而n由实验者确定。
2013-3-12
柏建岭讲稿
30
二项分布的应用条件
各观察单位只能有互相对立的一种结果, 如阳性或阴性,生存或死亡等。
已知发生某一结果(如阴性)的概率不变, 其对立结果(如阳性)的概率则为1-。
n次试验在相同条件下进行,且各观察单位 的结果互相独立。
2013-3-12
柏建岭讲稿
31
率的抽样误差
( 0.2 +0.8 )3 = 0.23 + 3×0.22×0.8 + 3×0.2×0.82 + 0.83
生存 死亡 概率 概率
三生
二生一死
一生二死
三死
二项式展开式中的各项对应于各死亡数(X)的概率P(X),二项分布由此得名。
2013-3-12 柏建岭讲稿 15
二项分布的定义
• 二项分布是指在只会产生两种可能结果如 “阳性”或“阴性”之一的n次独立重复实 验中,当每次试验“阳性”概率保持不变 时,出现“阳性”的次数 X=0,1,2,… , n的一种概率分布。
Medical statistics
医学统计学
二项分布
柏建岭 bjlcn@163.com 南京医科大学公共卫生学院 流行病与卫生统计学系
主要内容
数据分布
二项分布
2013-3-12
柏建岭讲稿
2
数据分布
对于一组变量值,若以该变量为横轴,数 据出现的频数(或频率)为纵轴作图,该数 据在坐标系中呈一定的图形,称为数据的 分布。
2013-3-12 柏建岭讲稿 5
先看一个例子
已知:小白鼠接受某种毒物一定剂量时, 死亡概率=80% 生存概率=20% 每只鼠独立做实验,相互不受影响 若每组各用3只小白鼠(甲、乙、丙) 3只小白鼠的存亡方式符合二项分布
2013-3-12
柏建岭讲稿
6
你认为实验结果将会出现多少种可能的情况?
所有可能结果 甲乙丙 生生生 生生死 生死生 死生生 生死死 死生死 死死生 死死死 死亡数
0
1 0 0 1 0 1 0
1
4 2 3 4 2 7 1
0.1
0.4 0.2 0.3 0.4 0.2 0.7 0.1
33
柏建岭讲稿
率的抽样误差
从 =0.3中随机抽样,样本含量为10的 10000个样本率的频率分布图
2013-3-12 柏建岭讲稿 34
率的抽样误差
从 =0.3中随机抽样,样本含量为100的 10000个样本率的频率分布图
3
4 5 6 7 8 9 10
2013-3-12
0
0 1 0 1 0 1 0
0
1 0 0 0 0 1 1
1
0 0 0 0 0 1 0
0
1 0 0 0 0 1 0
0
1 0 1 1 0Biblioteka Baidu0 0
0
0 0 0 0 0 1 0
0
0 0 0 1 1 0 0
0
0 1 1 0 0 0 0
0
0 0 1 0 1 1 0
0.2
0.1
0.0 4
2013-3-12
8
12
16
0 2 4
0 2 4 6 X
4
8
12
16
29
柏建岭讲稿
二项分布的图形
• 当=0.5,分布对称;当 0.5,分布呈偏态; • 当<0.5时分布呈正偏态;当>0.5时分布呈负偏 态;特别是当n值不是很大时,偏离0.5愈远,分 布愈偏。 • 随着n的增大,二项分布逐渐逼近正态分布。 • 一般地说,如果n和n(1-)大于5时,常可用正态 近似原理处理二项分布问题。
2013-3-12
柏建岭讲稿
3
数据分布
分布是统计方法产生的基础 常用的数据分布有正态分布、二项分布、 Poisson分布等
2013-3-12
柏建岭讲稿
4
二项分布(binomial distribution)
二分类资料:观察对象的结局只有相互对 立的两种结果。 例如: 生存、死亡 阳性、阴性 发病、不发病 治愈、未愈
2013-3-12 柏建岭讲稿 13
三只小白鼠存亡的排列和组合方式及其概率的计算
所有可能结果 甲乙丙 每种结果的概率 死亡数 生存数 不同死亡数的概率
X Cn (1 )n X X
(1 )n X X
0.2×0.2×0.2 0.2×0.2×0.8 0.2×0.8×0.2 0.8×0.2×0.2 0.2×0.8×0.8 0.8×0.2×0.8 0.8×0.8×0.2 0.8×0.8×0.8 1
柏建岭讲稿 22
2013-3-12
二项分布的累计概率
• 从阳性率为的总体中随机抽取n个个体, 则 ① 最多有k例阳性的概率:
P ( X k ) P ( X ) P ( 0) P (1) ... P ( k )
0 k
2013-3-12
柏建岭讲稿
23
二项分布的累计概率
• 从阳性率为的总体中随机抽取n个个体, 则 ② 最少有k例阳性的概率:
5 ! P(3) (0.15) 2 (0.85) 3 0.138178125 3 (5 3) ! ! 53 0.85 P(4) P(3 1) 0.138178125 0.391504688 3 1 1 0.85 P(5) 0.855 0.443705313 则 P(X≥3)=0.138178125+0.391504688+0.443705313 =0.973388126
X
0 1
n-X
生生生 生生死 生死生 死生生 生死死 死生死 死死生 死死死
3 2
0.008 0.096
2 3
1 0
0.384 0.512 1.000
14
2013-3-12
柏建岭讲稿
二项展开
对应于二项展开式:
1 (1 ) (1 )n 0 C n (1 )n 1 1 C nX (1 )n X X n n C n 1 (1 )1 n 1 (1 )0 n
0 1 0
=0.3
1 1 0
p = 0.4
0
0 0 1
2013-3-12
柏建岭讲稿
32
率的抽样误差
从 =0.3中随机抽样,样本含量为10的 10份独立样本的样本率
样本号 1 2 x1 0 0 x2 0 1 x3 1 0 x4 0 0 x5 0 1 x6 1 1 x7 0 1 x8 1 0 x9 0 0 x10 0 1 X 3 5 p 0.3 0.5
率的抽样分布特点
当总体率<0.5时为正偏态;当>0.5时为负
偏态,当=0.5时为对称分布。
在n较大,且率和(1- )都不太小时即n和 n(1-)均大于5,率的抽样分布近似正态分布。
2013-3-12
2013-3-12 柏建岭讲稿 26
二项分布的图形
三只小白鼠死亡的二项分布(n=3, =0.8)
2013-3-12 柏建岭讲稿 27
二项分布的图形
某毒物的50%致死剂量后5只动物死亡数的二项分布(n=5, =0.5 )
2013-3-12 柏建岭讲稿 28
二项分布的图形
0.4 P(X) 0.3 n =20 =0.5 n =5 =0.3 n =10 =0.3 n =30 =0.3
X
0 1
生存数 n-X 3
2
2 3
1 0
如果计算生与死的顺序,则共有8种排列方式;如果只计生存与 死亡的数目,则只有4种组合方式。
2013-3-12 柏建岭讲稿 7
概率的乘法法则
几个独立事件同时发生的概率,等于各独 立事件的概率之积 。 一个事件发生(的概率)对另一个事件发生 (的概率)没有影响,这两个事件就是独立事 件。
2013-3-12 柏建岭讲稿
20
二项分布的性质
如果X~B(n, ),则:
X的均数: X的方差: X的标准差:
X n n (1 )
2 X
X n (1 )
2013-3-12
柏建岭讲稿
21
二项分布的性质
若均数与标准差不用绝对数而用率表示时
1 1 p X n n n 1 2 1 2 p X n (1 ) (1 ) n n 1 1 (1 ) p X n (1 ) n n n sp p(1 p ) n
1 5 1
51
二 项 分 布
P(2) C (1 0.5)
2 5
52
(0.5) 0.31250
2
3 P(3) C5 (1 0.5)53 (0.5)3 0.31250 4 P(4) C5 (1 0.5)54 (0.5)4 0.15625 5 P(5) C5 (1 0.5)55 (0.5)5 0.03125
2013-3-12 柏建岭讲稿 12
出现每一种可能结果的概率是多少?
3只小白鼠2死1生的概率 P1=0.20.80.8=0.128 P2=0.80.20.8=0.128 P=0.384 P3=0.80.80.2=0.128 3只小白鼠均死亡的概率 P=0.80.80.8=0.512
• 例已知某种动物关于某毒物的50%致
死剂量(LD50),现有5只这样的动物注 射了该剂量,试分别计算死亡动物数X
=0,l,2,3,4,5的概率。
2013-3-12
柏建岭讲稿
19
二项分布的概率
0 P(0) C5 (1 0.5)50 (0.5)0 0.03125
P(1) C (1 0.5) (0.5) 0.15625
B={数字6朝上},则P(B)=1/6
求A或者B发生的概率?
P(A+B) = P(A)+ P(B) =1/6+1/6=1/3
2013-3-12 柏建岭讲稿 11
出现每一种可能结果的概率是多少?
3只小白鼠均生存的概率 P=0.20.20.2=0.008 3只小白鼠2生1死的概率 P1=0.20.20.8=0.032 P2=0.20.80.2=0.032 P=0.096 P3=0.80.20.2=0.032
2013-3-12 柏建岭讲稿 9
概率的加法法则
互不相容事件和的概率等于各事件的概率 之和。 不可能同时发生的事件是互不相容事件, 又称互斥事件。
2013-3-12
柏建岭讲稿
10
例子
投掷一枚质地均匀的馓子,求“数字4朝上” 或“数字6朝上”的概率?
已知: A={数字4朝上},则P(A)=1/6
P ( X k ) P( X ) 1 P( X k 1)
k n
n X P( X 1) P( X ) X 1 1
其中,X=0,1,2,…,k,…,n。
2013-3-12 柏建岭讲稿 24
二项分布的累计概率
• 例 据以往经验,用某药治疗小儿上呼吸道 感染、支气管炎,有效率为85%,今有5个 患者用该药治疗,问:①最多1人有效的概 率为多少?②至少3人有效的概率为多少?
2013-3-12
柏建岭讲稿
8
例子
甲、乙射击命中目标的概率分别是1/2与1/3, 求甲、乙各射击一次,同时命中目标的概 率是多少? 已知: A={甲命中目标},则P(A)=1/2 B={乙命中目标},则P(B)=1/3 求A、B同时发生的概率P(AB)? P (AB) = P(A) * P(B) = 1/2 * 1/3 = 1/6
2013-3-12
柏建岭讲稿
25
• 本例 =0.85,l- =0.15,n =5,依题意, • 最多1人有效的概率为: 1 P(X 1) P(0) P(1) 0.155 C5 (0.15)51 0.85 0.002227501
• 至少3人有效的概率为: P(X≥3)=P(3)+P(4)+P(5)
2013-3-12
Page 17
柏建岭讲稿
17
如已知n=3,=0.8,则恰有1例阳性的概 率P(1)为:
P(1)
1 n 1 1 C n (1 )
3! 31 1 (1 0.8) 0.8 0.096 1! (3 1)!
2013-3-12
柏建岭讲稿
18
二项分布的概率
2013-3-12
柏建岭讲稿
16
二项分布的定义
从阳性率为的总体中随机抽取含量为n的 样本,恰有X例阳性的概率为:
P ( X ) C (1 )
X n n X
, X 0,1, 2,, n
X
则称X服从参数为的二项分布(Binomial Distribution),记为:X~B(n,)。其中参数 常常是未知的,而n由实验者确定。
2013-3-12
柏建岭讲稿
30
二项分布的应用条件
各观察单位只能有互相对立的一种结果, 如阳性或阴性,生存或死亡等。
已知发生某一结果(如阴性)的概率不变, 其对立结果(如阳性)的概率则为1-。
n次试验在相同条件下进行,且各观察单位 的结果互相独立。
2013-3-12
柏建岭讲稿
31
率的抽样误差
( 0.2 +0.8 )3 = 0.23 + 3×0.22×0.8 + 3×0.2×0.82 + 0.83
生存 死亡 概率 概率
三生
二生一死
一生二死
三死
二项式展开式中的各项对应于各死亡数(X)的概率P(X),二项分布由此得名。
2013-3-12 柏建岭讲稿 15
二项分布的定义
• 二项分布是指在只会产生两种可能结果如 “阳性”或“阴性”之一的n次独立重复实 验中,当每次试验“阳性”概率保持不变 时,出现“阳性”的次数 X=0,1,2,… , n的一种概率分布。
Medical statistics
医学统计学
二项分布
柏建岭 bjlcn@163.com 南京医科大学公共卫生学院 流行病与卫生统计学系
主要内容
数据分布
二项分布
2013-3-12
柏建岭讲稿
2
数据分布
对于一组变量值,若以该变量为横轴,数 据出现的频数(或频率)为纵轴作图,该数 据在坐标系中呈一定的图形,称为数据的 分布。
2013-3-12 柏建岭讲稿 5
先看一个例子
已知:小白鼠接受某种毒物一定剂量时, 死亡概率=80% 生存概率=20% 每只鼠独立做实验,相互不受影响 若每组各用3只小白鼠(甲、乙、丙) 3只小白鼠的存亡方式符合二项分布
2013-3-12
柏建岭讲稿
6
你认为实验结果将会出现多少种可能的情况?
所有可能结果 甲乙丙 生生生 生生死 生死生 死生生 生死死 死生死 死死生 死死死 死亡数
0
1 0 0 1 0 1 0
1
4 2 3 4 2 7 1
0.1
0.4 0.2 0.3 0.4 0.2 0.7 0.1
33
柏建岭讲稿
率的抽样误差
从 =0.3中随机抽样,样本含量为10的 10000个样本率的频率分布图
2013-3-12 柏建岭讲稿 34
率的抽样误差
从 =0.3中随机抽样,样本含量为100的 10000个样本率的频率分布图
3
4 5 6 7 8 9 10
2013-3-12
0
0 1 0 1 0 1 0
0
1 0 0 0 0 1 1
1
0 0 0 0 0 1 0
0
1 0 0 0 0 1 0
0
1 0 1 1 0Biblioteka Baidu0 0
0
0 0 0 0 0 1 0
0
0 0 0 1 1 0 0
0
0 1 1 0 0 0 0
0
0 0 1 0 1 1 0
0.2
0.1
0.0 4
2013-3-12
8
12
16
0 2 4
0 2 4 6 X
4
8
12
16
29
柏建岭讲稿
二项分布的图形
• 当=0.5,分布对称;当 0.5,分布呈偏态; • 当<0.5时分布呈正偏态;当>0.5时分布呈负偏 态;特别是当n值不是很大时,偏离0.5愈远,分 布愈偏。 • 随着n的增大,二项分布逐渐逼近正态分布。 • 一般地说,如果n和n(1-)大于5时,常可用正态 近似原理处理二项分布问题。
2013-3-12
柏建岭讲稿
3
数据分布
分布是统计方法产生的基础 常用的数据分布有正态分布、二项分布、 Poisson分布等
2013-3-12
柏建岭讲稿
4
二项分布(binomial distribution)
二分类资料:观察对象的结局只有相互对 立的两种结果。 例如: 生存、死亡 阳性、阴性 发病、不发病 治愈、未愈
2013-3-12 柏建岭讲稿 13
三只小白鼠存亡的排列和组合方式及其概率的计算
所有可能结果 甲乙丙 每种结果的概率 死亡数 生存数 不同死亡数的概率
X Cn (1 )n X X
(1 )n X X
0.2×0.2×0.2 0.2×0.2×0.8 0.2×0.8×0.2 0.8×0.2×0.2 0.2×0.8×0.8 0.8×0.2×0.8 0.8×0.8×0.2 0.8×0.8×0.8 1
柏建岭讲稿 22
2013-3-12
二项分布的累计概率
• 从阳性率为的总体中随机抽取n个个体, 则 ① 最多有k例阳性的概率:
P ( X k ) P ( X ) P ( 0) P (1) ... P ( k )
0 k
2013-3-12
柏建岭讲稿
23
二项分布的累计概率
• 从阳性率为的总体中随机抽取n个个体, 则 ② 最少有k例阳性的概率:
5 ! P(3) (0.15) 2 (0.85) 3 0.138178125 3 (5 3) ! ! 53 0.85 P(4) P(3 1) 0.138178125 0.391504688 3 1 1 0.85 P(5) 0.855 0.443705313 则 P(X≥3)=0.138178125+0.391504688+0.443705313 =0.973388126
X
0 1
n-X
生生生 生生死 生死生 死生生 生死死 死生死 死死生 死死死
3 2
0.008 0.096
2 3
1 0
0.384 0.512 1.000
14
2013-3-12
柏建岭讲稿
二项展开
对应于二项展开式:
1 (1 ) (1 )n 0 C n (1 )n 1 1 C nX (1 )n X X n n C n 1 (1 )1 n 1 (1 )0 n
0 1 0
=0.3
1 1 0
p = 0.4
0
0 0 1
2013-3-12
柏建岭讲稿
32
率的抽样误差
从 =0.3中随机抽样,样本含量为10的 10份独立样本的样本率
样本号 1 2 x1 0 0 x2 0 1 x3 1 0 x4 0 0 x5 0 1 x6 1 1 x7 0 1 x8 1 0 x9 0 0 x10 0 1 X 3 5 p 0.3 0.5