二项分布与泊松分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
400 ! (0.99)399(0.01)1 1!(400 1)!
=0.0180+0.0725=0.0905 因 为 P(X≤ 1)=0.0905> , 故 无 理 由 拒 绝 H0, 即 据 此 样 本 不 能 说 该地新生儿染色体异常率低于一般新生儿。
例 7-6
据 以 往 经 验 新 生 儿 染 色 体 异 常 率 为 0.01,
( p Z 2 S p , p Z 2 S p )
Sp
p(1 p) / n
式中: 0.05 时, Z0.05 2 1.96 ; 0.01 时, Z0.01 2 wenku.baidu.com.58
(二)样本率与总体率的比较
1. 直接法
(1)出现“阳性”的次数 X 至多为 k 次的概率为 P(X k) P( X )
(三)两样本率的比较
设两样本率分别为 p1 和 p2,当n1 与n2均较大,且p1 、 1-p1 及 p2 、 1-p2 均不太小 ,如 n1p1 、 n1(1-p1) 及 n2p2 、 n2(1-p2) 均大于 5 时,可采用正态近似法对两总体率作 统计推断。检验统计量u的计算公式为
p1 p2 Z S p1 p2
第二节 二项分布的性质
一、二项分布的均数与方差 若 X ~ B( n, ), 则
X 的 均 数 X = n
2 X 的 方 差 X = n (1- )
(7-2) (7-3) (7-4)
X 的 标 准 差 X=
n 1
例 7-3
例 7-1 B( n, )=B(3,0.4)的 鼠 死 亡 数 X 的
三、两样本率的比较
(一)总体率区间估计(参见p42)
1. 查表法 对于n 50的小样本资料,根据n与X,直接查附表7。 2. 正态分布法
当 n 较大、 p 和 1-p 均不太小, 如满足 np 和 n(1-p) 均大于 5 时, 可假定样本率 p 的分布近似服从正态分 布,由此来估计总体率的 1 置信区间。计算公式:
3 P( X 1) (1 ) 1 (1 ) 2
(1 )(1 )(1 )
(1 )(1 )
(1 ) (1 ) (1 )(1 )
2
1
死 死 生
(1 )
2 1 P( X 2) ( 3 2 ) (1 )
(a b) ? ? ? ?.......... ...
2 n 2
...
n n 1
n n k 0 k
a b a b a b
n 1 1 k nk
n 0
第一节 二项分布的概念
一、Bernoulli试验
毒性试验:白鼠 临床试验:病人 临床化验:血清 事件 死亡——生存 治愈——未愈 阳性——阴性
四、二项分布的概率计算
例 7-2 如 果 例 7-1 中 的 =0.4, 则 3 只白鼠中死亡白鼠数 X 服从以 n=3、 =0.4 的 二 项 分 布 , 即 X~ B(3,0.4), P(X=0)= P(X=1)= P(X=2)= P(X=3)=
3 0 0
3 1 1
X 各取值的概率:
30
(1 )
(1 )
3
0
死
3 0 P( X 3) ( 3 3 ) (1 )
0 3 3 1 2 3 2 1 3 3 0 ( (1 ))3 3 (1 ) (1 ) (1 ) (1 ) 0 1 2 3 3 k 3 k 3 (1 ) k 0 k
H 0 : 1 2
S p1 p2 (
H1 : 1 2
0.05
23 13 80 85 2.0915 Z 0.0643
23 13 23 13 1 1 )(1 )( ) 0.0643 80 85 80 85 80 85
Sp
例 7-5
p1 p n
(7-7)
抽 居 民 3 0 0 人 的 粪 便 , 检 出 蛔 虫 阳 性 6 0 人 , 求 Sp
60 240 S p 300 300 = 0 . 0 2 3 1 = 2 . 3 1 % 300
第三节 二项分布的应用
一、总体率的区间估计
二、样本率与总体率的比较
三、样本率的均数和标准差 样 本 率 p的 总 体 均 数 样 本 率 p的 总 体 标 准 差
1 1 X (n ) n n
(7-5)
(1 ) 1 p X n n
(7-6)
总 体 率 通 常 未 知 , 采 用 样 本 率 p 代 替 总 体 率 , 有 Sp 为 :
例 7-6
据 以 往 经 验 新 生 儿 染 色 体 异 常 率 为 0.01, 某 研 究 者 想 了
解 当 地 新 生 儿 染 色 体 异 常 是 否 低 于 一 般 , 他 随 机 抽 查 当 地 400 名 新 生 儿,结果 1 名染色体异常,请作统计推断。 H0: =0.01, H1: <0.01 =0.05 P(X≤ 1)= P(X=0)+ P(X=1) =(0.99)400+
成功(A)——失败(非A)
这类“成功─失败型”试验称为Bernoulli试 验。
二、Bernoulli试验序列
n次Bernoulli试验构成了Bernoulli试验序列。 其特点(如抛硬币): (1)每次试验结果,只能是两个互斥的结果之 一(A或非A)。 (2)每次试验的条件不变。即每次试验中,结 果A发生的概率不变,均为 π 。 (3)各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
X 0 k k
X 0
n! X (1 ) n X X !(n X )!
(2)出现“阳性”的次数 X 至少为 k 次的概率为 P(X k) P( X )
X k X k n n
n! X (1 ) n X X !(n X )!
显然,P(X k)+ P(X k)=1+ P(X=k)。
若一个随机变量 X的可能取值是
k = 0,1,… , n, 且 相 应 的 取 值 的 概 率 为 :
n k n k k X P ( = ) = ( k ) (1 )
则 称 此 随 机 变 量 X 服 从 以 n、 为 参 数 的 二 项 分 布 , 记 为 X~ B( n, )。
第七章 二项分布与泊松分布 (Binomial Distribution and Poisson Distribution )
本讲的内容
二项分布
概念、性质、应用 泊松分布
概念、性质、应用
复习中学数学概念
• ①、组合(Combination):从个n元素中抽取x个元 素组成一组(不考虑其顺序)的组合方式个数记 为
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例 7-7
为 研 究 A 、 B 两 地 学 生 的 肺 吸 虫 感 染 率 是 否 相 同 ,某 研 究
者 随 机 抽 取 8 0 名 A 地 学 生 和 8 5 名 B 地 学 生 ,查 得 感 染 人 数 A 地 2 3 , B 地 13。 请 作 统 计 推 断 。 本 例 n1 = 8 0 , n1 p1 = 2 3 , n1 (1 p1 ) = 5 7 ; n2 = 8 5 , n2 p 2 = 1 3 , n2 (1 p 2 ) = 7 2 , 可认为两地学生的肺吸虫感染样本率近似正态分布,故可用 Z 检验。 记 A 地 学 生 肺 吸 虫 感 染 率 为 1 , B 地 学 生 肺 吸 虫 感 染 率 为 2
表 7-1 死 亡 数 存 活 数
3 只 白 鼠 各 种 试 验 结 果 及 其 发 生 概 率
试 验 结 果 甲 生 死 生 生 乙 生 生 死 生 死 生 死 死 丙 生 生 生 死 生 死 死 死 试 验 结 果 的 概 率
X取
值 概 率
X
0 1
3 X
3 2
k 3k P( X ) ( 3 k ) (1 ) 0 3 P( X 0) ( 3 0 ) (1 )
某 研 究 者 随 机 抽 查 当 地 400 名 新 生 儿 , 结 果 1 名 染 色 体异常,问是否该地染色体异常率与以往有所不同。 H0: =0.01, H1: ≠ 0.01 =0.05 双 侧 P=2*P(X≤ 1) =0.181〉 0.05 故 无 理 由 拒 绝 H0, 即 据 此 样 本 不 能 说 该 地 新 生 儿 染 色体异常率与一般新生儿不同。
三、成功次数的概率分布─二项分布
• 例7-1 设某毒理试验采用白鼠共3只,它 们有相同的死亡概率π,相应不死亡概率 为1-π 。记试验后白鼠死亡的例数为X, 分别求X=0、1、2和3的概率
k n k P( X k ) ( n ) (1 ) k k nk n 右侧(n ) (1 ) 为二项式 [ (1 )] 展开式的各项 k
总体均数 总体方差 总体标准差
X = 3 × 0 . 4 = 1 . 2 ( 只 )
2 =3×0.4×0.6=0.72(只 ) X
X = 3 0.4 0.6 = 0 . 8 5 ( 只 )
二、二项分布的正态近似 1. 当 =0.5 时 , 图 形 对 称 ; 当 ≠ 0.5 时 , 图 形 呈 偏 态 , 但 随 n 的 增大,图形逐渐对称。 2 . n 5, 且n(1 ) 5 ( n 大 , 不 接 近 0 、 1 ) 时 , 近似正态分布。
( )0.4 (1 0.4)
( )0.4 (1 0.4)
=0.216
31
=0.432
=CRITBINOM(3,0.4,0.217) =BINOMDIST(1,3,0.4,0)
2 32 (3 ) 0 . 4 ( 1 0 . 4 ) 2 =0.288
3 33 (3 ) 0 . 4 ( 1 0 . 4 ) 3 =0.064
愈率π 0=0.45。新治疗方法是否更好。 检验假设为 H0:π =0.45;H1:π >0.45; =0.05。 本例 n=180,p=117/180=0.65, Z
0.65 0.45 5.394 0.45(1 0.45) 180
查 Z 界值表得单侧 P 0.0005 。按 =0.05 水准,拒绝 H0,接受 H1,即新的治疗方法比常规疗法的效果好。
(n! 为的阶乘, n!=1*2*……*n, 0!=1)
• ②、牛顿二项展开式:
(a b) a 2ab b
2 2
3 3 2 2
2
3
(a b) a 3a b 3ab b
n
( a b) a b a b a b
n n 0 0 n n n n 1 1 n 1 n 2
n n! k k !(n k )!
n k 或 C n k
1 0 1 0 0
3 3! (3)(2)(1) 3 2 2!(3 2)! (2)(1)(1)
10 10! (10)(9)(8)(7)(6)5! 252 5 5!(10 5)! 5!(5)(4)(3)(2)(1)
2.正态近似法
当 n 较大、 p 和 1-p 均不太小, 如 np 和 n(1-p)
均大于 5 时,样本率的分布近似正态分布,可采用检验统计量
Z p 0 ,作样本率 p 与已知总体率π 0 的比较。 0 (1 0 ) n
例
新治疗方法治疗 180 人,117 人治愈。常规治疗方法的治
=0.0180+0.0725=0.0905 因 为 P(X≤ 1)=0.0905> , 故 无 理 由 拒 绝 H0, 即 据 此 样 本 不 能 说 该地新生儿染色体异常率低于一般新生儿。
例 7-6
据 以 往 经 验 新 生 儿 染 色 体 异 常 率 为 0.01,
( p Z 2 S p , p Z 2 S p )
Sp
p(1 p) / n
式中: 0.05 时, Z0.05 2 1.96 ; 0.01 时, Z0.01 2 wenku.baidu.com.58
(二)样本率与总体率的比较
1. 直接法
(1)出现“阳性”的次数 X 至多为 k 次的概率为 P(X k) P( X )
(三)两样本率的比较
设两样本率分别为 p1 和 p2,当n1 与n2均较大,且p1 、 1-p1 及 p2 、 1-p2 均不太小 ,如 n1p1 、 n1(1-p1) 及 n2p2 、 n2(1-p2) 均大于 5 时,可采用正态近似法对两总体率作 统计推断。检验统计量u的计算公式为
p1 p2 Z S p1 p2
第二节 二项分布的性质
一、二项分布的均数与方差 若 X ~ B( n, ), 则
X 的 均 数 X = n
2 X 的 方 差 X = n (1- )
(7-2) (7-3) (7-4)
X 的 标 准 差 X=
n 1
例 7-3
例 7-1 B( n, )=B(3,0.4)的 鼠 死 亡 数 X 的
三、两样本率的比较
(一)总体率区间估计(参见p42)
1. 查表法 对于n 50的小样本资料,根据n与X,直接查附表7。 2. 正态分布法
当 n 较大、 p 和 1-p 均不太小, 如满足 np 和 n(1-p) 均大于 5 时, 可假定样本率 p 的分布近似服从正态分 布,由此来估计总体率的 1 置信区间。计算公式:
3 P( X 1) (1 ) 1 (1 ) 2
(1 )(1 )(1 )
(1 )(1 )
(1 ) (1 ) (1 )(1 )
2
1
死 死 生
(1 )
2 1 P( X 2) ( 3 2 ) (1 )
(a b) ? ? ? ?.......... ...
2 n 2
...
n n 1
n n k 0 k
a b a b a b
n 1 1 k nk
n 0
第一节 二项分布的概念
一、Bernoulli试验
毒性试验:白鼠 临床试验:病人 临床化验:血清 事件 死亡——生存 治愈——未愈 阳性——阴性
四、二项分布的概率计算
例 7-2 如 果 例 7-1 中 的 =0.4, 则 3 只白鼠中死亡白鼠数 X 服从以 n=3、 =0.4 的 二 项 分 布 , 即 X~ B(3,0.4), P(X=0)= P(X=1)= P(X=2)= P(X=3)=
3 0 0
3 1 1
X 各取值的概率:
30
(1 )
(1 )
3
0
死
3 0 P( X 3) ( 3 3 ) (1 )
0 3 3 1 2 3 2 1 3 3 0 ( (1 ))3 3 (1 ) (1 ) (1 ) (1 ) 0 1 2 3 3 k 3 k 3 (1 ) k 0 k
H 0 : 1 2
S p1 p2 (
H1 : 1 2
0.05
23 13 80 85 2.0915 Z 0.0643
23 13 23 13 1 1 )(1 )( ) 0.0643 80 85 80 85 80 85
Sp
例 7-5
p1 p n
(7-7)
抽 居 民 3 0 0 人 的 粪 便 , 检 出 蛔 虫 阳 性 6 0 人 , 求 Sp
60 240 S p 300 300 = 0 . 0 2 3 1 = 2 . 3 1 % 300
第三节 二项分布的应用
一、总体率的区间估计
二、样本率与总体率的比较
三、样本率的均数和标准差 样 本 率 p的 总 体 均 数 样 本 率 p的 总 体 标 准 差
1 1 X (n ) n n
(7-5)
(1 ) 1 p X n n
(7-6)
总 体 率 通 常 未 知 , 采 用 样 本 率 p 代 替 总 体 率 , 有 Sp 为 :
例 7-6
据 以 往 经 验 新 生 儿 染 色 体 异 常 率 为 0.01, 某 研 究 者 想 了
解 当 地 新 生 儿 染 色 体 异 常 是 否 低 于 一 般 , 他 随 机 抽 查 当 地 400 名 新 生 儿,结果 1 名染色体异常,请作统计推断。 H0: =0.01, H1: <0.01 =0.05 P(X≤ 1)= P(X=0)+ P(X=1) =(0.99)400+
成功(A)——失败(非A)
这类“成功─失败型”试验称为Bernoulli试 验。
二、Bernoulli试验序列
n次Bernoulli试验构成了Bernoulli试验序列。 其特点(如抛硬币): (1)每次试验结果,只能是两个互斥的结果之 一(A或非A)。 (2)每次试验的条件不变。即每次试验中,结 果A发生的概率不变,均为 π 。 (3)各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
X 0 k k
X 0
n! X (1 ) n X X !(n X )!
(2)出现“阳性”的次数 X 至少为 k 次的概率为 P(X k) P( X )
X k X k n n
n! X (1 ) n X X !(n X )!
显然,P(X k)+ P(X k)=1+ P(X=k)。
若一个随机变量 X的可能取值是
k = 0,1,… , n, 且 相 应 的 取 值 的 概 率 为 :
n k n k k X P ( = ) = ( k ) (1 )
则 称 此 随 机 变 量 X 服 从 以 n、 为 参 数 的 二 项 分 布 , 记 为 X~ B( n, )。
第七章 二项分布与泊松分布 (Binomial Distribution and Poisson Distribution )
本讲的内容
二项分布
概念、性质、应用 泊松分布
概念、性质、应用
复习中学数学概念
• ①、组合(Combination):从个n元素中抽取x个元 素组成一组(不考虑其顺序)的组合方式个数记 为
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例 7-7
为 研 究 A 、 B 两 地 学 生 的 肺 吸 虫 感 染 率 是 否 相 同 ,某 研 究
者 随 机 抽 取 8 0 名 A 地 学 生 和 8 5 名 B 地 学 生 ,查 得 感 染 人 数 A 地 2 3 , B 地 13。 请 作 统 计 推 断 。 本 例 n1 = 8 0 , n1 p1 = 2 3 , n1 (1 p1 ) = 5 7 ; n2 = 8 5 , n2 p 2 = 1 3 , n2 (1 p 2 ) = 7 2 , 可认为两地学生的肺吸虫感染样本率近似正态分布,故可用 Z 检验。 记 A 地 学 生 肺 吸 虫 感 染 率 为 1 , B 地 学 生 肺 吸 虫 感 染 率 为 2
表 7-1 死 亡 数 存 活 数
3 只 白 鼠 各 种 试 验 结 果 及 其 发 生 概 率
试 验 结 果 甲 生 死 生 生 乙 生 生 死 生 死 生 死 死 丙 生 生 生 死 生 死 死 死 试 验 结 果 的 概 率
X取
值 概 率
X
0 1
3 X
3 2
k 3k P( X ) ( 3 k ) (1 ) 0 3 P( X 0) ( 3 0 ) (1 )
某 研 究 者 随 机 抽 查 当 地 400 名 新 生 儿 , 结 果 1 名 染 色 体异常,问是否该地染色体异常率与以往有所不同。 H0: =0.01, H1: ≠ 0.01 =0.05 双 侧 P=2*P(X≤ 1) =0.181〉 0.05 故 无 理 由 拒 绝 H0, 即 据 此 样 本 不 能 说 该 地 新 生 儿 染 色体异常率与一般新生儿不同。
三、成功次数的概率分布─二项分布
• 例7-1 设某毒理试验采用白鼠共3只,它 们有相同的死亡概率π,相应不死亡概率 为1-π 。记试验后白鼠死亡的例数为X, 分别求X=0、1、2和3的概率
k n k P( X k ) ( n ) (1 ) k k nk n 右侧(n ) (1 ) 为二项式 [ (1 )] 展开式的各项 k
总体均数 总体方差 总体标准差
X = 3 × 0 . 4 = 1 . 2 ( 只 )
2 =3×0.4×0.6=0.72(只 ) X
X = 3 0.4 0.6 = 0 . 8 5 ( 只 )
二、二项分布的正态近似 1. 当 =0.5 时 , 图 形 对 称 ; 当 ≠ 0.5 时 , 图 形 呈 偏 态 , 但 随 n 的 增大,图形逐渐对称。 2 . n 5, 且n(1 ) 5 ( n 大 , 不 接 近 0 、 1 ) 时 , 近似正态分布。
( )0.4 (1 0.4)
( )0.4 (1 0.4)
=0.216
31
=0.432
=CRITBINOM(3,0.4,0.217) =BINOMDIST(1,3,0.4,0)
2 32 (3 ) 0 . 4 ( 1 0 . 4 ) 2 =0.288
3 33 (3 ) 0 . 4 ( 1 0 . 4 ) 3 =0.064
愈率π 0=0.45。新治疗方法是否更好。 检验假设为 H0:π =0.45;H1:π >0.45; =0.05。 本例 n=180,p=117/180=0.65, Z
0.65 0.45 5.394 0.45(1 0.45) 180
查 Z 界值表得单侧 P 0.0005 。按 =0.05 水准,拒绝 H0,接受 H1,即新的治疗方法比常规疗法的效果好。
(n! 为的阶乘, n!=1*2*……*n, 0!=1)
• ②、牛顿二项展开式:
(a b) a 2ab b
2 2
3 3 2 2
2
3
(a b) a 3a b 3ab b
n
( a b) a b a b a b
n n 0 0 n n n n 1 1 n 1 n 2
n n! k k !(n k )!
n k 或 C n k
1 0 1 0 0
3 3! (3)(2)(1) 3 2 2!(3 2)! (2)(1)(1)
10 10! (10)(9)(8)(7)(6)5! 252 5 5!(10 5)! 5!(5)(4)(3)(2)(1)
2.正态近似法
当 n 较大、 p 和 1-p 均不太小, 如 np 和 n(1-p)
均大于 5 时,样本率的分布近似正态分布,可采用检验统计量
Z p 0 ,作样本率 p 与已知总体率π 0 的比较。 0 (1 0 ) n
例
新治疗方法治疗 180 人,117 人治愈。常规治疗方法的治