统计学课件Ch06几种离散型变量的分布及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10!
0.55 X (1 0.55)10X
X 9
X 9 X !(10 X )!
=0.023257
按=0.05水准,拒绝H0,接受H1,即认 为实施峡部-峡部吻合术妇女的受孕率要高 于壶腹部-壶腹部吻合术。
例 6-5 已知某种非传染性疾病采用甲药治疗的
有效率为 0.60。今改乙药治疗该疾病患者 10 人,发
0.55+1.96×0.0497=0.6474
即该药物治疗有效率的 95%可信区间为(45.26%,
64.74% )。
(二)样本率与总体率的比较
1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
本 例 n=10 , π=0.70 , X=6 , 7 , 8 。 按 公 式 (6-1)计算相应的概率为
P(6) 10! 0.706 (1 0.70)106 0.20012 6!(10 6)!
P(7) 10! 0.707 (1 0.70)107 0.26683
7!(10 7)!
P(8) 10! 0.708 (1 0.70)108 0.23347
在上面的例6-1中,对这10名非传染 性疾病患者的治疗,可看作10次独立 的重复试验,其疗效分为有效与无效, 且每一名患者治疗有效的概率
(π=0.70)是恒定的。这样,10人 中发生有效的人数X~B(10,0.70)。
(二) 二项分布的性质
1. 二项分布的均数与标准差 在n次独立重 复试验中,出现“阳性”次数X的
第六章
几种离散型变量的 分布及其应用
讲授内容: 第一节 二项分布 第二节 Poisson分布 第三节 负二项分布(不讲)
随机变量有连续型和离散型之分, 相应的概率分布就可分为连续型分布和 离散型分布。有关连续型分布如 u 分布、
t 分布和 F 分布等在前面的章节中已作
了介绍。本章介绍在医学中常用的三种 离散型分布:二项分布、Poisson 分布和 负二项分布。
大,分布趋于对称。当n 时,只要π不
太靠近0或1,二项分布则接近正态分布, 见图6-2。
P(X)
0.5 0.4 0.3 0.2 0.1
0
0
1
2
3
n=2
阳性数X
P(X)
0.4 0.3 0.2 0.1
0 0
12345
n=5
阳性数X
P(X)
0.3
0.3
0.2
0.2
P(X)
0.1
0.1
0
012345678
检验统计量u的计算公式为:
u p1 p2 S p1 p2
S p1 p2
X1 X 2 (1 X1 X 2 )( 1 1 )
n1 n2
n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别 差异,今随机抽查了该职业人群男性120人 和女性110人,发现男性中有36人患有颈椎 病,女性中有22人患有颈椎病。试作统计 推断。
在一般情形下,总体率π往往并不知道。此 时若用样本资料计算样本率p=X/n作为π的 估计值,则 的p 估计为:
S p p(1 p) / n
2.二项分布的图形 对于二项分布而言,当 π=0.5时,分布是对称的,见图6-1;
图 6-1. =0.5 时,不同 n 值下的二项分布
当 0.5时,分布是偏态的,但随着n的增
例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估 计该药物治疗有效率的95%可信区间。
本例 n=100,p=55/100=0.55
Sp
p(1 pS)p 0.55(1 0.55) 0.0497
n
Hale Waihona Puke Baidu
100
0.55-1.96×0.0497=0.4526
=0.058652
0.05<P<0.10,按 =0.05 水准,不拒绝 H0,尚不
能认为甲、乙两种药物的疗效不同。
2.正态近似法 当n较大、p和1-p均不太小, 如np和n(1-p)均大于5时,利用样本率的分 布近似正态分布的原理,可作样本率p与已 知总体率π0的比较。检验统计量u值的计算 公式为:
记 性为该π职2,业其人检群验颈假椎设病为的患病率男性为π1,女 H0:π1=π2
H1:π1≠π2
=0.05
本例 n1=120 , X1=36 , p1=X1/n1=36/120=0.30 ; n2=110,X2=22,p2=X2/n2=22/110=0.20
S p1 p2
36 22 (1 36 22 )( 1 1 ) =0.0573
75%)。
附表6只列出
X
n2的部分。当X
n 2
时,可先按“阴
性”数n-X查得总体阴性率的1 可信区间QL~QU,
再用下面的公式转换成所需的阳性率的 1可信
区间。 PL=1-QU, PU=1-QL
2. 正态近似法 根据数理统计学的中心极限 定理可得,当n较大、π不接近0也不接近1 时,二项分布B(n,π)近似正态分布
u
p 0
0 (1 0 ) n
例6-6 对某疾病采用常规治疗,其治愈率 为45%。现改用新的治疗方法,并随机抽 取180名该疾病患者进行了新疗法的治疗, 治愈117人。问新治疗方法是否比常规疗 法的效果好?
本例是单侧检验,记新治疗方法的治愈率 为π,而π0=0.45。其假设检验为
H0:π=0.45 H1:π>0.45
8!(10 8)!
一、二项分布的适用条件和性质
(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果
之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的
概率π固定不变;
3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出
例6-2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术妇 女受孕率的95%可信区间。
本例n=13,X=6。查附表6,取0.05时,在n=13
(横行)与X=6(纵列)的交叉处数值为19~75,
即该吻合术妇女受孕率的95%可信区间为(19%
例6-8 某研究者为研究某种非遗传性疾病 的家族集聚性,对一社区82户3口人的家庭 进行了该种疾病患病情况调查,所得数据 资料见表6-1中的第(1)、(2)栏。试分 析其家族集聚性。
=0.05
本例n=180,p=117/180=0.65
u 0.65 0.45 5.394 0.45(1 0.45) 180
查u界值表(t界值表中 为 ∞的一行)得
单侧 接果好受。H1
,P 即0.新000的。5 治按疗а=方0.法05比水常准规,疗拒法绝H的0效,
(三)两样本率的比较
N(n,n (1 )) ,而相应的样本率p的分布也近 似 N( , p2) 正态分布。为此,当n较大、 p和1-p均不太小如np和n(1-p)均大于5时, 可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
的1可信区间为:
( p u 2S p , p u 2S p )
如: 的95%可信区间为 ( p 1.96Sp, p 1.96Sp ) 的99%可信区间为 ( p 2.58Sp, p 2.58Sp )
(1)出现“阳性”的次数至多为k次的概率为:
k
k
P(X k) P( X )
n!
X (1 ) n X
X 0
X 0 X !(n X )!
(2)出现“阳性”的次数至少为k次的概率为
n
n
P(X k) P( X )
n!
X (1 ) n X
X k
X k X !(n X )!
P(X i) P(X k) 。
例6-4 据报道,对输卵管结扎了的育龄妇女实施 壶腹部-壶腹部吻合术后,受孕率为0.55。今对10 名输卵管结扎了的育龄妇女实施峡部-峡部吻合术, 结果有9人受孕。问实施峡部-峡部吻合术妇女的 受孕率是否高于壶腹部-壶腹部吻合术?
显然,这是单侧检验的问题,其假设检验为
规律:二项分布 二项式 1 n
展开的通项
P( X )
(
n X
)
X
(1
)nX
P( p)
式中
(
n X
)
n! X!(n
X
)!
且总有 P( X ) 1
二项分布有两个参数:
总体率
样本含量 n
记作:X~B(n,π)
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10 人,试分别计算这10人中有6人、7人、8人 有效的概率。
对于双侧检验而言,由于要回答的是
“有无差别”,即备择假设 H1:π π0 是否
成立,因此,所要计算的双侧检验概率 P 值 应为实际样本(记“阳性”次数为 k 次)出
现的概率与更背离无效假设的事件(记“阳
性”次数为 i 次,i k)出现的概率之和,
即 P P(X k) P(X i) , 其 中 i 满 足 i
总体均数为 n
总体方差为 2 n (1 )
总体标准差为 n (1 )
若以率表示,则样本率p的
总体均数为 p
总体方差为
2 p
(1 )
n
总体标准差为
p
(1 )
n
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
n=8
阳性数X
0 0 1 2 3 4 5 6 7 8 9 10
n=10
阳性数X
图 6-2. =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法
1. 查表法 对于n 50的小样本资料,直接
查附表6百分率的95%或99%可信区间表, 即可得到其总体率的可信区间。
H0:π=0.55
H1:π>0.55
=0.05
对这10名实施峡部-峡部吻合术的妇女,按 0.55的受孕率,若出现至少9人受孕的概率 大于0.05,则不拒绝H0;否则,拒绝H0, 接受H1。
本例n=10,π=0.55,k=9。按公式(6-12) 有:
10
10
P(X 9) P(X )
0.040311
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足
P(X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
P P(X 9) P(X 0) P(X 1) P(X 2) P(X 10)
=0.040311+0.000104858+0.001572864+0.010617 +0.006046618
现 9 人有效。问甲、乙两种药物的疗效是否不同?
显然,这是双侧检验的问题。记乙药治疗该疾病
的有效率为π,其假设检验为
H0:π=0.60
H1:π 0.60
=0.05
本例 n=10,按π=0.60,实际样本阳性数 X =9 出现
的概率由公式(6-1)有
P( X
9)
10! 0.60 9 (1 0.60)109 9!(10 9)!
120 110 120 110 120 110
u 0.30 0.20 =1.745
0.0573
查u界值表得0.05<P<0.10。按=0.05水准,不拒绝H0,即尚 不能认为该职业人群颈椎病的发病有性别差异。
(四)研究非遗传性疾病的家族集聚性
非遗传性疾病的家族集聚性(clustering in families),系指该种疾病的发生在家族成员 间是否有传染性?如果没有传染性,即该 种疾病无家族集聚性,家族成员患病应是 独立的。此时以家族为样本,在n个成员中, 出现X个成员患病的概率分布呈二项分布; 否则,便不服从二项分布。
第一节 二项分布
分类资料:分类个体数。最简单——分两类
总体:总个体数 N 某类个体数 M 非某类个体数 N M 总体率(构成比) M / N
统计推断:由样本信息推断
样本:含量:n
某类个体数 X 非某类个体数 n X
样本率(构成比) p X / n
X 0,1, 2, , n
p 0,1,2, ,n nnn n
两样本率的比较,目的在于对相应的两总体率进 行统计推断。
设两样本率分别为p1和p2,当n1与n2均较大,且 p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1) 及n2p2、n2(1-p2)均大于5时,可利用样本率的分 布近似正态分布,以及独立的两个正态变量之差 也服从正态分布的性质,采用正态近似法对两总 体率作统计推断。