几种离散型变量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0 1 2 n p , , ,… , n n n n
案例2:
抛一枚均匀硬币, 正面朝上的出现次数X及其概率: 0 (正面朝下) 1 (正面朝上)
π
0.5
0.5
如果将此试验重复若干次,如 10 次,正面朝上的 出现次数 X 可以为0,1,2,…,10, 则正面朝上的出现 次数 X 的分布即为二项分布。
二项函数 1 展开式的通项
n
n! P( X ) X (1 ) n X X 0,1, 2, , n X !( n X )!
n! X !(n X )!
式中
且总有
二项系数
P( X ) 1
二项分布有两个参数:
总体率 样本含量
A、单侧检验,即“劣” 或“优” 的问题 ( 1 )回答“差”或“低”的问题,则需计算 出现“阳性”的次数至多为k次的概率为:
P( X k )
P( X )
X 0
k
k
X 0
n! X (1 ) n X X !( n X )!
( 2 )回答“优”或“高”的问题,则需计算 出现“阳性”的次数至少为k次的概率为
例6-3 在观测一种药物对某种非传染性疾病的治疗 效果时,用该药治疗了此种非传染性疾病患者100 人,发现55人有效,试据此估计该药物治疗有效率 的95%可信区间。
本例 n=100,p=55/100=0.55
Sp p (1 p ) Sp n 0.55(1 0.55) 0.0497 100
10! 6 106 P(6) 0.70 (1 0.70) 0.20012 6! (10 6)!
10! 7 107 P(7) 0.70 (1 0.70) 0.26683 7! (10 7)!
10! 8 108 P (8) 0.70 (1 0.70 ) 0.23347 8! (10 8)!
0.55-1.96×0.0497=0.4526 0.55+1.96×0.0497=0.6474 即该药物治疗有效率的 95% 可信区间为( 45.26% , 64.74% ) 。
(二)样本率与总体率的比较( 与 0 的比较 )
1.直接法 可利用二项分布直接计算有关概率, 对样本率与总体率的差异进行有无统计学意 义的比较。 比较时,在总体阳性率为 π 的 n 次独立重复 试验中,一般有下面几种情形的概率计算:
H0:π=0.60 H1:π≠ 0.60 ɑ =0.05 本例n=10,按π=0.60,实际样本阳性数 X =9出现的概率由公式(6-1)有
10! P( X 9) 0.609 (1 0.60)109 0.040311 9!(10 9)!
π=0.6
比实际样本更背离无效假设的事件,即满足
1. 二项分布的均数与标准差 在 n 次独立重复试验中,出现“阳性”次数 X 的 总体均数为
n
2
总体方差为 总体标准差为
n (1 )
n (1 )


若以率表示,则样本阳性率 p ( p=0/n , 1/n,2/n,…,n/n)也服从二项分布,其 p 总体均数为 总体方差为
第一节 二项分布
分类资料:将观察单位按某种属性或类别分 组,计分类个体数。最简单——分两类
总体:总个体数 N 某类个体数 M 非某类个体数 N M 总体率(构成比) M / N
统计推断:由样本信息P 推断
样本:含量:n 某类个体数 X 非某类个体数 n X p X / n 样本率(构成比) X 0,1, 2,… , n
P( X i) 0.040311的i(i ≠ 9)分别有:0、1、2、
10。
因此,所要计算的双侧检验概率P值为
P P( X 9) P( X 0) P( X 1) P( X 2) P( X 10)
=0.040311+0.000104858+0.001572864+0.010617+0. 006046618
u
p 0
0 (1 0 ) n


例 6-6
对某疾病采用常规治疗的治愈率为45%。
现随机抽取180名该疾病患者改用新的治疗方法 进行治疗,治愈117人。问新治疗方法是否比常 规疗法的效果好? 本例是单侧检验,记新治疗方法的治愈率为 π, 而π0=0.45。其假设检验为

H0:π=0.45
其中i满足 P( X i) P( X k ) 。
i
k)出现的概率之和,即 P P( X k ) P( X i) ,

例6-4 据报道,对输卵管结扎了的育龄妇女实施 壶腹部 -壶腹部吻合术后,受孕率为0.55。今对10 名输卵管结扎了的育龄妇女实施峡部-峡部吻合术, 结果有 9 人受孕。问实施峡部 - 峡部吻合术妇女的 受孕率是否高于壶腹部-壶腹部吻合术? 显然,这是单侧检验的问题,其假设检验为
按 ɑ =0.05 水准,拒绝 H0 ,接受 H1 ,即认为实 施峡部 - 峡部吻合术妇女的受孕率要高于壶腹部 -

壶腹部吻合术。
例6-5 已知某种非传染性疾病采用甲药治疗 的有效率为0.60。今改乙药治疗该疾病患者 10人,发现9人有效。问甲、乙两种药物的 疗效是否不同?
这是双侧检验的问题。记乙药治疗该疾病 的有效率为π


H1:π>0.45

=0.05

本例n=180,p=117/180=0.65
u

0.65 0.45 0.45(1 0.45) 180
5.394
查u界值表(t界值表中 为 ∞的一行)得 单侧 P 0.0005 。按 α=0.05水准,拒绝H0, 接受 H1 ,即新的治疗方法比常规疗法的效 果好。 P697
=0.058652

0.05<P<0.10 ,按 ɑ=0.05 水准,不拒绝 H0 ,尚不能认为甲、
乙两种药物的疗效不同。

2.正态近似法 当n 较大、p 和1-p 均不太小,如 np 和n(1-p)均大于5时,利用样本率的分布近似正 态分布的原理,可作样本所在总体率 与已知总体 率π0的比较。检验统计量u 值的计算公式为:
见图6-2。
0.5 0.4 0.3 0.2 0.1 0 0
0.3
0.4 0.3
P(X)
P(X)
0.2 0.1 0 0 1 2 n=5 3 阳性数X 4 5
1 n=2
2 阳性数X
3
0.3 0.2 0.1 0 0 1 2 3 4 n=10 5 6 7 8 阳性数X
P(X)
0.1 0 0 1 2 3 n=8 4 5 6 7

Sp
p (1 p ) / n
2.二项分布的图形
对于二项分布而言,当π=0.5时,分布是对 称的,见图6-1;
图 6-1.
=0.5 时,不同 n 值下的二项分布

当 0.5时,分布是偏态的,但随着n的增
大,分布趋于对称。当n 时,只要π不
太靠近 0 或 1 ,二项分布则接近正态分布,
8
P(X)
0.2
阳性数X
9 10
图6-2.
=0.4时,不同n值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 对于n 50的小样本资料,直接查附表6百
分率的95%或99%可信区间表,即可得到其 总体率的可信区间。
P709-713

例6-2
在对13名输卵管结扎的育龄妇女经

n
记作:X~B(n,π)
X 服从试验次数为n 和“阳性”的概率为π的 二项分布
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10人, 试分别计算这10人中有6人、7人、8人有效 的概率。 本例n=10,π=0.70,X=6,7,8。按公式(61)计算相应的概率为
p
2

(1 )
n
(1 )
n

总体标准差为
p

样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率 π 往往并不知道。 此时若用样本资料计算样本率 p=X/n作为π 的估计值,则 p 的估计为:
P(X k) P ( X )
X k n n X k
n! X (1 ) n X X !( n X )!
B、双侧检验,即“有无差别”的问题

所要计算的双侧检验概率P 值应为实际样本
(记“阳性”次数为k次)出现的概率与更背
i 离无效假设的事件(记“阳性”次数为i次,
第六章
几种离散型变量的 分布及其应用
讲授内容: 第一节 二项分布 第二节 Poisson分布
随机变量有连续型和离散型之分, 相应的概率分布就可分为连续型分布和 离散型分布。有关连续型分布如 u 分布、
t 分布和Байду номын сангаасF 分布等在前面的章节中已作
了介绍。本章介绍在医学中常用的三种 离散型分布:二项分布、Poisson 分布和 负二项分布。
(三)两样本率的比较( 1与 2 的比较 )
目的:对相应的两总体率进行统计推断。
当n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5
时,可利用样本率的分布近似正态分布,以 及独立的两个正态变量之差也服从正态分布 的性质,采用正态近似法对两总体率作统计
推断。

检验统计量u的计算公式为:
定义:
二项分布(binomial distribution),是指在
只会产生两种可能结果如“阳性”或“阴 性”之一的n次独立重复试验中,当每次试 验的“阳性”概率π保持不变时,出现“阳 性”次数X=0,1,2,…,n的一种概率分 布。
0,1,2,……n
在n次独立重复试验中出现阳性次数X的概率 :



H0:π=π0=0.55
H1:π>0.55
ɑ =0.05
π=0.55
本例 n=10,π=0.55,k=9。按公式(6-12)有:
P(X 9) P ( X )
X 9 10 10 X 9
10! 0.55 X (1 0.55)10 X X !(10 X )!
=0.023257
n n 的部分。当 X X 2 2
时,可
PL=1-QU, PU=1-QL
?
n=30, X=26, 95%CI
2. 正态近似法
根据数理统计学的中心极限定理可得,当n 较 大、π不接近0也不接近1时,二项分布B(n,π)近 似正态分布 N ( n , n (1 )) ,而相应的样本率p 的分布也近似正态分布 N ( , p 2 )。
一、二项分布的适用条件和性质
(一) 二项分布的适用条件
1. 每次试验只会发生两种对立的可能结果之一,即 两种对立结果的概率之和恒等于1;(π,1-
π)
2. 每次试验产生某种结果(如“阳性”)的概率固 定不变; 3. 重复试验是相互独立的,即任何一次试验结果的 出现不会影响其它试验结果出现的概率。
(二) 二项分布的性质
为此,当n 较大、p 和1-p 均不太小如 np 和n(1-p)均大于5时,可利用样本率p的分布近 似正态分布来估计总体率的1 可信区间。
的1 可信区间为:
( p u 2 S p , p u 2 S p )
的95%可信区间为 ( p 1.96S p , p 1.96S p ) 如: 的99%可信区间为 ( p 2.58S p , p 2.58S p )
壶腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术妇
女受孕率的95%可信区间。
本例n=13,X=6。查附表6,取0.05时, 在n=13(横行)与X=6(纵列)的交叉处 数值为19~75,即该吻合术妇女受孕率的 95%可信区间为(19%,75%)。
附表6只列出
先按“阴性”数n-X 查得总体阴性率的 1 可 信区间QL~QU,再用下面的公式转换成所需的阳 性率的 1 可信区间。
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别差 异,今随机抽查了该职业人群男性 120 人和 女性 110 人,发现男性中有 36 人患有颈椎病, 女性中有22人患有颈椎病。试作统计推断。
相关文档
最新文档