第6章 总率的区间估计和假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章总体率的区间估计和假设检验
♦掌握率的抽样误差的概念和意义
♦掌握总体率区间估计的概念意义和计算方法
♦掌握率的U检验的概念和条件,计算方法
♦第一节率的抽样误差与总体率的区间估计
一、率的抽样误差:在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。
例6.1 检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。
本例:n=800,p=0.25,1-p=0.75,
%
53
.1
0153
.0
800
75
.0
25
.0
=
=
⨯
=
p
S
二、总体率的区间估计
㈠正态分布法
样本含量n足够大,np与n(1-p)均≥5时,
例6.2 求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。
95%的可信区间为:25%±1.96×1.53% 即(22.00%,28.00%)
99%的可信区间为:25%±2.58×1.53% 即(21.05%,28.95%)㈡查表法
当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。
第二节率的u检验
应用条件:样本含量n足够大,np与n(1-p)均≥5 。
此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的。
一、样本率与总体率比较的u
♦u值的计算公式为:
例6.5 根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃n
p
)
1(π
π
σ
-
=
n
p
p
S
p
)
1(-
=
p
S
u
p
α
±
n
p
p
u
p
)
1
(
|
|
|
|
π
π
π
σ
π
-
-
=
-
=
溃疡病患者是否较一般胃溃疡病患者易发生胃出血。 计算结果及判断58.3152
)20.01(20.0|
20.0316.0|=--=
u
判断:u=3.58 > u0.05=1. 64(单侧), P<0.05。
在α=0.05水准上,拒绝H 0,接受H 1,差异有统计学意义。
二、两样本率比较的u 检验
计算公式为
例 6.6 某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表
6-1。问两组流感发病率有无差别?
表6-1 用药组和对照组流感发病率比较
第七章 二项分布与Poisson 分布
第一节 二项分布及其应用
一、二项分布的概念及应用条件
二项分布(binominal distribution ) 是一种重要的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无效等。
二项分布 也称为贝努里分布(Bernoulli distribution )或贝努里模型,是由法国数学家J.Bernoulli 于1713年首先阐述的概率分布。
如果已知发生某一结果(如阳性)的概率为π,其对立结果(阴性)的概率为(1-π),且各观察单位的观察结果相互独立,互不影响,则从该总体中随机抽取n 例,其中出现阳性数为X (X =0,1,2,3,…,n )的概率服从二项分布。 贝努里模型应具备下列三个基本条件
试验结果只出现对立事件A 或,两者只能出现其中之一。这种事件也称为互斥事件。 试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。 每次试验中,出现事件A 的概率为π ,而出现对立事件的概率为1- π 。则有总概率 π +(1- π )=1。
二、 二项分布的概率函数
根据贝努里模型进行试验的三个基本条件,可以求出在n 次独立试验下,事件A 出现的次数X 的概率分布。X 为离散型随机变量,其可以取值为0,1,2,…,n 。
则X 的概率函数为: X=0,1,2,3…..,n 式中:0<π<1, X
n C 为组合数,上述公式称随机变量X 服从参数为n ,π的二项分布,
则记为X ~B(n,π)。 三、 二项分布的性质
1. 二项分布的每种组合的概率符合二项展开式,其总概率等于1
Λ
+-+-=-=-+-=-∑11
1000)1()1()1()]1([n n n n n
X X n X X n n
C C C ππππππππ1)1()1(0111=-+-+--ππππn n n n n n C C
二项展开式有以下特点: (1)展开式的项数为n +1。
(2)展开式每项π和(1- π )指数之和为n 。 (3)展开式每项π的指数从0到n ;(1- π )的指数从n 到0。
2. 二项分布的累积概率 设m1≤X ≤m2 (m1<m2), 则X 在m 1至m2区间的累积概率有: ∑=--=
≤≤2
1
)1()(21m m X X n X X n
n C
m X m P ππ
至多有x 例阳性的概率为: ∑==
≤x
X n X P x X P 0)()( X =0,1,2,…,x (7.4)
至少有x 例阳性的概率为: ∑==
≥n
x
X n X P x X P )()( X =x ,x +1,…,n
分别为下侧累计概率,和上侧累计概率。 3.二项分布的概率分布图形
以X 为横坐标,P (X )为纵坐标,在坐标纸上可绘出二项分布的图形, 由于X 为离散型随机变量,二项分布图形由横坐标上孤立点的垂直线条组成。
二项分布的图形取决于与n 的大小。当n 充分大时,二项分布趋向对称,可以证明其趋向正态分布。
一般地,如果n π之积大于5时,分布接近正态分布;当n π<5时,图形呈偏态分布。当π =0.5时,图形分布对称,近似正态。如果π≠0.5或距0.5较远时,分布呈偏态。 4.二项分布的数字特征
(这里的数字特征主要指总体均数、方差、标准差等参数)
(1)随机变量X 的数学期望E (X )=μ,即指总体均数: μ =n π (2)随机变量X 的方差D (X )=σ 2 为:)1(2
ππσ-=n (3)随机变量X 的标准差为:)1(ππσ-=n
X n X
X n n C X P --=
)1()(ππ