第6章 总率的区间估计和假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章总体率的区间估计和假设检验

♦掌握率的抽样误差的概念和意义

♦掌握总体率区间估计的概念意义和计算方法

♦掌握率的U检验的概念和条件,计算方法

♦第一节率的抽样误差与总体率的区间估计

一、率的抽样误差:在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。

例6.1 检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。

本例:n=800,p=0.25,1-p=0.75,

%

53

.1

0153

.0

800

75

.0

25

.0

=

=

=

p

S

二、总体率的区间估计

㈠正态分布法

样本含量n足够大,np与n(1-p)均≥5时,

例6.2 求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。

95%的可信区间为:25%±1.96×1.53% 即(22.00%,28.00%)

99%的可信区间为:25%±2.58×1.53% 即(21.05%,28.95%)㈡查表法

当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。

第二节率的u检验

应用条件:样本含量n足够大,np与n(1-p)均≥5 。

此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的。

一、样本率与总体率比较的u

♦u值的计算公式为:

例6.5 根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃n

p

)

1(π

π

σ

-

=

n

p

p

S

p

)

1(-

=

p

S

u

p

α

±

n

p

p

u

p

)

1

(

|

|

|

|

π

π

π

σ

π

-

-

=

-

=

溃疡病患者是否较一般胃溃疡病患者易发生胃出血。 计算结果及判断58.3152

)20.01(20.0|

20.0316.0|=--=

u

判断:u=3.58 > u0.05=1. 64(单侧), P<0.05。

在α=0.05水准上,拒绝H 0,接受H 1,差异有统计学意义。

二、两样本率比较的u 检验

计算公式为

例 6.6 某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果见表

6-1。问两组流感发病率有无差别?

表6-1 用药组和对照组流感发病率比较

第七章 二项分布与Poisson 分布

第一节 二项分布及其应用

一、二项分布的概念及应用条件

二项分布(binominal distribution ) 是一种重要的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无效等。

二项分布 也称为贝努里分布(Bernoulli distribution )或贝努里模型,是由法国数学家J.Bernoulli 于1713年首先阐述的概率分布。

如果已知发生某一结果(如阳性)的概率为π,其对立结果(阴性)的概率为(1-π),且各观察单位的观察结果相互独立,互不影响,则从该总体中随机抽取n 例,其中出现阳性数为X (X =0,1,2,3,…,n )的概率服从二项分布。 贝努里模型应具备下列三个基本条件

试验结果只出现对立事件A 或,两者只能出现其中之一。这种事件也称为互斥事件。 试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。 每次试验中,出现事件A 的概率为π ,而出现对立事件的概率为1- π 。则有总概率 π +(1- π )=1。

二、 二项分布的概率函数

根据贝努里模型进行试验的三个基本条件,可以求出在n 次独立试验下,事件A 出现的次数X 的概率分布。X 为离散型随机变量,其可以取值为0,1,2,…,n 。

则X 的概率函数为: X=0,1,2,3…..,n 式中:0<π<1, X

n C 为组合数,上述公式称随机变量X 服从参数为n ,π的二项分布,

则记为X ~B(n,π)。 三、 二项分布的性质

1. 二项分布的每种组合的概率符合二项展开式,其总概率等于1

Λ

+-+-=-=-+-=-∑11

1000)1()1()1()]1([n n n n n

X X n X X n n

C C C ππππππππ1)1()1(0111=-+-+--ππππn n n n n n C C

二项展开式有以下特点: (1)展开式的项数为n +1。

(2)展开式每项π和(1- π )指数之和为n 。 (3)展开式每项π的指数从0到n ;(1- π )的指数从n 到0。

2. 二项分布的累积概率 设m1≤X ≤m2 (m1<m2), 则X 在m 1至m2区间的累积概率有: ∑=--=

≤≤2

1

)1()(21m m X X n X X n

n C

m X m P ππ

至多有x 例阳性的概率为: ∑==

≤x

X n X P x X P 0)()( X =0,1,2,…,x (7.4)

至少有x 例阳性的概率为: ∑==

≥n

x

X n X P x X P )()( X =x ,x +1,…,n

分别为下侧累计概率,和上侧累计概率。 3.二项分布的概率分布图形

以X 为横坐标,P (X )为纵坐标,在坐标纸上可绘出二项分布的图形, 由于X 为离散型随机变量,二项分布图形由横坐标上孤立点的垂直线条组成。

二项分布的图形取决于与n 的大小。当n 充分大时,二项分布趋向对称,可以证明其趋向正态分布。

一般地,如果n π之积大于5时,分布接近正态分布;当n π<5时,图形呈偏态分布。当π =0.5时,图形分布对称,近似正态。如果π≠0.5或距0.5较远时,分布呈偏态。 4.二项分布的数字特征

(这里的数字特征主要指总体均数、方差、标准差等参数)

(1)随机变量X 的数学期望E (X )=μ,即指总体均数: μ =n π (2)随机变量X 的方差D (X )=σ 2 为:)1(2

ππσ-=n (3)随机变量X 的标准差为:)1(ππσ-=n

X n X

X n n C X P --=

)1()(ππ

相关文档
最新文档