四格表资料的Fisher确切概率法
定性资料常用的统计学方法
定性资料常用的统计学方法一、χ2检验χ2检验(chi-square test)是一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
(一)四格表资料的χ2检验例17:为了解吲达帕胺片治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表4 -5-1,试分析吲达帕胺片治疗原发性高血压的有效性。
表4 -5-1 两种疗法治疗原发性高血压的疗效1.四格表χ2检验的原理:对于四格表资料,χ2检验的基本公式为:式中,A为实际频数(actual frequency),T为理论频数(theoreticalfrequency)。
理论频数T根据检验假设H0:π1=π2确定,其中π1和π2分别为两组的总体率。
计算理论频数T的公式为:式中Tij 为第i行第j列的理论频数,ni+和n+j分别为相应行与列的周边合计数,n为总例数。
现以例17为例说明χ2检验的步骤:(1)建立检验假设并确定检验水准。
H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.05(2)计算检验统计量。
按式(4 -5-2)计算T11,然后利用四格表的各行列的合计数计算T12、T21和T22,即T11=(44×41)/70=25.77,T12=44-25.77=18.23T21=41-25.77=15.23,T22=26-15.23=10.77按式(4 -5-3)计算χ2值(3)确定P值,作出推断结论。
以ν=1查χ2分布界值表,得P<0.005。
按α=0.05水准,拒绝H,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可以认为吲达帕胺片治疗原发性高血压优于对照组。
2.四格表资料χ2检验的专用公式:在对两样本率比较时,当总例数n≥40且所有格子的T≥5时,可用χ2检验的通用公式(4 -5-1)。
spss中怎样进行fisher精确概率法统计
spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。
这类资料在医学研究中较为多见。
例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下:有效无效有效率(%)试验组 12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。
四格表的确切概率法
例7-6 设有56份咽喉涂抹标本,把每一份标本 一分为二,依同样的条件分别接种于甲、乙两种白 喉杆菌培养基上,观察白喉杆菌的生长情况,结果 如表7-10,问两种培养基上白喉杆菌的生长概率有 无差别?
表7-10 两种培养基白喉杆菌生长情况
甲培养基
阳性 阴性 合计
阳性
22 (a) 2 (c) 24
乙培养基 阴性 18 (b) 14 (d) 32
20
由 2临界值表,
2 0.05(1)
3.84,11.25
3.84,
P
0.05,
按 0.05 水准拒绝 H0 ,差别有统计学意义, 可以认为,两种培养基上白喉杆菌生长的阳性
概率不相等。鉴于甲培养基阳性频率为
40/56==71.4%,乙培养基为24/56=42.9%,可以认为,
甲培养基阳性概率高于乙培养基。
bc
(7-12)
若 b c 40,需对 公式(7-14)校正公式为
2 ( b c 1)2 v 1
bc
(7-13)
对于例7-6数据,因为 b c 40, 按式(7-15)计算
2 (18 2 1)2 225 11.25, v 1
18 2
检验水准 0.05
变量1
1 2 … R 合计
表7-13 配对设计下多分类资料的R×R列联表
变量2
1
2
…
R
合计
A11
A12
…
A1c
n1(固定值)
A21
A22
…
A2c
n2(固定值)
…
…
…
…
…
AR1
AR2
国开电大医学统计学形成性考核任务三参考答案
·大题目、
名词解释
·题目、
χ2检验
【答案】
也称卡方检验,是对分类变量资料进行假设检验的统计学方法。
·大题目、
名词解释
·题目、
理论频数
【答案】
第R行第C列的理论频数记为TRC,计算公式为,其中nR表示第R行实际数的行合计,nC表示第C列实际数的列合计,n表示总例数。
·大题目、
名词解释
·题目、
行×列表
【答案】
当行数或列数大于2时,称为行×列表或R×C表。
行×列表χ2检验主要用于多个独立样本率或多个独立构成比之间的比较。
·大题目、
名词解释
·题目、
统计表
【答案】
是以表格的形式客观展示数据、数据分析过程及统计分析结果的重要工具。
与文字叙述相比,统计表更加直观,可提供更多的原创信息。
四格表确切概率法的应用条件
四格表确切概率法的应用条件
四格表确切概率法的应用条件包括:
1. 当四格表中的数据满足某一格子的理论频数T<1或者样本容量n<40时,需要使用确切概率法。
2. 当四格表中的数据满足有一个格子的理论频数1≤T<5且样本容量n≥40时,需要先进行连续性校正,然后使用确切概率法。
请注意,确切概率法是一种直接计算概率的假设检验方法,当卡方检验的应用条件不满足时,可以使用这种方法。
以上内容仅供参考,如需更专业的解释,建议咨询统计学专业人士。
四格表资料的fisher确切概率法公式
四格表资料的fisher确切概率法公式
我们要了解四格表资料的Fisher确切概率法公式。
首先,我们需要了解什么是四格表资料和Fisher确切概率法。
四格表资料是指一个包含四个单元格的数据表格,通常用于展示两个分类变量之间的关系。
Fisher确切概率法是一种用于计算四格表中每个单元格概率的方法。
假设四格表的四个单元格分别为 A, B, C 和 D。
则Fisher确切概率法公式为:
P(A) = (a+b+c)!(a+b+c+d)! / (a!b!c!d!),
P(B) = (a+c)!(a+c+d)! / (a!b!c!d!),
P(C) = (a+b)!(a+b+d)! / (a!b!c!d!),
P(D) = (b+c)!(a+b+c+d)! / (a!b!c!d!)。
其中,a, b, c 和 d 分别表示四格表中的四个单元格的计数。
这个公式可以用于计算四格表中每个单元格的概率,从而帮助我们了解两个分类变量之间的关系。
计数资料常用检验方法
.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV
合
计
2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)
四格表资料的Fisher确切概率法资料讲解
9
二、两样本率比较
目的:推断两个样本各自代表的两总体率是否相等 应用条件:当两个样本率均满足正态近似条件时,
可用u检验。
up1p2 sp1p2
p1p2
pc(1pc)(n11
1) n2
pc
x1 n1
x2 n2
10
两样本率比较
例5 为研究高血压病的遗传度, 某医师进行了高血 压子代患病率调查。其中父母双亲有一方患高血压 者调查了205人,其中高血压患者101人;父母双亲 均患高血压者调查了153人,其中高血压患者112人。 问双亲中只有一方患高血压与双亲均患高血压的子 代中,高血压患病率是否相同? 本例 p1=101/205=0.49268
H0(=0=50) 成立时,1小时内该装置发出的质点数的概率分布 19
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万,在该省某 地抽查10万人,进行三年死亡回顾调查,得肺 癌死亡数为82人。已知该地人口年龄别构成与 全省基本相同。问该地肺癌死亡率与全省有无 差别?
本例π0=0.80,1-π0=0.20,n=10, 根据题意需求最少治愈9人的概率。
5
样本率与总体率的比较----直接计算概率法
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0成立时, 400名新生儿中染色体异常例数的概率分布
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
12
spss中怎样进行fisher精确概率法统计
spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。
这类资料在医学研究中较为多见。
例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下:有效无效有效率(%)试验组12 1 92.31对照组 3 8 27.27可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。
Fisher确切概率法
第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现久,或,或用公式(8-1)与公式(8-4)计算出工值后所得的概率巴:::二时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2 x 2 table)。
该法是由R.A.Fisher(1934 年)提出的,其理论依据是超几何分布(hypergeometric distributen) ,并非工检验的范畴但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章<下面以例8-1介绍其基本思想与检验步骤。
例8-1某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。
问两组新生儿的HBV总体感染率有无差别?表8-3 两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率厂;再按检验假设用单侧或双侧的累计概率匸,依据所取的检验水准- 做出推断。
1 •各组合概率厂的计算在四格表周边合计数不变的条件下,表内4个实际频数变动的组合数共有“周边合计中最小数+1 ”个。
如例7-4,表内4个实际频数变动的组合数共有卢-1-个,依次为:(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc = -198 ad-bc = -165 ad-bc =:-132 ad-bc =-99 ad-bc = -66⑹(7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc = -33 ad-bc =0 ad-bc =33 ad-bc =66 ad-bc = 99各组合的概率'服从超几何分布,其和为1。
四格表资料的Fisher确切概率法资料讲解
17
样本阳性数与总体平均数的比较
2. 正态近似法
近似
x ~ N(0,0)
u X 0
当μ0≥20时,
0
,可利用Poisson分
布的正态近似原理做检验。
18
样本阳性数与总体平均数的比较----直接计算概率法
例9 质量控制标准规定某装置平均每小时发出质点 数不超过50个。今抽查一次,在1小时内测得该装置 发出的质点数为58个,问该装置是否符合要求?
87.00
39
卡方检验基本思想
2
2
2 (AT)2
T
(行 数 1)列 ( 数 1)
TRC
nR.nC n
应用检:验用的于检两验个统或计多量个为样本率,度检验。
40
3. P 值的确定
卡方检验基本思想
2
2
2
2 ,
P
检2验 时2,,要根P据自由度ν 查附表9 界值表。
表 6-1 两组降低颅内压有效率的比较
组别
有效
无效
合计 有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a b) 对照组 75(83.52) c 21(12.48) d 96 (c d)
95.20 78.13
合计 174 (a c) 26 (b d) 200 (n)
例11 某省肿瘤研究所分别在甲、乙两县随机抽 查10万育龄妇女,进行追踪观察。三年中甲县 死于宫颈癌的有28人,乙县死于宫颈癌者47人。 问甲乙两县宫颈癌死亡率有无差别?
23
两样本阳性数的比较
例12 某车间在改革生产工艺前,随机测量三次 车间空气中的粉尘浓度,每次取1升空气,分别测 得有38、29、36颗粉尘;改革生产工艺后又测量3 次,每次取1升空气,分别测得有25、18、21颗粉 尘。问工艺改革前后粉尘浓度是否有变化?
Fisher确切概率法
第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。
该法是由,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。
但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。
下面以例8-1介绍其基本思想与检验步骤。
例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。
问两组新生儿的HBV总体感染率有无差别?表8-3两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27一、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。
1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数, ,,变动的组合数共有“周边合计中最小数+1”个。
如例7-4,表内4个实际频数变动的组合数共有个,依次为:(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66(6) (7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99各组合的概率服从超几何分布,其和为1。
医学统计学 四格表资料的 检验
1. 2 分布
(1) 2分布是一种连续型分布:按分布的密度函数可给出
自由度=1,2,3,……的一簇分布曲线 (图7-1)。
(2) 2分布的一个基本性质是可加性: 如果两个独立的
随机变量X1和X2分别服从自由度ν1和ν2的分布,
即
X1
~
2 1
,
X2
~
2 2
,那么它们的和(
X1+X2
)服从自由度
( ν1+ν2 )的 分 2布,即 ( X1 X~2 )
95.20
对照组 75(83.52) c 21(12.48) d 96 (c+d)
78.13
合 计 174(a+c)
26(b+d)
200 (n)
87.00
本例资料经整理成图7-2形式,即有两
个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 75
5 21
四个
基本数据,其余数据均由此四个数据推算
α=0.05。
(2)求检验统计量值
T11 104 174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
电大医学统计学。形考3
电大医学统计学。
形考31.χ2检验是一种用于分类变量资料进行假设检验的统计学方法,也称为卡方检验。
它在实践中得到了广泛的应用。
2.理论频数,又称验频数,是一种统计学概念,用于推算各实际频数的估计值,通常是通过阳性理论率来计算的。
3.行x列表是指在两个样本率比较的χ2检验中,基本数据形式为2行2列的四格表。
当行数或列数大于2时,称为行x列表或RxC表。
行x列表资料的χ2检验主要用于多个独立样本率或多个独立构成比之间的比较。
4.统计表是以表格的形式客观地展示数据、数据分析过程及统计分析结果的重要工具。
一个有效的统计表由表号、标题、标目、线条和数字或文字几个部分组成,与文字叙述相比,统计表更加直观,可提供更多的原创信息。
5.统计图是以点、线、面等几何图形客观展示数据的分布、水平、构成及关系等特征的重要工具。
一个有效的统计图由图号、标题、标目和几何图形几个部分组成。
与统计表相比,统计图更直观。
1.若对三个独立样本率进行χ2检验,且χ2>χ20.05,2则统计结论为各总体率不同或不全相同。
2.当需要比较两种药物的疗效时,最佳的方法是Fisher确切概率法。
3.在两独立样本设计的四格表资料中,如果行合计和列合计不变,实际频数发生变化,则理论频数不变。
4.两独立样本设计四格表资料χ2检验校正公式的应用条件是样本数n≥40且最小理论频数TXXX5.5.四格表资料的自由度等于1.6.在多个样本率的假设检验中,无效假设是各样本率相等。
7.配对资料的卡方检验备择假设是两组样本的比率不相等。
2)应用条件:两组样本独立,样本容量足够大,期望频数不小于5.2.简述散点图的作用及绘制方法。
散点图可以用来展示两个变量之间的关系,可以帮助我们发现变量之间的相关性或趋势。
绘制散点图的方法是将两个变量分别标在横轴和纵轴上,然后将每个观测值在两个轴上对应的位置连线,形成散点图。
可以通过散点图的趋势线来描述变量之间的关系。
当样本量较大且T值在1到5之间,使用两独立样本设计的四格表资料进行X检验时,可以使用校正公式或专用校正公式。
最新第四 r×c表卡方检验 第五 fisher确切概率检验ppt课件
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
表7-7 两组患者尿路疼痛原因的分布
分 组
治 疗 组 对 照 组 合 计
尿 路 感 染 34 29 63
尿 路 疼 痛 原 因 器 械 损 伤 29 35 64
其 它 9 8 17
合 计
72 72 144
2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有
2 144(1)13.40222929222923258 726创3创7创2647217726372647217
=0.05
已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有
2 c
(12 3 1)2 12 3
4.27
查附表
8,
2 0.025,1
5.02
,
2 0.05,1
3.84
,得
0.025<P<0.05,按
=0.05
水准拒绝
H0,接
受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 b>c)。
小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
由公式(7-1)还可以看出: 2 值的大小还取决于( A T ) 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
样本率与总体率的比较-----正态近似法
例4 经长期临床观察, 发现胃溃疡患者发生胃出血症状 的占20%。现某医院观察了304例65岁以上的老年胃溃疡 患者,有96例发生胃出血症状,占31.58%。问老年胃溃 疡患者是否较一般患者更易发生胃出血?
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
精选ppt
10
二、两本率比较
目的:推断两个样本各自代表的两总体率是否相等
应用条件:当两个样本率均满足正态近似条件时, 可用u检验。
up1p2 sp1p2
p1p2
pc(1pc)(n11
1) n2
pc
x1 n1
x2 n2
精选ppt
11
两样本率比较
例5 为研究高血压病的遗传度, 某医师进行了高血 压子代患病率调查。其中父母双亲有一方患高血压 者调查了205人,其中高血压患者101人;父母双亲 均患高血压者调查了153人,其中高血压患者112人。 问双亲中只有一方患高血压与双亲均患高血压的子 代中,高血压患病率是否相同?
第六章 分类资料的假设检验
山东大学公共卫生学院
主要内容
§1 服从二项分布资料的假设检验 §2 服从Poisson分布资料的假设检验 §3 2 检验
精选ppt
2
§1 服从二项分布资料的假设检验
样本率与总体率的比较 两样本率的比较
精选ppt
3
一、样本率与总体率的比较
目的:推断样本率所代表的未知总体率π与已知 总体率π0是否相等。
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
精选ppt
13
☆二项分布的应用☆
1. 估计总体率的可信区间
(1)查表法 (n50,特别是p远离0.5时)
(2)正态近似法 (n>50 且 np5 和n(1-p) 5 )
2. 样本率与已知总体率比较的假设检验
根据资料的具体情况,可选用: 1. 直接计算概率法 2. 正态近似法
精选ppt
4
1. 直接计算概率法
样本率与总体率的比较
应用条件:π0偏离0.5较远,且阳性数X 较小 作单侧检验时。
例1 根据以往长期的实践,证明某常用药的 治愈率为80%。现在某种新药的临床试验中, 随机观察了10名用该新药的患者,治愈9人。 问该新药的疗效是否比传统的常用药好?
布的正态近似原理做检验。
u X 0 0
精选ppt
19
样本阳性数与总体平均数的比较----直接计算概率法
例9 质量控制标准规定某装置平均每小时发出质点 数不超过50个。今抽查一次,在1小时内测得该装置 发出的质点数为58个,问该装置是否符合要求?
H0(=0=50) 成立时,1小时内精选该ppt装置发出的质点数的概率分布 20
样本阳性数与总体平均数的比较 两样本阳性数的比较
精选ppt
15
一、样本阳性数与总体平均数的比较
目的:推断样本所代表的未知总体平均数 μ 与 已知总体平均数 μ0 是否相等。
根据资料的具体情况,可选用: 1. 直接计算概率法 2. 正态近似法
精选ppt
16
样本阳性数与总体平均数的比较
1. 直接计算概率法
精选ppt
5
样本率与已知总体率的比较----直接计算概率法
H0成立时,随机抽查的10人中治愈人数x 的分布
本例π0=0.80,1-π0=0.20,n=10, 根据题意需求最少治愈9人的概率。
精选ppt
6
样本率与总体率的比较----直接计算概率法
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0成立时, 400名新生儿中染色体异常例数的概率分布
精选ppt
7
2. 正态近似法
样本率与总体率的比较
应用条件:当π0不太靠近0或1,且样本含量n
足够大;或nπ0≥5且n(1-π0)≥5时,
近似
X~Nn0,n010
p近 ~似 N0,01n0
可利用二项分布的正态近似原理做检验。
u X n 0 u p0
(1)直接计算概率法( π0偏离0.5较远, X 较小, 单侧检验 )
(2)正态近似法(n>50 且 n05 和n(1-0) 5 )
3. 两大样本率比较的假设检验
正态近似法 n1, n2>50 且 n1p15 , n1(1-p1) 5
n2p25 , n2(1-p2) 5
精选ppt
14
§2 服从Poisson分布资料的假设检验
例8 卫生标准规定, 生活饮用水大肠杆菌数不得 超过3个/ml。现对某饮用水进行抽检,抽取1ml 水样培养得到5个大肠杆菌。问该水样中的大肠 杆菌是否超标?
H0(=3)成立时, 每毫升水中大肠杆菌数的概率分布
精选ppt
18
样本阳性数与总体平均数的比较
2. 正态近似法
近似
当μ0≥20时, x ~ N(0,0,) 可利用Poisson分
应用条件:μ0<20,且样本阳性数 X 较小作单侧检 验时。
例7 已知接种某疫苗时,一般严重反应率为1‰。 现用某批号的该种疫苗接种150人,有2人发生严重 反应,问该批号疫苗的严重反应率是否高于一般?
H0(=0.001)成立时1精50选人ppt中发生严重反应人数的概率分布 17
样本阳性数与总体平均数的比较----直接计算概率法
本例 p1=101/205=0.49268 p2=112/153=0.73203, pc =(101+112)/(205+153)=0.59497
精选ppt
12
两样本率比较
例6 某研究者在某地区随机抽取10岁儿童100 人,20岁青年120人,检查发现10岁儿童中有 70人患龋齿,20岁青年中有60人患龋齿,问该 地区10岁儿童与20岁青年患龋齿率是否相等?
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万,在该省某 地抽查10万人,进行三年死亡回顾调查,得肺 癌死亡数为82人。已知该地人口年龄别构成与 全省基本相同。问该地肺癌死亡率与全省有无 差别?
n 0 1 0
0(10)/n
精选ppt
8
样本率与总体率的比较-----正态近似法
例3 据报道,某常规疗法对某种疾病的治愈率为65%。现 某医生用中西医结合疗法治疗了100例该病患者,共治愈80 人。问该中西医结合疗法的疗效是否比常规疗法好?
当H0成立时,
100例患者中治愈人数的概率分布 精选ppt