配对设计2×2列联表的精确检验方法及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
布是不合理的,此时须采用二项分布的方法进行精确
检验。
配对设计2×2列联表的精确检验
在表1中,如果行变量和列变量的频数分布相同, 那么理论上b和C的比例应为1:1,即两种不一致情 况出现的概率相等,令P=1/2。由此,我们可以给出 无效假设Ho:P=1/2;备择假设H1:p=/:l/2。
令,.=min(b,C)。在Ho:P=1/2成立的前提 下,我们利用二项分布计算累积概率:
SPSSl3.0还提供了配对设计行×列表的精确检 验,此方法是2 X 2列联表的推广。与SAS9.0相比, 这是SPSSl3.0的优点。
参考文献
1.Benard Rosner.Fundamentals of Biostatistics.5th ed.Brooks/Cole, 2000.
2.孙尚拱.生物统计学基础.北京:科学出版社,2004. 3.舢an Agresti.An introduction to categorical data analysis.New York:
万方数据
Chinese Journal of Health Statisticst Oct 2006,V01.23,No;
tables A*B/agree;
weight freq;
SPSSl3.0及SAS9.0软件应用 SPSSl3.0软件应用 例1中令变量A为“电子血压计”,变量B为“水 银血压计”,变量A与B的取值为1=高血压,2=正 常血压;变量freq表示相应的频数(图1)。在统计分析 前,需要进行数据的预处理:用“weight cases”命令,以 #eq为加权变量进行加权。
York:John Wiley&Sons.1981.
(实际工作中通常为两样本率或构成比的比较),则采 用McNemar卡方检验。大多数的国内医学统计书籍
z2:掣 中认为,当b+c≥40时,采用如下公式:
^
+r
、‘7
公式(1)是未修正的McNemar卡方检验,当b+f
<40时,采用如下公式:
1.北京大学医学部公共卫生学院流行病与卫生统计学系(100083) 2.北京大学第三医院职业病科(100083) 3.北京大学医学部药学院药物分析教研室(100083)
万方数据
proc freq; tables A*B;
exact mcnem;
weight freq;
run;
值得注意的是,当b+C很小时,SAS程序给出的 未修正McNemar卡方检验可能会得出错误的结论(如 例1),此时需要谨慎考察卡方检验的结果。
讨论
对于配对设计2X2列联表的检验方法,目前国内 医学统计书籍通常只介绍McNemar卡方检验方法,而 且提出在b+c<40时采用连续性修正。这样的提法 是很不严谨的。当b+c很小时,由于正态分布不能 很好地近似二项分布,所以采用卡方检验是不合理的, 此时应该采用精确检验。
·450·
·方法介绍·
生垦卫生箕进2Q竖生!Q旦錾21鲞筮§塑
配对设计2×2列联表的精确检验方法及应用
(1)h (2)b
何平平1 王洪源1 郭利霞2
配对设计在医学科研中应用很广泛。病例对照研 究或者实验研究中有时会采用1:1匹配(match)设计 来提高研究效率,控制混杂因素;或者在相同条件下同 一受试者接受两种不同的处理,以评价两种处理是否 有差异。当配对设计中所研究的变量为二分类变量 时,常需要将数据整理成配对设计的2×2列联表,然 后进行相应的统计学检验。对于配对设计的2×2列 联表,目前大多数的国内医学统计书籍介绍McNemar 卡方检验方法。但是此卡方检验的使用,需要满足正 态近似的条件。当正态近似不满足时,此检验是不适 用的,需要采用相应的精确检验方法【10】。常用统计 软件SPSS和SAS中已经给出精确检验方法,但目前 国内医学书籍却较少介绍此方法。本文讨论了配对设 计2×2列联表的精确检验方法,通过实例介绍精确检 验的应用,并给出相应的SPSS和SAS程序。
John Wiley&Sons.1996. 4.Alan Agresti.Categorical data analysis.New York:John Wiley&Sons。
1990. 5.Fleiss,Joseph L.Statistical methods for rates and proportions.New
此例中,b=7,f=1,b+C=8,r=min(b,C) =1,根据公式(3)
1 /Q\
P=2×∑{”一i=jO\(z1//2)8=2×(0.003906-I-
0.03125)=0.070 按照口=0.05,P>0.05,则尚不能认为两种血
压计测量血压有差异。
值得注意的是,若采用公式(1),则z2=4.5,P= 0.0339,即两种血压计测量血压有差异。本例中未修 正的McNemar检验与精确法结论相反!
图1例1的SPSS数据库格式 SPSS软件有两种方法可以进行配对设计2×2列 联表检验。一种是列联表方法(在“crosstabs”菜单中 选择“McNemar”选项):此方法只计算精确检验(公式 (3));另外一种是非参数方法(在“nonparametric tests” 菜单中选择“2 related samples”,然后选择“McNemar” 选项):当b+c<25时,此方法给出精确检验(公式 (3));当b+c≥25时,此方法给出连续性修正的Mc— Nemar卡方检验(公式(2))。 对于例1,因为b+c=8<25,所以两种方法都给 出了精确检验的结果:P=0.070。 SAS9.0软件应用 程序PROC FREQ中,当指定AGREE选项时,可 以计算未修正的McNemar卡方检验(公式(1));当在 EXACT语句中指定MCNEM选项时,可以同时给出 未修正的McNemar卡方检验(公式(1))和精确检验 (公式(3))。程序如下: data McNemar; input A B freq; cards; l 13 127 211 229
有研究提出当b+c<20时,须采用配对设计2X 2列联表的精确检验(1,引。在SPSSl3.0软件中,以b +f<25为精确检验的条件。这两种条件差别不大, 计算结果基本一致。
SPSSl3.0软件中,我们推荐采用非参数方法 Cnonparametric tests”菜单),此方法可以给出精确检 验(当b+c<25时)或者连续性修正的McNemar卡 方检验(当b+f≥25时)。SAS9.0软件中PROC FREQ程序,在EXACT语句中指定MCNEM选项,可 以同时给出未修正的McNemar卡方检验和精确检验。 需要注意的是,当b+c很小时,SAS9.0中未修正的 McNemar卡方检验可能会得出错误结论,此时我们推 荐采用精确检验。
McNemar检验
当配对设计中研究变量为二分类变量时,可以将 数据整理成如下2×2列联表(表1)。
表1配对设计的2×2列联表的卡方检验
李 凯1 吕 筠1 陈 鑫3
z2:山L掣
^
1
…
C
公式(1)和(2)是将正态分布近似二项分布,其中
公式(2)采用了连续性修正,能更好地近似二项分布。
值得注意的是,当b+c很小时,正态分布近似二项分
根据公式(3)计算P值,若取检验水准口=0.05, 则当P≤0.05时,拒绝H。,认为行变量和列变量的频 数分布不同。
例1【1]:某研究欲比较用电子血压计与水银血压 计测量血压是否有差异。该研究中高血压定义如下: 若收缩压≥160或舒张压≥95,则为高血压。随机入 选20人,分别用两种血压计测量每人的血压,测量结 果见表2,判断两种血压计测量血压是否有差异?
P(X≤r):∑(?¨}(1/2)…
由予通常采用双侧检验,所以计算双侧概率为
公式(3)中({『+。)_矗缟 P:2×妻f?¨I(1/2)b∥
(3)
—i=—0\z
/
表1中,a和d是行变量和列变量观测结果一致
的匹配对,b和C是行变量和列变量观测结果不一致
的匹配对。 若要比较行变量和列变量的频数分布是否相同