医学统计学(6) 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 第4步:x2检验(1) • 选择分析→交叉表
• 交叉表对话框:组别和感染结果分别进入行和列
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
• 在中医药科研中,经常遇到同一个样本中 两个或多个构成比比较的问题,在满足卡 方检验的要求条件下,可用卡方检验来分 析实际频数的比率是否符合理论比率。
【例1】为探索高血压患者中医证型构成,调查原发性 高血压患者3578例,中医证型构成见表。问原发性高血 压患者中医证型内部构成是否相同?
A
T
• X2=392.514 • V=5-1=4 • P=1-CDF.CHISQ(392.514,4)=0.000
• 单个样本构成比的x2检验——拟合优度检验
• 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
x2检验
• 单个样本构成比的x2检验——拟合优度检验 • 独立样本四格表的x2检验
• 行×列的x2检验
• 配对设计分类资料的x2检验 • 多维分类资料的x2检验
• 第5步:结果解读(1)
• 结果解读:各组的中医分型构成比。
• 第5步:结果解读(2)
• 结果解读:x2=4.020,p=0.403
【例7】某医院肝胆外科在手术中,观察了222例胆结石 患者,其发病部位与结石类型的资料见表,分析其发病 部位与结石类型间有无关系?
行变量和列变量均为无序分类变量。 可分析行、列两变量之间有无关联,关联 的密切程度。 可进行多个样本率或构成比的比较。
• 选择分析→交叉表 • 交叉表对话框:结石部位和结石类型分别进入行和列
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方和 相关系数
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 第5步:结果解读(2)
• 结果解读:有2个格子的期望值小于5,不符 合卡方检验的条件。
• 第5步:结果解读(3)
• 结果解读:四格表中有期望值小于5,选连 续校正的卡方。x2=3.621,p=0.057? • P(exact)=0.031?
2 四格表x 检验结果的选择
• 1)当n≥40,所有理论值≥ 5时,用 pearson卡方检验。 • 2)当n≥40,但有理论频数1≤理论值<5 时,用连续校正的卡方检验;或者确切概 率法。 • 3) n<40或有理论值<1,或P≈α时,用 确切概率法。
注意事项
进行拟合优度 x2 检验,一般要求有足够的 样本含量,理论频数不小于 5 。 理论频数小于 5 时,需要合并计算。
x2检验
• 单个样本构成比的x2检验 • 独立样本四格表的x2检验 • 行×列的x2检验
• 配对设计分类资料的x2检验
• 多维分类资料的x2检验
四格表的卡方检验,也是通过计算代表实 际频数A与理论频数T之间的吻合程度的卡 方值来进行检验的。 理论频数T采用两组的合并情况来计算。
【例2】某医院把慢性支气管炎患者376名,随机分为2 组,分别用中西医结合法和西医法治疗,结果见表。问 两种疗法治疗慢性支气管炎病人的治愈率是否有差别?
理论值T的计算
345/376(总的治愈率)*276=253.24 276-253.24=22.76 345/376(总的治愈率)*100=91.76 100-91.76=8.24
【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感 染HBV的效果,将33例HBsAg阳性孕妇随机分为预防 注射组和非预防组,结果见表。问两组新生儿的HBV总 体感染率有无差别?
• 第1步:定义变量
SPSS软件操作
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
• 第5步:结果解读(1)
• 结果解读:新药组的有效率为88.9%,传统药物组 的有效率为86.7%,安慰剂组的有效率为70.9%。
• 第5步:结果解读(2)
• 结果解读:x2=13.238,p=0.001
卡方检验的校正公式
【例3】某中医院比较两药治疗某病的效果,所得结果 见表。问甲乙两药疗效有无差别?
校正公式
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
• 第4步:x2检验(1) • 选择分析→交叉表 • 交叉表对话框:组别和疗效分别进入行和列
卡方值的计算
卡方值的影响因素: • 1、格子数 • 2、实测值与理论值的差距
专用公式的推导
T11=(a+c)/(a+b+c+d)*(a+b) T12=(b+d)/(a+b+c+d)*(a+b) T21=(a+c)/(a+b+c+d)*(c+d) T22=(b+d)/(a+b+c+d)*(c+d)
专用公式的推导
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
• 第4步:x2检验(1) • 选择分析→交叉表 • 交叉表对话框:组别和疗效分别进入行和列
输出4种卡方 检验结果: 1、pearson卡方
CMH多维卡 方检验
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:中西医组的治愈率为98.2%,西 医组的治愈率为74.0%。
• 第5步:结果解读(2)
• 结果解读:x2=56.772,p=0.000
• 两种疗法治疗慢性支气管炎病人的治愈率的 差别有统计学意义
2 四格表x 检验结果的选择
• 1)当n≥40,所有理论值≥ 5时,用 pearson卡方检验。 • 2)当n≥40,但有理论频数1≤理论值<5 时,用连续校正的卡方检验;或者确切概 率法。 • 3) n<40或有理论值<1,或P≈α时,用 确切概率法。
医学统计学 (6 )
《中华医学杂志》对来稿统计学处理的有关要求
卡方检验(chi-square test)
• χ2检验是现代统计学的创始人之一,英国人 Karl . Pearson于1900年提出的一种具有广 泛用途的统计方法。 • 可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
关联性分析
列联系数的意义 • |rp|<0.4,关联程度低 • 0.4≤|rp|<0.7,关联程度中等 • |rp|≥0.7,关联程度高
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
• 第4步:x2检验(1)
• 配对设计分类资料的x2检验
• 多维分类资料的x2检验
行×列卡方检验计算公式
• n为总例数;R和C分别为行数和列数; A为第R行、第C列位置上的实际频数; nR为实际频数所在行的行合计;nC为 实际频数所在列的列合计。
【例5】某中医师将某病患者随机分为三组,分别用新 药、传统药物和安慰剂治疗,结果见表。问三种方法治 疗该病的有效率是否有差别?
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
• 第5步:结果解读(1)
• 结果解读:甲药组的有效率为92.9%,乙药 组的有效率为64.3%。
•进一步的两两比较
•P<0.017才有 统计学意义!!
【例6】某中医院用三种治疗方法治疗413例糖尿病患者, 资料见表。为避免中医不同证型对疗效比较的影响,分 析3种疗法治疗的病人按3种中医分型的构成比有无差别?
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
行×列表卡方检验注意事项
• 当多个样本率(或构成比)作卡方检验, 结论为拒绝零假设时,只能认为各总体率 (或总体构成比)之间总的有差别,不能 说明两两之间有差别;两组间的比较需进 一步做多个样本率或构成比的两两比较, 即多重比较。
行×列表卡方检验注意事项
• R×C表可以分为双向无序 、单向有序、双向有序属 性相同和双向有序属性不 同等4类。 • 通常情况下只有双向无序 的资料(例如多个样本率 的比较、多个样本构成比 的比较)可以使用R×C列 联表卡方检验。 • 右上表格使用卡方检验分 析不同疗法间疗效是否有 别,右下表格分析不同的 血型分类结果是否有关联 (不同的血型分类是否相 互独立);它们都属于双 向无序的列联表,都可使 用卡方检验分析
• 结果解读:行与列均为无序变量,行、列百 分比均有各自专业意义。
• 第5步:结果解读(2)
• 结果解读:x2=64.059,p=0.000
• 第5步:结果解读(3)
• 结果解读:rp=0.473,p=0.000 • 两者有关联,但关联度不高。
行×列表卡方检验注意事项
• 同四格表资料一样,R×C表的卡方分布是 建立在大样本的假定上的,要求总例数不 可过少,不能有1/5以上的格子理论频数小 于5,且不能有一个格子的理论频数小于1 。 • 如果出现上述情况,可以考虑:增大样本 量;根据专业知识合理地合并相邻的组别 ;删除理论数太小的行列 ;改用其它方法 分析,例如确切概率法或似然比卡方检验 。
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 例数→加权个案(频 数变量)
• 第4步:x2检验 • 选择分析→非参数检验→ 卡方 • 中医证型→检验变量列表
• 第5步:结果解读
• 结果解读: x2=392.514, p=0.000,说明 原发性高血压患 者中医证型内部 构成不相同。
• 第5步:结果解读(1)
• 结果解读:预防注射组的感染阳性率为4/22, 非预防组的感染阳性率为5/11。
• 第5步:结果解读(2)
• 结果解读:四格表中有期望值小于5,总例 数小于40。
• 第5步:结果解读(3)
• 结果解读:选Fisher的精确检验p(exact)=0.121
x2检验
• 单个样本构成比的x2检验 • 独立样本四格表的x2检验 • 行×列的x2检验
卡方检验基本思想
用卡方值的大小来衡量实际频数和理论频数 之间的吻合程度。 在零假设H0 成立的条件下,实际频数与理论 频数相差不应该很大,即x2值不应该很大。 若实际计算出的x2值较大,说明实际频数和 理论频数吻合程度小,相差大,则有理由怀 疑H0的真实性,从而拒绝H0,接受H1。
x2检验
A
nR
nC
SPSS软件操作
• 第1步:定义变量
• 第2步:输 入原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
• 第4步:x2检验(1) • 选择分析→交叉表 • 交叉表对话框:组别和疗效分别进入行和列
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
2、卡方值的校正值 3、似然比卡方,一 般用于对数线性模 型。 4、fisher的精确检 验 5、线性趋势检验
输出2种相关 系数: 1、pearson相关系
数 2、spearman相关系 数
列联系数:分 析行与列之间的 关联程度
Kappa:一 致性检验 风险:计算 相对危险度( RR)和比数比 (OR)。 McNemar: 优势性检验。
• 第4步:x2检验(1)
• 选择分析→交叉表 • 交叉表对话框:组别和中医分型分别进入行和列
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行