计数资料的统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公共卫生学院
1.2 连续校正卡方检验
例1.2 冠心病复发与体育锻炼的关系研究 ,结果见表5.2.为冠心病复发与体育锻炼 有关系吗?关联强度是多大?
表1.2 体育锻炼与冠心病复发关系的研究
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ①建立假设检验,确定检验水准 H0:π1=π2(参加体育锻炼与不参加体育 锻炼者的冠心病复发率一致) H1:π1≠π2(参加体育锻炼与不参加体育 锻炼者的冠心病复发率不一致) α=0.05
计数资料的 统计推断
靳利梅
jinlimei520@126.com
内容:计数资料的统计推断
1 四格表数据的卡方检验 2 R×C无序列联表卡方检验 3 Fisher’s 精确检验
公共卫生学院
卡方检验
2检验是常用于计数资料的假设检验,又 称为卡方检验。该方法主要用于两个或者 多个样本率或者构成比的比较。
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
③根据检验统计量的结果做出统计推断 三个地区60岁以上老年人高血压患病率分别 为25.2%,23.3%,21.2%,Pearson卡方 =6.293,P=0.043,按0.05的检验水准拒绝H0, 认为三个地区的60岁以上老年人高血压患病 率间的差异有统计学意义。
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断 n=114, 最小理论频数=4.395,因此选用 校正的卡方检验结果,即卡方=4.317, P=0.038,按0.05的检验水准拒绝H0,认为 两组复发率差异有统计学意义
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ③根据检验统计量的结果做出统计推断 由于n40,且50%的格子的T 5,所以采用 四格表精确概率法计算,得出P=0.050, 按照α=0.05的水平拒绝H0,认为甲药、乙 药的疗效差异有统计学意义。
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ③根据检验统计量的结果做出统计推断
由b可知,本例不需要校正,Pearson 2=6.273,P=0.012,在0.05的检验水准下, 拒绝H0,说明西药中药的治愈率差异有统计 学意义,可认为中药的治愈率比西药高。
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.1 一般四格表卡方检验
➢卡方检验的零假设,假定比较样本来自 总体率(π)相等的总体,即H0:π1=π2.卡方 检验的统计量也称为Pearson’s卡方检验
公共卫生学院
1.1 一般四格表卡方检验
公共卫生学院
内容
3. Fisher’s 精确检验
• 3.1 四格表的精确概率法
• 3.2 R×C列联表的精确概率法
公共卫生学院
应用条件
四格表的精确概率法
在四格表2检验中 ①一个格子理论频数T1 ②或 n 40
公共卫生学院
3.1四格表的精确概率法
例3.1 比较两种药物的驱虫疗效,对18名患 者进行治疗,结果见下表。问两种驱虫药的 疗效有无差异?
四格表的卡方检验 校正四格表的卡方检验 四格表的确切概率法 配对卡方检验 校正配对卡方检验 行×列表卡方检验
行×列表的确切概率法
公共卫生学院
www.themegallery.com
据题意,本题需分析两组的构成比例之间有无差异
①建立假设检验,确定检验水准
H0:三组的总体构成相同 H1:三组的总体构成不同或不全相同
α=0.05
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
③根据检验统计量的结果做出统计推断
Pearson卡方值为51.790,P=0.000,按0.05的 水准拒绝H0,认为不同年龄的儿童视力健康 状况构成比差异有统计学意义。
①理论频数(T)均应大于5, ②或1T<5的格子数不宜大于总格子数的 1/5(20%)
公共卫生学院
2.1 多个样本率的卡方检验
例2.1 随机抽取某市三个地区,调查60岁以上 老年人高血压患病情况,结果见表2.1.问三个 区的老年人高血压患病率有无差别?
表2.1 某市三个区60岁以上老年人高血压患病情况
公共卫生学院
计数资料的假设检验
应用条件
统计方法
N≥40且T≥5 两个率或构成比
的比较
N≥40且1≤T<5
(完全随机设计)
N<40或T<1
配对Fra Baidu bibliotek格表比较 b+c≥40
(配对设计)
b+c<40
多个率或构成比 资料的比较
全部各自T>5或 少于1/5的格子1≤T<5
(完全随机设计)
若有T<1或 多于1/5的格子1≤T<5
公共卫生学院
注意事项
行×列表卡方检验
(1)2检验一般要求不宜有20%以上的格子的理 论频数(T) 5,或有一个格子的T1.
处理方法: ①增加样本含量 ②删除T太小的行或者列 ③将T太小的行或列与相邻合并(性质相同或者相近)
公共卫生学院
注意事项
行×列表卡方检验
(2) 多个样本率或构成的2检验,结论拒绝H0, 只能认为总体上有差异,并不能认为各个样本 率之间有差异。想具体知道哪两个之间有差异 ,需要进行行×列表的卡方分割。
表1.1 两种药物的疗效对比结果
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤
①建立假设检验,确定检验水准 H0:π1=π2(两药物总体治愈率相等) H1:π1≠π2(两药物总体治愈率不相等) α=0.05
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤
②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断
即冠心病初发后进行体育锻炼的人复发冠心 病的危险是不锻炼的0.169倍。
公共卫生学院
内容
2. R×C列无序列联表卡方检验
• 1.1 多个样本率的卡方检验 • 1.2 多个样本构成的卡方检验
公共卫生学院
应用条件
R×C列无序列联表卡方检验检
公共卫生学院
应用条件
R×C列联表的精确概率法 ①有格子理论频数(T) 小于1, ②或1T<5的格子数大于总格子数的 1/5(20%)
公共卫生学院
3.2 R×C列联表的精确概率法
例3.2 肝动脉介入治疗加(减)全身化疗治疗转 移性肝癌的临床观察结果如下表。试比较两 种治疗方法的疗效是否有统计学意义?
表3.2 不同方法治疗转移性肝比较
公共卫生学院
3.2 R×C列联表的精确概率法
①建立假设检验,确定检验水准
H0:两种疗法治疗转移性肝癌疗效相同 H1:两种疗法治疗转移性肝癌疗效不同
α=0.05
公共卫生学院
3.2 R×C列联表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.2 R×C列联表的精确概率法
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ①建立假设检验,确定检验水准
H0:π1=π2=π3(三个地区高血压患病率相同) H1:三个地区高血压患病率不相同或不全相同
α=0.05
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.2 R×C列联表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ③根据检验统计量的结果做出统计推断 P=0.007,可信区间0.004~0.009,α=0.05的 水平拒绝H0,认为静脉化疗与介入加化疗 治疗转移性肝癌疗效有差异。
四格表资料
公共卫生学院
T为理论频数:行合计×列合计除以N
应用条件
一般四格表卡方检验
①理论频数(T)均应大于5 ②或1T<5的格子数不宜大于总格子数的 1/5(20%)
公共卫生学院
1.1 一般四格表卡方检验
例题1.1 有195例肾炎患者,分别采用中 药和西药的方法治疗,疗效见表5.1.问两 组的疗效有无差异?
➢检验步骤 ②选择检验方法,计算统计量
(1) 频数加权
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
(2) Crosstabs(交叉表)过程对话框操作提示
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
(3) 定义Crosstabs过程对话框
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.2 连续校正卡方检验
➢当样本含量较大,且有20%格子的理论 频数小于5时,则需要采用连续性校正卡 方检验
➢应用条件
①四格表数据的样本含量较大(n≥40) ②一个格子的理论频数1≤T5
表3.1 两种药物的驱虫疗效对比
公共卫生学院
3.1四格表的精确概率法
据题意,本题n<40,故需用Fisher精确概率法
①建立假设检验,确定检验水准
H0:π1=π2 H1:π1≠π2
α=0.05
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.2 多个样本构成的卡方检验
例2.2 2002年某市某区妇幼保健院对该区 幼儿园4~6岁儿童视力进行筛查,结果见 表2.2。问不同年龄的儿童视力健康状况构 成比是否有差异?
公共卫生学院
2.2 多个样本构成的卡方检验
例2.2 4~6岁儿童视力筛查情况
公共卫生学院
2.2 多个样本构成的卡方检验
1.2 连续校正卡方检验
例1.2 冠心病复发与体育锻炼的关系研究 ,结果见表5.2.为冠心病复发与体育锻炼 有关系吗?关联强度是多大?
表1.2 体育锻炼与冠心病复发关系的研究
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ①建立假设检验,确定检验水准 H0:π1=π2(参加体育锻炼与不参加体育 锻炼者的冠心病复发率一致) H1:π1≠π2(参加体育锻炼与不参加体育 锻炼者的冠心病复发率不一致) α=0.05
计数资料的 统计推断
靳利梅
jinlimei520@126.com
内容:计数资料的统计推断
1 四格表数据的卡方检验 2 R×C无序列联表卡方检验 3 Fisher’s 精确检验
公共卫生学院
卡方检验
2检验是常用于计数资料的假设检验,又 称为卡方检验。该方法主要用于两个或者 多个样本率或者构成比的比较。
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
③根据检验统计量的结果做出统计推断 三个地区60岁以上老年人高血压患病率分别 为25.2%,23.3%,21.2%,Pearson卡方 =6.293,P=0.043,按0.05的检验水准拒绝H0, 认为三个地区的60岁以上老年人高血压患病 率间的差异有统计学意义。
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
②选择检验方法,计算统计量
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断 n=114, 最小理论频数=4.395,因此选用 校正的卡方检验结果,即卡方=4.317, P=0.038,按0.05的检验水准拒绝H0,认为 两组复发率差异有统计学意义
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ③根据检验统计量的结果做出统计推断 由于n40,且50%的格子的T 5,所以采用 四格表精确概率法计算,得出P=0.050, 按照α=0.05的水平拒绝H0,认为甲药、乙 药的疗效差异有统计学意义。
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ③根据检验统计量的结果做出统计推断
由b可知,本例不需要校正,Pearson 2=6.273,P=0.012,在0.05的检验水准下, 拒绝H0,说明西药中药的治愈率差异有统计 学意义,可认为中药的治愈率比西药高。
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.1 一般四格表卡方检验
➢卡方检验的零假设,假定比较样本来自 总体率(π)相等的总体,即H0:π1=π2.卡方 检验的统计量也称为Pearson’s卡方检验
公共卫生学院
1.1 一般四格表卡方检验
公共卫生学院
内容
3. Fisher’s 精确检验
• 3.1 四格表的精确概率法
• 3.2 R×C列联表的精确概率法
公共卫生学院
应用条件
四格表的精确概率法
在四格表2检验中 ①一个格子理论频数T1 ②或 n 40
公共卫生学院
3.1四格表的精确概率法
例3.1 比较两种药物的驱虫疗效,对18名患 者进行治疗,结果见下表。问两种驱虫药的 疗效有无差异?
四格表的卡方检验 校正四格表的卡方检验 四格表的确切概率法 配对卡方检验 校正配对卡方检验 行×列表卡方检验
行×列表的确切概率法
公共卫生学院
www.themegallery.com
据题意,本题需分析两组的构成比例之间有无差异
①建立假设检验,确定检验水准
H0:三组的总体构成相同 H1:三组的总体构成不同或不全相同
α=0.05
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
③根据检验统计量的结果做出统计推断
Pearson卡方值为51.790,P=0.000,按0.05的 水准拒绝H0,认为不同年龄的儿童视力健康 状况构成比差异有统计学意义。
①理论频数(T)均应大于5, ②或1T<5的格子数不宜大于总格子数的 1/5(20%)
公共卫生学院
2.1 多个样本率的卡方检验
例2.1 随机抽取某市三个地区,调查60岁以上 老年人高血压患病情况,结果见表2.1.问三个 区的老年人高血压患病率有无差别?
表2.1 某市三个区60岁以上老年人高血压患病情况
公共卫生学院
计数资料的假设检验
应用条件
统计方法
N≥40且T≥5 两个率或构成比
的比较
N≥40且1≤T<5
(完全随机设计)
N<40或T<1
配对Fra Baidu bibliotek格表比较 b+c≥40
(配对设计)
b+c<40
多个率或构成比 资料的比较
全部各自T>5或 少于1/5的格子1≤T<5
(完全随机设计)
若有T<1或 多于1/5的格子1≤T<5
公共卫生学院
注意事项
行×列表卡方检验
(1)2检验一般要求不宜有20%以上的格子的理 论频数(T) 5,或有一个格子的T1.
处理方法: ①增加样本含量 ②删除T太小的行或者列 ③将T太小的行或列与相邻合并(性质相同或者相近)
公共卫生学院
注意事项
行×列表卡方检验
(2) 多个样本率或构成的2检验,结论拒绝H0, 只能认为总体上有差异,并不能认为各个样本 率之间有差异。想具体知道哪两个之间有差异 ,需要进行行×列表的卡方分割。
表1.1 两种药物的疗效对比结果
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤
①建立假设检验,确定检验水准 H0:π1=π2(两药物总体治愈率相等) H1:π1≠π2(两药物总体治愈率不相等) α=0.05
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤
②选择检验方法,计算统计量
公共卫生学院
1.1 一般四格表卡方检验
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断
即冠心病初发后进行体育锻炼的人复发冠心 病的危险是不锻炼的0.169倍。
公共卫生学院
内容
2. R×C列无序列联表卡方检验
• 1.1 多个样本率的卡方检验 • 1.2 多个样本构成的卡方检验
公共卫生学院
应用条件
R×C列无序列联表卡方检验检
公共卫生学院
应用条件
R×C列联表的精确概率法 ①有格子理论频数(T) 小于1, ②或1T<5的格子数大于总格子数的 1/5(20%)
公共卫生学院
3.2 R×C列联表的精确概率法
例3.2 肝动脉介入治疗加(减)全身化疗治疗转 移性肝癌的临床观察结果如下表。试比较两 种治疗方法的疗效是否有统计学意义?
表3.2 不同方法治疗转移性肝比较
公共卫生学院
3.2 R×C列联表的精确概率法
①建立假设检验,确定检验水准
H0:两种疗法治疗转移性肝癌疗效相同 H1:两种疗法治疗转移性肝癌疗效不同
α=0.05
公共卫生学院
3.2 R×C列联表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.2 R×C列联表的精确概率法
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ①建立假设检验,确定检验水准
H0:π1=π2=π3(三个地区高血压患病率相同) H1:三个地区高血压患病率不相同或不全相同
α=0.05
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.2 R×C列联表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ③根据检验统计量的结果做出统计推断 P=0.007,可信区间0.004~0.009,α=0.05的 水平拒绝H0,认为静脉化疗与介入加化疗 治疗转移性肝癌疗效有差异。
四格表资料
公共卫生学院
T为理论频数:行合计×列合计除以N
应用条件
一般四格表卡方检验
①理论频数(T)均应大于5 ②或1T<5的格子数不宜大于总格子数的 1/5(20%)
公共卫生学院
1.1 一般四格表卡方检验
例题1.1 有195例肾炎患者,分别采用中 药和西药的方法治疗,疗效见表5.1.问两 组的疗效有无差异?
➢检验步骤 ②选择检验方法,计算统计量
(1) 频数加权
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
(2) Crosstabs(交叉表)过程对话框操作提示
公共卫生学院
1.1 一般四格表卡方检验
➢检验步骤 ②选择检验方法,计算统计量
(3) 定义Crosstabs过程对话框
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.2 连续校正卡方检验
➢当样本含量较大,且有20%格子的理论 频数小于5时,则需要采用连续性校正卡 方检验
➢应用条件
①四格表数据的样本含量较大(n≥40) ②一个格子的理论频数1≤T5
表3.1 两种药物的驱虫疗效对比
公共卫生学院
3.1四格表的精确概率法
据题意,本题n<40,故需用Fisher精确概率法
①建立假设检验,确定检验水准
H0:π1=π2 H1:π1≠π2
α=0.05
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
3.1四格表的精确概率法
➢检验步骤 ②选择检验方法,计算统计量
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.2 多个样本构成的卡方检验
例2.2 2002年某市某区妇幼保健院对该区 幼儿园4~6岁儿童视力进行筛查,结果见 表2.2。问不同年龄的儿童视力健康状况构 成比是否有差异?
公共卫生学院
2.2 多个样本构成的卡方检验
例2.2 4~6岁儿童视力筛查情况
公共卫生学院
2.2 多个样本构成的卡方检验