实验性研究统计分析策略(分类变量)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P 0.005 。按 0.05 检验水准拒绝 H 0 ,接受 H 1 ,可以认为两组降低颅内压总体有效率不
等, 即可认为异梨醇口服液降低颅内压的有效 率与氢氯噻嗪+地塞米松的有效率不同。
理论知识点—卡方检验
105
19
四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
理论知识点—卡方检验
组别 实验组 对照组 合计
有效 99(a) 75(c) 174
无效 5(b) 21(d) 26
合计 104 96 200
有效率(%) 95.20 78.13 87.00
理论知识点—卡方检验
本例资料经整理成下图形式,即有两个 处理组,每个处理组的例数由发生数和未发生
95 5 数两部分组成。表内有 75 21
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)
由英国统计学家Karl Pearson首次提出,故被 称为Pearson 2 。
理论知识点—卡方检验
个数的多少(严格 2 值也会愈 地说是自由度ν的大小)。自由度ν愈大, 2 大;所以只有考虑了自由度ν的影响, 值才能正确 地反映实际频数A和理论频数T 的吻合程度。
T
2
来表示
若检验假设 H0:π1=π2 成立,四个格子的实际 频数 A 与理论频数 T 相差不应该很大,即统计量 不应该很大。如果上述统计量值很大,从而怀疑 H0的正确性,继而拒绝H0,接受其对立假设H1, 即π1≠π2 。 这个统计量就称为卡方统计量。
理论知识点—卡方检验
2
( AT ) , (行数-1)(列数 1) T
T
值的大小还取决于
2
A T 2
检验的自由度取决于可以自由取值的格子数目, 而不是样本含量n。四格表资料只有两行两列,ν =1, 即在周边合计数固定的情况下,4个基本数据当中只 有一个可以自由取值。
可通过 检验的基本公式来理解。
2
卡方分布: 若k个随机变量,z1,z2,…zk,相互独立且服从标
四个基本数据
源自文库
,其余数据均由此四个数据推算出来的,故称
四格表资料。
理论知识点—卡方检验
处理组 甲 乙 合 计
发生数
未发生数
合计
a c a+c
b d b+d
a+b c+d n
图7-2 四格表资料的基本形式
理论知识点—卡方检验
资料的特征及统计分析策略(1)
采用卡方检验
• 单因素分组:2个水平
• 资料类型:二分类资料
2+z 2+…+z 2被称 准正态分布,则随机变量 x=z 1 2 K 卡方值是一定自由度的卡方分布函 2 为服从自由度为k的卡方分布,记作: x (k ) 数的一个值,正常情况下该值较小
理论知识点—卡方检验
2 分布图形
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
1
2 2 2 2 (99 90.48) (5 13.52) (75 83.52) (21 12.48) 2 90.48 13.52 83.52 12.48 12.86
( 2 1)(2 1) 1
理论知识点—卡方检验
(3)求P值,做统计结论
以 =1 查 2 界值表得 2 界值为 3.84 ,
第一个问题
我们的效果/结局指标是无序分类变量资料 (包括二分类)还是有序分类变量资料?
理论知识点—卡方检验
(一)无序分类变量资料比较
案例
某院欲比较异梨醇口服液(试验组)和氢
氯噻嗪 +地塞米松(对照组)降低颅内压的疗效。
将 200例颅内压增高症患者随机分为两组,结果见
表1。问两组降低颅内压的总体有效率有无差别?
2
2
(99 21 5 75) 200 104 96 174 26
2
12.86
理论知识点—卡方检验
2 四格表资料 检验方法选择条件
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
α=0.05。
理论知识点—卡方检验
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
• 设计类型:完全随机设计
理论知识点—卡方检验
表7-2 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
有效者应为104(174/200)=90.48, 无效者为104(26/200)=13.52;
同理,对照组的96例颅内压增高症患者中
有效者应为96(174/200)=83.52, 无效者为96(26/200)=12.48。
理论知识点—卡方检验
反映实际频数与理论频数的吻合程度可用统计量
A T
f ( )
2
6
10
82
10
12
14
16
理论知识点—卡方检验
2值、P值和统计结论
2值 P值
统计结论
220.05, 0.05 不拒绝H0,差异无统计学意义
220.05, 0.05 拒绝H0,接受H1,差异有统计学意义
理论知识点—卡方检验
假设检验步骤
(1) 建立检验假设,确定检验水平。
实际频数
理论频数
理论知识点—卡方检验
理论频数由下式求得:
nR nC TRC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
理论知识点—卡方检验
理论频数 T 是根据检验假设 H0 : 1 2 ,且用合 并率来估计 而定的。 无效假设是试验组与对照组降低颅内压的总体 有效率相等,均等于合计的有效率87%。那么理论 上,试验组的104例颅内压增高症患者中
等, 即可认为异梨醇口服液降低颅内压的有效 率与氢氯噻嗪+地塞米松的有效率不同。
理论知识点—卡方检验
105
19
四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
理论知识点—卡方检验
组别 实验组 对照组 合计
有效 99(a) 75(c) 174
无效 5(b) 21(d) 26
合计 104 96 200
有效率(%) 95.20 78.13 87.00
理论知识点—卡方检验
本例资料经整理成下图形式,即有两个 处理组,每个处理组的例数由发生数和未发生
95 5 数两部分组成。表内有 75 21
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)
由英国统计学家Karl Pearson首次提出,故被 称为Pearson 2 。
理论知识点—卡方检验
个数的多少(严格 2 值也会愈 地说是自由度ν的大小)。自由度ν愈大, 2 大;所以只有考虑了自由度ν的影响, 值才能正确 地反映实际频数A和理论频数T 的吻合程度。
T
2
来表示
若检验假设 H0:π1=π2 成立,四个格子的实际 频数 A 与理论频数 T 相差不应该很大,即统计量 不应该很大。如果上述统计量值很大,从而怀疑 H0的正确性,继而拒绝H0,接受其对立假设H1, 即π1≠π2 。 这个统计量就称为卡方统计量。
理论知识点—卡方检验
2
( AT ) , (行数-1)(列数 1) T
T
值的大小还取决于
2
A T 2
检验的自由度取决于可以自由取值的格子数目, 而不是样本含量n。四格表资料只有两行两列,ν =1, 即在周边合计数固定的情况下,4个基本数据当中只 有一个可以自由取值。
可通过 检验的基本公式来理解。
2
卡方分布: 若k个随机变量,z1,z2,…zk,相互独立且服从标
四个基本数据
源自文库
,其余数据均由此四个数据推算出来的,故称
四格表资料。
理论知识点—卡方检验
处理组 甲 乙 合 计
发生数
未发生数
合计
a c a+c
b d b+d
a+b c+d n
图7-2 四格表资料的基本形式
理论知识点—卡方检验
资料的特征及统计分析策略(1)
采用卡方检验
• 单因素分组:2个水平
• 资料类型:二分类资料
2+z 2+…+z 2被称 准正态分布,则随机变量 x=z 1 2 K 卡方值是一定自由度的卡方分布函 2 为服从自由度为k的卡方分布,记作: x (k ) 数的一个值,正常情况下该值较小
理论知识点—卡方检验
2 分布图形
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
1
2 2 2 2 (99 90.48) (5 13.52) (75 83.52) (21 12.48) 2 90.48 13.52 83.52 12.48 12.86
( 2 1)(2 1) 1
理论知识点—卡方检验
(3)求P值,做统计结论
以 =1 查 2 界值表得 2 界值为 3.84 ,
第一个问题
我们的效果/结局指标是无序分类变量资料 (包括二分类)还是有序分类变量资料?
理论知识点—卡方检验
(一)无序分类变量资料比较
案例
某院欲比较异梨醇口服液(试验组)和氢
氯噻嗪 +地塞米松(对照组)降低颅内压的疗效。
将 200例颅内压增高症患者随机分为两组,结果见
表1。问两组降低颅内压的总体有效率有无差别?
2
2
(99 21 5 75) 200 104 96 174 26
2
12.86
理论知识点—卡方检验
2 四格表资料 检验方法选择条件
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
α=0.05。
理论知识点—卡方检验
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
• 设计类型:完全随机设计
理论知识点—卡方检验
表7-2 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
有效者应为104(174/200)=90.48, 无效者为104(26/200)=13.52;
同理,对照组的96例颅内压增高症患者中
有效者应为96(174/200)=83.52, 无效者为96(26/200)=12.48。
理论知识点—卡方检验
反映实际频数与理论频数的吻合程度可用统计量
A T
f ( )
2
6
10
82
10
12
14
16
理论知识点—卡方检验
2值、P值和统计结论
2值 P值
统计结论
220.05, 0.05 不拒绝H0,差异无统计学意义
220.05, 0.05 拒绝H0,接受H1,差异有统计学意义
理论知识点—卡方检验
假设检验步骤
(1) 建立检验假设,确定检验水平。
实际频数
理论频数
理论知识点—卡方检验
理论频数由下式求得:
nR nC TRC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
理论知识点—卡方检验
理论频数 T 是根据检验假设 H0 : 1 2 ,且用合 并率来估计 而定的。 无效假设是试验组与对照组降低颅内压的总体 有效率相等,均等于合计的有效率87%。那么理论 上,试验组的104例颅内压增高症患者中