医学统计学 四格表资料的 检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
by”选项;从左边源变量名称框中选择频数变量“freq”作为权变量,将 其选入”Frequency variable”框中 • “Analyze”→ “Descriptive Statistics” → “Crosstabs”打开 “Crosstabs” … • Row(s): treat • Column(s): effect • Statistics… Chi-square • Cells Expected • 3.结果及解释
1. 2 分布
(1) 2分布是一种连续型分布:按分布的密度函数可给出
自由度=1,2,3,……的一簇分布曲线 (图7-1)。
(2) 2分布的一个基本性质是可加性: 如果两个独立的
随机变量X1和X2分别服从自由度ν1和ν2的分布,
即
X1
~
2 1
,
X2
~
2 2
,那么它们的和(
X1+X2
)服从自由度
( ν1+ν2 )的 分 2布,即 ( X1 X~2 )
95.20
对照组 75(83.52) c 21(12.48) d 96 (c+d)
78.13
合 计 174(a+c)
26(b+d)
200 (n)
87.00
本例资料经整理成图7-2形式,即有两
个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 75
5 21
四个
基本数据,其余数据均由此四个数据推算
α=0.05。
(2)求检验统计量值
T11 104 174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
分析步骤
• 1.建立数据文件 :3个变量 • (1)处理组别变量(treat):1代表试验组,2代表对照组。 • (2)疗效变量(effect):1代表有效,2代表无效。 • (3)freq为频数变量 • 2.统计分析: • DATA→Weight Cases打开“Weight Cases”对话框,激活“Weight Case
2
2. 2 检验的基本思想
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结 果见表7-1。问两组降低颅内压的总体有效率有无 差别?
表7-1 两组降低颅内压有效率的比较
组 别 有效
无效
合 计 有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a+ b)数ຫໍສະໝຸດ ,而不是样本含量n。四格表资料只有
两 行 两 列 , = 1 , 即 在 周 边 合 计 数 固 定 的 情
况下,4个基本数据当中只有一个可以自由
取值。
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
检验统计量 2值反映了实际频数与理
论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际频 数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 值2 很大,即相对应的P 值很小,
若 P,则 反过来推断A与T相差太大,超出了抽
样误差允许的范围,从而怀疑H0的正确性,继而 拒绝H0,接受其对立假设H1,即π1≠π2 。
出来的,故称四格表资料。
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合 计 a+c b+d
n
图7-2 四格表资料的基本形式
基本思想:可通过 2 检验的基本公式
来理解。
2 (AT)2 , (行数-1)(列数1)
T
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
。 2 1 2
(3) 2 界值:当 确定后, 2 分布曲线下右侧尾部的 面积为 时,横轴上相应的 2 值,记作2, (见附表 8)。 2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
0.5 0.4 0.3
f (2) 0.2
0.1 0 0
1 6
10
2 4 6 8 10 12 14 16
理论频数由下式求得:
TRC
nRnC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
理论频数 是T根据检验设 H0 :,1 且2用 合
并率来估计 而定的。
如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
由公式(7-1)还可以看出: 2值的大小还取决于 (A T )2
个数的多少(严格地说是自由度ν的大小)。由于各
(
A
T T
)2
T
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑
了自由度ν的影响, 值2 才能正确地反映实际频数A和理论频
数T 的吻合程度。
检 2验的自由度取决于可以自由取值的格子
多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。
检验统计量: 2
应用:计数资料
第一节 四格表资料的 2 检验
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
一、 2检验的基本思想
2
检 验
第一节 四格表资料的 2 检验 第二节 配对四格表资料的 2 检验 第三节 四格表资料的 Fisher 确切概率法 第四节 行×列表资料的 2 检验 第五节 多个样本率间的多重比较 第六节 有序分组资料的线性趋势检验(不讲) 第七节 频数分布拟合优度的 2 检验
目的: 推断两个总体率或构成比之间有无差别
90.48
13.52
83.52
12.48
12.86
(2 1)(2 1) 1
以 =1 查附表 8 的 2 界值表得 P 0.005 。按 0.05 检验水准拒绝 H 0 , 接受 H1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。
1. 2 分布
(1) 2分布是一种连续型分布:按分布的密度函数可给出
自由度=1,2,3,……的一簇分布曲线 (图7-1)。
(2) 2分布的一个基本性质是可加性: 如果两个独立的
随机变量X1和X2分别服从自由度ν1和ν2的分布,
即
X1
~
2 1
,
X2
~
2 2
,那么它们的和(
X1+X2
)服从自由度
( ν1+ν2 )的 分 2布,即 ( X1 X~2 )
95.20
对照组 75(83.52) c 21(12.48) d 96 (c+d)
78.13
合 计 174(a+c)
26(b+d)
200 (n)
87.00
本例资料经整理成图7-2形式,即有两
个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 75
5 21
四个
基本数据,其余数据均由此四个数据推算
α=0.05。
(2)求检验统计量值
T11 104 174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (21 12.48)2
分析步骤
• 1.建立数据文件 :3个变量 • (1)处理组别变量(treat):1代表试验组,2代表对照组。 • (2)疗效变量(effect):1代表有效,2代表无效。 • (3)freq为频数变量 • 2.统计分析: • DATA→Weight Cases打开“Weight Cases”对话框,激活“Weight Case
2
2. 2 检验的基本思想
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结 果见表7-1。问两组降低颅内压的总体有效率有无 差别?
表7-1 两组降低颅内压有效率的比较
组 别 有效
无效
合 计 有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a+ b)数ຫໍສະໝຸດ ,而不是样本含量n。四格表资料只有
两 行 两 列 , = 1 , 即 在 周 边 合 计 数 固 定 的 情
况下,4个基本数据当中只有一个可以自由
取值。
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
检验统计量 2值反映了实际频数与理
论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际频 数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 值2 很大,即相对应的P 值很小,
若 P,则 反过来推断A与T相差太大,超出了抽
样误差允许的范围,从而怀疑H0的正确性,继而 拒绝H0,接受其对立假设H1,即π1≠π2 。
出来的,故称四格表资料。
处理组 发生数 未发生数 合计
甲
a
b
a+b
乙
c
d
c+d
合 计 a+c b+d
n
图7-2 四格表资料的基本形式
基本思想:可通过 2 检验的基本公式
来理解。
2 (AT)2 , (行数-1)(列数1)
T
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
。 2 1 2
(3) 2 界值:当 确定后, 2 分布曲线下右侧尾部的 面积为 时,横轴上相应的 2 值,记作2, (见附表 8)。 2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
0.5 0.4 0.3
f (2) 0.2
0.1 0 0
1 6
10
2 4 6 8 10 12 14 16
理论频数由下式求得:
TRC
nRnC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
理论频数 是T根据检验设 H0 :,1 且2用 合
并率来估计 而定的。
如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
由公式(7-1)还可以看出: 2值的大小还取决于 (A T )2
个数的多少(严格地说是自由度ν的大小)。由于各
(
A
T T
)2
T
皆是正值,故自由度ν愈大, 2 值也会愈大;所以只有考虑
了自由度ν的影响, 值2 才能正确地反映实际频数A和理论频
数T 的吻合程度。
检 2验的自由度取决于可以自由取值的格子
多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。
检验统计量: 2
应用:计数资料
第一节 四格表资料的 2 检验
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
一、 2检验的基本思想
2
检 验
第一节 四格表资料的 2 检验 第二节 配对四格表资料的 2 检验 第三节 四格表资料的 Fisher 确切概率法 第四节 行×列表资料的 2 检验 第五节 多个样本率间的多重比较 第六节 有序分组资料的线性趋势检验(不讲) 第七节 频数分布拟合优度的 2 检验
目的: 推断两个总体率或构成比之间有无差别
90.48
13.52
83.52
12.48
12.86
(2 1)(2 1) 1
以 =1 查附表 8 的 2 界值表得 P 0.005 。按 0.05 检验水准拒绝 H 0 , 接受 H1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。