统计理论5_分类变量的假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.14 0.25
u
2.031
0.20 0.80(1 100 1 120)
• 判断:u =2.031 > u0.05 = 1.96(双侧),p < 0.05。 • 在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。
版权所有:多多医善
χ 检验
版权所有:多多医善
χ 分布的基本概念
χ 分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线。 χ 界值:当 确定后,χ 分布曲线右侧尾部的面积为 时,横轴上相应的χ 值记作 , 。χ
组别 甲组 乙组 合计
阳性数
a c a+c
阴性数
b d b+d
合计
a+b c+d a+b+c+d=n
版权所有:多多医善
四格表χ 检验
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例 颅内压增高症患者随机分为两组,结果见下表。问两组降低颅内压的总体有效率有无差别?
u | p 0 | | p 0 |
p
0 (1 0 ) n
版权所有:多多医善
率的u检验
根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃 溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃 疡病患者易发生胃出血。
P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接
受其对立假设H1,即π1≠π2 。
版权所有:多多医善
四格表χ 检验
2×2分类变量经整理成图四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生 数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料
应用条件:样本含量n足够大,两样本的np和n(1-p)均大于5 。 分布:样本率p以总体率为中心呈正态分布或近似正态分布。 u值计算公式:
u p1 p2
p1 p2
S p1 p2
pc (1 pc )(1 n1 1 n2 )
pc
x1 x 2 n1 n 2
版权所有:多多医善
两样本率比较的u检验
处理组 甲 乙
合计
发生数 a c a+c
未发生数 b d
b+d
合计 a+b c+d n
=∑ ( ) , =(行数-1)(列数-1) 其中A为实际频数,T为期望频数
检验统计量χ 值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际
频数A与理论频数T相差不应该很大,即统计量 χ 不应该很大。如果χ 值很大,即相对应的P值很小,若
组 别 有效
无效
试验组 对照组
99(90.48) a 75(83.52) c
5(13.52) b 21(12.48) d
合 计 174(a+c)
26(b+d)
合 计 有效率(%)
104 (a+ b)
95.20
96 (c+d)
78.13
200 (n)
87.00
无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。 理论上 试验组的104例颅内压增高症患者中:有效者为104(174/200)=90.48;无效者为104(26/200)=13.52;
11(a)
9 (b)
1 (c)
7 (d)
12
16
合计
20 8 28
上述配对设计实验中,就每个对子而言,两种培养效果不外乎有四种可能,差异只体现在后两种情况:
①两种检测方法皆为阳性(a);
②两种检测方法皆为阴性(d);
③甲培养基为阳性,乙培养基为阴性(b);④甲培养基为阴性,乙培养基为阳性(c)。
版权所有:多多医善
• X2=2.71<X20.05,1=3.84 • 若对X2值不校正,α=4.06,得P<0.05,结论正好相反。
版权所有:多多医善
匹配情况下四格表χ 检验
因变量和自变量均为二分类变量; 用于按照自变量特征匹配情况下,因变量差异的假设检验。
若b+c>40,公式为:
2 b c2
bc
若b+c≤40,需计算X2校正值
u | 0.316 0.20 | 3.58 0.20(1 0.20) 152
• 判断:u=3.58 > u0.05=1. 64(单侧), P<0.05。 • 在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。
版权所有:多多医善
两样本率比较的u检验
此处的率本质上是构成比 应用于二分类变量某一类别的构成比与某一给定值是否一致
匹配情况下四格表χ 检验
例 有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观 察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如下表所示,两种白喉杆菌 培养基的效果有无差别?
(1)建立检验假设 H0:总体B=C,即两种白喉杆菌培养基的效果相同 H1:总体B≠C,即两种白喉杆菌培养基的效果不同
组 别 有效
无效
试验组 对照组
99(90.48) a 75(83.52) c
5(13.52) b 21(12.48) d
合 计 174(a+c)
26(b+d)
合 计 有效率(%)
104 (a+ b)
95.20
96 (c+d)
78.13
200 (n)
87.00
T11 104174 / 200 90.48 ,T12 104 90.48 13.52 T21 174 90.48 83.52 ,T22 26 13.52 12.48
值越大, 值越小;反之,χ 值越小, 值越大
版权所有:多多医善
χ 检验
X2检验(chi-square test)或称卡方检验; 常用于检验两个或多个样本率及构成比之间有无差别; 还用来检验匹配的分类变量及两种属性或特征之间是否有关系等。
版权所有:多多医善
四格表χ 检验
因变量和自变量均为二分类变量; 推断两个总体率(构成比)是否有差别(和u检验等价)。
处理组 甲 乙
合计
发生数 a c a+c
未发生数 b d
b+d
合计 a+b c+d n
=∑ ( ) , =(行数-1)(列数-1) 其中A为实际频数,T为期望频数
公式推导可得:
χ
=
(a
+
(ad b)(a +
− bc) c)(b +
n d)(b
+
c)
版权所有:多多医善
四格表χ 检验
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例 颅内压增高症患者随机分为两组,结果见下表。问两组降低颅内压的总体有效率有无差别?
理论频数T是根据检验假设H :π =π = π,且用合并率来估计π而定的。
=
其中,TRC为第R行C列的理论频数
nR 为相应的行合计
nC 为相应版的权所列有合:多计多医善
四格表χ 检验
2×2分类变量经整理成图四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生 数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料
组 别 有效
无效
合 计 有效率(%)
试验组 99(90.48) a 对照组 75(83.52) c 合 计 174(a+c)
5(13.52) b 21(12.48) d 26(b+d)
104 (a+ b) 96 (c+d) 200 (n)
95.20 78.13 87.00
版权所有:多多医善
四格表χ 检验
2×2分类变量经整理成图四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生 数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料
处理组 甲 乙
合计
发生数 a c a+c
未发生数 b d
b+d
合计 a+b c+d n
=∑ ( ) , =(行数-1)(列数-1) 其中A为实际频数,T为期望频数
2
=
(99−90.48)2 90.48
+
(5−13.52)2 13.52
+
(75−83.52)2 83.52
+
(21−12.48)2 12.48
=
12.86


(2 1)(2 wenku.baidu.com)
1
χ . , = 3.84 χ . , = 6.63
以 =1查 2界值表得P<0.005。按 =0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效 率不等,即可认为异梨醇口服液降低颅内压的版有权所效有率:多高多于医善氢氯噻嗪+地塞米松的有效率。
χ 分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量χ 的抽样分布亦呈
离散性质。为改善统计量χ 分布的连续性,则需行连续性校正。
χ=
− − 0.5
χ=
| − | − ⁄2 + )( + )( + )( +
版权所有:多多医善
四格表χ 检验
2×2分类变量经整理成图四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生 数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料
四格表χ 检验
2×2分类变量经整理成图四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生 数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料
处理组 甲 乙
合计
发生数 a c a+c
未发生数 b d
b+d
合计 a+b c+d n
=∑ ( ) , =(行数-1)(列数-1) 其中A为实际频数,T为期望频数
某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果 如下表所示,两组流感发病率有无差别?
组别 用药组 对照组 合计
观察人数 100 120 220
发病人数 14 30 44
发病率(%) 14 25 20
• n1=100,p1=14%,n2=120,p2=25%,pc=20%,1-pc=80%
(2)计算值 本例b=9,c=1,b+c<40
2 (| 9 1 | 1) 2 4.90
9 1
(3)确定P值 本例X2=4.90>X2=3.84,P<0.05 (4)推断结论 在α=0.05的水准上,拒绝H0,接收H1,差异有统计学意义。可认为甲、乙两种白喉杆菌培
分类变量的假设检验
版权所有:多多医善
1 • 分类变量统计分析概述 2 • 率的u 检验 3 χ 检验 4 • 列联表的精确概率法 5 • 秩和检验
版权所有:多多医善
分类变量统计分析概述
医学研究 目的是发现适用于总体人群的科学规律 由于实施可行性的限制,往往无法直接研究总体人群,而是选择由部分个体组成的样本
处理组 甲 乙
合计
发生数 a c a+c
未发生数 b d
b+d
合计 a+b c+d n
=∑ ( ) , =(行数-1)(列数-1) 其中A为实际频数,T为期望频数
四格表资料χ 检验公式选择条件: n≥ 40, ≥ 5,专用公式 n≥ 40,1 ≤ T < 5,校正公式
n<40或T<1,确切概率法
版权所有:多多医善
对照组的96例颅内压增高症患者中:有效者为96(174/200)=83.52;无效者为96(26/200)=12.48。
版权所有:多多医善
四格表χ 检验
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例 颅内压增高症患者随机分为两组,结果见下表。问两组降低颅内压的总体有效率有无差别?
统计推断 统计推断的任务就是用样本信息推论总体特征。
统计推断
参数估计 假设检验
点估计 区间估计
已在医学统计推断概述部分介绍
版权所有:多多医善
u检验
版权所有:多多医善
样本率与总体率比较的u检验
此处的率本质上是构成比 应用于二分类变量某一类别的构成比与某一给定值是否一致
应用条件:样本含量n足够大, np与n(1-p)均≥5 。 分布:样本率p以总体率为中心呈正态分布或近似正态分布。 u值计算公式:
2 b c 12 bc
版权所有:多多医善
匹配情况下四格表χ 检验
例 有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观 察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如下表所示,两种白喉杆菌 培养基的效果有无差别?
甲种
+ - 合计
乙种


四格表χ 检验
某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如下表,问两疗法的治愈率是否相等?
组别 用药组 对照组 合计
治愈人数 26(28.8) 36(33.2) 62
未治愈人数 7(4.2) 2(4.8) 9
合计 33 38 71
2 26 2 7 36 71 22 71 2.74 33 38 62 9
相关文档
最新文档