医学统计学第12章__x2检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
布变量之平方和。可表示为:
2=u12+ u22+……+ uv2 每一自由度下的2分布曲线都有其自身分布规
律。
P33
2分布与定量资料
2分布是方差的抽样分布 设从正态分布N(,2)中随机抽取含量为n的样本,
样本均数和标准差分别为 和sX,且:
2 (n 1)s2 2
则2值服从自由度为n-1的2分布(2-distribution)
按α =0.05,有统计学意义,不 拒 不绝 相H同0,。尚不能认为两组存活率
2. 四格表专用公式
2= 例(续)
ad bc2 n
a bc d a cb d
578 39 272131
2=
3.52 963584 47
3.四格表 2值的校正
由于 2界值表是由连续分布: 2分布
计算出来的,但原始数据属计数资料,是
离散的,由此计算出来的 2值也是离散
的,特别是四格表,有时若不校正,所
求 2值偏大,所得概率p值偏低。
F.Yates
1) n≥40,且T≥5时,用未校正的值
2) 1≤T<5,且n≥40时,宜用校正χ2值
3) T<1或n<40时,宜用精确概率计算法
表7.3 两组化疗的缓解率比较
治疗组
单纯化 疗
复合化 疗
合计
缓解 未缓解 2(4.68) 10(7.32)
14(11.32) 15(17.68)
ຫໍສະໝຸດ Baidu
16
25
合计 12
29 41
缓解率(%) 16.67
48.28 39.02
例7.3
解:(1)建立检验假设和确定检验水准
H0:两种方法治疗后患者的完全缓解率相等,即
四格表基本格式
行合计
患病
未患病
(nR)
实验组
a
b
n1.
对照组
c
d
n2.
列合计
nC
n.1
n.2
n
例7-2某医院肿瘤科3 年中共治疗乳腺癌患者n=131
例,每例均观察满5年,其中单纯手术治疗组观察 n1=84例,存活x1=57例,存活率p1=67.9%,联合治 疗(手术+术后化疗)组观察n2=47例,存活x2=39例,
84(c+d)
67.9
131(n=a+b+c+d) 73.3
提出问题
• 研究目的:比较两组存活率有无差别?
p1=67.9%
1 =
p2=83%
2 ?
• 能否认为两组存活率有差别?
H0:两个组的存活率相同,即1=2
=合并存活率96/131=73.33%
H1:两总体存活率不等,即12。
• 假设:两种药物的存活率相同 • 则可以算得理论上的两组的存活率均为
• 考虑绝对数不能完全体现其对2 值的贡
献:
2
(A T)2 T
• 考虑 2 值受格子数多少的影响,引入
(行数 -1)(列数 -1)
A T 2
2=
T
实际频数
理论频数
H0:两个组的存活率相同 =合并存活率73.33%
实际频数和理论频数的差别 96/131
A T 2
2=
T
自由度 =(行数-1)(列数-1)
四格表 =(2-1)(2-1)=1
X2统计量的特征: 2=
① 2≥0


A
T T
2
② 2值的大小反映了实际频数与理论
频数的吻合程度。
③ 2值的大小与格子数有关,格子数 越多,则自由度ν越大, 2值也越大。
确定P值
• 如果检验假设成立,则实际数与理论数之
2.36
(3) 确定p值,下结论
按 =1查附表3,2界值表,得P>0.05,按 =
0.05水准,不拒绝H0,差异无统计学意义。故根 据本资料尚不能认为两种疗法的总体缓解率有差 别。
补充例 某矿石粉厂当生产一种矿石粉石时,在数
天内即有部分工人患职业性皮肤炎,在生产季节开 始,随机抽取15名车间工人穿上新防护服,其余仍 穿原用的防护服,生产进行一个月后,检查两组工 人的皮肤炎患病率,结果如下
3.84
7.81
12.59
3
6
9
12
15
18
¿¨· ½ Öµ
2 分布的特征
2分布为一簇单峰正偏态分布曲线,2取值范 围为0~∞。=1时分布最为偏斜。随的逐渐加
大,分布趋于对称。
自由度为的2分布,其均数为,方差为2。 =1时2分布实际上是标准正态分布变量之平 方。自由度为的.分布实际上是个标准正态分
96/131=73.33%。
计算理论频数
• 按两组合计的有效率73.33%,则理论上:
单纯组有效人数为: 单纯组无效人数为: 联合组有效人数为: 联合组无效人数为:
84 96 131
84 35 131
47 96 131
47 35 131
T nRnC n
T nRnC n
• nR 为相应行的合计 • nC 为相应列的合计 • n 为总例数。
T12=84-61.56=22.44
• 如果假设成立,则实际频数和理论频数吻
合,即: (A T ) 0
对每一个格子有:A T 0 而实际上:
57-61.56=-4.56 27-22.44= 4.56
39-34.44=4.56 8-12.56=-4.56
• 为消除符号的影响,则: (A T )2
行合计
患病
未患病
(nR)
实验组 a(T11) b(T12)
n1.
对照组 c(T21) d(T22)
n2.
列合计
nC
n.1
n.2
n
两组治疗方法治疗乳腺癌存活率比较
处理
存活
未存活
合计
单纯组 57(61.56) 27(22.44)
84
联合组 39(34.44) 8(12.56)
47
合计
96
35
131
T11= 84*96 =61.56 131
重要的连续性分布。 K.Pearson
2分布(chi-square distribution)
Ý×߸
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2 )

1
2(
/
2)

2
2
(
/ 21)
e2 /2
× Ô ÓÉ ¶È £½ 1 × Ô ÓÉ ¶È £½ 2 × Ô ÓÉ ¶È £½ 3 × Ô ÓÉ ¶È £½ 6 P=0.05的临界值
1=2
• H1:两种方法治疗后患者的完全缓解率不等,即
12 • =0.05
(2) 计算检验统计量
本例a格的理论频数最小,T11=1216/41=4.68<5,n>40,
故考虑用校正公式计算2值。
( 215 1014 41/ 2)2 41
c2
12 2916 25
1<T11<5 且 n=43>40,
所以宜用2值的校正公式2=2.94
补充
(3)下结论 查χ2界值表得0.10>p>0.05,按α =0.05水平不拒 绝有H差0,别尚。不能认为穿不同防护服的皮肤炎患病率
若不校正, 2 =4.33 p<0.05
三.行×列表的χ2检验—
多个率或构成比比较 前面介绍的四格表只有2行2列,是最简单形式的 行×列表,只能对2个率或2类构成比作出比较。 在医学研究中有时要比较几个率,如:要比较某 市重污染区、一般市区和农村三个地区的出生婴 儿的致畸率。有时要分析两组或几组多类构成的 构成比是否相同,如:以母乳、牛乳、混合三种 不同方式喂养的新生儿体重增长的构成是否一致。 有时要推断2个分类变量是否有关联,如:研究 冠心病与眼底动脉硬化的关系。
障患病率有无差异?
表7.4 2003年南通市新城桥街道老人白内障患病率(%)
文化程度 文盲 小学 初中 高中及中专 大专及以上 合计
受检人 数
455 684 664 682 555 3040
差一般不会很大,2值应很小,即此时出 现大的2值的概率P很小。 • 2与P值的对应关系可查2界值表(附表3)。 2值愈大,P值愈小。
2检验的精髓
检验实际频数和理论频数的吻合 程度。如果实际频数和理论频数越吻合, 说明H0假设成立的可能性就越大,反之, 如果实际频数和理论频数相差越远,说明 H0越不可能成立。
地区
甲 乙 丙 合计
检验的样品数
未污染
污染
6
23
30
14
8
3
44
40
合计
29 44 11 84
污染率(%)
79.3 31.8 27.3 47.6
2检验是一种非常重要的,用途非常广
泛的假设检验方法。用以检验多个率(或 构成比)之间差异是否具有统计学意义, 当然也适合于两组比较。
2检验来源于 2分布, 2分布是一种非常
二. 四格表的 2检验
四格表基本格式 处理 有效 无效 合计 A 组 a b a+b B 组 c d c+d 合计 a+c b+d n
四格表资料
• 四格表(fourfold table),亦称2×2表(2×2 table)
四格表资料的2 检验
• 基本思想:实际频数和理论频数吻合的程度
• 2 检验的计算公式
P33
2分布(与定性资料)
应用原理: 用途:
2


( Ai
Ti Ti
)2
1. 推断多个总体率之间有无差别
2. 推断几组总体构成比之间有无差别
3. 两个变量之间有无关联性
4. 频数分布的拟合优度检验
P33
一. χ2检验的基本思想
在医学资料中,常常需要比较两个样本 之间的差异有无显著性,如推断某人群 男与女的某种疾病的患病率是否相等, 即此病是否与性别有关。这类资料由4个 数据构成:男与女的患病人数和未患病 人数,统计学称这类资料为四格表资料。P74
2检验
例7-2某医院肿瘤科3 年中共治疗乳腺癌患者n=131
例,每例均观察满5年,其中单纯手术治疗组观察 n1=84例,存活x1=57例,存活率p1=67.9%,联合治 疗(手术+术后化疗)组观察n2=47例,存活x2=39例,
存活p2=83.0%,问两组存活率有无差别?
是否可用前面所学的方法进行统计推断?
表2 穿新旧两种防护服工人的皮肤炎患病率比较
防护服
阳性
阴性
合计
患病率

1
14
15
6.7

10
18
28
35.7
合计
11
32
43
25.6
问两组工人的皮肤炎患病率有无差别?
补充
解:(1)建立检验假设和确定检验水准 H0:π 1=π 2 H1:π 1≠π 2
α =0.05
(2)计算检验统计量 理论频数T11=15*11/43=3.84,
2
(A T)2 T
A 为实际频数 ( actual frequency) T 为理论频数(theoretical frequency)
1.四格表的χ2检验的基本步骤
例7.2 解:建立检验假设和确定检验水准
H0:两组存活率相同,即π 1=π 2 H1:两组存活率不相同,即π 1≠π 2
表7.1 两种药物治疗牙科术后疼痛有效率的比较
处理 单纯 联合 合计
存活 57 39 96
死亡 27 8 35
合计
有效率(%)
84
67.9
47
83.0
178
73.3
例 某省观察三个地区的花生污染黄曲霉毒素B1的 情况,见下表,问三个地区花生污染黄曲霉毒素B1 污染率有无差别?
某省三个地区花生的黄曲霉毒素B1污染率比较
2
2
AT 0.5
T
2

2

a
ad bc n / 2
bc d a cb

n d

仅用于ν =1时
P84
例7.3 表7.3资料是单用甘磷酰芥(单纯化疗组)与复
合使用争光霉素、环磷酰胺等药(复合化疗组)对淋巴 系统肿瘤的疗效,问两组患者总体的完全缓解率有 无差别?
1.公式和检验步骤
行×列表的χ2值计算
一般公式

A
T
T
2
专用公式
n
A2 nR nC
1
例7-4:某研究小组为了解江苏省南通市市区60岁及
以上老人白内障的患病情况,于2003年抽取新城桥 街道8个社区作为调查范围,所有登记在册的3352名 老人接收了调查。在3040例接收眼科检查的老人中, 1060例患白内障,患病率为34.87%。按文化程度分 组后的患病情况见表7.4,问不同文化程度老人白内
存活p2=83.0%,问两组存活率有无差别?
是否可用前面所学的方法进行统计推断?
表7.2 131例乳腺癌患者治疗后5年存活率的比较
处 理
联合 治疗
单纯 治疗
合 计
存活数 39(a) 57(c) 96(a+c)
死亡数 8(b) 27(d)
35(b+d)
合计治疗数 47(a+b)
存活 率(%)
83.0
α =0.05
(2) 计算检验统计量
理论频数
T11=96*84/131=61.56 T12=22.44
T21=34.44
T22=12.56
2=3.52
自由度ν=(R-1)(C-1)=1
(3) 确定p值,下结论
自由度ν =(R-1)(C-1)=1 查 2界值表得 P>0.05 x20.05,1=3.84
相关文档
最新文档