医学统计学第3版 卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量:
2
应用:定性资料
8
第一节 2分布和拟合优度检验
一、2分布
2分布是一种连续型随机变量的概率分布。
如果Z服从标准正态分布,那么Z2服从自由度为
1的2分布, 其概率密度在(0,+∞)区间上表 现为L型,如图7-1对应于自由度=1的曲线,取 较小值的可能性较大,取较大值的可能性较小。
9
χ2分布(chi-square distribution)
0.5 0.4 0.3
1 f ( ) 2( / 2) 2
2
2

( / 2 1)
e
2 / 2
ß Ý · ×
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
13
拟合优度检验
2.计算检验统计量
实际观察到的频数用A表示,根据H0确定的 理论频数用T表示,则大样本时统计量,自由度 =K-1-(利用的参数个数)
2 ( A T ) 2 i i Ti i 1 k
( A T )2 T
2
14
拟合优度检验
以上两个公式2检验的基本公式,所有其它
11
2分布

图7-1, 2分布的形状依赖于自由度ν的大小, 当自由度ν>2时,随着ν的增加,曲线逐渐 趋于对称,当自由度ν趋于∞时,2分布逼 近正态分布。各种自由度的2分布右侧尾 2 部面积为α时的临界值记为 ,
列于附表8。
12
二、拟合优度检验
拟合优度检验是根据样本的频率分布 检验其总体分布是否等于某给定的理论分 布。 拟合优度检验步骤: 1.建立检验假设 H0:总体分布等于给定的理论分布 H1:总体分布不等于给定的理论分布
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ¨· ½ Ö µ
15
18
10
(1)自由度一定时,P值越小, x2值 越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 (2)当P 值一定时,自由度越大, x2 越大。 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
(16.6) 43 (26.4)
(55.4) 143 (87.6)
H 0 成立
两组人群的总体阳性率相同
TRC
nR nC n
理论频数的计算及含义
x2 统计量的含义
2 ( A T ) 2 RC RC TRC
( R 1)(C 1)
对应P 值
各种情形下,理论频数与实际频数偏离的总和即为χ2值(chi24 square value),它服从自由度为ν的χ2分布。
2 Χ
检 验
1
主要内容

1、卡方分布 2、拟合优度检验基本思想和步骤 3、两独立2×2列联表资料卡方检验 两配对2×2列联表资料卡方检验

R×C列联表资料卡方检验

2ห้องสมุดไป่ตู้
例 7-1 某医生欲比较万拉法新与氟西汀治疗老年期抑郁症的疗效,将病情相近的60名患 者随机分成两组,分别用两种药物进行治疗,结果见表 8-1。 表8-1 分 组 疗效:痊愈 万拉法新组 氟西汀组 合 计 19(63.33) 15(50.00) 34(56.67) 未愈 11(36.67) 15(50.00) 26(43.33) 30 30 60 万拉法新与氟西汀治疗老年期抑郁症的疗效比较 例数(百分率) 合计
处理组 甲
发生数 a
未发生数 b
合计 a+b

合计
c
a+c
d
b+d
c+d
n
23
四格表资料的基本形式
二、 χ2 检验的基本思想
例 8.1 分组 肺癌组 对照组 合计 阳性 CEA 对两组人群的诊断结果 阴性 合计 72 114 186 阳性率 (% ) 45.8 8.8 23.1
33( 16.6) 39( 55.4) 10( 26.4) 104 ( 26.4)
实际频数A ( 2) 2 2 7 17 25 37
Φ (X1) ( 3) 0.00069 0.00466 0.02275 0.08076 0.21186 0.42074
Φ (X2) ( 4) 0.00466 0.02275 0.08076 0.21186 0.42074 0.65542
P(X) ( 5) 0.00397 0.01809 0.05801 0.13110 0.20888 0.23468
21

K. Pearson在统计学方面的主要贡献: 2 2 1.推导出 分布,提出 检验(1900 年)。 2.发展了回归和相关理论。
22
第二节 独立样本2×2列联表资料的 2 检验
例 8.1 分组 肺癌组 对照组 合计 阳性 33 10 43 CEA 对两组人群的诊断结果 阴性 39 104 143 合计 72 114 186 阳性率(%) 45.8 8.8 23.1
形式的2检验公式都来源于此。 2值反映了样本 实际频数分布与理论总体分布的符合程度。如果 原假设成立, 2值不会太大;反之,A若与T差 距大, 2值也大;当2值超出一定范围时,就有
理由认为原假设不成立。
3.确定相应的概率P,作出推断结论
15
拟合优度检验
例7-1 对表7-1所示数据作正态分布拟合优度检验。
无效
4 (8.44) 11 (6.56) 45(固定值) 35(固定值) 80
65
15
26


问题:
这两个频数分布的总体分布是否相等?

或者这两份样本是否来自同一个总体。因
为这里是二分类变量,问两个总体分布是
否相等就相当于问两个有效概率是否相等。
27
(1)建立检验假设 H0:π1= π2 两药的有效概率相同 H1: π1≠π2 两药有效概率不同 检验水准=0.05 (2)计算检验统计量

2
(A T ) T
2
28
(41 36.56) 2 (4 8.44) 2 (24 28.44) 2 (11 6.56) 2 6.565 36.56 8.44 28.44 6.56
自由度
=(2-1)(2-1)=1
(3)确定p值
查附表8, =1对应的临界值 , P<0.025。
(4)结论:拒绝H0,两样本频率的差别具有统计学
意义。可以认为,兰芩口服液和银黄口服液的总
体有效概率不同,前者(91.1%)高于后者
(68.6%)。
29
对于四格表资料,四格表专用公式
(ad bc) n (a b)(c d )(a c)(b d )
表 7-6 完全随机设计 R× 2 列联表形式(频数) 组 别 1 1 2 „ R 合计 A11 A21 „ AR1 m1 属 性 2 A12 A22 „ AR1 m2 n1 n2 „ nR n 合 计
6
表 7-6 完全随机设计 R× 2 列联表形式(频数) 组 别 1 1 2 „ R 合计 A11 A21 „ AR1 m1 属 性 2 A12 A22 „ AR1 m2 n1 n2 „ nR n 合 计
3
表 7-2 处理
两组频数分布的四格表一般形式 属 阳性 性 合计 阴性 a c m 1 =a+c b d m 2 =b+d n1 =a+b n2 =c+d n= a+b+c+d
A B 合计
4
例 7-2 采末梢血与静脉血检查乙型肝炎抗原,结果见表 8-3。 表 8-3 末梢血与静脉血检查乙型肝炎抗原结果(例数) 静脉血 阳性 阳性 阴性 合计 47 7 54 末 梢 血 阴性 3 243 246 50 250 300 合计
16 4 1 —
0.65542
0.84134 0.94520 0.98610 —
0.84134
0.94520 0.98610 0.99744 —
0.18592
0.10386 0.04090 0.01135 —
25.2855
14.1244 5.5618 1.5434 —
0.00322
0.24906 0.43858 0.19130 6.26692
T=n×P(X) ( 6) 0.5405 2.4601 7.8889 17.8294 28.4083 31.9167
(A—T)2/T ( 7) 3.94143 0.08605 0.10016 0.03859 0.40892 0.80961
1.264―
1.270― 1.276― 1.282― 合计
25
表 7-4 配对设计 2× 2 列联表形式 变量 1 结果 + 合计 变量 2 结果 + a c m 1 =a+c b d m 2 =b+d 合 计 n1 =a+b n2 =c+d n= a+b+c+d
5
例 7-3 用磷霉素的三种制剂治疗皮肤软组织感染,其疗效结果见表 8-5。 表 7-5 制剂 软膏 油膏 粉剂 磷霉素不同制剂对皮肤软组织感染的疗效 痊愈人数 47 24 159 未愈人数 19 1 44 合计 66 25 203 痊愈率(%) 71.21 96.00 78.33
教授数学与力学,从此待在该校一直到1933年。
19


Karl Pearson

K. Pearson是活跃在19世纪末叶和20世纪初叶的 罕见的百科全书式的学者。他是应用数学家、生 物统计学家和优生学家,也是天文学、弹性和工 程问题专家,又是名副其实的科学哲学家、历史 学家、民俗学家、宗教学家、人类学家、语言学 家、伦理学家,还是律师、教育改革者、社会主 义者、人道主义者、妇女解放的鼓吹者,同时还 是受欢迎的教师、编辑、文学作品和人物传记的 作者。
表 7-8
R× C 列联表的一般形式 处理分组 1 第 1组 第 2组 „ 第 R组 合计 A11 A21 „ AR1 m1 属性(水平) 2 A12 A22 „ AR2 m2 „ „ „ „ „ „ C A1 C A2 C „ ARC mC n1 n2 „ nR n
7
合计
目的:
推断两个总体率或构成比之间有无差别
136例体模骨密度测量值的均数=1.260;标准差 =0.010

检验的假设: 态分布
H0:总体分布等于均数为1.260,标准差为0.010的正 H1:总体分布不等于该正态分布
16
表7-1 136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算
组段 ( 1) 1.228― 1.234― 1.240― 1.246― 1.252― 1.258―
17
拟合优度检验

计算统计量:
2 ( A T ) 2 6.27 T
计算T I 时的参数有2 个(均数和标准差)
2 0.50, 7 6.35 推断结论:自由度=10-1-2=7,查附表8,得到
P>0.50,可以认为该样本服从正态分布。
18
Karl Pearson

Karl Pearson卡尔· 皮尔森 (1857-1936):英国生物学家 和统计学家,旧数理学派和描述统计学派的代表人物,现 代统计科学的创立者,被公认为统计学之父。 他是个社会主义者。出于对马克思的敬仰,他在二十三岁 那年,把名字从英文的习惯写法Carl改为与马克思相 同的Karl。 K. Pearson 22岁毕业于剑桥大学数学系;曾参与激进的 政治活动。出版几本文学作品,并且作了三年的律师实习。 27岁进入伦敦大学学院 (University College, London),
20
Karl Pearson

K. Pearson 最重要的学术成就,是为现代统计学 打下基础。许多熟悉的统计名词如标准差,成分 分析,卡方检验都是他提出的。 K. Pearson、Galton 与 Weldon 为了推广统计在 生物上的应用,于1901年创立统计的元老期刊 《Biometrika》, 由 K. Pearson 主编至死,但 是 K. Pearson 的主观强,经常对他本人认为有 “争议”的文章, 删改或退稿,并因此与英国二 十世纪最有才华的统计学家 Fisher 结下梁子。
一、二分类情形——2×2列联表
例7-2 某医师研究用兰芩口服液与银黄口服液治疗
慢性咽炎疗效有无差别,将病情相似的80名患者 随机分成两组,分别用两种药物治疗,结果见表 7-2。
25
表7-2 慢性咽炎两种药物疗效资料
药物 疗效 合计
有效
兰芩口服液 银黄口服液 合计 41 (36.56) 24 (28.44)
相关文档
最新文档