中国医科大学研究生医学统计学第五讲计数资料与卡方检验2

合集下载

医学统计学卡方检验讲课稿

医学统计学卡方检验讲课稿

第一页PPT:同学们好,我们今天来一起学习卡方检验的基本思想。

第二页PPT:我们看一个研究案例,某神经内科医师欲比较A、B两种药物治疗脑血栓病人的疗效,将病情轻重、病程相近且满足实验人选标准的200例脑血管栓塞患者随机分为两组,结果见表1。

问两药治疗近期有效率是否有差别?请同学们思考一个问题,结合已学的知识关于两个率的比较我们会使用什么方法呢,那我们继续带着这个问题进入到我们今天的课程学习。

第三页PPT:这节课需要掌握的理论知识有:1.X2检验的定义、主要用途2.X2分布、X2检验的基本思想(这是重点内容)以及应用完全随机设计的四格表X2检验方法是我们这节课的难点内容。

第四页PPT:离散型概率分布有二项分布和泊松分布基于二项分布的假设检验方法可以做两样本率比较的检验问题,条件是np、n(1-p)均大于5,可以做Z检验进行,也是解决我们的案例问题。

第五页PPT:在医学研究中,进行两组或多组样本的总体率(或构成比)之间的差别是否具有统计学意义,X2检验(chi-square test)是解决此类问题较为常用的统计方法,。

X2检验是英国统计学家K.Pearson提出的一种具有广泛用途的假设检验方法,常用于分类变量资料的统计推断。

第六页PPT:X2检验主要用于:1.推断两个及多个总体率或总体构成比之间有无差别2.两种属性或两个变量之间有无关联性3.频数分布的拟合优度检验4.百分率线性趋势检验第七页PPT:我们来继续看我们的案例,两药有效率的比较问题。

表中我们A 药、B药的有效和无效分别为99、5、75、21,我们可以用a.b.c.d 来表示,表中其余的数据是由abcd这4个数据推算出来,我们习惯将这种资料形式称为四格表。

为什么叫四个表因为它有效的就是四个格子。

a.b.c.d是我们实际观察所得到的频数,我们叫实际频数(actual frequency),用A表示。

根据我们的研究目的,我们要比较两个率是否有差别的问题。

医学统计学之卡方x2检验

医学统计学之卡方x2检验

举例
买彩票
奖项 中奖概率
T
A
一等 1% 10 0
0
二等 5% 50 0
0
三等 10% 100 20
2%
四等 20% 200 180
18%
五等 64% 640 800
80%
二、基本原理
基本思想是检验实际频数和理论频数的差别是否 由抽样误差所引起的,由样本率来推断总体率。
x2反映了实际频数于理论频数的吻合程度,x2值
α=0.05。
T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8
(2)求检验统计量值
2 (20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 8.40
作χ2检验后所得概率P接近检验水准α,需要
计数资料的统计推断
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
2 检验的应用
①检验两个样本率之间差别的显著性; ②检验多个样本率或构成比之间差别的
显著性; ③配对计数资料的比较; ④检验两个双向无序分类变量是否存在
关联。
某医生想观察一种新药对流感的预防效 果,进行了如下的研究,问此药是否有 效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220

医学统计学课件-卡方检验

医学统计学课件-卡方检验

联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数= 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)

6
23
29
79.3

30
14
44
31.8

8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题-应用条件
某矿石粉厂当生产一种矿石粉石时,在数天内即有 部分工人患职业性皮肤炎,在生产季节开始,随机 抽取15名车间工人穿上新防护服,其余仍穿原用的 防护服,生产进行一个月后,检查两组工人的皮肤 炎患病率,结果如表 ,问两组工人的皮肤炎患病 率有无差别?
χ2检验相关问题-应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2

(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d

第五章计数资料组间比较的假设检验—卡方)检验(chi-

第五章计数资料组间比较的假设检验—卡方)检验(chi-

2 ( b c 1)2 (12 3 1)2 4.27, 1
bc
12 3
• 4.确定自由度(ν)和 χ2值 的概率P
• ν=(行数-1)(列数-)
• 本例:ν=(2-1)(2-1)=1
2 0.05,1
3.84
• 本例χ2=4.27>3.84,P<0.05
• 5.结论:在α=0.05水准,拒绝H0,认为两剂 量的死亡率不同,甲剂量的死亡率 (18/39=46.2%)高于乙剂量死亡率 (9/39=23.1%)。
• ν=(行数-1)(列数-)=(R-1)(C-1) • 本例:ν=(2-1)(2-1)=1

2 与
2
0.05,
比较
2
4.84
2 0.05,1
3.84, P0.05
• 5.结论:在=0.05水准上拒绝H0, 两总体率差别有统计的显著性,即
两组总体率不同,用苯乙双胍组的
病死率高于安慰剂组。
两组率相等的理论数与实际数
2
2
( A T 0.5)
T
2 ( ad bc N / 2)2 N
(a b)(a c)(c d)(b d)
公式5-9 公式5-10
表5-2 两零售点猪肉带菌率的比较
• 组别 阳性数 阴性数 合计 带菌率%
• 甲 2(4.67) 26(23.33) 28 7.14
• 乙 5(2.33) 9(11.67) 14 35.71
• 合计 7
35
42 16.67
• 校正公式
2 ( 29 265 42 / 2)2 42 3.62
(28) (14) (7) (35)
• 不校正X2=5.49 p<0.05
P> 0.05 .

中国医科大学医学统计学 卡方检验

中国医科大学医学统计学 卡方检验

四格表专用公式

2
(ad bc) n
2
(a b)(c d )( a c)(b d )
(4111 24 4) 80
2
本例

2
45 35 65 15
6.565
校正公式
当n≥40时,如果有某个格子出现 1T<5

2
( A T 0.5) T
1) 7.584
自由度 = (3-1)(2-1) = 2 20.025(2)=7.38,P<0.025,拒绝H0 可以认为三种剂量镇痛有效的总体概率有差别。 三个都不同? 哪两个间不同?
第二节 配对设计下两组频数分布的2检验
例 设有28份咽喉涂抹标本,把每份标本一分为二, 依同样的条件分别接种于甲、乙两种白喉杆菌培养基上, 观察白喉杆菌的生长情况,结果如表7-10,问两种培养基 上白喉杆菌的生长概率有无差别?
2
或其等价的形式

2
(| ad bc | n / 2) n
2
(a b)(c d )( a c)(b d )
例 将病情相似的淋巴系肿瘤患者随机分成两组,分别 做单纯化疗与复合化疗,两组的缓解率见表7-4,问两 疗法的总体缓解率是否不同?
属性 组别 缓解 单纯化疗 复合化疗 合计 2 ( 4.8) 14 (11.2) 16 未缓解 10 ( 7.2) 14 (16.8) 24 12 (固定值) 28 (固定值) 40 16.7 50.0 40.0 合计 缓解率 (%)
第十一章 2检验
第一节 独立样本列联表资料的2检验
例11.1
疗效 组别 有效 甲药 乙药 合计 27 40 67 无效 18 5 23 45(60.00%) 45(88.89%) 90(74.44) 合计

《卡方检验》课件

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。

医用统计学-卡方检验2

医用统计学-卡方检验2

220(c+d) 400(a+b+c+d)
2
a
ad bc 2 n b c d a c b
d
χ2=21.65 P<0.05
1
14
2×2表χ2值的连续性校正:
➢ 当n≥40,且T≥5时,不需进行连续性校正(使用基本 公式或专用公式);
➢ 当n≥40,但1≤T<5时,需进行连续性校正;
2
合计 138
正常体重 48(43.3) 42(37.8) 21(18.9)
111
合计
78(31.3) 78(31.3) 93(37.4)
249
24
1.建立检验假设,确定检验水准 H0:两组人群的体育运动习惯的总体构成比相同 H1:两组人群的体育运动习惯的总体构成比不相同 α=0.05 2.选择公式,计算检验统计量
0.5 0.4
f (x2 ) 0.3
v 1
0.2
v6
0.1
0.05 v 10
0 024
3.84
6 8 10 12 14 16
x2
χ2分布规律: 自由度一定时,χ2值越大, P值越小。 当P值一定时,自由度越大,χ2越大。
=1时, χ2 =3.84, P=0.05 χ2 =6.63, P=0.01
根据 =1查2界值表,得P<0.05,按=0.05 的检验水准,拒绝H0,接受H1,提示两种药 物治愈率有差别。
专用公式法:
表8-1 两组流感患者不同疗法治愈率的比较
组别 治愈人数 未治愈人数
合计
中药 144(a)
36(b)
180(a+b)
西药 128(c) 合计 272(a+c)

医学统计学卡方检验

医学统计学卡方检验
02 P =P1+ P2 + P3 + P6 =0.370 > 0.05,不拒绝H0 。
03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18

研究生医学统计学-X2检验课件

研究生医学统计学-X2检验课件

01
这是为了保证X2统计量的分布接近卡方分布。
每个单元格中的期望数都应该大于5
02
这是为了确保卡方分布的精确性和稳定性。
观察数和期பைடு நூலகம்数之间没有关联
03
这是为了确保X2统计量不受其他因素的影响。
限制条件
1 2
样本量较小
如果样本量较小,X2检验的准确性可能会受到影 响。
分类变量之间存在高度相关性
如果分类变量之间存在高度相关性,X2检验的结 果可能会受到干扰。
X2统计量的解读
X2值的大小表示分类变量之间关系的强度,X2值越大,说明分类变量之 间的关系越强。
X2检验的临界值一般为3.841、6.635等,当X2值大于临界值时,可以认 为分类变量之间存在显著关系。
在解读X2值时,需要考虑样本量和数据分布情况,对于小样本和极端数据 需要进行特殊处理。
X2统计量的优缺点
研究生医学统计学-x2检验课件
目录
CONTENTS
• X2检验的基本概念 • X2检验的假设与限制 • X2检验的统计量与解读 • X2检验的实际应用 • X2检验的软件实现 • X2检验的案例分析
01 X2检验的基本概念
CHAPTER
X2检验的定义
X2检验是一种用于检验分类变量间独 立性的统计方法,也称为卡方检验。 它通过比较实际观测频数与期望频数 之间的差异,来判断变量间的关联性。
谢谢
THANKS
总结词
探讨X2检验在医学研究中如何应用
详细描述
在医学研究中,X2检验常用于分析分类变量之间的关系,如疾病与基因型、治疗方式与疗效等。通过 X2检验,可以判断不同组别之间是否存在显著差异,从而为医学研究提供科学依据。

卡方检验(计数资料)

卡方检验(计数资料)

卡方检验(计数资料)四格表资料的卡方检验四格表资料的卡方检验用于进行两个率或两个构成比的比较。

1. 专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)2. 应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。

当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。

行X列表资料的卡方检验行X列表资料的卡方检验用于多个率或多个构成比的比较。

1. 专用公式:r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]2. 应用条件:要求每个格子中的理论频数T均大于5或1<t<1或1<t<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行x列表资料卡方检验的应用条件。

而多个率的两两比较可采用行x 列表分割的办法。

列联表资料的卡方检验:同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。

1. R*C 列联表的卡方检验:R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。

2. 2*2列联表的卡方检验:2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。

当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。

列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。

“医学统计课件-卡方检验”

“医学统计课件-卡方检验”
适合度卡方检验用于判断观察频数与期望频数之间的差异是否显著。我们将探讨其原理、计算方法,并 分享一个医学研究的应用案例。
卡方检验中的显著性水平和p 值
显著性水平和p值是判断卡方检验结果是否显著的重要指标。我们将解释它们 的概念和计算方法,并讨论常用的显著性水平选择。
卡方检验的优缺点
卡方检验是一种简单有效的统计方法,但也有其局限性。我们将讨论卡方检 验的优点和不足之处,以及与其他统计方法的比较。
单样本卡方检验的原理和步骤
单样本卡方检验用于比较一个分类变量的观察频数与期望频数之间的差异。 我们将介绍其原理、计算方法和实际操作步骤。
独立性卡方检验的原理和步骤
独立性卡方检验用于判断两个分类变量之间是否存在相关性。我们将详细解 释它的原理、计算方法,并提供一个实际案例进行分析。
适合度卡方检验的原理和步骤
卡方检验的实际应用案例
通过实际案例,我们将展示卡方检验在医学和流行病学研究中的应用。这些 案例将帮助您更好地理解卡方检件——卡方 检验”
卡方检验是一种常用的统计方法,用于比较两个或多个分类变量之间的差异。 本课件将详细介绍卡方检验的原理、步骤、应用和优缺点,以及在医学研究 和流行病学中的实际案例。
卡方检验的分类及适用范围
卡方检验可以分为单样本卡方检验、独立性卡方检验和适合度卡方检验。每 种检验方法适用的情况略有不同,我们将详细探讨它们的应用领域和限制。

医学统计方法之卡方检验

医学统计方法之卡方检验

医学统计方法之卡方检验卡方检验,又称卡方分布检验(Chi-Square Test),是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在显著差异。

本文将详细介绍卡方检验的原理、应用范围以及具体的步骤。

一、原理:卡方检验的原理是基于卡方分布的性质。

卡方分布是指具有自由度的正态分布的平方和,记为χ^2(k),其中k为自由度。

在卡方检验中,我们将观察到的频数与理论预期频数进行比较,从而判断两个或多个分类变量之间的差异是否显著。

二、应用范围:卡方检验广泛应用于医学研究中的数据分析,尤其是在对两个或多个分类变量之间的关联进行检验时。

常见的应用场景包括但不限于以下几种:1.检验观察频数与理论预期频数之间的差异,以判断观察结果是否与理论预期相符。

2.检验两个或多个分类变量之间的关联性,以确定它们之间是否存在显著的相关性。

3.比较两个或多个群体在一个或多个分类变量上的分布差异,从而判断它们之间是否存在显著差异。

三、步骤:卡方检验的主要步骤包括以下几个:1. 建立假设:首先需要明确检验的假设。

在卡方检验中,通常有两种假设:“原假设”(null hypothesis,H0)和“备择假设”(alternative hypothesis,H1)。

原假设通常表示没有差异或关联,备择假设则表示存在差异或关联。

2.计算期望频数:根据原假设,计算出理论预期频数。

理论预期频数是基于既定的分布假设和样本总体的参数计算得出的。

3.计算卡方值:将观察频数与理论预期频数进行比较,计算出卡方值。

卡方值是观察频数与理论预期频数之间的差异的平方和。

4.确定自由度:根据检验问题的具体情况确定自由度。

在卡方检验中,自由度通常由分类变量的水平数目决定。

5.查表找出p值:根据卡方分布表,找出相应自由度下的临界值。

将计算得到的卡方值与临界值进行比较,确定其显著性水平。

p值是指在原假设成立的前提下,观察到的差异大于或等于当前差异的概率。

6.做出判断:根据p值与显著性水平的比较,做出判断是否拒绝原假设。

医学统计学课件卡方检验

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。

(医统)卡方检验

(医统)卡方检验

2
观测值的自由度(vi>2),Si为第i组观测值的标 准差 2 • 拒绝原假设的条件为: 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设: 2 2
1 2
• 检验统计量:
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件: F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布,即用卡方统计量检验实验分布 是否服从某一理论分布(正态、二项等) • 步骤:1.将总体X的取值范围分成k个互不重迭的 小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每 个小区间的概率p,于是np就是落入该区间的样本 值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较,进行决策
χ2 检验 数据资料 总体 检验对象
离散型资料 总体分布是未知的
连续型资料假设检验
连续型资料 正态分布 对总体参数或几个总体 参数之差
不是对总体参数的检 验,而是对总体分布 的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来,然后用实际观测值与理论
数相比较,从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消,并不能反映实 际观测值与理论值相差的大小。
为了避免正、负相抵消的问题,可将实际 观测值与理论值的差数平方后再相加,也就是 计算:
∑(O-E)2
O--实际观察的频数 E--无效假设下的期望频数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=96×174/200
表7-1内只有4个数
是该表的
基本数据,其余数据都是由这4
个基本数据推算出来的,称为
(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
(三)正确计算合计率
不能简单地由各组率相加或平均而得, 而应用合计的有关实际数字进行计算。 例如用某疗法治疗肝炎,甲医院治疗150 人,治愈 30 人,治愈率为 20 %;乙医院 治疗100人,治愈30人,治愈率为30%。 两个医院合计治愈率应该是 [(30+30) / (150+100)]×100 % =24 % 。 若 算 为 20 % +30 %。 50 %或 (20 % +30 % ) / 2=25 %, 则是错的。
表7-1 两组降低颅内压有效率的比较
p1=a/(a+b)=99/104 p2=c/(c+d)=75/96 pc=(a+c)/n=174/200
TRC n R nC n
H0:π1=π2
=pc= (a+c)/n
T11=(a+b)(a+c)/n=(a+b) pc =104×174/200
T21= (c+d)(a+c)/n=(c+d) pc
(六)样本率(或构成比)的抽样误差 不能仅凭数字表面相差大小下结 论,而应进行样本率 ( 或构成比 ) 差别 的假设检验。
2 χ 检验
χ2检验在分类资料中的应用:
( 1) 推断两个(或多个)总体率或构成比 之间有无差别 (2)多个样本率间多重比较 (3)两个分类变量之间有无关联性 (4)多维列联表的分析 (5)频数分布拟合优度的χ2检验
常用的相对数指标有比、比例和率三种。 1.两个有关指标之比称为比(ratio),或称相 对比; 2. 当比的分子是分母的一部分时,称为比 例(proportion),或称结构相对数。
3. 当比例与时间有关系称为率(rate),或 称为强度相对数。
第一节 常用相对数 一、率(强度相对数 ) 率( rate )是表示某种现象发生的 频率和强度,常以百分率(%),千分 率(‰),万分率(1/万),十万分率 (1/10万)等表示,计算公式为:
第一节
2 四格表资料的χ 检验
• χ2检验的基本思想:是检验实际 频数和理论频数的差别是否由抽样 误差所引起的。
一、χ2检验的统计量基本公式为:

2
( ARC TRC ) TRC
2
应用条件:n≥40,且T ≥ 5, 其中
TRC
n R nC n
处理 A B 合计
有效 a c a+c
应用相对数的注意事项
(一)结构相对数不能代替强度相对 数 构成比只能说明某事物内部各 组成部分的比重和分布,不能说明 这事物某一部分发生的强度与频率 。
(二) 计算相对数应有足够数量 分母过小时相对数不稳定。在观 察例数较小时,直接用绝对数表示 。如“5例中4例有效”,而不要写 有效率为80%,以免引起误解。
特点: (1)同一事物的各个组成部分的 构成比之和应为100%。 (2)事物内部各组成部分之间呈 此消彼长的关系。
三、相对比
相对比(ratio),是两个有关的指标之 比,用以描述两者的对比水平。两个指标 可以是绝对数、相对数或平均数;可以 性质相同,也可以性质不同。
甲指标 相对比 乙指标
第二节
率 某事物或现象发生的实 际数 比例基数 某事物或现象发生的所 有可能数
例1 • 某企业2003年有2839名职工,该企业 每年都对职工进行体检,这一年新发 生高血压患者5例,高血压发病率为: 5/2839×1000‰=1.76‰。 比例基数的选择 主要依据习惯用法或使计算结果保留 一位或二位整数,以便阅读。
第五讲 分类资料的统计描述与χ2检验
• 计数资料常见的数据形式是绝对数,如 某病的出院人数、治愈人数、死亡人数 等。 绝对数:只能表示某事物在某时、某地 发生的实际水平。 相对数:便于相互比较与分析。
例:甲、乙两地麻疹流行,
甲地发病300人 绝对数 乙地发病250人 甲>乙 但不能据此确定甲地麻疹流行较为严重,需考 虑易感人数。若甲地易感人数3000人 乙地易感人数1000人 则甲地麻疹发病率=300/3000=10% 乙地麻疹发病率=250/1000=25% 相对数 乙>甲
表1 常用χ2值界值表

2 0.05(1)
3.84 3.84 u
2 0.05 / 2

2 0.05,1
1.96
2
χ2分布的参数:自由度。其计算
公式为: ν=(行数-1)(列数-1) =(R-1)(C-1)
例7-1 某院欲比较异梨醇口服液(试验组) 和氢氯噻嗪+地塞米松(对照组)降低颅 内压的疗效。将200例颅内压增高症患 者随机分为两组,结果见表7-1。问两 组降低颅内压的总体有效率有无差别?
无效 b d b+d
合计 a+b c+d n= a+b+c+d
n1. n.1 (a c ) T11 (a b) n n
• 表7-1两组降低颅内压有效率的比较
χ2 值的含义: 反映了实际频数与理论 频数的吻合程度。 χ2值理论上是非负值。(即χ2≥0) χ2检验判别准则: 若 χ2<χ20.05(ν) , 则 P>0.05, 不拒绝无 效假设H0; 若 χ2≥χ20.05(ν) , 则 P<0.05, 拒绝无效假 设H0,接受H1 。
二、构成比(结构相对数 )
构成比(Constituent ratio)表示事物内 部各个组成部分所占整体的比重,通常以 100%为比例基数,以百分比表示,计算公 式如下 :
构成比 某事物内部某一组成部分观察单位数 100% 同一事物各组成部分的观察单位总数
• 例2 某医院1990年和1998年住院病人 死于五种疾病的人数见下表。
相关文档
最新文档