第11章_卡方检验 公共卫生课件
合集下载
《卡方检验正式》课件
卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
卫生统计学卡方检验课件
2/19/2021
卫生统计学卡方检验
7
若H0成立,则理论上:
奥美拉唑组愈合人数:
115
T11
85 57.84 169
奥美拉唑组未愈合人数:
T12
8554 27.16 169
雷尼替丁组愈合人数:
T21
8411557.16 2/19/2012619
T nRnC n
雷尼替丁组未愈合人数:
T22
8454 26.84 169
2/19/2021
卫生统计学卡方检验
3
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。
2. 两种药物的总体愈合率确有不同。
2/19/2021
卫生统计学卡方检验
4
一、卡方检验的基本思想
表1中,64、21、51、33 是整个表的基本数据,其余
卫生统计学卡方检验
8
TRC
nR nC n
n R 为相应行的合计
n C 为相应列的合计
n 为总例数。
2/19/2021
卫生统计学卡方检验
9
表1 两药治疗消化道溃疡4周后疗效
2/19/2021
卫生统计学卡方检验
10
2 检验的基本公式:
2 (AT)2
T
2/19/2021
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 实际频数和理论频数之差一 般不会相差太大, 2值相 应也不会太大; 反之,实际频数和理论频数之差相差 很大卫,生则统计 学2 值卡相方检应验也会很大,11 相应的P值也就越小,
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计方法之卡方检验PPT课件
3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
卡方检验ppt课件
2检验 (chi-square test)
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
卡方检验1011ppt课件
n R nC
多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压 的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等 分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果 见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?
表11.4 三种方案治疗轻、中度高血压的效果
编号
组别
编号
1
乙药
67
2
甲药
68
3
乙药
69
4
甲药
70
5
乙药
71
6
甲药
72
7
甲药
73
8
乙药
74
9
甲药
75
10
乙药
76
11
甲药
77
组别 甲药 乙药 乙药 甲药 乙药 甲药 甲药 甲药 乙药 乙药 甲药
患儿编号 1 2 3 4 5
.
.
Table. 结果记录表 处理 乙药 甲药 乙药 甲药 乙药
. .
疗效 有效 有效 无效 有效 无效
对子 2
C
随机
T
对子 3
C
配对设计
✓ 自身配对 a. 同一对象给予两种不同处理 b. 同一对象处理前后
例11.6 某研究者欲比较心电图和生化测定 诊断低钾血症的价值,分别采用两种方法 对79名临床确诊的低钾血症患者进行检查 ,结果见表11.9。问两种方法的检测结果是 否不同?
患者编号 1 2 3 4 5
表11.9 两种方法诊断低血钾的结果
心电图
+ - 合计
生化测定
+
-
45
25
4
5
49
多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压 的疗效,将年龄在50~70岁的240例轻、中度高血压患者随机等 分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果 见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?
表11.4 三种方案治疗轻、中度高血压的效果
编号
组别
编号
1
乙药
67
2
甲药
68
3
乙药
69
4
甲药
70
5
乙药
71
6
甲药
72
7
甲药
73
8
乙药
74
9
甲药
75
10
乙药
76
11
甲药
77
组别 甲药 乙药 乙药 甲药 乙药 甲药 甲药 甲药 乙药 乙药 甲药
患儿编号 1 2 3 4 5
.
.
Table. 结果记录表 处理 乙药 甲药 乙药 甲药 乙药
. .
疗效 有效 有效 无效 有效 无效
对子 2
C
随机
T
对子 3
C
配对设计
✓ 自身配对 a. 同一对象给予两种不同处理 b. 同一对象处理前后
例11.6 某研究者欲比较心电图和生化测定 诊断低钾血症的价值,分别采用两种方法 对79名临床确诊的低钾血症患者进行检查 ,结果见表11.9。问两种方法的检测结果是 否不同?
患者编号 1 2 3 4 5
表11.9 两种方法诊断低血钾的结果
心电图
+ - 合计
生化测定
+
-
45
25
4
5
49
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2展开公式
2 A T 2 1 (a d b c )2n
T
(a b )(c d )(a c )(b d )
2 AT2 1 n( A R 2C1)
T
nRnC
2的取值
若假设成立,即甲= 乙
理论上2=0 2不正好等于0 ,即2>0是由于抽样误差引起, 但出现较大2的可能性较小
在2分布的基础上说明样本 2值是否发生小概率事件
引例
例11.1 某研究者欲比较甲、乙两药治疗小 儿上消化道出血的效果,将90名患儿随机 分为两组,一组采用甲药治疗,另一组采 用乙药治疗,一个疗程后观察结果,见表 11.1。问两药治疗小儿上消化道出血的有效 率是否有差别?
2检验
表11.1 甲、乙两药治疗小儿上消化道出血的效果
表11.1 甲、乙两药治疗小儿上消化道出血的效果
组别
有效
无效
合计
有效率(%)
甲药
27
18
45
60.00
乙药
40
5
45
88.89
合计
67
23
90
74.44
组别
有效
无效
合计
有效率(%)
甲药
2277
18
45
60.00
乙药
40
5
45
88.89
合计
67
23
90
74.44
按有效率74.44%,理论上:
甲药组有效人数为: 45674567
ARC
Nr
mc
n
边缘合计(makginal sum)
总合计
四格表
组别Biblioteka G1 G2 合计表11.8 独立样本四格表形式
指标
Y1
Y2
a
b
c
d
a+c
b+d
合计
a+b c+d n
分析
分析目的
两种药物有效率是否有差别,即甲乙
变量类型
效应指标按是否有效分成两类(有效/无效),二 分类资料
设计类型
实验设计—成组设计
=1 =3
四格表(=1)
T5(Tmin 5)且n40 样本例数或理论频数太小的处理办法
1T<5且n40时, 需进行连续性校正, 或改用确 切概率计算法
c2
(| ARC TRC | 0.5)2 TRC
(| ad bc | n / 2)2 n
(a b)(c d)(a c)(b d)
T<1或n<40时, 需用确切概率计算法
2(2751840)2909.870
45456723
1
2界值表
P
0.99 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.02 0.01 0.001
1 0.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 10.83
R×C表(>1)
Cochkan(1954年)认为不宜有1/5以上格子的 理论频数小于5, 或有一个理论频数小于1。 理论频数太小的处理办法
增大样本例数 删除或合并理论频数太小的行或列 确切概率法
2检验的基本思想
对总体提出某种假设
计算理论频数T
用2统计量度量A、T
的吻合程度
2分布和2统计量
之间的关系
90 90
甲药组无效人数为: 乙药组有效人数为:
4455TRC692703n4R95nm09C60723
90 90
乙药组无效人数为: 45239023
90 90
2检验
表11.1 甲、乙两药治疗小儿上消化道出血的效果
组别
有效
无效
合计
有效率(%)
甲药
27(33.5)
18(11.5)
45
60.00
乙药
40(33.5)
5(11.5)
45
88.89
合计
67
23
90
74.44
2检验
实际频数(A)和理论频数(T)之间的吻合程度:
A-T
每个格子的差异
(AT)2
(A
T T
)2
形成综合性指标,并 去除正负号的影响
考虑每个格子对总差 异的相对贡献大小
(AT)2 2
T
2~ 2( ), =RC-R-
(C-1) = (R-1)(C-1)
已知条件
表11.1 甲、乙两药治疗小儿上消化道出血的效果
组别
有效
无效
合计
有效率(%)
甲药
27
18
45
60.00
乙药
40
5
45
88.89
合计
67
23
90
74.44
60.00%(甲)<88.89%(乙)
乙药好于甲药 乙药好于甲药
抽样误差
假设检验
(2检验)
2检验
建立检验假设 H0:甲乙合并697074.44%
第11章 2检验
列联表 (contingency table)
表11.1 甲、乙两药治疗小儿上消化道出血的效果
组别
有效
无效 合计 有效率(%)
甲药
27
18
45
60.00
乙药
40
5
45
88.89
合计
67
23
90
74.44
列联表 (contingency table):观测数据按两个定性
变量分类所列出的频数表。也叫R×C表:行变
3.确定P值,作出统计推断
查2界值表,得0.01<P<0.001。按=0.05水
准,拒绝H0,接受H1,差别有统计学意义,可以 认为两药治疗小儿上消化道出血的有效率不同,
乙药较高。
例11.3
2 0.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 13.82
3 0.11 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 16.27
… …………………………………
假设不成立,即甲 乙
2>0
2和2分布
2~2 () (近似服从)
如果假设成立,则在一次抽样中实际数与理论
数之差一般不会很大,2值应较小 在2 ()分布下,若出现的2值大到为假设成立
条件下的小概率事件,就不能单纯用抽样误差 来解释这种实际频数A和理论频数T的差异,则 拒绝假设
2和2分布
英国统计学家Yates F认为,2检验中的 2 只是近似服从2分布,尤其当 =1
组别
有效
无效
合计
有效率(%)
甲药
27(33.5)
18(11.5)
45
60.00
乙药
40(33.5)
5(11.5)
45
88.89
合计
67
23
90
74.44
引例具体步骤
1.建立检验假设,确立检验水准
H0:两种药有效率相同,即甲= 乙 H1:两种药有效率不同,即甲 乙 =0.05
2.计算检验统计量
由于Tmin=11.55,且n=9040,故无需校正。
量有R个类别,列变量有C个类别。 四格表(foukfold table) :2×2表
列联表 (contingency table)
… … … … … …
属性X
X1 X2
XR 合计
列联表的形式
属性Y
Y1
Y2
…
A11
A12
…
A21
A22
…
AR1
AR2
…
m1
m2
…
列合计
合计 YC
A1C
n1
行
A2C
n2
合 计