第七章卡方检验

合集下载

第七章卡方检验

第七章卡方检验

二、两相关样本率检验(McNemar) 两相关样本率检验(
1.资料类型 1.资料类型 两个相关样本率资料又称配对计数资料,顾名思义, 两个相关样本率资料又称配对计数资料,顾名思义, 是采用配对设计,且结果以频数方式表达的资料, 是采用配对设计,且结果以频数方式表达的资料,见 例 7 -3 。 某抗癌新药的毒理研究中, 78只大鼠按性 例7-3某抗癌新药的毒理研究中,将78只大鼠按性 窝别、体重、年龄等因素配成39 39对 别、窝别、体重、年龄等因素配成39对,每个对子的 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 试验结果见表7 试验结果见表7-4。试分析该新药两种不同剂量的 毒性有无差异。 毒性有无差异。
P <α
理论频数太小的三种处理方法
1.增大样本量. 1.增大样本量. 增大样本量 2.删去理论频数太小的格子所对应的行或列。 2.删去理论频数太小的格子所对应的行或列。 删去理论频并理论频数太小的格子所相邻的行或列。 合并理论频数太小的格子所相邻的行或列
一、多个样本率的比较
例7-4用A、B、C三种不同方法分别处理新 生儿脐带,发生感染的情况见表7 生儿脐带,发生感染的情况见表7-6,试 比较3种不同方法的脐带感染率有无差异。 比较3种不同方法的脐带感染率有无差异。
三、多组百分比的比较
在某项疼痛测量研究中, 160例手术后疼痛 例7-6 在某项疼痛测量研究中,给160例手术后疼痛 的患者提供四种疼痛测量量表,即直观模拟量表( 的患者提供四种疼痛测量量表,即直观模拟量表( VAS),数字评估量表(NRS),词语描述量表( ),数字评估量表 ),词语描述量表 VAS),数字评估量表(NRS),词语描述量表(VDS ),面部表情疼痛量表 FPS) 面部表情疼痛量表( ),面部表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表9 及患者的文化程度见表9-8,问患者首选疼痛量表与 文化程度是否有关? 文化程度是否有关?

第七章卡方检验

第七章卡方检验

2.6525 1.5469
Mantel-Haenszel Chi-Square
Phi Coefficient Contingency Coefficient Cramer's V
1
2.6667
0.1025
-0.2887 0.2774 -0.2887
WARNING: 25% of the cells have expected counts less
解答问题的步骤
2.计算检验统计量。
A n( 1) n R nC
2
2 2 2 199 7 26 2 532( 1) 21.04 206 481 206 51 144 51
2
解答问题的步骤
3.查相应界值表,确定P值,下结论。
=(R-1)(C-1)=2,查附表8,
**三、专用公式计算
(A T) T
2 2
组别 A B 合计 结果 阳性 阴性 a b c d a+c b+d 合计 a+b c+d a+b+c+d=N
(ad bc) N (a b)(c d )(a c)(b d )
2 2
(99 21 5 75) 200 12.86 104 96 174 26 两公式比较:计算、应用、含义
一、2检验的基本思想(听懂)
组别 A B 合计
2
结果 阳性 阴性 a b c d a+c b+d
2
合计 a+b c+d a+b+c+d=N
(A T) T
实际频数:A 理论频数:TRC=nrnc/N

研究生医学统计学 卡方检验 PPT课件.ppt

研究生医学统计学 卡方检验 PPT课件.ppt

431 388 495 137 1451
490 410 587 179 1666
902 800 950 32 2684
合计
1823 1598 2032 348 5801
H0:两种血型系统间无关联 H1:两种血型系统间有关联
=0.05
2 5801( 4312 490 2 ... 322 1) 213 .16
(A T )2 T

行数-1列数 1
2 (99 90.48)2 (5 13.52)2 (75 83.52)2 (2112.48)2 12.86
90.48
13.52
83.52
12.48
(2 1)(2 1) 1
以 1 查 2界值表得P<0.005。按 0.05水准,
拒绝H0,接受H1,可以认为两组降低颅内压的总体有效率不等,即 可认为异梨醇口服液降低颅内压的有效率高于氢氯噻泰+地塞米松 的有效率。
程度太差,不宜用2检验,而应改用确
切概率法。
四格表资料2检验的校正公式
2 C
( A T 0.5) 2 T
2 C
( ad bc n / 2)2 n (a b)(c d )(a c)(b d )
例 7-2 某医师欲比较胞磷胆碱与神经节甘酯治疗脑血管疾病的疗效, 将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治 疗脑血管疾病的有效率是否相等?
组别
阳性
预防注射组 4
非预防组 5(3)
合计
9
阴性 18 6 24
合计 22 11 33
感染率(%) 18.18 45.45 27.27
本例n为33<40,且有一个格子的理论频数为3<5.

卡方检验

卡方检验

27
表7 - 8
三种疗法有效率的比较 合计 有效率(%) 有效率(%) 206 182 144 532 96.60 90.11 81.94 90.41
疗法 物理疗法组 药物治疗组 外用膏药组 合计
有效 199 164 118 481
无效 7 18 26 51
28
检验步骤1 检验步骤1-建立假设
H0:三种疗法的有效率相等
免疫荧光法 + -
合计
+
11(a)
12(b)
23
-
2(c)
33(d)
35
合计
13
45
58
20
检验步骤1 检验步骤1-建立假设
H0:两种方法的检测结果相同
H1:两种方法的检测结果不相同
确定检验水准:α = 0.05
21
检验步骤2 检验步骤2-计算检验统计量
(b-c)2 2 未校正计算公式: 未校正计算公式:χ = b+c
P<0.05
结论:在 α = 0.05水准上,拒绝H0,接受H1,可以认 结论: 水准上,拒绝H 接受H 为三种疗法的有效率不全相等(统计学结论),可 ),可 为三种疗法的有效率不全相等(统计学结论), 以认为三种疗法治疗周围性面神经麻痹的有效率有 差别(专业结论)。 差别(专业结论)。
31
多个样本构成比的比较
14
四格表专用公式: 四格表专用公式:
(A−T) χ =∑ T
2
2
2
(ad −bc) N χ = (a +b)(c + d)(a + c)(b + d)
2
(99×21−5×75) ×200 本 : = 例 χ =12.86 104×96×174×26

医学统计学--卡方检验

医学统计学--卡方检验
பைடு நூலகம்
笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5

卫生统计学第七章卡方检验

卫生统计学第七章卡方检验

卫⽣统计学第七章卡⽅检验⼀、题型:A1题号: 1 本题分数: 2四格表资料两样本率⽐较的χ2检验,正确的⼀项为A. χ2值为两样本率⽐较中u值B. P<α前提下,χ2值越⼤,越有理由拒绝H0C. χ2值⼤⼩与样本含量⽆关D. 每个格⼦的理论频数与实际频数的差值相等E. χ2检验只能进⾏单侧检验正确答案: B答案解析:根据专业知识确定四格表资料两样本率⽐较的χ2检验采⽤单侧检验或是双侧检验, (也可使⽤四格表专⽤公式),可以证明四格表计算得出的χ2值与正态近似法两率⽐较中u值的平⽅相等,其⼤⼩与样本含量有关,且每个格⼦的理论频数与实际频数的差的绝对值相等,P<α前提下,⾃由度⼀定时,χ2值越⼤,P值越⼩,越有理由拒绝H0,故答案为B。

做答⼈数:0做对⼈数:0所占⽐例: 0题号: 2 本题分数: 2下列能⽤χ2检验的是A. 成组设计的两样本均数的⽐较B. 配对设计差值的⽐较C. 多个样本频率的⽐较D. 单个样本均数的⽐较E. 多个样本均数的⽐较正确答案: C答案解析:χ2检验可⽤于率或构成⽐⽐较的假设检验中,不适宜于均数的⽐较。

做答⼈数:0做对⼈数:0所占⽐例: 0题号: 3 本题分数: 2⾏×列表的⾃由度是A. ⾏数-1B. 列数-1C. ⾏数×列数D. (⾏数-1)×(列数-1)E. 样本含量-1正确答案: D答案解析:⾏×列表中,⾏的⾃由度=⾏数-1,列的⾃由度=列数-1,⾏×列⼆维表资料的χ2统计量所对应的⾃由度=(⾏数-1)×(列数-1)。

做答⼈数:0做对⼈数:0所占⽐例: 0题号: 4 本题分数: 2四个百分率做⽐较,有⼀个理论数⼩于5,其他都⼤于5,则A. 只能做校正χ2检验B. 不能做χ2检验C. 直接采⽤⾏×列表χ2检验D. 必须先做合理的合并E. 只能做秩和检验正确答案: C答案解析:四个百分率做⽐较,资料可整理为4×2的⾏×列表,多个率⽐较的⾏×列表资料不适宜采⽤秩和检验,当满⾜⾏×列⼩于5,可直接进⾏χ2检验。

卡方检验

卡方检验

17
第二节 多个独立样本列联表资料的2检验
18
行×列表资料的2检验
•行×列表基本数据有以下三种情况: 多个样本率比较,有R行2列,称R×2表 ; 两个样本的构成比比较,有2行C列,称2×C表; 多个样本的构成比比较,以及双向无序分类资料关联性检 验,有R行C列,称R×C表。 •行×列表资料2检验的专用公式:
校正公式:
2
( A T 0.5)2 T
2
( ad bc n / 2)2 n (a b)(c d )(a c)(b d )
14
例7-2 某医生欲研究含钙胶囊预防妊高征的效果,将 22~ 33岁单胎初孕妇女具有妊娠高危因素者随机分为两组。含钙 胶囊组42人从孕28周起到分娩止每日口服,结果出现妊高征 3例。安慰剂组29人,结果出现妊高征8例。试问补钙对妊高 征是否具有预防作用?
第七章 2检验
凌莉 教授
医学统计与流行病学系 公共卫生学院
1
主要内容
• 两个独立样本四格表资料的2检验 • 多个独立样本列联表资料的2检验
• 配对设计资料的2检验
• 频数分布拟合优度的的2检验
2
第一节 两个独立样本四格表资料的2检验
3
2分布
•由正态分布构造的一个新的分布,k个独立的标准正态分布变量的平方 和服从自由度为k的2分布。 •2分布形状由自由度v决定: v≤2,曲线呈L形; 随v的增大,曲线趋于对 称;v→∞,曲线趋向正态分布。 •2分布具有可加性:若有k个服从2分布且相互独立的随机变量,则他们 之和仍是2分布,自由度为原来k个自由度之和。 •2分布的界值由自由度v和检验水准α决定。
2.计算检验统计量和自由度
2
( ad bc n 2) 2 n (a b)(c d )(a c)(b d )

第七章 卡方检验

第七章  卡方检验

2 校正公式
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
2
( A T 0.5)2 T
例 7
例3- 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,
两组的缓解率见表7-4。问两疗法的总体缓解率是否不同?
第一节 频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
一、χ 2 分布
χ 2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
,
则称
2

Z12

Z
2 2

Z
2 3
...Biblioteka Z2 v为服从自由度为v 的 2 分布。
观察频数A (2) 2 2 7 17 25 37 25 16 4 1
136(n)
概率P(X) (3)
0.00397 0.01809 0.05801 0.13110 0.20888 0.23468 0.18592 0.10386 0.04090 0.01135
1.000
理论频数T (4)=(3) ×n
27 18
v (3 1)(2 1) 2
P<0.025 , 拒绝H0 ,认为三种剂量镇痛效果有差别.
二、多个率之间两两比较—2 分割法
行×列表资料的2 检验只能得出总的结论:即各总体率或构成比之 间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决 此问题,可用2 分割法( partitions of 2 method)。 2 分割原理: (1)n个相互独立的2 分割之和服从2 分布且2总= 2 分割1+ 2 分割2+… (2) ν总=ν分割1+ ν分割2+ … (3)最相近原则分割原表

次数资料分析---卡方检验

次数资料分析---卡方检验

第七章 次数资料分析---χ2检验第一节 χ2检验的原理与方法1.χ2分布χ2分布是从正态分布派生出来的一种分布。

⏹[定义]设X 1,X 2,X 3,…,X n 相互独立同分布,且X i ~N(0,1),则随机变量χ2= x i 2n i=1的分布称为具有n 个自由度的χ2分布。

记作: χ2 = x i 2n i=1 ~χ2(n ) 即:n 个标准正态分布的随机变量的平方和,服从自由度为n 的χ2分布。

⏹[推论]若随机变量X 1,X 2,X 3,…,X n 相互独立,且X i ~N(μ, σ2),则χ2= (x i −μ)2σ2n i=1~χ2(n)⏹[自由度]在计算χ2的过程中,如果有一个统计量代替了其中的一个参数,则其自由度为(n-1);如果有两个统计量代替了其中的两个参数,则其自由度为(n-2)。

χ2= ~χ2(n-1)22212)1()(σσS n x x ni i -=-∑=2.χ2分布的性质⏹χ2分布的“可加性”—在进行χ2统计分析时,可将相邻的数据合并在一起统计⏹χ2分布为非对称的连续性分布,分布区间为[0,+∞]⏹χ2分布曲线因自由度不同而异不同自由度的概率分布密度曲线 2χ 3.χ2检验的基本原理与方法χ2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。

⏹[基本原理] 用于实际观测值(O )与理论推算值(E )之间的偏离程度来计算χ2值的大小,根据χ2的概率来检验观测值与理论值的差异程度和符合程度的大小。

⏹[检验方法]按照假设检验的一般步骤,对计数资料进行右尾检验。

如果有k 组资料,则检验统计量的值按下式计算:χ2=(A i −T i )2T iki=1【k:类别;A i :实际观测值;T i :理论推算值】⏹[连续性矫正] 当自由度df ≧2时,一般不作连续性矫正。

但在自由度df =1时,需进行连续性矫正,统计量计算公式:x c2= (∣A i −T i ∣−0.5)2T iki=1第二节 适合性检验1.适合性检验的定义所谓适合性检验,就是检验某一试验结果类别频数的划分是否符合某一理论比例。

医学统计学第七章卡方检验

医学统计学第七章卡方检验

n 40 或 T 1,直接计算概率。
2 连续性校正仅用于 的1 四格表资料,当
,一般不作校正。
时2
23
第二十三页,共100页
例7-2 某医师欲比较胞磷胆碱与神
经节苷酯治疗脑血管疾病的疗效,将78 例脑血管疾病患者随机分为两组,结果 见表7-3。问两种药物治疗脑血管疾病的
有效率是否相等?
24
阳性 阴性
4
18
5(3) 6
9
24
合计 感染率(%)
22
18.18
11
45.45
33
27.27
39
第三十九页,共100页
一、基本思想
在四格表周边合计数固定不变的条件
下,计算表内4个实际频数变动时的各种
组合之概率 ;再Pi按检验假设用单侧 或双侧的累计概率 ,依P据所取的检验
水准 做出推断。
40
第四十页,共100页
b, c为两法观察结果不一致的两种情况。
检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
Байду номын сангаас
,
=1
33
第三十三页,共100页
注意:
本法一般用于样本含量不太大的资料。因为
它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情况
(a, d)。所以,当n很大且a与d的数值很大(即两
1.各组合概率Pi的计算 在四格表周边合计数不 变的条件下,表内4个实际频数 a,b,c,d 变动的 组合数共有“周边合计中最小数+1”个。如例
7-4 , 表 内 4 个 实 际 频 数 变 动 的 组 合 数 共 有 9+1=10个,依次为:

第七章卡方检验报告

第七章卡方检验报告

H0:两种检验方法的结果相同,即总体B=C; H1:两种检验方法的结果不同,即总体BC。
=0.05。
2

( 26 5 1) 2 26 5
12.90
按 =1查2界值表,P<0.005。在 =0.05水准上拒绝H0 , 接受H1,差异有统计学意义。可认为两法检验结果不同,荧 光抗体法阳性结果高于常规培养法。
24
22 14
(0.97 1.00]
(1.00 1.03] (1.03 1.06] 合计
由 2界值表查得 20.05,1 = 3.84 ,即理论上
如果H0成立,则2有95%的可能 在0~3.84
之间,2 >3.84的可能性只有0.05,是一小概
率事件。
.5
.4
.3
.2
.1
0 0
3.84
四格表资料专用公式:
组别 试验 对照
有效 99 a 75 c
无效 5 b 21 d
合计
有效率%
当b+c≤20时:计算确切概率(利用二项分布
法计算)
例:用两种检验方法对某食品作沙门氏菌检验,结果
如下表,试比较两种方法的阳性结果是否有差别。
两种检验方法结果比较 常规培养法 + 160(a) 5(c) 165 26(b) 48(d) 74
荧光抗体法 + 合计
合计 186 53 239

样本构成比较的比较
例: 某医生分别调查了维吾尔族与回族居民 1513 人和平共处 1355 人, 得其 ABO 血型资料如下表,问两个民族居民血型构成是否相同。 维吾尔族与回族居民 ABO 血型的构成 民族 维吾尔族 回族 合计 A 442 369 811 B 483 384 867 O 416 487 903 AB 172 115 287 合计 1513 1355 2868

第七章 卡方检验

第七章 卡方检验
2 c
( A − T − 0.5) T
2

当自由度大于1时 当自由度大于 时,χ2分布与连续型随 这时, 机变量χ2分布相近似 ,这时,可不作连 续性矫正 , 但要求各组内的理论次数 不小于5。 不小于 。 若某组的理论次数小于5, 若某组的理论次数小于 ,则应把它 与其相邻的一组或几组合并, 与其相邻的一组或几组合并,直到理论 为止。 次数大 于5 为止。
二、 2×2表独立性检验 × 表

在做2× 表的独立性检验时 表的独立性检验时, ( 在做 ×2表的独立性检验时,df=(21)(2-1)=1,故计算χ2时需做连续性矫正。 故计算χ ) 故计算 时需做连续性矫正。 一般形式如下: 一般形式如下: • 2×2列联表一般形式 × 列联表一般形式 列 行 1 2 总数 1 O11 O21 C1 2 O12 O22 C2 总 数 R1 R2 n
数与理论次数差异不显著; 数与理论次数差异不显著; 差异不显著
2 χ02.05 ≤ χ2(或 χ c2 )< χ0.01 ,0.01< P ≤0.05ቤተ መጻሕፍቲ ባይዱ • 若 < ,
表明实际观察次数与理论次数差异显著; 表明实际观察次数与理论次数差异显著; 差异显著
2 • 若χ2( 或 χ c2 )≥ χ0.01 , P ≤0.01,表明实际观察 , 次数与理论次数差异极显著 差异极显著。 次数与理论次数差异极显著。


t检验主要用于两样本平均数(或 检验主要用于两样本平均数( 检验主要用于两样本平均数 一个样本平均数与总体平均数) 一个样本平均数与总体平均数)间 的差异显著性检验; 的差异显著性检验; F检验主要应用于样本平均数的个 检验主要应用于样本平均数的个 检验 数大于或等于3时的假设检验 时的假设检验。 数大于或等于 时的假设检验。

医学统计学课件卡方检验

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。

最新-11-09 第七章 卡方检验2课件ppt

最新-11-09 第七章 卡方检验2课件ppt

第三节
四格表资料的Fisher确切概率法
条件:
理论依据:超几何分布
(非χ2 检验的范畴)
例7-4 某医师为研究乙肝免疫球蛋白 预防胎儿宫内HBV感染的效果,将33例 HBsAg阳性孕妇随机分为预防注射组和非预 防组,结果见表7-4。问两组新生儿的HBV 总体感染率有无差别?
一、基本思想
在四格表周边合计数固定不变的条件 下,计算表内4个实际频数变动时的各种组
二、检验步骤(本例n=33<40 )
H0:1=2,即两组新生儿HBV的总体感染率相等 H1:1≠2,即两组新生儿HBV的总体感染率不等
α =0.05 1.计算现有样本四格表的P*及各组合下四格表的Pi ,见表7-5。本例P*=0.08762728。
2.计算满足Pi≤P*条件的所有四格表的累计概率P。
病种
阳性
阴性
合计
胆囊腺癌
6
胆囊腺瘤
1
合计
7
4
10
9
10
13
20
H0:1=2,即胆囊腺癌与胆囊腺瘤的P53基因表达
阳性率相等
H1:1≠2,即胆囊腺癌与胆囊腺瘤的P53基因表达
阳性率不等 α=0.05 本例 a+b=c+d=10,由表7-7可看出,四格表内各种 组合以i=4和i=5的组合为中心呈对称分布。
表组合的累计概率为左侧概率,记为PL;现 有样本四格表及其以右的所有四格表组合的 累计概率为右侧概率,记为PR。若备择假设
H1为12,则P单侧=PR;若H1为12,则
P单侧=PL。
(2)双侧检验 计算满足Pi ≤ P*条件的各种组合下四格表
的累计概率。若遇到 a+b=c+d 或 a+c=b+d 时 ,四格表内各种组合的序列呈对称分布,此 时按单侧检验规定条件只计算单侧累计概率 ,然后乘以2即得双侧累计概率。

卡方检验

卡方检验
卡方检验
假设检验方法
01 基本原理
03 检验方法 05 代码实现
目录
02 步骤 04 资料检验
卡方检验,是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括两个率或两个构成比 比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
基本原理
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程 度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡 方值就为0,表明理论值完全符合。
卡方检验要求:最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据 不符合要求,就要应用校正卡方。
谢谢观看
注意:卡方检验针对分类变量。
步骤
(1)提出原假设: H0:总体X的分布函数为F(x). 如果总体分布为离散型,则假设具体为 H0:总体X的分布律为P{X=xi}=pi, i=1,2,... (2)将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,…,Ak,如可取 A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak), 其中a0可取-∞,ak可取+∞,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5, 而区间个数k不要太大也不要太小。 (3)把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和 f1+f2+...+fk等于样本容量n。 (4)当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i个小区间Ai的概率pi,于是,npi 就是落入第i个小区间Ai的样本值的理论频数(理论值)。
检验方法
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
普通2检验适用条件: n40且所有T 5。
h
7
二. 2检验的校正公式
(|A-T|-0.5)2 2 =
T
(n40但有1T5)
简化公式: 2 =
(|ad-bc|-n/2)2n (a+b)(c+d)(a+c)(b+d)
(A-T)2 2 =
T
(通用公式)
h
4
2 分布的性质
2 分布为连续型分布, 2 自0至,永远大 于0。
2 分布同t分布、F分布一样,也是随自由度 的不同而形成簇状分布。 2 分布的形态随自 由度而变化,自由度越小,偏态越甚;自由度 越大,其分布越趋近于正态分布。
2 具有可加性。
h
5
如何计算理论频数T?
2 =
b+c
(b + c40) (b + c<40)
本例
(10-31)2
2 =
10+31
= 10.76, =1
查表得P 0.005,按=0.05水准,拒绝H0,接受H1,可以认为甲乙两 法的血清学阳性检出率不同。
h
16
练习 用两种方法检验已确诊的癌症患者140名。甲法的检出率为65%,乙法 的检出率为55%,甲乙两法一致的检出率为40%。试分析两法的优劣。
| P1-P2| 0.267 0.1 0.067 0.233 0.4
P(i)
0.1079
0.0166
极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245
按=0.05水准不拒绝H0,尚不能认为两组发癌h 率有差别。
14
第二节 配对四格表资料的 2检验
例6.8 甲法
h
12
补充题:
用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中 4只发生癌变,对照组10只无1只发生癌变,问两组发癌率 有无差别?
h
13
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
4 0
0
3 1
1
2 2
2
1 3
3
0 4
4
阴性
11 10 12 9 13 8 14 7 15 6
P1 P2 0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4
设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D 的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数 相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧
P值,再乘以2得双侧检验的概率。
P=
15! 10! 4! 21!
=0.1423
1! 14! 3! 7! 25!
将该表分解成若干种不同的情况,使得周边数不变:
h
10
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
0 0
4
1 1
3
2 2
2
3 3
1
4 4
0
阴性
15 6 14 7 13 8 12 9 11 10
P1 P2 0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000
+ 合计
两种血清学检验结果比较


+
-
80(a) 31(c)
10(b) 11(d)
111
21
合计
90 42 132
h
15
解:H0:两法总体阳性检出率无差别,即B=C; H1:两法总体阳性检出率不同,即BC; =0.05
Tb=Tc=(b+c)/2,

(b - c)2
2 =
b+c
, =1
校正公式
(|b - c|-1)2 , =1
处理 洛赛克 雷尼替丁 合计
愈合
未愈合
合计
64 (57.84) 21 (27.16) 85
51 (57.16) 33 (26.84) 84
115
54
169
合计愈合率:115/169
愈合率(%) 75.29 60.71 68.05
T11=
115 169
×85, T21=
115 ×84, 169
T12 =
第七章 2检验 (Chi-square test)
用于:
– 对多个独立样本率的比较,也适用于两个率 的比较;
– 对多组构成比的比较; – 对按照两个变量分组的资料,检验此两变量
的关系; – 对频数分布做拟合优度检验。
h
1
第一节 四格表(fourfold table)资料的2检验
h
2
一.普通2检验
| P1-P2| 0.400 0.233 0.067 0.100 0.267
P(i) 0.0166 0.1423
0.1079
极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布h氏病患者PHA反应阳性率有差别。11
h
3
例 6.2
处理 洛赛克 雷尼替丁 合计
表6.2 两种药物治疗消化道溃疡效果
愈合 64 51 115
未愈合 21 33 54
合计 85 84 169
5
解 H0:1= 2; H1:1 2; =0.05
A:实际频数(actural frequency) T:理论频数(theoretical frequency)
h
8
三. Fisher确切概率法 (Fisher’s exact probabilities)
适用于n 40或有T 1时。 基本思想:在四格表周边合计不变的条件下,获得某个四格表 的概率为
(a+b)!(c+d)! (a+c)!(b+d)! P=
a! b! c! d! n!
h
9

两型慢性布氏病的PHA皮试反应
54×85, T22 =
169
TRC=
nRnC n
h
5×484, 169
6
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
病人分型
阳性数
阴性数
合计
活动型
1(2.4) 14(12.6) 15
稳定型
3(1.6) 7(8.4)
10
合计
4
21
25
阳性率(%) 6.67
30.00 16.00
解 H0:1= 2; H1:1 2; =0.05
表中活动型的阳性率 P1 =0.067,稳定型的阳性率 P2=0.300,两
者差别 | P1-P2| =0.233,该表出现的概率为
相关文档
最新文档