卡方检验(计数资料)
中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2
(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d
5-1卡方检验
105
14
表8-1 老年人白内障的年龄分布及患病率
年龄组 (岁) 受检人 数 患病人 数 相对比 年龄构成比 (%) 患病率 (%)
(1) 40506070 80 合计
(2) 560 441 296 149 22 1468
(3) 68 129 135 97 19 448
(4) 1.00 1.90 1.99 1.43 0.28 105
2
105
42
本资料若不校正时,
(22 3 8 37) 70 4.75 30 40 59 11 0.025 P 0.05
2 2
结论与之相反。
105
43
配对四格表资料的 检验
2
105
44
与计量资料推断两总体均数是否 有差别有成组设计和配对设计一样, 计数资料推断两个总体率(构成比) 是否有差别也有成组设计和配对设计, 即四格表资料和配对四格表资料。
四格表资料的基本形式
105 26
基本思想:可通过 检验的基本公式来理解。
2
2
( AT ) , (行数-1)(列数 1) T
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
105 27
理论频数由下式求得:
105 30
( A T )2 值的大小还取决于 由公式(11-12)还可以看出: T 2 个数的多少(严格地说是自由度ν的大小)。由于各 ( A T ) T
2
2 皆是正值,故自由度ν愈大, 值也会愈大;所以只有考虑 2 了自由度ν的影响, 值才能正确地反映实际频数 A和理论 频数T 的吻合程度。
9 第十二章 卡方检验(一)
确切概率法计算公式
在四格表的周边合计不变的条件 下 , 用下式直接计算表内四个数据 的各种组合之概率。 的各种组合之概率。 式中a、b、c、d为四格表的实际 频数
(a+b)!(c+d)!(a+c)!(b+d)! P= a!b c!d!n ! !
四格表资料的精确检验法基本步骤
1、建立假设 Ho:假设差别是由抽样误差引起的 H1:假设差别是本质上存在的 确定显著性水准: 2、确定显著性水准:α=0.05 3、计算确切概率P 周边合计不变,列出各种组合的四格表; (1)周边合计不变,列出各种组合的四格表; 计算各个四格表的| (2)计算各个四格表的|A-T|值; 样本| (3)求|A-T|值≥样本|A-T|值的所有四格表的Pi 值; Pi=(a+b)!(c+d)!(a+c)!(b+d)!/[a!b!c!d!n!] (4)求出确切概率P:P=ΣPi 结果判断: 4、结果判断:在事先确定的显著性水准α下作 出专业结论。 出专业结论。
行×列表资料χ2检验时的注意事项
1、行×列表资料χ2检验对资料的要求是:不宜有1/5以上 检验对资料的要求是:不宜有1 格子的理论数小于5 且理论数应大于1 格子的理论数小于 5 , 且理论数应大于 1 , 若发生上述情 可选用下述三种处理方法 三种处理方法: 况 , 可选用下述 三种处理方法 : ① 适当增大样本含量以 增大理论频数; 增大理论频数 ; ② 将理论数过小的格子所在的行或列与 性质相近的行或列中的实际数合并, 性质相近的行或列中的实际数合并 , 使重新计算的理论 数增大; 删去理论数过小的行或列。 数增大 ; ③ 删去理论数过小的行或列 。 后两种处理方法 有可能损失资料信息, 且可能破坏样本随机性, 有可能损失资料信息 , 且可能破坏样本随机性 , 故不宜 常规使用。 常规使用。 2、当试验效应按照强弱分为若干个级别,试验结果可整理 当试验效应按照强弱分为若干个级别, 为单向有序行×列表资料, 为单向有序行 × 列表资料 , 在比较各处理组间的效应有 无差别时,宜选用秩和检验、Ridit分析 趋势检验等, 分析、 无差别时,宜选用秩和检验、Ridit分析、趋势检验等, 检验只能说明各组构成比的差别有无显著性。 如作χ2检验只能说明各组构成比的差别有无显著性。 3、多个样本率或多个构成比的χ2检验,结果有显著性意义 检验, 只能认为总体率或总体构成之间总的来说有差别, 时,只能认为总体率或总体构成之间总的来说有差别, 不能说明两两之间皆有差别, 不能说明两两之间皆有差别,若要对每两个率或每两个 构成比进行比较,应采用行× 构成比进行比较,应采用行×列表的χ2分割法或者采用 其它率或构成比的多重比较。 其它率或构成比的多重比较。
计数资料的统计描述与卡方检验
25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
卡方检验
卡方检验3.解:条件判断变量类型:计数资料设计类型:两样本率的四格表资料其他条件:n=120>40(2)建立假设检验,确定检验水准H0 :π1=π2 ,即两组的总体有效率相等H1:π1≠π2,即两组的总体有效率不等ɑ=0.05计算检验统计量由图所示:n>40且Tmin=15.87>5X2=13.755结论:确定P=0.0001,作出推断结论:P<0.05,按ɑ=0.05检验水准,拒绝H0,接受H1,差异有统计学意义,可认为两组即紫外线和抗病毒药物治疗带状疱疹的有效率不等。
解:条件判断:变量类型:计数资料设计类型:三个样本率的行×列表其他条件:n=1072>40(2)建立假设检验,确定检验水准H0 :π1=π2,即3种疗法的总体有效率相等H1 :π1≠π2,即3种疗法的总体有效率不等ɑ=0.05计算检验统计量由图所示:n>40且Tmin=24.35>5,X2=15.00确定P=0.001,作出推断结论:P<0.05,按ɑ=0.05检验水准,拒绝H0,接受H1,差异有统计学意义,可认为3种疗法治疗肩周炎的总体有效率不等。
(5)需进一步进行3种疗法的两两比较。
H0 :π1=π2,即任2对比组的总体有效率相等H1 :π1≠π2,即任2对比组的总体有效率不等ɑ’=0.05÷3=0.0167温热磁组和蜡疗组:由图所示:Tmin=20.35>5,X2=11.889确定P=0.001,作出推断结论:P<0.0167,按ɑ’=0.0167检验水准,拒绝H0,接受H1,差异有统计学意义,可认为温热磁组和蜡疗组的总体有效率不等。
②超短波组和蜡疗组由图所示:Tmin=33.96>5,X2=12.660确定P=0.0001,作出推断结论:P<0.0167,按ɑ’=0.0167检验水准,拒绝H0,接受H1,差异有统计学意义,可认为超短波组和蜡疗组的总体有效率不等。
卡方的检验
甲 25(26.57) 6(4.43) 31
乙 29(27.43) 3(4.57) 32
合计 54
9
63
由表可见 n>40且有1<T<5,故
应用校正公式,步骤如下:
由于理论数的计算方法是:
TRC=nR nC / n
分母大家都一样,所以最小理论数 的计算:
Tmin=行和最小*列和最小 / n
四格表卡方要不要校正,只要计算 最小理论数就可以判断了。
故每个实际数所对应的理论数 算法是,该实际数对应的行和乘 列和再除以总的N样本含量。
即 n TRC= R nC / n
卡方检验基本公式
2
A
T T
2
A: 实际数 T: 理论数
卡方检验的基本思想是看理论数 与实际数的吻合程度
上述公式中卡方统计量的大小
取决于实际数和理论数的相差大 小情况,如果无效假设成立的话, 那么实际数和理论数不应该相差 过大,所以卡方统计量应该较小, 而如果卡方统计量越大,则越有 可能推翻无效假设而得出有统计 差异得结论。
故应该用校正公式 1.建立假设:
H0:π1 = π2 H1: π1≠ π2
α=0.05
2.计算χ2
2 ( 22 6 512 45 / 2)2 45 0.61
27 18 34 11
χ2 =0.61 < χ2 0.05(1) = 3.84, P >0.05,差异无统计学意义,
认为两药疗效没有差异。
3.发病率和患病率中会超过100%的
是
()
A 发病率和患X 病1.96S 率都
B 患病率
C 发病率
D.两者都不会
计算题1
比较槟榔煎剂和阿的平驱蛲虫的效 果,对45名蛲虫患者进行治疗,结 果如下,问两药疗效有无差别?
计数资料常用检验方法
.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV
合
计
2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)
10.卡方检验-10
式中 a、b、c、d 分别为四格表中的四个实际频数, n 为总例数。
3.
检验的连续性校正问题
检验的校正公式:
一般原则是: ① 当n ≥40且所有T≥ 5时,用 检验的理 论公式(9-1)或专用公式(9-9);若所得的P ≈ α , 改用Fisher确切概率法。
② 当n≥40但有1≤T<5时,用 校正公式(9-10)或(9-11)。
甲处理 + -
乙处理
合计
+ a c a+c
b d b+d
合计 a+b c+d n
两个相关样本率比较检验统计量
的计算公式:
b + c≥40
b + c <40
例10-4 用两种不同的方法对53例肺癌患者进行诊 断,收集得表10-4的资料,问两种方法的检测 结果有无差别? 甲法 + 合计 乙法 + 25(a) 11(c) 36 2 (b ) 15(d) 17 合计 27 26 53
2 2 30 25 10 17 82 30 10 17 2530 17 10 25 =9.98
(3)确定概率P值和判断结果 自由度ν= (2-1) (2-1) =1 查2界值表,20.005(1)=7.88,2>20.005(1),P< 0.005, 按 =0.05的水准,拒绝H0,接受H1,可认为婴儿 腹泻与喂养方式之间存在关联性。
2
2. 行×列表资料经2检验后,如假设检验 的结果是拒绝无效假设,只能认为各总体 率或构成比之间总的来说有差别,但并不 是说它们彼此之间都有差别,如例10-7的 检验结果为拒绝了H0,仅能说明甲、乙两 城市各种空气质量类别所占的比例不同, 不能说明全不相同。如果想进一步了解彼 此之间的差别,需将行×列表分割,再进 行2检验(详见本章第四节)。
04.计数资料统计分析-卡方检验ppt课件
用药史 曾服该药 未服该药
合计
某抗生素的人群耐药性情况
不敏感
敏感
180(174.10) 215(220.90) 73(78.90) 106(100.10)
253
321
最新课件
合计 耐药率(%)
395
45.57
179
40.78
574
44.08
5
四格表资料的基本形式
分组 阳性事件发生数 阴性事件发生数
检验——卡方检验
Chi-square Test
最新课件 独立样本四格表的 检验 ➢ 配对资料四格表的 检验 ➢ 行x列表的 检验
最新课件
2
检验的用途
用于分类变量(计数)资料的统计推断 。 检验两个(或多个)率或构成比之间差别 是否有差异。
最新课件
3
检验的基本思想
27
行x列表 2 检验的注意事项
建议:用确切概率法
最新课件
28
本章总结
最新课件
29
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
30
最新课件
14
四格表 2 检验的确切概率检验法
最新课件
15
➢ 例:有17名腰椎间盘脱出症患者,其中有9人志愿接受一种新 的疗法,治愈率为77.78%,其它8人接受保守疗法,治愈率为 25.00%,问:两种疗法的疗效是否有差别?
疗 法 治愈
新疗法 7
保守疗法 2
合计
9
未治愈 2 6 8
合计 9 8 17
最新课件
18
独立样本与配对样本的区别
例8.11 有28份咽喉涂抹标本,把每份标本一分为二,分别接种在 甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况。问两种 培养基的阳性检出率是否相等?
5习题-卡方检验知识讲解
计数资料统计分析————习题1.220.05,n x x ≥ 则( )A.P ≥0.05B.P ≤0.05C.P <0.05D.P =0.05E.P >0.052.2x 检验中,自由度v 的计算为( )A.行×列(R ×C )B.样本含量nC.n-1D.(R -1)(C -1)E.n2.四格表卡方检验中,2x <20.05(1)x ,可认为A.两样本率不同B.两样本率相同C.两总体率不同D.两总体率相同E.样本率与总体率不同3.分析计数资料时,最常用的显著性检验方法是( )A.t 检验法B.正态检验法C.秩和检验法D.2x 检验法 E.方差分析4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( )A.不变B.愈大C.愈小D.与2x 值相等E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文2x >20.01(1)x 2x >20.05(1)x 。
若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信D.甲论文结果不可信E.甲论文说明两总体的差别大6.计算R ×C 表的专用公式是( )A. 22()()()()()ad bc n x a b a c b d c d -=++++ B. B. 22()b c x b c -=+ C . 221R C A x n n n ⎛⎫=- ⎪⎝⎭∑ D. ()220.5b c x b c --=+E. 22()A T x T -=∑7.关于行×列表2x检验,正确的应用必须是()A.不宜有格子中的实际数小于5 B.不宜有格子中的理论数小于5C.不宜有格子中的理论数小于5 或小于1D.不宜有1/5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l E.不宜有1/5 以上的格子中的实际教小于5 或有一个格子中的实际数小于18.R×C 表的2x检验中,P<0.05 说明()A.被比较的n 个样本率之间的差异有显著性B.样本率间差别没有显著性C.任何两个率之间差别均有显著性D.至少某两个样本率是差别有显著性E.只有两个样本率间差别有显著性9.四个样本率作比较,220.01,(3)χχ>,可认为()A.各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等D.各样本率不等或不全相等E.各总体率相等10.配对四格表资料需用校正公式的条件()A.1<T<5 和n>40B.b+c<40C.T<1 或n<40D.T>1 n>40E.a+c<4011.配对资料2x值专用公式是()A.22()()()()()ad bc nxa b a c b d c d-=++++B.2 2()b c xb c-=+C.221R CAx nn n⎛⎫=-⎪⎝⎭∑D.()2 20.5b cxb c--=+E.2 2()A T xT-=∑12.在x2 检验中,四格表的校正公式是:A.22()()()()()ad bc nxa b a c b d c d-=++++B.2 2()b c xb c-=+C . 221R C A x n n n ⎛⎫=- ⎪⎝⎭∑ D. ()220.5b c x b c --=+ E. 22()A T x T -=∑ 13.作四格表卡方检验,当N>40,且__________时,应该使用校正公式A T<5B T>5C T<1D T>5E 1<T<514.四格表资料的卡方检验时无需校正,应满足的条件是( )。
计数资料常用检验方法
计数资料行×列(R ×C)表卡方检验 公式:
X2=35.81> , 差异有显著性,P<0.01,可以认为三组疗效不同,中西药结合组较其他两组高,若要进一步作两两比较,可分成三个四格表再进行比较。
中西药结合组
组别
有效
无效
合计
46
12
02
Pearson列联系数(P)
Cramer(修正)列联系数(C)
演讲人姓名
列联表计数资料的相关分析数据格式 (PEMS软件包)
卡方值 = 74.4015
自由度 v = 4
概率 P = 0.0000
Pearson 列联系数 = 0.2597
各个格子的理论数均大于 5
结果
列联表计数资料的相关分析.一致性检验.Kappa值(PEMS软件包)
66
12
78
0.05,差异无统计学意义,可以认为甲、乙两组有效率相同,如用X2值一般公式计算X2=2.85
(3) 、当总例数n>40,但有理论数0<T<1,或总例数n<40,有实际观察数为0的情况,此时应采用确切概率法直接算出概率P
两种药物治疗结果
组别
治愈
未愈
合计
新药
5(1.82)
、当总例数n>40,1<T<5时,由于理论数偏小,往往使得X2值偏大,此时可应用四格表X2值校正公式:
甲 、乙两组有效率比较
表中有一个理论数 4.62((30×12)/78=4.62)大于1小于5,可采用X2值校正公式计算
分组
有效数
无效数
合计数
甲组
38
10
48
乙组
第五章计数资料组间比较的假设检验—卡方)检验(chi-
4.结论:在=0.05水准上,p>0.05,不拒 绝H0,差别无统计的显著性, 还不能认 为四种疗法的生存率有差别.
2×K表的两两比较 (多组样本率的两两比较)
• 当比较组k≥3时,2×K表的χ2值有统计意义, 可用下法了解各样本率两两间的差别。
• 方法(见81页):
• 1.可信区间法(例5-13,81页)
表5-4黑色素瘤患者随访3年生存情况
• 治疗组 生存人数 死亡人数 合计
•Ⅰ
77
108
185
•Ⅱ
89
103
192
•Ⅲ
99
104
203
•Ⅳ
90
91
181
• 合计 355
406
761
生存率% 41.6 46.4 48.8 50.0 46.6
• 1.假设:H0; 1= 2 = 3= c=355/761=46.6
• 观察指标(X):死亡、生存(共78例,39对)
• 结果值(X):
•
甲 乙 对子例数
•
死亡 死亡
6
• •
死亡 生存 生存 死亡
12 3
39对
•
生存 生存
18
配对设计资料的四格表及公式
• 例表5-3 两种剂量的毒理实验结果
•
乙剂量
• 甲剂量 死亡
生存
合计
• 死亡 6 (a) 12(b)
18(a+b)
•
X1
• 1 37
• 2 45
• 3 43
• 4 59
•。
• 100 54
X2 X3 男A 女B 男A 女B
男B
X4 X5 11.27 12.53 10.93 14.67
计数资料常用检验方法
计数资料常用检验方法
1、Chi-square test(卡方检验)
卡方检验是一种针对离散变量之间(或内部)的关系的常见的统计检
验方法。
它通过检验样本观察值和样本理论分布的偏离程度来衡量两个总
体是否相同。
卡方检验可用于完全指定表,大于2阶分类表,完全指定表
中数据类型为定数(指样本观察值)或实数的多比例表,2阶分类表中数
据类型为定数的实数表(包括均匀表)和双方表。
2、Z-test(Z检验)
Z检验是一种用于检验两个总体均值是否有显著差异的统计检验方法。
它是由样本均值标准差和样本大小的组合度量的,也就是把两个样本的标
准偏差组合成Z分布函数。
Z检验经常用于评估两个样本的平均值是否有
显著差异,以及是否存在统计学上有效的差异。
3、Kolmogorov-Smirnov test(KS检验)
K-S检验是一种基于统计分布的非参数检验,用来检验数据是否属于
其中一特定的分布。
K-S检验是基于比较观察值的分布和其中一种理论分
布之间的最大距离,从而检验它们是否属于同一个总体。
它经常用于检验
独立的实数数据是否符合其中一特定的概率分布。
4、T-test(T检验)
T检验是一种统计检验,它比较一个样本所要检验的总体均值与另一
样本的总体均值之间的差异。
计数资料常用检验方法
u=8.13,P<0.01,差异有显著性。 ( 或卡方检验,X2=66.15,P<0.01, 结论同u检验)。(因u= x 2 )
甲、乙两组总有效率比较 组别
总有效数
无效数
合计
总有效率(%)
甲组
乙组 合计
288
90 378
18
50 68
306
140 446
94.12
64.29 84.75
甲、乙两组总有效率比较X2=66.15,P<0.01,结论同u检验,
Chi-Square Tests Value .229b .000 .227 .219 24 df 1 1 1 1 Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) .633 1.000 .634 .665 .494 .640
本资料拟进行列的合并, 将III级与IV级合并见下表, 合并后各格理论数均大于5, 自由度相应减少为v=(2-1) (3-1)=2,
两组疗效等级分级合并后的情况:
组别 甲组 I 72 II 28 ≥III 7 合计 107
乙组
合计
74
146
32
60
7
14
113
220
X2=0.13,P>0.05,差异无显著性,可认为两 组病人病情分级构成的分布相同。
(2) 、当总例数n>40,1<T<5时,由于理 论数偏小,往往使得X2值偏大,此时可应 用四格表X2值校正公式:
2
( ad bc n 2) n
2
(a b)( a c)( c d )( b d )
医学统计学-第九章计数资料的参数估计与卡方检验
率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
护理计数资料卡方检验解释
护理计数资料卡方检验解释
计数检验:在抽样的样本中,记录每一个体有某种属性或计算每一个体中的缺陷数目的检查。
计量检验:计量检验的总体要求,在《规则》第五章第一节《总则》中,对定量包装商品净含量计量检验明确了两个原则性的要求,一是计量检验应采用的方法;二是在检验时应考虑的因素。
卡方检验是一种用途很广的计数资料的假设检验方法。
它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。
只有当样本量比较充足时,才可以忽略两者问的差异,否则将可能导致较大的偏差具体而言,一般认为对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有4/5的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。
如果数据不符合要求,可以采用确切概率法进行概率的计算。
两组计数资料的卡方检验要求
两组计数资料的卡方检验1. 引言卡方检验是一种常用的统计方法,用于比较两组计数资料之间是否存在显著差异。
在许多领域中,我们经常需要对不同群体或样本进行比较,以了解它们之间的差异。
卡方检验可以帮助我们确定这些差异是否是由于偶然因素导致的,还是真实存在的。
2. 卡方检验原理卡方检验基于观察频数与期望频数之间的差异来判断两组计数资料之间的显著性差异。
观察频数是指实际观察到的数据,在统计学中通常用O表示;期望频数则是指根据某种假设或模型所预期得到的数据,在统计学中通常用E表示。
卡方值(χ²)可以通过下面公式计算得到:χ² = Σ((O - E)² / E)其中Σ表示对所有数据进行求和。
卡方值越大,说明观察频数与期望频数之间的差异越大,即两组计数资料之间的差异越显著。
3. 卡方检验步骤进行卡方检验的一般步骤如下: - 建立假设:首先需要明确研究问题,并建立相应的原假设(H0)和备择假设(H1)。
原假设通常是指两组计数资料之间没有显著差异,备择假设则是指两组计数资料之间存在显著差异。
- 计算期望频数:根据某种假设或模型,计算出期望频数。
常见的方法包括独立性假设、均匀性假设等。
- 计算卡方值:根据观察频数和期望频数,使用卡方公式计算出卡方值。
- 确定临界值:根据显著性水平和自由度,查找卡方分布表中的临界值。
一般来说,显著性水平为0.05或0.01比较常见。
- 比较卡方值与临界值:将计算得到的卡方值与临界值进行比较。
如果卡方值大于临界值,则拒绝原假设,认为两组计数资料之间存在显著差异;如果卡方值小于等于临界值,则接受原假设,认为差异不显著。
4. 实例分析为了更好地理解卡方检验的应用,我们以一个实际问题为例进行分析。
假设有一家餐厅想评估其服务质量是否与顾客的满意度相关。
餐厅收集了两个计数资料:服务质量得分(优、良、差)和顾客的满意度(满意、一般、不满意)。
现在我们想知道这两组资料之间是否存在显著差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要求每个格子中的理论频数T均大于5或1<T<5ห้องสมุดไป่ตู้格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行X列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。
列联表资料的卡方检验:
同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。
列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。
1.随机样本数据;
2.卡方检验的理论频数不能太小。
两个独立样本比较可以分以下3种情况:
1.所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
2.如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。
行X列表资料的卡方检验
行X列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
3.如果有理论数T<1或n<40,则用Fisher’s检验。
上述是适用于四格表。
R×C表卡方检验应用条件:
1.R×C表中理论数小于5的格子不能超过1/5;
2.不能有小于1的理论数。我的实验中也不符合R×C表的卡方检验。可以通过增加样本数、列合并来实现。
1. R*C 列联表的卡方检验:
R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。
2. 2*2列联表的卡方检验:
2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
四格表资料的卡方检验
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad-bc)2*n/(a+b)(c+d)(a+c)(b+d),
自由度v=(行数-1)(列数-1)
2. 应用条件: