简述 x2 检验的注意事项。
医学统计学名词解释及问答题
医学统计学名词解释及问答题1、总体(population ):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation ):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic ):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error ):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability ):某事件发生的可能性大小。
9、正态分布(normal distribution ):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical referenee range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(varianee ):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation ):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用b 表示。
15、标准误(standard error ):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean ):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing ):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
第五章 χ2检验
χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。
卡方检验
表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。
第7章 x2检验
例7-3:某实验室采用两种方法对58名可疑 红斑狼疮患者的血清抗体进行测定,问:两 方法测定结果阳性检出率是否有差别?
表7-3 两种方法的检测结果 免疫荧光法 + - 乳胶凝集法
合计
+ 11(a) 2(c) 13
- 12(b) 33(d) 45
合计 23 35
58
检测结果一致: (a)免+乳+ ,(d) 免-乳检测结果不一致:(b) 免+乳- , (c)免-乳+ 比较两种检测方法有无差异时,只需比较不一致的 结果 。
感染率 18.18 45.45 27.27
一、基本思想
1.各组合概率Pi的计算 周边合计不变的条件下,表内4个实际频数 变动的组合数共有“周边合计中最小数+1”
表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计 9 24 33 27.27
公式:
b c 40
2 ( b c ) 2 x , bc b c 40
v 1
(7 7)
(| b c | 1) x , bc
2 2
v 1
(7 8)
1.建立检验的假设,确定检验水准 H0:b=c ;H1:b c =0.05 2.计算 χ2 统计量
b+c=2+12=14<40
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
2.累计概率P的计算 1)单侧检验:现有样本四格表及其以左的所 有四格表组合的累积概率为左侧概率(PL); 现有样本四格表及其以右的所有四格表组合的 累积概率为右侧概率(PR)。 H1为π1>π2,则P单侧 =PR; 若H1为π1<π2,则P单侧=PL 2.双侧检验: 计算满足Pi ≤P*条件下的各种组合之四格表 的累计概率。
X2检验——精选推荐
X2检验第七章 X2检验Chi-square testX2分布——计数资料第⼀节四格表资料的X2检验⼀、X2检验的基本思想1、X2分布(1)X2分布是⼀种连续型分布:X2分布(chi-square distribution)只有⼀个参数,即⾃由度。
当⾃由度V《2时,曲线呈L形随着V的增加,曲线逐渐趋于对称当⾃由度V—00⽆穷时,X2分布趋近正态分布(2)X2分布的⼀个基本性质是它的可加性:(X1+X2)——X2 (V1+V2)(3)X2 分布的界值:X2值愈⼤,P值愈⼩;反之,X2值愈⼩,P值愈⼤。
2、X2检验的基本思想四格表(fourfold table)资料PearsonX2——X2={Σ(A-T)2/T } V =(⾏数-1)(列数-1)A为实际频数(actual frequency)T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。
T(RC)=nRnC/nT(RC)为第R⾏(row)第C列(column)的理论频数,nR为相应⾏的合计,nC为相应列的合计,n为总列数。
X2值反映了实际频数与理论频数的吻合程度。
3、X2检验的步骤H0::π1=π2,即试验组与对照组——总体有效率相等H1::π1≠π2,即——————————————不等ɑ=0.05——T值——V——P值⼆、四格表资料X2检验的专⽤公式X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c)a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d. 四格表资料X2检验的校正公式三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c)(1)当n》40且所有的T》5时,⽤X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,⽤四格表资料X2检验的校正公式。
x2检验 医学统计学
基本思想
所谓两属性X和Y互相独立,是指属性X的概 率和属性Y的概率分布无关,否则称这两种 属性之间存在关联性。即
ij
ri cj
( nri n
)( ncj n
)
Tij
n ij
nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立
α=0.05
2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理
有效例数
无效例数
合计
有效率(%)
A药 B药 合计
68(64.818)a 52(55.182)c
120 (a+c)
6(9.182)b
74 (a+b)
11(7.818)d
63 (c+d)
17 (b+d)
137 (n=a+b+c+d)
91.89 82.54 87.59
P=0.01, x2 =6.63 ▪ P=0.05时, v=1, x2 =3.84
v=2, x2 =5.99
四格表χ2检验公式
当n≥40,T≥5时
2
( ARC TRC )2 TRC
2
ad bc2 n
a ca bc db d
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同
为两组疗效之间的差异有统计学意义。
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
配对四格表χ2检验
▪ 一般形式
甲属性
乙属性
x2检验或卡方检验和校正卡方检验的计算
x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19 24 43 44.2 化疗加放疗组34 10 44 77.3合计53 34 87 60.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
x2检验
2
A T
2
T 411.25 19.81 20.58 297.59
321 41.25
2
444 358.15
358.15
2
4.
v=(3-1)(4-1)=6, 则P<0.05,拒绝H0,认为三个地区的人群血型分布构成不同或不全相同。 查χ2界值表
服从x2分布,计算出x2值后,查表判断这么大的 x2是否为小概率事件,以判断建设检验是否成立。
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2
( / 21)
e
2 / 2
Ý ß ×·
×Ó ¶ £ 1 Ô É È ½
0.2 0.1 0.0 0 3
3.84
×Ó ¶ £ 2 Ô É È ½ ×Ó ¶ £ 3 Ô É È ½ ×Ó ¶ £ 6 Ô É È ½
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ·Ö ¨½ µ
15
18
自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
计数资料的统计推断
教师:数学统计教研室
胡冬梅
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
第七章 X2检验(医学统计学)
∵ P=0.2668>0.05,∴ 在α=0.05水准上,不拒
绝H0,故尚不能两型患者的反应阳性率有差别。 四格表检验小结 1、当T>5(所有格子),且 n>40时,应用 2 ( A T ) x2 T 或
2 ( ad bc ) n 2 x (a b)(c d )(a c )(b d )
α=0.05
按公式
X2=2.56
2 A x 2 n( 1) n R nC
计算
2 2 x0 2 . 37 x V=(2-1)(4-1)=3 , , .5, 3 0.25, 3 4.11 ,0.5>P>0.25
──────────────────── ━━━━━━━━━━━━━━━━━━━━━━
1、建立假设
H0:π1=π2
H1:π1≠π2 α=0.05
2、计算X2值
因T11=3.84<5, 故需要使用校正公式
用专用公式:a=1、 b=14 、 c=10 、 d=18
x
2
( ad bc n / 2) n
|A-T|值的四格表的P值,将其相加,即得到检验
概率P。
双侧检验:
对所有 |A-T|值等于及大于样本
|A-T|值的四格表P值相加;
单侧检验:按检验目的,取阳性数增大或减小一
侧的|A-T|值等于及大于样本|A-T|值四格表;
四格表概率P的计算公式
(a+b)!(c+d)!(a+c)!(b+d)! P=──────────── a!b!c!d!n!
各种组合的四格表: 样本四格表
0 15 15 1 14 15 2 13 15 3 12 15 4 11 15
卫生统计学试卷(含答案)
卫⽣统计学试卷(含答案)卫⽣统计学试卷姓名:__________ 考试时间:_______ ___(本⼤题满分40分,每⼩题1分)1. 算术均数适⽤于:( )A. 偏态分布资料B. 分布类型不明的资料C. 对数正态分布资料D. 以上都不是E. 正态分布资料2. 某医⽣在进⾏科室病例资料统计时,拟⽤算术平均数表⽰平均⽔平,应当选⽤什么样的资料:( )A. 性质不同的变量值B. 差异相同的变量值C. 性质相同的变量值D. 个体差异较⼤的变量值E. 个体差异较⼩的变量值3. 均数与标准差适⽤于:( )A. 正态分布B. 正偏态分布C. 不对称分布D. 偏态分布E. 负偏态分布4. 样本含量的估计是( )。
A. 不必估计,调查整个总体最好B. 保证研究结论具有⼀定可靠性的前提下确定的最少例数C. 经济条件允许的情况下,越多越好D. 时间允许的情况下,越多越好E. 根据实际情况,能选多少是多少5. 标化后的总死亡率:( )A. 它反映了事物实际发⽣的强度B. 以上都不对C. 它反映了实际⽔平D. 它不随标准选择的变化⽽变化E. 仅仅作为⽐较的基础,它反映了⼀种相对⽔平6. 下⾯说法中不正确的是( )。
A. 抽样误差的⼤⼩⼀般⽤标准误来表⽰B. 好的抽样设计⽅法,可避免抽样误差的产⽣C. 没有个体差异就不会有抽样误差D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别E. 医学统计资料主要来⾃统计报表、医疗⼯作记录、专题调查或实验等7. 计算某⾎清⾎凝抑制抗体滴度的平均⽔平,宜⽤:( )A. 四分位数B. ⼏何均数C. 相对数D. 中位数E. 均数8. 变异系数是表⽰资料的:( )A. 对称分布B. 平均⽔平C. 相对变异D. 集中趋势E. 变异数9. 统计上所说的样本是指:( )A. 总体中的每⼀个个体B. 按照随机原则抽取总体中有代表性部分C. 按照研究者要求抽取总体中有意义的部分D. 有意识的抽取总体中有典型部分E. 随意抽取总体中任意部分10. ⼀群7岁男孩⾝⾼标准差为5cm,体重标准差为3kg,则⼆者变异程度⽐较:( )A. ⾝⾼变异⼩于体重B. ⾝⾼变异不等于体重C. ⾝⾼变异等于体重D. ⽆法⽐较E. ⾝⾼变异⼤于体重11. 某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:( )A. GB. CvC. XD. SE. M12. t<t0.05(v),统计上可认为:( )A. B、两样本均数,差别⽆显著性B. 两总体均数,差别有显著性C. 两样本均数,差别有显著性D. 两总体均数,差别⽆显著性E. 以上均不是13. 下列关于统计表的要求,叙述错误的是:( )A. 不宜有竖线及斜线B. 标题位于表的上⽅中央C. 线条要求三线式或四线式D. 备注不必列⼊表内E. ⽆数字时可以不填14. 四个样本率作⽐较,x2>x20.01(3),可以认为:( )A. 各总体率不同或不全相同B. 各总体率均不相同C. 样本率与总体率均不相同D. 各样本率均不相同E. 各样本率不同或不全相同15. 计算标化率的⽬的是:( )A. 起加权平均的作⽤B. 使率能更好的代表实际⽔平C. 使⼤的率变⼩,D. 消除资料内部构成不同的影响,使率具有可⽐性E. 使⼩的率变⼤16. 四格表资料在哪种情况下作χ2检验不必校正( )。
简述 x2 检验的注意事项。
简述 x2 检验的注意事项。
x²检验是一种常用的假设检验方法,用于判断两个分类变量之
间是否存在相关性。
在进行x²检验时,有一些注意事项需要考虑。
首先,x²检验要求样本数据是随机抽取的,且样本之间是独立的。
这意味着样本应该是代表性的,并且每个样本只能被归类到一
个分类变量中,不能重复或属于多个分类。
其次,x²检验要求样本数据的观测值应当足够大,以满足检验
的要求。
通常要求每个单元格的预期频数不小于5,这是由于当预
期频数过小时,检验结果可能不准确,影响统计推断的可靠性。
另外,x²检验的结果受样本量的影响。
当样本量较大时,即使
存在微弱的相关性,也可能导致显著的检验结果。
因此,在解释检
验结果时,需要综合考虑实际背景和领域知识,避免过度解读。
此外,x²检验是一种无参数检验方法,不对数据的分布做出假设。
因此,在进行x²检验时,不需要对数据进行正态性检验或其
他分布假设的检验。
最后,x²检验只能判断变量之间是否存在相关性,不能确定其因果关系。
相关性只是表明两个变量之间存在某种关联,但不能确定其中哪个变量是因果变量,或者是否存在其他变量的干扰。
总之,在进行x²检验时,需要注意样本的随机性和独立性,确保样本量足够大且每个单元格的预期频数不小于5。
同时,对检验结果要进行谨慎解读,结合实际背景和领域知识进行分析。
《医学统计学》复习题
中国医科大学网络教育学院2002级预防专业《医学统计学》复习题第一部分一、最佳选择题:1. 偏态分布资料宜用_______来描述集中趋势。
A .x B.S C. M D. CV2.直线回归方程的适用范围,一般以_______取值范围为限。
A .自变量X B. 应变量Y C.估计值YD.s x 96.1±3.用均数和标准差可全面描述 _____资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.不对称分布4.欲研究某药治疗糖尿病的疗效,临床观察了200名糖尿病病人的血糖情况。
其研究总体是:A .这200名糖尿病患者B .这200名糖尿病患者的血糖 C.所有的糖尿病患者 D.所有糖尿病患者的血糖值5. 在抽样研究中样本是:A.总体中任意一部分 B.总体中的典型部分 C.总体中有意义的一部分 D.总体中有代表性的一部分 6.2χ分布、t 分布、正态分布各有______个参数。
A. 1,1,1B.2,2,2C. 1,1,2D. 2,2,17. 正态分布曲线下,横轴上,从均数μ到μ+1.96倍标准差的面积为___。
A .95%B .45% C.97.5% D.47.5%8.样本相关系数0=r 时说明_______。
A.两变量存在相互关系的可能性很小B.两变量间的关系不能确定C.两变量间必然存在某种曲线关系D.两变量间不存在直线关系,但不排除存在某种曲线关系9. 比较身高和体重两组数据变异度大小宜采用_____。
A.变异系数 B.方差 C.极差 D.标准差10.标准正态分布是指( )。
A. ),(σμNB. )0,0(NC. )1,1(ND. )1,0(N11.相关系数反映了事物间的_____。
A.依存关系 B.函数关系 C.相互关系 D.因果关系12.血清学滴度资料最常用来表示其平均水平的指标是_____。
A.算术平均数 B.中位数 C.几何均数 D.平均数13.下列统计图纵坐标必须以“0”为起点的是( )。
x2检验第六版
第二个表显示列联表的资料,一个期望频数小于5(4.8)
皮尔逊卡方值x2(pearson chi-square)
连续校正x2(continuity correction),仅在2×2表计 算
似然比值(likelylihood ratio) 费歇尔精确检验(fisher‘s exact test) 线形组合(linear-by-linear association) 有效例数(N of valid cases)
如果想对其中的两个率进行相互比较时, 最好能够采用更加复杂的分类数据模型, 如对数线性模型或者logistic回归模型进行 分析,采用列联表分割等方法只能得到近 似的结果,最好不要使用。
四、配对设计
(一)配对设计四格表(2×2列联表)
计数资料配对设计的应用: 可用于两种检验方法、培养方法、诊断
有效例数(N of valid cases)
结论:有0个格子的期望频数小于5,最小 期望频数为6.56,符合pearson x2检验的要 求。
皮尔逊卡方值x2=4.130,p=0.042<0.05, 差别有统计学意义。
四格表校正卡方检验
例题9-3
步 骤:
1、定义变量,输入数据 设三个变量: 处理(r):即行号 状况(c):即列号 频数(f)
Rows框:sex columns框:x0 cells: percentages:选择row、column、total →continue→ok
Cells 按钮
首先是处理记录缺失情况报告,可见24例 均为有效值。
第九章 χ2 检 验(卡方检验)
χ2检验(chi square test)是以χ2 分布为理论基础的检验 方法。主要用于分类资料(列联表资料,contingency table)的假设检验。也用于频数分布的拟合优度检验 (goodness of fit).
第7章 χ2检验
89.02
70.27 80.13
2、计算卡方值 a=73 b=9 c=52 d=22 n=156 2 ( ad bc ) n 2 =8.59 (a b)(a c)(b d )(c d )
(四)四格表资料卡方检验的校正
1、校正条件: n≥40,且 1<T<5(一个及以上格子) 2、基本公式
那么A药组82人中理论上讲有效人数为65.7人
(82*80.13%=65.7),即第一行第一列的理论频
数为82*80.13%=65.7
n n R C 用计算,即 也可以 T RC n
T11=125*82/156=65.7)。
表7-1 两药治疗脑血管栓塞有效率比较
药物 A B 合计 有效 73 (65.7) 52 (59.3) 125 无效 9 (16.3) 22 (14.7) 31 合计 82 74 156 有效率(%) 89.02 70.27 80.13
a c
b d
73 52
9 3
四格表资料的基本形式
处理组 A药 B药 合 计 发生数 未发生数 合计 a+b c+d n
a c a+c
b d b+d
请判断下列a、b、c谁属四格表:两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发 癌率有无差别?
表 处理 甲组 乙组 合计 不同致癌剂作用下大白鼠发癌率比较 例数 71 42 113 发癌数 52 39 91 未发癌数 19 3 22 发癌率% 73.24 92.86 80.33
T 怎么求 ?
n n R C T:理论频数(theoretical frequency) TRC n T 第R 行C 列的理论频数
第七章X2检验
第七章X2检验X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。
一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。
两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。
造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。
为了区别这两种情况,应当进行X2检验。
其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。
将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。
2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。
即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。
上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。
当H0被拒绝时,就意味着接受其对立假设即备择假设H1。
此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。
一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。
3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。
计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。
用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。
后者为81.25人。
然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。
计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。
x2检验或卡方检验和校正卡方检验的计算
x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。
第1行1列:43×53/87=26.2第1行2列:43×34/87=16.8第2行1列:44×53/87=26.8第2行2列:4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。
007 第七章 X2检验
表7-4 两种方法检验结果 甲法(病理) + + - 合计 130(a) 11(c) 141 乙 法(超声) - 75(b) 41 (d) 116 205 52 257 合计
这是配对设计计数资料,表中两法的差别是由b和 c 两格数据来反映。总体中 b 和 c 对应的数据可用 B 和C 表示。
配对X2检验计算公式:
合
计
H0 :胃十二指肠疾病患者与健康输血员血型总体构成比相同 H1 :胃十二指肠疾病患者与健康输血员血型总体构成比不同 α=0.05 按公式
有效率(%)
治疗组 对照组 合 计
200 190 390 160 148
160 148 308 160 148
80.00 77.89 78.97 40 42
200 190
二、X2检验基本思想 X2 值的计算方法(通用公式):
2 ( A T ) x2 T
式中A为实际数,T为理论数,是根据H0的假设 推算出来。
2 ( b c ) x2 , v 1 bc
若b+c<40:
2 (| b c | 1) x2 , v 1 bc
H0:两种方法总体检出率相等,即B=C; H1:两种方法总体检出率不相等,即B≠C; α=0.05
2 2 ( b c ) (75 11) x2 47.63 bc 75 11
疗法 阴转人数 未阴转人数 合计 阴转率(%)
───────────────────────────── 甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7 ───────────────────────────── 合计 71 62 133 53.4 ━━━━━━━━━━━━━━━━━━━━━
第八章 x2检验
实际频数A (actual frequency) ( a、b、c、d) 理论频数T ( theoretical frequency)
2检验的基本思想:
(A T) 基本公式: T
2 2
式中A代表每个格子的实际频数( actual
frequency ),即表中的基本数据;T代表每个格子的
(三)四格表专用公式
当总例数n≥40且所有格子的T ≥5时, 可用χ2检 验的基本公式,也可用下面的专用公式:
(ad bc) n (a b)(c d )(a c)(b d )
2 2
1
疗法 盐酸苯乙双胍 安慰剂 合 计
பைடு நூலகம்
死亡 26 (a) 2 (c) 28 (a+c.)
3.R×C列联表的分割
季节 感染人数 未感染人数 合计 感染率(%)
春 夏
秋 冬 合计 季节 春 感染人 数 12
12 12
29 35 88 未感染 人数 699
699 666
665 717 2747 合计 711
711 678
694 752 2835
1.69 1.77
4.18 4.65 3.10
二、独立样本R×C列联表资料的χ2检验
1. 多个独立样本率的比较(R×2表)
2.多个样本的构成比比较(R×C表)
3.两个样本的构成比比较(2×C表)
R×C表的χ2检验通用公式
基本公式
2
通用公式
2
(A T) A 2 n( 1) T nR nC
2
1.多个独立样本率的比较
( b c 1) 2 , 1 bc
2
(b+c<40)
χ2检验
第一节 计数资料的统计描述
计数资料中清点出的各组例数称为绝对数。绝 对数可以反映客观事物或现象的基本信息,但不便 于比较。
甲乙两地麻疹流行情况:甲地患儿100人,乙地患儿50人。
甲地麻疹流行严重 甲地易感儿童667人——15% 乙地易感儿童250人——20%
需要考虑两地易感儿童的人数
配对四格表的格式
A处理 + 合计 B处理 + 合计
2 ( b c ) 2 bc
a c a+c
b d b+d
a+b c+d n
2
( b c 1) 2 bc
三、行×列资料的χ2检验
行×列表:行数或列数至少有一个超过2的
统计表称为行×列表,也可以表示为R×C表。 行×列表χ2检验可用于: 多个样本率的比较 2个或多个样本构成比的比较 双向无序分类资料的关联性检验
一、相对数
相对数:两个有关联的数值之比就称为相对数,
用以说明事物的相对水平。
常用的相对数: 强度相对数(率)、结构相对数(构成比)、相对比
二、应用相对数时的注意事项
1。结构相对数不能代替强度相对数(以比代率) 2。计算相对数应有足够数量 3。正确计算合计率 4。应注意资料的可比性 (其一:内部构成是否相同) 5。对比不同时期资料应注意客观条件是否相同 6。样本率(或构成比)的抽样误差
A组
B组 合计
a(A11)) b(A12)
c(A21) d(A22) a+c b+d
a+b
c+d n
(ad bc)2 n (a b)(c d )(a c)(b d )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述 x2 检验的注意事项
引言
x2 检验(Chi-Square Test)是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在相关性。
它是统计学中最常用的非参数检验之一,通常适用于已知样本的多个标称变量之间的关系推断。
在进行 x2 检验时,有一些注意事项需要被考虑。
注意事项一:样本量要求
在进行 x2 检验时,每个分类变量的样本数量应该足够大,以确保结果的有效性。
通常,每个分类变量的样本数量应不少于5。
注意事项二:数据类型
x2 检验通常适用于标称变量,即具有无序分类的变量。
因此,在进行 x2 检验之前,需要将待分析的变量进行适当的编码或转换,以确保其符合 x2 检验的前提条件。
注意事项三:独立性假设
x2 检验的基本假设是各个分类变量之间的无关性,即独立性假设。
在进行 x2 检验前,需要对该假设进行明确的说明,并确认其是否合理。
注意事项四:数据整理
在进行 x2 检验之前,需要对数据进行适当的整理和汇总。
通常,可以使用交叉制表(cross-tabulation)的方法,将不同分类变量的数据整理为一个列联表(contingency table)。
这样可以方便计算各个分类变量之间的卡方值和 p 值。
注意事项五:计算结果的解读
x2 检验的计算结果包括卡方值和 p 值。
卡方值用于衡量观察值与期望值之间的差异程度,而 p 值表示了观察到的差异在统计学上的显著性。
通常,较大的卡方值和较小的 p 值意味着分类变量之间存在显著的相关性。
注意事项六:多重比较问题
在进行多个分类变量之间的 x2 检验时,需要注意多重比较问题。
如果进行了多个检验,需要对 p 值进行校正,以控制整体的错误率。
注意事项七:样本的代表性
在进行 x2 检验时,样本的代表性非常重要。
样本应该可以代表总体,并且应该从总体中随机选择,以减少选择偏倚和非随机误差的影响。
注意事项八:结论的谨慎性
x2 检验只能判断分类变量之间是否存在相关性,不能确定因果关系。
因此,在得出结论时应保持谨慎,并考虑其他变量和因素的可能影响。
结论
x2 检验是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在相关性。
在进行 x2 检验时,需要注意样本量的要求、数据类型、独立性假设、数据整理、计算结果解读、多重比较问题、样本的代表性以及结论的谨慎性。
只有在遵守这些注意事项的前提下,才能保证 x2 检验的有效性和可靠性。