χ2检验.

合集下载

医学统计学之卡方x2检验

医学统计学之卡方x2检验

举例
买彩票
奖项 中奖概率
T
A
一等 1% 10 0
0
二等 5% 50 0
0
三等 10% 100 20
2%
四等 20% 200 180
18%
五等 64% 640 800
80%
二、基本原理
基本思想是检验实际频数和理论频数的差别是否 由抽样误差所引起的,由样本率来推断总体率。
x2反映了实际频数于理论频数的吻合程度,x2值
α=0.05。
T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8
(2)求检验统计量值
2 (20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 8.40
作χ2检验后所得概率P接近检验水准α,需要
计数资料的统计推断
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
2 检验的应用
①检验两个样本率之间差别的显著性; ②检验多个样本率或构成比之间差别的
显著性; ③配对计数资料的比较; ④检验两个双向无序分类变量是否存在
关联。
某医生想观察一种新药对流感的预防效 果,进行了如下的研究,问此药是否有 效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220

第五章 χ2检验

第五章 χ2检验

χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。

医学统计学9 χ2检验

医学统计学9 χ2检验
1)有效者应为26(41/70)=15.2; 2) 无效者为26(29/70)=10.8; 同理,对照组的44例颅内压增高症患者中 1)有效者应为44(41/70)=25.8; 2)无效者为44(29/70)=18.2。
卡方检验的基本原理
反映实际频数与理论频数的吻合程度可用统计量
A
T T
2
来表示
案例分析
某医院采用甲乙两种方法测定60例结核杆菌阳性率, 如下图。试问这两种检测方法阳性率是否相同。
测定方法 阳性数 阴性数 合计
阳性率
甲法
42
18
60
70.0%
乙法
23
37
60
38.3%
合计
65
55
120
54.2%
错误的方法
根据2*2四格表卡方检验方法进行 可求得 2 =12.62, p<0.001;
2
(ad bc)2n
(a b)(a c)(bd )(c d )
c2
(
29 26 5 2 42
2 5 )( 26 9 )( 2 26 )( 5
9
)
5.49
x2,1 3.84
P 0.05
结论与之相反。
配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有差别有成组设 计和配对设计一样,计数资料推断两个总体率(构 成比)是否有差别也有成组设计和配对设计,即四 格表资料和配对四格表资料。
若检验假设H0:π1=π2成立,四个格子的实际频 数A与理论频数T 相差不应该很大,即统计量不
应该很大。如果上述统计量值很大,从而怀疑H0 的正确性,继而拒绝H0,接受其对立假设H1,即 π1≠π2 。
这个统计量就称为卡方统计量。

医学统计学定性资料的统计分析-χ2检验

医学统计学定性资料的统计分析-χ2检验

29 41
48.28 39.02

H0:1=2; H1:12; =0.05。 本例a格的理论频数最小,T11=1216/41=4.68<5, n>40,故考虑用校正公式计算2 值。
2 C
( 2 15 1014 41/ 2) 12 2916 25
2
41
2 2.36 0.05,1 3.84
(二)2检验的基本思想
例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出 血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例 发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 表中基本数据是a,b,c,d,其余数 据都是从这四个基本数据推算出 表4-6-1 131例胃癌患者治疗后5年存活率的比较 来的,这种资料称为四格表资料。 存活率(%) 存活数 死亡数 合计治疗数
(即多个率或构成比的比较)
上述两个样本率比较的资料,其基本数据只 有2行2列,称为2 ×2表或四格表资料。当基 本数据超过2行或2列的资料,就称为行×列 表或 R × C表资料。行×列表资料的2检验 主要用于多个样本率或多个构成比之间的比 较。
2 值的计算可按前述基本公式( 2 =∑(A-
2

计算统计量Z :
z
0.33 0.25
0.25 (1 0.25) / 300
3.20

. 确定P 值和判断结果:
Z0.01=2.326,得P<0.01,按=0.05水 准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于 20%,即老年患者较一般患者易出血.
(二)两样本率的比较
3.确定P 和判断结果:=(2-1)×(2-1)= 1;查2界 值表,20.05=3.84, 所以P>0.05,按=0.05水准不拒绝H0,差别无统计 学意义。故尚不能认为单纯手术疗法与联合疗法对胃 癌患者治疗效果有差别。

χ2检验

χ2检验

检验(chi-square test)检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。

可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19244344.2化疗加放疗组34104477.3合计53348760.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。

这里可通过检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。

T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:公式(20.13)式中TRC是表示第R行C列格子的理论数,n R为理论数同行的合计数,n C为与理论数同列的合计数,n为总例数。

第1行1列:43×53/87=26.2第1行2列:43×34/87=16.8第2行1列:44×53/87=26.8第2行2列:4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较组别有效无效合计化疗组19(26.2)24(16.8)43化疗加放疗组34(26.8)10(17.2)44合计533487因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算值按公式20.12代入4.查值表求P值在查表之前应知本题自由度。

第六章 χ2检验

第六章 χ2检验

二、计算检验统计量:
2 1 4 1 3
2
2 2 2 2 2 2 2 2 30 38 32 12 19 30 19 9 189 1 0 . 69 112 49 112 68 112 51 112 21 77 49 77 68 77 51 77 21
统计:按照α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。 专业:结合本例,可以认为三种方法治疗慢性支气管炎的效果不同或 不全相同。
2.两组或多组样本构成比的比较
例6-4:欲了解儿童白血病患者的血型分布是否与成 年患者有所不同,资料见表6-4。试分析儿童白血病 患者与成年患者的血型分布构成比有无差别?
第六章 χ2检验
《医学统计学》余松林主编
本章内容
第三节 独立性检验 第四节 趋势检验 第五节 多个四格表的联合分析 第六节 四格表的费歇尔精确概率检验
第三节 独立性检验
本节介绍应用χ2检验推断两个或两个以 上总体率(或构成比)之间有无差别及 两分类变量间有无相关关系。
一、四格表资料的χ2检验 (两个样本率的比较)
表6-4 儿童急性白血病患者与成人急性白血病患者的血型分布
分组
儿童 成人 合计
A型 30
19 49
B型 38
30 68
O型 32
19 51
AB型 12
9 21
合计 112
77 189
解:
一、建立假设,确定检验水准:
H0:儿童白血病患者与成人患者的血型分布构成比相同 H1:儿童白血病患者与成人患者的血型分布构成比不相同 检验水准α=0.05。
二、计算检验统计量:

应用统计学(第六章 次数资料的χ2检验)

应用统计学(第六章 次数资料的χ2检验)

次有极为密切的关系。
若需进一步比较r×c列联表内组间的差异,可将r×c列联表做 成多个2×c列联表进行检验。
例4:碘治疗甲状腺肿效果与年龄关系3×4列联表
年龄(岁) 治愈
显效
好转 无效 合计
11~30 67(45.29) 9(17.87) 10(22.02) 5(5.82) 91
31~50 32(39.32) 23(15.51) 20(19.12) 4(5.05) 79
49.00
59.04
df=2, χ20.05 =5.992;χ2> χ20.05 ,P<0.05
推断:否定H0 ,接受HA。三种农药对烟蚜的毒杀效果 存在显著差异。
例3:肺门密度与矽肺期次的3×3列联表
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
+ 43(249) 1(17.2) 6( 7.9)
50
肺门密度 ++
188(149.9) 96(103.4) 17( 47.7)
例5:为研究53BP2对肿瘤发生易感性的影响,建立了该基因的 基因敲除小鼠,其等位基因杂合型(-/+)和野生型(+/+)小鼠 在接受γ射线照射之后的肿瘤发生情况记录如下表。问该基 因是否影响小鼠对肿瘤的易感性?
肿瘤
无瘤
合计
野生型
3
16
19
杂合型
9
10
19
合计
12
26
38
解:组合概率计算
i
a
b
c
d
ij
T
(i=1,2,…
j=1,2,…)
3.理论数和χ2值的计算
理论数
r
c
Eij Oij Oij

【统计分析】x2检验

【统计分析】x2检验

表 10-6
三种药物治疗老年 2 型糖尿病的疗效
有效
无效
合计
35
21
56
17
13
30
29
1
30
81
35
116
有效率(%) 62.5 56.7 96.7 69.8
单向有序R×C表
有两种形式
一种是R×C表中的分组变量(如年龄组)是有序的, 而指标变量(如传染病的类型)是无序的。其研究目 的通常是分析不同年龄组各种传染病的构成情况,此 种单向有序R×C表可用行×列表资料 χ2 检验进行分 析。
α=0.05
2. 计算检验统计
2 b c 12 2 11 12 4.92
bc
2 11
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验
公式与普通四格表检验公式相同
1. 建立假设 H0:两法的结果无相关 H1:两法的结果相关
α=0.05 2. 计算检验统计
2
a
ad bc2 n ca bc d b
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
双向无序R×C表
若研究目的为多个样本率(构成比)的比较, 可用行×列表资料 χ2 检验; 若研究目的为分析两个分类变量直接有无关联 性,可用行×列表资料 χ2 检验及列联系数进 行分析。
组别 降糖 1 号 玉泉丸 格列本脲 合计
x2检验基本思想
组别
+

合计
A
a
B
c
合计
m1

χ2检验的公式

χ2检验的公式

χ2检验的公式χ2检验是一种常用的统计方法,用于检验两个分类变量之间是否存在相关性。

它的全称是卡方检验,是由卡方分布衍生而来的统计检验方法。

χ2检验的公式如下:χ2 = Σ ( (Oij - Eij)^2 / Eij )其中,χ2表示卡方值,Oij表示观察到的频数,Eij表示期望的频数。

在χ2检验中,我们需要先确定一个原假设和备择假设,然后根据实际观察到的频数和期望频数,计算出卡方值。

最后,根据卡方值和自由度的关系,确定拒绝域,从而判断原假设的可信程度。

χ2检验可以用于比较两个分类变量的分布情况,例如比较两组样本在不同类别上的分布是否存在差异。

这种差异可能源于不同类别之间的关联性,也可能是由于其他因素导致的。

χ2检验的目的就是通过计算卡方值,判断这种差异是否显著。

在进行χ2检验时,需要注意以下几点:1. 样本容量要足够大。

当样本容量较小时,χ2检验的结果可能不准确。

2. 数据应该是独立的。

χ2检验要求样本观测值之间是相互独立的,否则会导致结果的偏差。

3. 期望频数要大于5。

当期望频数小于5时,χ2检验的结果可能不可靠。

4. 自由度的确定。

在计算卡方值时,需要根据分类变量的类别数和样本容量来确定自由度的取值。

χ2检验的步骤如下:1. 建立假设。

根据研究问题,确定原假设和备择假设。

2. 收集数据。

根据研究问题,收集相应的数据样本。

3. 计算期望频数。

根据总体分布的假设,计算出每个类别的期望频数。

4. 计算卡方值。

根据观察频数和期望频数,使用χ2检验公式计算出卡方值。

5. 确定拒绝域。

根据显著性水平和自由度的关系,确定拒绝域的边界。

6. 做出判断。

比较计算得到的卡方值和拒绝域的边界,判断原假设的接受或拒绝。

χ2检验的应用非常广泛,特别是在医学、社会科学和市场研究等领域。

例如,医学研究可以使用χ2检验来比较不同治疗组的治愈率是否存在差异;社会科学研究可以使用χ2检验来分析不同人群之间的社会行为是否存在关联;市场研究可以使用χ2检验来分析不同产品的偏好是否存在差异。

第7章 χ2检验

第7章  χ2检验
74 156
89.02
70.27 80.13
2、计算卡方值 a=73 b=9 c=52 d=22 n=156 2 ( ad bc ) n 2 =8.59 (a b)(a c)(b d )(c d )
(四)四格表资料卡方检验的校正
1、校正条件: n≥40,且 1<T<5(一个及以上格子) 2、基本公式
那么A药组82人中理论上讲有效人数为65.7人
(82*80.13%=65.7),即第一行第一列的理论频
数为82*80.13%=65.7
n n R C 用计算,即 也可以 T RC n
T11=125*82/156=65.7)。
表7-1 两药治疗脑血管栓塞有效率比较
药物 A B 合计 有效 73 (65.7) 52 (59.3) 125 无效 9 (16.3) 22 (14.7) 31 合计 82 74 156 有效率(%) 89.02 70.27 80.13
a c
b d
73 52
9 3

四格表资料的基本形式
处理组 A药 B药 合 计 发生数 未发生数 合计 a+b c+d n
a c a+c
b d b+d
请判断下列a、b、c谁属四格表:两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发 癌率有无差别?
表 处理 甲组 乙组 合计 不同致癌剂作用下大白鼠发癌率比较 例数 71 42 113 发癌数 52 39 91 未发癌数 19 3 22 发癌率% 73.24 92.86 80.33
T 怎么求 ?
n n R C T:理论频数(theoretical frequency) TRC n T 第R 行C 列的理论频数

χ2检验

χ2检验
2
2

( / 2 1 )
e
2 / 2
Ý ß ×·
×Ó ¶ £ 1 Ô É È ½
0.2 0.1 0.0 0 3 6 9 12 ¿ ·Ö ¨½ µ
×Ó ¶ £ 2 Ô É È ½ ×Ó ¶ £ 3 Ô É È ½ ×Ó ¶ £ 6 Ô É È ½
15
18 χ2值
χ
2
分 布 特 点
χ
2
检 验 自 由 度
取决于可以自由取值的格子数目。 在表内R行和C列中均有一行(或一列) 数据受到行或列合计的限制而不能自由变动, 因而自由度为:
υ=(R-1)×(C-1)

CHI-SQUARE DISTRIBUTION
The chi-square distribution is defined by the following theorem:
χ检验
Chi-square test
2
华中科技大学同济公共卫生学院
李 忠 良

例1 抢救200例心肌梗塞病人时, 使用与 不使用抗凝剂效果如表7-2, 问两组病 死率的差别有无统计学意义。
思 考 题
表1 抢救心肌梗塞病人使用抗凝剂效果比较 ─────────────────────── 组别 例数 病死数 生存数 病死率(%) ─────────────────────── 未用抗凝剂组 125 51 74 40.8 用抗凝剂组 75 19 56 25.3 ─────────────────────── 合 计 200 70 130 35.0 ───────────────────────
为不小于零的连续型分布, 左右不对称, 向左倾斜; 形状与自由度有关; 具有可加性;

第10章x2检验

第10章x2检验
变量)
第4步:x2检验(1)
选择分析→交叉表 交叉表对话框:结石部位和结石类型分别进入行和列
第4步:x2检验(2)
选择统计量 按钮
在交叉表: 统计量对 话框:勾 上卡方和 相关系数
第4步:x2检验(3)
选择单元格 按钮
在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
第5步:结果解读(1)
第4步:x2检验(3)
选择单元格 按钮
在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
第5步:结果解读(1)
结果解读:新药组的有效率为88.9%,传统药物组的 有效率为86.7%,安慰剂组的有效率为70.9%。
第5步:结果解读(2) 结果解读:x2=13.238,p=0.001
x2检验
卡方检验(chi-square test)
χ2检验是现代统计学的创始人之一,英国人 Karl . Pearson于1900年提出的一种具有广 泛用途的统计方法。
可用于两个或多个率间的比较,计数资料的 关联度分析,拟合优度检验等等。
0.3
0.2
0.1
0.0 0
X2分布
2
4
6
8
10
卡方分布图形特征*
选择单元格 按钮
在交叉表: 单元显示 对话框: 勾上观察 值、期望 值、百分 比:行
第5步:结果解读(1)
结果解读:预防注射组的感染阳性率为4/22, 非预防组的感染阳性率为5/11。
第5步:结果解读(2)
结果解读:四格表中有期望值小于5,总例数 小于40。
第5步:结果解读(3)
结果解读:选Fisher的精确检验p(exact)=0.121
卡方分布的形状依赖于自由度ν 的大小: 当自由度ν≤2时,曲线呈“L”型; 随着ν 的增加,曲线逐渐趋于对称; 当自由度ν →∞时,曲线逼近于正态曲线

非参数检验I:χ2检验.

非参数检验I:χ2检验.

Pearson统计量的自由度可能发生变化 一般来说,如果给定的分布函数F(x)中不含有未知参数, 则Pearson统计量的自由度就是r – 1; 但如果 F(x) 中含有一个或几个未知参数,需要用从样本中 计算出的估计量代替,则使用了几个估计量自由度一般就应 在r – 1的基础上再减去几。 如,观测值共分了9组,自由度本应为9 – 1 = 8,但由于理论 分布的μ和σ2未知,使用估计量代替,因此自由度应为8 – 2 = 6。
非参数检验I:χ2检验 参数检验,也就是说检验目标是判断总体参数是否 等于某一指定值,或两个总体的某一参数是否相等。
非参数检验,检验的目标一般与参数无关,而是总 体分布的某种性质是否存在,例如是否服从某种指定 的分布,两个事件是否独立等等。
χ2检验在非参数检验中应用相当广泛。
χ2分布
在一个总体中进行随机抽样, n 为样本含量,具有 r 种不同属 性出现(或可分为r组),Oi为样本中第i种属性出现的次数的观察 值,T为 i样本中第 i种属性出现次数的理论值,则 Pearson统计量定 义为: 2 r
连续性矫
若自由度为1,则应作连续性矫正,即把统计量改为:
r
ቤተ መጻሕፍቲ ባይዱ
2 i 1
( Oi Ti 0.5) Ti
2
假设测验步骤 (1)建立假设: H0:Oi = T i;HA:Oi ≠ T I,但检验是上 单尾检验。 (2)确定显著水平 (3) 由H0:Oi = T I出发,计算样本资料的χ2值 (4)根据df 和显著水平,查χ2临界值。 (5)结果判断 χ2大于χ2临界值,否定H0; χ2小于χ2临界值 ,接受H0;
pi P( xi 1 xi x xi 1 x x xi ) ( ) ( ) S S

第九章-χ2检验

第九章-χ2检验
【四分位数】复选框:输出四分位数。
b.【缺失值】栏:选择缺失值处理的方式,包含【按检验排除个案】和【按列表排 除个案】两个选项,前文已做过相关介绍,这里不再赘述。
(4)完成设置之后,单击【卡方检验】对话框中的【确定】按钮,运行χ2检验。
13
——
第 一 节
检 验 卡单 方个 检变 验量 人 数 分 布 的 差 异
(1)在SPSS菜单栏中选择【分析】>【描述统计】>【交叉表】菜单命令,如 图9-7所示。
图9-7 交叉表的操作命令
——
第 二 节
检 验 交多 叉个 表变 量 联 合 人 数 分 布 的 差 异
二、操作方法
(2)此时弹出【交叉表】对话框,如图9-8 所示。从左侧列表框中选择一个类别变量,单 击对应的 按钮,将其移入【行】列表框; 类似地,从左侧列表框中选择另一个类别变量, 单击对应的 按钮,将其移入【列】列表框。 此外,如果研究者想加入第3个类别变量,则 可以将第3个变量移入【层】列表框。研究者 如果单击【下一张】按钮则进入下一层,可添 加第4,5个类别变量,以此类推;如果单击 【上一张】按钮,则返回上一层。
第五章也提过,当数据是连续数据,且来自于某种已知的分布时,可以采用参数检 验。非参数检验则是与参数检验相对的另一种假设检验方法,适用于间断数据(如序 号数据和名义数据),且不限定总体分布,其使用范围更广。一般而言,非参数检验 可以适用于参数,也可以适用于非参数,但参数检验不适用于非参数。
4
——
第 一 节
1表示自变量完全预测因变量,越接近于0表示自变量的预测作用越小。 【不定性系数】复选框:输出反映自变量预测其他变量时的误差缩减比例。同样,取
值在0~1之间,越接近于0表示自变量对其他变量的预测作用越小。

心理统计学二第十章χ2检验

心理统计学二第十章χ2检验
一、单因素分类数据的同质性检验 二、列联表形式的同质性检验 三、计数数据的合并方法
48
一、单因素分类数据的同质性检验
检验步骤: 1. 计算各个样本组的χ 2值和自由度; 2. 累加各样本组χ 2值,计算其总和以及自由度的总和; 3. 将各样本组原始数据按相应类别合并,产生一个总的数 据表,并计算这个总数据表的χ2值和自由度; 4. 计算各样本组的累计χ 2值与总测试次数合并获得的χ 2值 之差——异质性χ 2值; 5. 查χ 2临界值表,判断χ 2值差是否显著。
14
4、使用校正公式
❖在二乘二的列联表检验中, 若单元格的期望次数低于10但 高于5,可使用耶茨校正公式 来校正。若低于5,或样本总 人数低于20,则应使用费舍精 确概率检验法。
15
六、应用χ 2检验应注意取样设计
应用χ 2检验时,要十分注意取样的代表性。
16
第二节 配合度检验
一、配合度检验的一般问题 二、配合度检验的应用 三、连续变量分布的吻合性检验
4549505455596064656970747579808485899094959910182240467244281812例例101055一独立性检验的一般问题与步骤一独立性检验的一般问题与步骤二四格表四格表独立性检验独立性检验rcc表独立性检验表独立性检验四多重列联表分析四多重列联表分析一统计假设一统计假设二理论次数的计算二理论次数的计算三自由度的确定三自由度的确定四统计方法的选择四统计方法的选择五结果及解释五结果及解释一独立样本四格表的独立样本四格表的22检验检验二相关样本四格表的相关样本四格表的22检验检验三四格表四格表22值的近似校正值的近似校正四格表的fisherfisher精确概率检验方法精确概率检验方法22独立样本四格表的独立样本四格表的22检验就是双向表检验就是双向表22检验

χ2 检验.

χ2  检验.

1092 416
3072 416
合计 109 307 416
2 2 O T R 1 j 1 2 R1 R2 C j T 372 492 232 4162 109 307 187 149 80 7.692 2 2 2 O T R 2 j 2 2 R1 R2 C j T 1502 1002 572 4162 109 307 187 149 80 7.692 2
(1) H0 :豌豆F2分离符合9:3:3:1的自由组合规 律
HA :豌豆F2分离不符合9:3:3:1的自由组合 规律; (2)取显著水平α =0.05
(3)计算统计数χ2值:
χ2 =0.016+0.101+0.135+0.218=0.470
(4)查值表,进行推断: χ2< χ20.05
P>0.05
孟德尔分离规律
自由组合定律
例:有一鲤鱼遗传试验,以红色和青灰色杂交,其F2 代获得不同分离尾数,问观测值是否符合孟德尔 3:1遗传定律.
体色
青灰色 1503
红色 99
总数 1602
F2观测尾数
• (1)H0:鲤鱼体色分离符合3:1, HA:不符. • (2)确定显著水平α =0.05 • (3)计算χ 2:由于理论资料k=2,df=2-1=1,
307 80 E23 59.04 416
理论值的计算: 甲 乙 丙 死亡数 37(49.00) 49(39.04) 23(20.96) 未死亡数 150(138.00) 100(109.96) 57(59.04) 合计 187 149 80 合计 109 307 416

χ2检 验

χ2检 验

心理统计学ຫໍສະໝຸດ 立性或同质性χ2检验使用条件
检验对象
独立性χ2检验:推断两个离散型变量是否存在依从 关系
同质性χ2检验:推断几次重复试验的结果是否相同
待检变量:任意类型变量,但较适合于离散型 待检总体:任意类型总体
抽样分布 SPSS数据文件的结构:多个因变量 SPSS菜单操作 SPSS输出结果的解读
心理统计学
χ2检验
χ2检验的基本概念 χ2分布的特点 拟合优度χ2检验 独立性或同质性χ2检验
χ2检验
χ2检验的类型:
拟合优度χ2检验:推断某个变量是否服从某种特定分布 独立性χ2检验:推断两个离散型变量是否存在依从关系
同质性χ2检验:推断几次重复试验的结果是否相同
拟合优度χ2检验的统计量:
2 fo ft 2 ~ 2df r 1c 1
ft
经SPSS for Windows算得: χ2 = 10.480, P=0.033 (3)统计决断:
∵ χ2 = 10.480, P=0.033<0.05 ,∴在0.05 的 报显考著师性范水专平业上的拒态绝度与H0其,家接庭受经H1济,状认况为有高关三。学生对
独立性或同质性χ2检验
例8.3 从某中学随机抽取150名高三毕业学生,经调查, 其家庭经济状况和是否愿意报考师范专业的态度 如表所示,问高三学生对报考师范专业的态度与 其家庭经济状况是否有关?
解:检验步骤: (1)提出假设: (2)HH01计::算报报检考考验师师统范范计专专量业业的的的值态态及度度其与与概家家率庭庭:经经济济状状况况无有关关
解:检验步骤: ( (12))提计出算假检设验统:计HH01量::的幼幼值儿儿及的的其颜颜概色色率选选:择择无有倾倾向向性性

3、χ2检验

3、χ2检验

结果说明:
本例df=1,需用连续性校正公式, 故采用Continuity Correction(连续性校 正的卡方值)的统计结果。 χ2=7.944, P=0.005 结果表明灭螨剂A组的杀螨率极显 著高于灭螨剂B组

张文彤
C h i -S q u a r e Te s t s Value 6.133b 5.118 6.304 df Asymp. Sig. (2-sided) .013 .024 .012 Exact Sig. (2-sided) .018 Exact Sig. (1-sided) .011
间断变量。
本班男、女生人数: 药物治疗效果:
χ2检验与测量数据假设检验的区别(2)
测量数据所来自的总体要求呈正 态分布; χ2检验的数据所来自的总体分布 是未知的。
χ2检验与测量数据假设检验的区别(3) 测量数据的假设检验是对总体参数或 几个总体参数之差所进行的假设检验; χ2 检验在多数情况下不是对总体参
独立性检验
同质性检验
适合性检验(吻合度检验) 是指对样本的理论数先通过一 定的理论分布推算出来,然后用实际 观测值与理论数相比较,从而得出实 际观测值与理论数之间是否吻合。因 此又叫吻合度检验。
独立性检验
是指研究两个或两个以上的计数 资料或属性资料之间是相互独立的或 者是相互联系的假设检验。
通过假设所观测的各属性之间没
与理论值完全符合。 原理
理论值观测值χ2来自Ⅰ高Ⅱ


χ2检验统计量的基本形式
χ2= ∑ (Oi-Ei)2 Ei
O:实际观察的频数(observational frequency) E:无效假设下的期望频数(expectation frequency)

χ2检验

χ2检验
计数资料的统计描述和假设检验
第一节 计数资料的统计描述
计数资料中清点出的各组例数称为绝对数。绝 对数可以反映客观事物或现象的基本信息,但不便 于比较。
甲乙两地麻疹流行情况:甲地患儿100人,乙地患儿50人。
甲地麻疹流行严重 甲地易感儿童667人——15% 乙地易感儿童250人——20%
需要考虑两地易感儿童的人数
配对四格表的格式
A处理 + 合计 B处理 + 合计
2 ( b c ) 2 bc
a c a+c
b d b+d
a+b c+d n

2
( b c 1) 2 bc
三、行×列资料的χ2检验
行×列表:行数或列数至少有一个超过2的
统计表称为行×列表,也可以表示为R×C表。 行×列表χ2检验可用于: 多个样本率的比较 2个或多个样本构成比的比较 双向无序分类资料的关联性检验
一、相对数
相对数:两个有关联的数值之比就称为相对数,
用以说明事物的相对水平。
常用的相对数: 强度相对数(率)、结构相对数(构成比)、相对比
二、应用相对数时的注意事项
1。结构相对数不能代替强度相对数(以比代率) 2。计算相对数应有足够数量 3。正确计算合计率 4。应注意资料的可比性 (其一:内部构成是否相同) 5。对比不同时期资料应注意客观条件是否相同 6。样本率(或构成比)的抽样误差
A组
B组 合计
a(A11)) b(A12)
c(A21) d(A22) a+c b+d
a+b
c+d n
(ad bc)2 n (a b)(c d )(a c)(b d )
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

甲组 乙组 合计
a c a+c
四格表的专用公式及校正公式

χ2=
(ad - bc) n (a b)(c d)(a c)(b d)
2

χ2=
( ad bc n/2) n (a b)(c d)(a c)(b d)
2
配对计数资料的卡方检验
2 ( b c ) 2 , 1 , (b c) 40 bc 2 ( b c 1 ) c2 , 1 , (b c) 40 bc
实习 计数资料的统计推断


明确率的抽样误差的意义 学会率的标准误的计算方法,并能正确 用于计数资料的分析 2 学会率的u检验、 检验的计算方法,并 正确动用假设检验对计数资料进行分析 评价。
四格表资料的χ2检验

主要用于两个样本率(或构成比)的假 设检验。

表11-1 四格表数据格式
阳性 阴性 b d b+d 合计 a+b=n1 c+d=n2 a+b+c+d= n 率pi a/n1 c/n2 (a+c)/n
27 18
45
22 12
34
行×列(R×C)表资料的χ2检验

χ2= n(

A2 1 n n ) R C
n为总例数 , A为每个格子的实际频数 , nR和 nC分别为与A同行和同列的合计数。
υ =(R-1)(C-1)

22.为比较槟榔煎剂和阿的平驱绦虫的 效果,对45名绦虫患者进行治疗,其结 果如下,问两药疗效是否相同?
槟榔煎剂和阿的平驱绦虫治疗的结果
药物
槟榔煎剂 阿 的 平 合 计
治疗人数
27 18 45
有效人数
22 12 34
槟榔煎剂和阿的平驱绦虫治疗的结果
药物 有效人数 无效人数 合 计
槟榔煎剂 22 阿 的 平
5
27
12 34
6(4.4) 11
18 45


x 0.607
2Leabharlann p217-23:为了研究两种方法细菌培养效果是否相同,分别 用两种方法对110份乳品作细菌培养,结果如下,请作统计
分析

两种方法对110份乳品细菌培养的结果
常规培养
乳胶凝集
+ + 27 8 1 74
合计
28 82
合计
35
75
110
x 4
2
P217-24 在某小学采用随机抽样的方法对二、四、 六这三个年级的部分学生进行了视力检查,资料
如下表。问3个年级学生的近视率有无差别?

某小学三个年级的部分学生视力检查结果
年级 近视人数 非近视人 数 合计 近视率(%)
二年级 四年级 六年级
会 计
13 21 38
72
107 119 107
333
120 140 145
405
10.83 15.00 26.21
17.78
x 11.75
2
p217-25某年某地爆发松毛虫病,对调查的333例 患者,以14岁为界分为儿童组和成人组,资料如 下表。问儿童和成人各型松毛虫病的构成比是否 相同?

某地儿童和成人松毛虫病患者的型别构成比
皮炎型 50 105
155 骨关节 炎型 软组织 炎型
年龄分 组
混合型 72 23
95
合计 188 145
333
儿童组 成人组
合计
48 10
58
18 7
25
x 70.14
2
槟榔煎剂和阿的平驱绦虫治疗的结果
药物 治疗人数 有效人数
槟榔煎剂 阿 的 平
合 计
相关文档
最新文档