第八章卡方检验

合集下载

RC表卡方检验

RC表卡方检验
2020年7月12日
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):疗效 击Statistics按钮选择Chi-square。
2020年7月12日
输出结果
结果分析:Pearson 2 =32.736,双侧P=0.000<0.05,
2020年7月12日
R×C表2 检验应注意的问题
❖2.多组比较时,若效应有强弱的等级,如+,++
,+++,最好采用后面的非参数检验方法。 2检
验只能反映其构成比有无差异,不能比较效应的 平均水平。 ❖3.行列两种属性皆有序时,可考虑趋势检验或 等级相关分析。
❖4.多个率比较的2检验,结论为拒绝H0时、需
d f(31 )(41 )6
2 =9.60< 2 0.1,6=10.64,P>0.1,
按α=0.05水准,不拒绝H0,即不能认为三组病 人中医各型的构成比不同.
2020年7月12日
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li8-4.sav。 行变量:“疗法”,Values为:1=“生胃宁素
C k2 k(k21)
20.050.0167
3(31)
2020年7月12日
(3)新复方与降压药比较:列出表C,2=4.419
,P=0.036,按α’= 0.0167水准,不拒绝H0,不 能认为新复方与降压药治疗高血压病的效果不 同。
表C 新复方与降压药比较
药物 新复方 降压药 合计
有效 35 20 55
2020年7月12日
输出结果

卫生统计学:第八章 χ2检验

卫生统计学:第八章   χ2检验

-
6(c)
54(d)
60
合计
30
90
120
配对四格表资料的χ2检验
配对设计
对子号


1
+
+
2
+
-



120
-
-
成组设计
编号 剂量组 结果
1

+
2

+



120

-
甲、乙两种真菌培养基的培养结果


合计
(+)
(-)
(+) 24(a) 36(b) 60
(-) 6(c) 54(d) 60
合计 30
90
6
4
2
9
2.19*
0.0568*
8
7 1
3 10
3.19
0.0065
8
2
9
0
11
4.19
0.0002
* 为实际数据的四格表
d )!
!:阶乘
例8.4
表8.12 某中药制剂预防HIV垂直传播临床试验
组别
新生儿HIV阴性 新生儿HIV阳性 合计
中药制剂
6(a)
4(b)
10
对照组
2(c)
9(d)
11
合计
8
13
22
N=22<40,采用Fisher确切概率计算法 周边合计最小是8,共计可获得8+1=9种组合的四格表
Fisher’s exact probability
=2, x2 =5.99

第八章 卡方检验

第八章 卡方检验

最小期望值(理论值)为4.09,2cells(25%)格子的 理论值小于5。 由此可见,pearson chi-squre的结论是不可信的。
我们继续根据医学合并合理性作合理的合并, 把输血二次、三次及四次的合并,统称为输 血二次以上。
旧编码 0 1 2 3
新编码 0 1 2 2
VAR00001 * VAR00002 Crosstabulation
行变量
列变量
是在输出结果中显示聚类条图 是隐藏表格,如果选择此项,将不输出R×C 交叉表
从左侧的源变量窗口中选择两个名义变量或 顺序变量分别进入Row(s)(行)窗口和 Column(s)(列)窗口。进入Row(s)窗口的 变量的取值将作为行的标志输出,而进入 Column(s)窗口的变量的取值将作为列的标志 输出。
上述选择做完以后,单击Continue 按钮,返 回到Crosstabs 对话框。
单击Format(格式)按钮
打开Format 对话框,如图 所示。在该对话框 中可以选择在输出的交叉表中行的排列是升 序还是降序。系统默认是升序。
选择做完以后,单击Continue 按钮,返回到 Crosstabs 对话框。
行列分割的种类
多组间的两两比较; 多个实验组与同一对照组比较。
(1)多组间的两两比较
对进行行列卡方检验有统计学意义的资料, 进一步作两两比较时,不能再用原来的检验 水准作为是否拒绝H0的标准。因为重复多次 的假设检验,将使第一类错误扩大。必须重 新规定检验水准,作为拒绝H0的根据。
在多组间的两两比较时,其检验水准按下式估计: ɑ‘=ɑ / N,其中
ROW * COLUMN Crosstabulation
ROW 亚 洲 Count

第八章 卡方分析教学版

第八章 卡方分析教学版
9
2=
i 1
fi -ei
ei
2
3.905, 在计算理论次数的过程中共用到平均数,
标准差和总数三个统计量,故本题的自由度为df 9-3=6,
2 查卡方分布表, 0.05 (6) 12.6, 2 2 0.05 , p 0.05, 故差异不显著,即552名中学生的身高分布
2 (三) 2×2 列联表 检验
因素X 因 素 Y
分类1
分类1 a
分类2
b a+b
分类2
c
a+c
d
b+d
c+d
n
nad bc ~ 2 1 a bc d a cb d
2 2
三、独立性检验
2 (三) 2×2 列联表 检验
观察频数a对应的理论频数为:
二、总体分布的拟合检验
(二)统计假设及相关计算
• H0: f0 = fe H1:
f0 ≠ fe
运用基本公式计算出卡方值 查表,比较其与临界卡方值的大小,如果„„ 注意:卡方值分布全部为正值,但f 0 -f e 可能是负值,因此, 卡方检验是双侧检验,0.05和0.01是指双侧概率而言。 拟合度检验需要先计算理论次数,这是计算卡方值的关键性 步骤。(一般根据某种理论或经验)
符合正态分布。
三、独立性检验
(一)适用材料
主要用于两个或两个以上因素多项分类的计 数资料分析。如果要研究的两个自变量之间是否 具有独立性或有无关联或有无“交互作用”的存 在,就要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意 味着对其中一个自变量来说,另一个自变量的多 项分类次数上的变化是在取样误差的范围之内。 假如两个因素是非独立,则称两变量有交互作用。

第八章卡方检验ppt课件

第八章卡方检验ppt课件

2 (A T )2
T
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
当n ≥40 ,且某格子出现1≤ T<5时,用校正公式:
2 ( A T 0.5)2 T
( ad bc n)2 n
2
2
(a b)(c d )(a c)(b d )
如果样本例数不是很大,计算时应先估计表中最小的T值。
17
设有k个相互独立的标准正态分布随机变量Z1、Z2…..Zν ,则Z12+Z22+…+Zν2的分 布服从自由度为ν的x2分布,记为x2(v)。 ν是指上式中包含的独立变量的个数。
当ν趋于∞时, x2分布逼近正态分布。各种自由度的x2分布右侧尾部面积为α时 的临界值记为x2(α,v)
=1 =2
=3 =4
组对象其它方面“同质”的前提下才能比较两个频率,才能进行2×2列联表 的x2检验。
26
小结
1、2检验的基本思想
2、四格表资料2检验,通常规定: (1) n ≥ 40,且T ≥ 5时,用2 检验基本公式和专用公式 (2) n ≥ 40,但有1≤ T<5时,用四格表2检验校正公式 (3) n< 40,或T<1时,改用fisher确切概率法 (4)连续性校正仅用于ν=1的四格表资料。
表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布
分组 A 型 B 型 O 型 AB 型
合计
儿童 30 38 32 12
112
成人
19 30 19
9
77
合计 49 68 51 21
2 0.005,2
10.60
32.74 2
2
• 认为因三而种P<药0物.0的05治,在疗α效=0果.05不水全准相上同拒。绝H0.00,05接,2受H1,差别有统计学意义。可以

8_八、卡方检验 PPT课件

8_八、卡方检验 PPT课件

相关问题-两个率或构成比的比较
分别指定行列 变量到Row(s) 和Columns中。
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
相关问题-两个率或构成比的比较
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
相关问题-两个率或构成比的比较
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
两分类变量间关联程度的度量
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
两分类变量间关联程度的度量
分别指定 行列变量到 Row(s)和 Columns中。
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
卡方检验基础-用途
检验某个连续变量的分布是否与某种理论分布一致,如是否符合正 态分布,Possion分布等
检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量 是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
卡方检验基础
2检验是以2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为:
H0:观察频数与期望频数没有差别
浙浙江江大大学学医医学学院院流流行行病病与与卫卫生生统统计计学学教教研研室室 沈沈毅毅
Odds Rati o for Newspaper subscri pti on (Yes / No) For cohort Response = Yes For cohort Response = No N of Val id Cases

《卡方检验》课件

《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。

9第八章 卡方检验

9第八章 卡方检验
Chi第八章 χ2检验 (Chi-square test)
也称卡方检验。 检验也称卡方检验 χ2 检验 也称卡方检验 。 是英国统计 学家Pearson于 1900年提出的一种应 于 学家 年提出的一种应 用范围很广的假设检验方法, 用范围很广的假设检验方法,可用于 检验两个率间的差异; 检验两个率间的差异 ; 检验多个率 (或构成比 间的差异;判断两种属性 或构成比)间的差异 或构成比 间的差异; 或现象间是否存在关联性; 或现象间是否存在关联性;了解实际 分布与某种理论分布是否吻合; 分布与某种理论分布是否吻合;判断 两个数列间是否存在差异等。 两个数列间是否存在差异等。
计算公式
(a + b)!(c + d )!(a + c)!(b + d )! P= a!b!c!d!n!
式中a、b、c、d 和n的意义同前 , !为阶乘符号。0!= 1, 为阶乘符号。 1!= 1 ,3!= 3×2×1 = 6。
(三)求P值的步骤
• 1 . 列四格表 。 使四格表周边合计数 列四格表。 不变, 不变 , 依次增减四格表中任一格子 的数据,列出所有可能的四格表。 的数据,列出所有可能的四格表。 • 列四表格的数量 = 最小合计数 + 1 。 列四表格的数量= 最小合计数+ • 如例 8 -3 , 增减 a 格的数据 ,得 9 个 如例8 格的数据, 四格表。 四格表。
χ2分布的特点
• ⑴ χ2 分布的形状依赖于 ν 的大小 : 当 ν≤2 时 , 曲线呈 L 型 ; 随着 ν 的增加 , 曲线呈L 的增加, 曲线逐渐趋于对称; →∞时 曲线逐渐趋于对称 ; 当 ν→∞ 时 , 分布 趋近于正态分布。 趋近于正态分布。 • ⑵χ2分布具有可加性:如果两个独立的 分布具有可加性: 随机变量X1和X2分别服从ν1和ν2的χ2分 那么它们的和( 也服从( 布,那么它们的和(X1+X2)也服从(ν1+ ν2)的χ2分布。 分布。

医用统计学-卡方检验2

医用统计学-卡方检验2

220(c+d) 400(a+b+c+d)
2
a
ad bc 2 n b c d a c b
d
χ2=21.65 P<0.05
1
14
2×2表χ2值的连续性校正:
➢ 当n≥40,且T≥5时,不需进行连续性校正(使用基本 公式或专用公式);
➢ 当n≥40,但1≤T<5时,需进行连续性校正;
2
合计 138
正常体重 48(43.3) 42(37.8) 21(18.9)
111
合计
78(31.3) 78(31.3) 93(37.4)
249
24
1.建立检验假设,确定检验水准 H0:两组人群的体育运动习惯的总体构成比相同 H1:两组人群的体育运动习惯的总体构成比不相同 α=0.05 2.选择公式,计算检验统计量
0.5 0.4
f (x2 ) 0.3
v 1
0.2
v6
0.1
0.05 v 10
0 024
3.84
6 8 10 12 14 16
x2
χ2分布规律: 自由度一定时,χ2值越大, P值越小。 当P值一定时,自由度越大,χ2越大。
=1时, χ2 =3.84, P=0.05 χ2 =6.63, P=0.01
根据 =1查2界值表,得P<0.05,按=0.05 的检验水准,拒绝H0,接受H1,提示两种药 物治愈率有差别。
专用公式法:
表8-1 两组流感患者不同疗法治愈率的比较
组别 治愈人数 未治愈人数
合计
中药 144(a)
36(b)
180(a+b)
西药 128(c) 合计 272(a+c)

第八章 卡方检验

第八章  卡方检验

20(25.8) 24(18.2) 21(15.2) 5(10.8) 41 29
表8-1中是两组样本的频数分布。我们的问题是 这两个频数分布的总体分布是否相等?或者这 两份样本是否来自同一个总体? 因为这里是二分类变量,问两个总体分布是否 相等就相当于问两组样本的总体有效率是否相 等。 四个格子的数据20、24、21、5是基本数据,其 余的数据44、25、41、29、70都是从这四个数 据计算得来的,因此,该表称为四格表 (fourfold table ),又称为2 × 2列联表。 在此四格表中, 20、24、21、5是实际频数A, 在这四个数字旁边括号内的数字是理论频数T, 通过实际频数和理论频数的差异的大小可以确 定 χ2 检验中检验统计量的大小。
2(d)0.85 14(固定值) 5 (固定值) 82 (固定值)
假设检验的过程
1.建立假设: H0 : π 1 = π 2 H1 : π 1 ≠ π 2 2.确定显著性水平, α取0.05。 3.确定比当前表格更极端表格的组合数,并计算 概率值P。 4.做出结论
在边缘合计数不变的条件下,比当前四 格表更极端的组合情况可根据最小的理 论频数所在的格子来寻找。本例中为d。 实际频数为2,理论频数为0.8536。差值 为1.15。所以d取值为2,3,4,5,这4 种组合就是满足条件的四格表。计算它 们的概率之和为0.20。 因为P > 0.05;不拒绝H0,差异无 统计学意义,还不能认为两组患者的 病死率存在差异。
42 2 ( 2 × 9 − 26 × 5 − ) × 42 2 2 χ = 28 × 14 × 7 × 35 = 3.62
V=(2-1)( ( )(2-1)=1 )( )
=3.62 < 3.84, P > 0.05;不拒绝H0, 差异无统计学意义,还不能认为两个年级学生 的近视眼患病率有差异。

第八章卡方检验-精选文档

第八章卡方检验-精选文档
第八章 χ2检验
第一节 行×列表资料的χ2检验
表8-1 三 个 不 同 地 区 血 型 样 本 的 频 数 分 布 地 区 亚 洲 欧 洲 北 美 洲 合计 A 321 258 408 987 B 369 43 106 518 A B 95 22 37 154 O 295 194 444 933 合 计 1080 517 995 2592
在进行多个样本率或构成比的比较时,可将原始资料整理成 频数表。当行或(和)列数超过2组时,统称为行×列表, 或称R×C表。
例8-1 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、 O血型资料,结果见表8-1所示,其目的是研究不同地区的人 群血型分类构成比是否一样。
表 8-1 三个不同地区血型样本的频数分布 地区 亚洲 欧洲 北美洲 合 计 A B AB O 295 388.75 194 186.10 444 358.15 933 36.00 合计 1080 517 995 2592 100.00
2 1 2 .5 9 0 .0 5 , 6
P0 .0 5
在α =0.05检验水准上,拒绝H0,认为三个不同地区的人群血 型分布构成的差别有统计学意义,说明三个不同地区的人群血 型分布构成不同或不全相同。
例8-2 某研究人员欲研究某新药治疗失眠的效 果,将122名患者随机分成三组,分别服用新药、 传统治疗失眠药和安慰剂,并跟踪观察三组患者 的治疗情况,结果如表8-2所示,试问三种药物 的疗效是否一样?
对例8-3做行列表χ 2检验的步骤如下:
1.建立检验假设并确定检验水准 H0:3种治疗方案的有效率相同 H1:3种治疗方案的有效率不同或不全相同 α =0.05 2.计算检验统计量χ 2值
2 2 2 2 A 5 1 4 9 1 5 2 n 1 2 5 4 1 n n 1 0 0 1 4 51 0 0 1 0 9 7 4 1 0 9 R C 22.81

第八章 检验(卡方检验)

第八章 检验(卡方检验)

乙疗法
45
50
95
47.37
合计
97
84
181
53.59
6. 2界值表
表 8-4 2 界值表
自由度
概率:(P)
0.05
0.01
1
3.84
6.63
2
5.99
9.21
3
7.81 11.34
4
9.49 13.28

20 31.41 37.57
图8.1 不同自由度的2分布曲线图
小结:2检验的基本思想
2
A T 2
1、四格表资料的2检验
• 基本公式:
专用公式:
2
A
T T
2
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
应用条件:n≥40,且T≥5。 SPSS 输出结果选择:
• 校正公式:
Pearson’s Chi-Square。
2
( AT
0.5)2
T
2 (| ad bc | n / 2)2 n
34
86
60.47
乙疗法
45
50
95
47.37
合计
97
84
181
53.59
男 女 合计
表 8-2 四格表资料示意


a(A11) c(A21)
a+c
b(A12) d(A22)
b+d
合计 a+ b c+d n
2. 检验假设: π1=π2=π,如检验假设成立,则两样本合计率 是π的最佳估计值。
3. 理论频数:
TRC = n R n C / n n R 为第R行合计数, n C为第C列合计数。 如:T11=86×97/181=46.09 T21=95×97/181=50.91

医学统计学课件卡方检验

医学统计学课件卡方检验

队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。

卡方检验

卡方检验

卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较 例题 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面 神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
■ 行×列表资料的χ2检验
多个样本率的比较
卡方检验
卡方检验
School of public health Shandong University
卡方检验
χ2检验(Chi-square test)是现代统计学的创始人之一, 英国人K . Pearson(1857-1936)于1900年提出的一种具
有广泛用途的统计方法,可用于两个或多个率间的比较, 计数资料的关联度分析,拟合优度检验等等。
卡方检验
■ 配对四格表资料的χ2检验
当两种处理方法无差别时,对总 体有 B C ,即两总体率相 等 1 2 。由于在抽样研究 中,抽样误差是不可避免的,样 本中的a和d往往不等( b c ,即 两样本率不等:p1 p2 )。为此 ,需进行假设检验(McNemar test),其检验统计量为:
卡方检验
■ 配对四格表资料的χ2检验
卡方检验
■ 行×列表资料的χ2检验
行×列表资料的χ2检验用于多个样本率的比较、两个或多个构成比的比 较、以及双向无序分类资料的关联性检验。其基本数据有以下三种情况: ①多个样本率比较时,有R行2列,称为R×2表;②两个样本的构成比比较 时,有2行C列,称2×C表;③多个样本的构成比比较,以及双向无序分类 资料关联性检验时,有R行C列,称为R×C表。以上三种情况可统称为行× 列表资料。
卡方检验
■ χ2检验的基本思想

卡方检验应用

卡方检验应用

卡方检验应用第八章记数数据统计法一卡方检验法知识引入在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。

例如,性别分男女,职业分为公务员、教师、工人、......... , 教师职称又分为教授、副教授、……。

有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。

对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。

卡方检验是专用于解决计数数据统计分析的假设检验法。

本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。

拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。

独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。

在计数数据进行统计分析时要特别注意取样的代表性。

我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。

在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。

在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。

例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。

这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。

因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。

第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。

它由统计学家皮尔逊推导。

统计学教案习题08卡方检验

统计学教案习题08卡方检验

第八章 2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。

2. 四格表的2χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。

3. 行⨯列表的2χ检验。

(二) 熟悉内容频数分布拟合优度的2χ检验。

(三) 了解内容 1.2χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要(一)2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。

在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。

四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法: np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2) 2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。

(8-3) (四)2χ检验的基本计算表8-12检验的用途、假设的设立及基本计算公式01四格表①独立资料两样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式)(22nbc ad -=χ 1②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ③配对设计cb c b +--=22)1(χR ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ (R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)( 据频数表的组数而定(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。

(医统)卡方检验

(医统)卡方检验

2
观测值的自由度(vi>2),Si为第i组观测值的标 准差 2 • 拒绝原假设的条件为: 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设: 2 2
1 2
• 检验统计量:
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件: F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布,即用卡方统计量检验实验分布 是否服从某一理论分布(正态、二项等) • 步骤:1.将总体X的取值范围分成k个互不重迭的 小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每 个小区间的概率p,于是np就是落入该区间的样本 值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较,进行决策
χ2 检验 数据资料 总体 检验对象
离散型资料 总体分布是未知的
连续型资料假设检验
连续型资料 正态分布 对总体参数或几个总体 参数之差
不是对总体参数的检 验,而是对总体分布 的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来,然后用实际观测值与理论
数相比较,从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消,并不能反映实 际观测值与理论值相差的大小。
为了避免正、负相抵消的问题,可将实际 观测值与理论值的差数平方后再相加,也就是 计算:
∑(O-E)2
O--实际观察的频数 E--无效假设下的期望频数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章2χ检验一、教学大纲要求(一) 掌握内容 1. 2χ检验的用途。

2. 四格表的2χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。

3. 行⨯列表的2χ检验。

(二) 熟悉内容频数分布拟合优度的2χ检验。

(三) 了解内容 1.2χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要(一) 2χ检验的用途2χ检验(Chi-square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。

在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。

四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np )1(ππσ-=,π为总体率,或 (8-1)np p S p )1(-=, p 为样本率; (8-2)2.总体率的可信区间当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

总体率的可信区间:(p p S u p S u p ⨯+⨯-2/2/,αα)。

(8-3) (四)2χ检验的基本计算 见表8-1。

表8-1 2χ检验的用途、假设的设立及基本计算公式资料形式用途0H 、1H 的设立与计算公式自由度四格表①独立资料两 样本率的比较②配对资料两 样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a nbc ad ++++-=χ②当n ≥40但1≤T<5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ ③配对设计cb c b +--=22)1(χ1R ⨯C 表①多个样本率、 构成比的比较②两个变量之 间关联性分析0H :多个总体率(构成比)相等(0H :两种属性间存在关联)1H :多个总体率(构成比)不全相等(0H :两种属性间存在关联))1(22-=∑CR n n A n χ (R-1)(C-1)频数分布表 频数分布的拟合优度检验0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布∑-TT A 2)(据频数表的组数而定(五)四格表的确切概率法当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。

(六)2χ检验的应用条件及注意事项1.分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

2.对于R ⨯C 表资料应注意以下两点:(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。

对于单向有序R ⨯C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ⨯C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ⨯C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

三、典型试题分析(一)单项选择题1.下列哪项检验不适用2χ检验( )A . 两样本均数的比较B . 两样本率的比较C . 多个样本构成比的比较D . 拟合优度检验答案:A[评析] 本题考点:2χ检验的主要用途。

2χ检验不能用于均数差别的比较。

2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )A .1<T <5,n>40B .T <5C .T 1≤或n 40≤D .T 1≤或n 100≤ 答案: C[评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。

3.2χ值的取值范围为A .∞-<2χ<∞+B .+∞≤≤20χC .12≤χ D .02≤≤∞-χ答案: B[评析]根据2χ分布的图形或2χ的基本公式可以判断2χ值一定是大于等于零且没有上界的,故应选B 。

(二)是非题 两样本率的比较可以采用2χ检验,也可以采用双侧u 检验。

答案:正确。

[评析]就两个样本率的比较而言,双侧u 检验与2χ检验是等价的。

(三)简答题1.四格表的2χ检验和u 检验有何联系与区别?答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2χ检验,两者是等价的,即22χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2χ检验可用于2⨯2列联表资料有无关联的检验。

2.R ⨯C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R ⨯C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。

当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。

但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况正常体重 肥胖合计 发生 未发生 发 生19 5 24 未发生 12 86 98 合 计31 91122[评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。

H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α cb c b +--=22)1(χ=()12.212511252=+--,1=ν2χ=2.11<21,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。

试对这三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较 矫治方法有效人数 无效人数 合计有效率(%)夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 18533.51[评析]0H :三种措施有效率相等1H :三种措施有效率不相等或不全相等 05.0=α)1(22-=∑cr n n A n χ=185⨯⎪⎪⎭⎫ ⎝⎛-⨯+⨯+⨯+⨯+⨯+⨯1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?颈麻100 41 注药100 94 置栓100 89 对照100 27 [评析] 为了应用2χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

表8-5 4种镇痛方法的效果比较镇痛方法 有效例数 无效例数 合计颈麻41 59 100 注药94 6 100 置栓89 11 100 对照27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同05.0=α)1(22-=∑c r n n A n χ=400⎪⎪⎭⎫ ⎝⎛-⨯++⨯+⨯⨯110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。

四、习 题(一) 单项选择题1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2χ分布C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2χ=u D . 两样本率比较时,有22χ=t 3. 率的标准误的计算公式是: A .)1(p p - B .n p p )1(- C.1-n p D.np p )1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43⨯表进行检验时,11=ν C .对四格表检验时,ν=4D .若2,05.02,05.0ηνχχ>,则ην>5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?A .不能确定B .甲、乙法一样C .甲法优于乙法D .乙法优于甲法 6.已知男性的钩虫感染率高于女性。

今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:A .分性别比较B .两个率比较的2χ检验C .不具可比性,不能比较D .对性别进行标准化后再做比较 7.以下说法正确的是A .两个样本率的比较可用u 检验也可用2χ检验B .两个样本均数的比较可用u 检验也可用2χ检验C .对于多个率或构成比的比较,u 检验可以替代2χ检验D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表5. 双向有序分类资料 6. 率的标准误7. 多个率的两两比较 8. Fisher 精确概率9. McNemar 检验 10. Yates 校正 (三) 是非题四个样本率做比较,2)3(05.02χχ> ,可认为各总体率均不相等。

相关文档
最新文档