卡方检验方法.ppt
合集下载
卡方检验.ppt
配对四格表资料的2检验
两种检验方法阳性率结果
可能的结果 甲
1
+
2
+
3
-
4
-
乙
频数
+
a
-
b
+
c
-
d
配对四格表资料的2检验
两种检验方法结果比较
荧光抗体法
+ - 合计
常规培养法
+
-
160(a) 26(b)
5(c)
48(d)
165
74
合计
186 53 239
配对四格表资料的实际数与理论数
实际数
5(c)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
理论数T
34.44 12.56 61.56 22.44
χ2检验的基本思想(2)
如果H0假设成立,则实际频数与理论频数应该比
较接近。差值 A T 属于随机误差,用χ2 统计量
表示:
2
( A T )2 ~ 2分布 T
H0成立时,实际数与理论数的差别不会很大,出现较大χ2 值概率很小。 若P≤α,则拒绝H0; 若P>α,则尚无理由拒绝它。
χ2检验的步骤(1)
(1)假设两总体率相等 H0:两组总体存活率相同,即π1=π2; H1:两组总体存活率不同,即π1≠π2;
α=0.05。
χ2检验的步骤(2)
(2)实际数与理论数的差值服从χ2分布
理论频数的计算
理论频数=47 73.3%
处理
存活 数
理论 频数
死亡数
理论 频数
合计
存活率 (%)
联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
卡方检验SPSS操作ppt课件
.000
N of Valid Cases
492
a.Not assuming the null hypothesis.
ing the asymptotic standard error assuming the null hypothesis
吸 烟史 * 基 因缺 失 Crosstabulation
列 联 系 数
矽 肺 期 次 * 肺 门 密 度 Crosstab ula tion
Count
矽肺 1 期次 2
3 Total
肺 门密 度
1 43
2 188
1
96
6
17
50
301
3 14 72 55
141
Total 245 169 78 492
Ch i-Squar e Te s t s
1
.018
概
Continuity Correctioan 3.544
1
.060
率
Likelihood Ratio
5.878
1
.015
Fisher's Exac t Test
.046
.029
Linear-by-Linear Association
5.352
1
.021
N of Valid Cases
21
Value Pearson Chi-Square 6.755a
Asymp. Sig.
df
(2-s ided)
ห้องสมุดไป่ตู้
3
.080
Likelihood Ratio
6.776
3
.079
Linear- by - Linear
卡方检验ppt课件
2检验 (chi-square test)
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
卡方检验 PPT
卡方检验基础
2值的计算:
2 (A E)2 E
由英国统计学家Karl Pearson首次提出,故被 称为Pearson 2 。
卡方检验基础-卡方分布
当n比较大时, 2 统计量近似服从k-1个自由度的2分布。
在自由度固定时,每个2值与一个概率值(P 值)相对应,
此概率值即为在H0成立的前提下,出现这样一个样本或偏
相关问题-两个率或构成比的比较
❖ 这是一个比较两个性别的 职位构成比是否相同的统计 学问题,要用Descriptive中 的Crosstabs实现,与单个率 的比较不同。
相关问题-两个率或构成比的比较
❖ 分别指定行列 变量到Row(s) 和Columns中。
相关问题-两个率或构成比的比较
相关问题-两个率或构成比的比较
离假设总体更远的样本的概率。如果P 值小于或等于显著
性水准,则拒绝H0,接受H1,即观察频数与期望频数不一
致。如果P 值大于显著性水准,则不拒绝H0,认为观察频 数与期望频数无显著性差异。P 值越小,说明H0假设正确 的可能性越小;P 值越大,说明H0假设正确的可能性越大。
卡方检验基础
利用单样本均值比较的t检验,可以检验样本所在总体
检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量 是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
相关问题-两个率或构成比的比较
例2 某妇女联合会向工会提出质疑,认为该公司在对女 性员工的职位安排上存在歧视,因为该公司216名女性 雇员中,只有10人为经理,其余206名为办事员;而 258名男性雇员中,74名为经理。但是工会说,男女间 职位类别比例的差异,只是一个随机误差,并不是真 的存在性别歧视。哪种说法才是正确的呢?(数据见 employee data.sav)
SPSS 卡方检验(共45张PPT)
如果不分层结果如下
结果解释:,差异具有统计学意义
分层做法
操作:(1)建立数据文件 分层变量:选如“gender” (2)菜单选择 统计量主对话框下 风险 Cochran’s and Mantel-Haenszel统计量
结果1:男性卡方检验 女性
结果2:风险估计,男性组,95%置信区间不 包括1。女性, 95%置信区间包括1。提示,
关系。结果显示在剔除性别影响后,吸烟
和肺癌仍然显著相关,即吸烟史导致肺癌 的危险因素。
• 结果5:又称公共OR值估计,合并OR值为,95%置信区间不包括 1,且与1相比差异有显著性()
• 注意:经OR值均一性检验各层OR值有显著差异时,不宜计算 公共OR值
主要内容
• 1.两独立样本率比较的卡方检验 • 2.配对计数资料的卡方检验 • 3.分层资料的卡方检验 • 4.卡方的两两比较
对于男性而言吸烟史发生肺癌的危险因素, 女性则不是。
关于OR值
• Odds Ratio:相对危险度(也称比值比、优 势比)
• 指病例组中暴露人数与非暴露人数的比值 除以对照组中暴露人数与非暴露人数的比 值。
• 涵义:暴露者的疾病危险度为非暴露者的 多少倍。OR>1说明疾病的危险度因暴露而 增加,暴露与疾病为“正”关联。OR<1说 明疾病的危险度因暴露而减少,“负”关 联
使用 系数分析吻合情况
例:116例患者的诊断结果见下表及数据“”,使用 kappa系数法分析影像CT诊断和病理诊断的吻合 情况。
• 文件为例
• 操作过程:
• 分析
•
统计描述
•
交叉表
• 行变量:treat_b
• 列变量:treat_a
• 统计量:McNemar
第十章 卡方检验.ppt
况下,4个基本数据当中只有一个可以 Nhomakorabea由取值。
样本率与总体率比较
例: • 全国高血压病调查结果:城市人口高血
压病患病率19.6%; • 某调查获得有高血压病家族史者358人,
其中高血压病者127人(P=35.47%) 问:有高血压病家族史者患病率是否高于
一般人群?
实际(A) 理论(T)
+
-
合计
127
Mantel-Haenszel Chi-Square
1 15.0822 0.0001
Phi Coefficient
0.5386
Contingency Coefficient
0.4742
Cramer's V
0.5386
关联性分析
• 行×列表的关联 P157:例10-8
Statistic Chi-Square Likelihood Ratio Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V
DF
Value Prob
6 15.3475 0.0177
6 14.7197 0.0226
1 3.5070 0.0611
0.1781
0.1753
0.1259
R × C表资料Chi-Square检验 应注意的问题
• 应用条件; • 多重比较问题 • 关联性分析问题 • 等级资料分析问题
– 双向无序单资料的分析 – 单向有序资料的分析 – 双向有序、属性不同资料的分析 – 双向有序、属性相同资料的分析
注意:不同年龄组可以合并,但不同血型就不能合
相关主题