RC列联表

合集下载

第2章列联表和对应分析ppt课件

第2章列联表和对应分析ppt课件
中央财经大学统计学院 6
检验统计量
r
c2
s (Oij Eij ) 2
i1 j1
Eij
在零假设成立时,该统计量近似服从自由 度为(r-1)ₓ(s-1)的c2分布。当该统计量的值 很大(或p值很小)时,就可以拒绝零假设, 认为这两个变量不相互独立。
中央财经大学统计学院 7
SPSS操作
“分析”“描述统计”“交叉表”,把 “婚姻状况”设为行变量,把“幸福状况” 设为列变量。接下来单击“统计量”,在 弹出的对话框中选中“卡方”,单击“继 续”;选择“单元格”,选中弹出对话框 中的“期望值”,单击“继续”返回前一 个是对话框,单击“确定”
中央财经大学统计学院 21
行变量(婚姻状况)各水平的坐标
婚姻状况 已婚 丧偶 离异 分居 未婚 有效总计
质量 .479 .096 .157 .041 .227 1.000
维中的得分
1
2
-.531
-.016
.437
-.660
.535
.168
.979
-.331
.389
.257
惯量 .037 .008 .013 .011 .010 .078
中央财经大学统计学院 23
列变量(幸福状况)的坐标
维中的得分
婚姻状况 质量 非常幸福 .304
1 -.684
2
惯量
-.193
.039
比较幸福 .575
.157
.207
.005
不太幸福
.121
.975
中央财经大学统计学院 24
-.498
.033
对应分析图
中央财经大学统计学院 25
对应分析图的解释

RC表卡方检验

RC表卡方检验
2020年7月12日
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):疗效 击Statistics按钮选择Chi-square。
2020年7月12日
输出结果
结果分析:Pearson 2 =32.736,双侧P=0.000<0.05,
2020年7月12日
R×C表2 检验应注意的问题
❖2.多组比较时,若效应有强弱的等级,如+,++
,+++,最好采用后面的非参数检验方法。 2检
验只能反映其构成比有无差异,不能比较效应的 平均水平。 ❖3.行列两种属性皆有序时,可考虑趋势检验或 等级相关分析。
❖4.多个率比较的2检验,结论为拒绝H0时、需
d f(31 )(41 )6
2 =9.60< 2 0.1,6=10.64,P>0.1,
按α=0.05水准,不拒绝H0,即不能认为三组病 人中医各型的构成比不同.
2020年7月12日
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li8-4.sav。 行变量:“疗法”,Values为:1=“生胃宁素
C k2 k(k21)
20.050.0167
3(31)
2020年7月12日
(3)新复方与降压药比较:列出表C,2=4.419
,P=0.036,按α’= 0.0167水准,不拒绝H0,不 能认为新复方与降压药治疗高血压病的效果不 同。
表C 新复方与降压药比较
药物 新复方 降压药 合计
有效 35 20 55
2020年7月12日
输出结果

RC列联表资料的统计分析与SAS软件实现

RC列联表资料的统计分析与SAS软件实现

一、调查问卷数据导入SPSS中。数据导入后,可以在SPSS主界面的 数据视图中查看数据。
二、进行列联表分析
1、打开列联表分析对话框
1、打开列联表分析对话框
在SPSS主菜单中,选择“分析”>“表”>“列联表”。这将打开列联表分析 对话框。
2、选择变量
2、选择变量
3、SAS实现
在这个示例中,mydata是包含RC列联表资料的数据集名称,var1和var2是需 要进行卡方检验的两个分类变量。chisq选项告诉PROC FREQ过程执行卡方检验。 运行这个过程后,将会生成一个包含卡方统计量、自由度和p值的输出表。
3、SAS实现
案例分析 为了更好地说明RC列联表资料的统计分析和SAS软件实现,让我们以一个实际 案例为例。在这个案例中,我们有一份包含两个分类变量的RC列联表资料,目的 是检验这两个变量之间的关联性。我们将分别使用Excel和SAS进行分析。
2、统计方法
2、统计方法
对于RC列联表资料,常用的统计方法包括卡方检验、Fisher精确检验、对数 似然比检验等。这些方法可以用来检验两个分类变量之间的独立性,以及判断某 种关联的存在性。根据分析目的和数据特点,选择合适的统计方法是非常重要的。
3、SAS实现
3、SAS实现
在SAS软件中,可以使用PROC FREQ和PROC LOGISTIC等过程来对RC列联表资 料进行统计分析。PROC FREQ过程可以用来进行频数统计和独立性检验,而PROC LOGISTIC过程则可以用来进行关联性分析和效应估计。下面是一个使用PROC FREQ进行卡方检验的示例代码:
三、解读结果
1、频率表
1、频率表
频率表展示了每个变量的单独频率以及不同变量组合的频率。通过查看频率 表,可以了解不同变量之间的关系。

第9章 列联表

第9章 列联表


系数
系数
以值为基础的相关测量

系数
C系数 V 系数
相关系数
1.
2. 3.
测度 22列联表中数据相关程度的一个量 对于22 列联表, 系数的值在0~1之间 相关系数计算公式为 2
n
2 (nij eij) r c 2 式中: i 1 j 1 e ij n为实际频数的总个数,即样本容量
3.
2
i 1 j 1
r
c
(nij eij ) 2 eij
其自由度为(r 1)(c 1) 式中:nij
— 列联表中第i行第j列类别的实际频数 eij — 列联表中第i行第j列类别的期望频数
检验
P279: 例2
使用 统计量检验列联表时, 需要注意的问题?
1. 对于2×2列联表,需要用修正的公式:
10/40 20/40 10/40
2/57 35/57 20/57
60/124
32/124 1
合计
1
1
1
一般只研究控制自变量x之后,因变量y的条件分布。
列联表中变量的相互独立性
列联表中变量的相互独立性
关于y的条件分布
老年
戏曲
y边缘分布
计算结果见表10-15(P275)
中年
青年Βιβλιοθήκη 合计32/12420/27
第三节 列联表中的相关测量
列联强度
列联表中的相关测量
1.
统计量检验只检验了列联表变量间是否存在 关系,而没有测量关系的强度 列联表中的相关测量就是检验变量间关系的强度 列联表相关测量的指标主要有
2. 3.
以值为基础的相关测量

RC列联表资料的统计分析.ppt

RC列联表资料的统计分析.ppt

表 8 100 例患者的临床诊断与 CT 诊断结果
临床诊断
患者例数
CT 诊断: Ⅰ级 Ⅱ级 Ⅲ级
Ⅰ级
60
4
2
Ⅱ级
4
12
3
Ⅲ级
3
3
9
当行变量与列变量的性质相同且取值的水平数及 含义也相同时,称这样的RC表为双向有序且属 性相同的RC列联表
双向有序且属性相同的RC表
表9 甲、乙两名医生对200例棉屑沉着病可疑患者的诊断结果
双向有序且属性不同RC表的统计方法
第四个分析目的,希望考察各行上的频数分布是 否相同,此时,将此资料视为双向无序的RC列 联表资料,可根据资料具备的前提条件,选用一
般 检验或Fish2er精确检验。若P<0.05,不能
认为两有序变量之间有相关关系,而只能认为各 行上的频数分布不同
双向有序且属性相同的RC表
双向有序且属性不同的RC表
表 6 不同年龄组中患者的疗效情况
年龄
患者例数
疗效: 痊愈 显效
好转
无效
<40
5
6
3
1
40~49
8
9
8
5
50~59
6
9
8
7
60~
4
6
7
8
当RC表中的两个定性变量,即原因变量与结果 变量都是有序变量,并且它们的性质不同,这样 的列联表称为双向有序且属性不同的RC表
双向有序且属性不同的RC表
表 4 不同药物组中患者的疗效情况
药物
患者例数
类型 疗效: 痊愈
显效
好转
无效
A
5
10
8
7
B

第五讲 列联表分析

第五讲 列联表分析
第五讲 列联表分析
导言
在数据分析中,我们不仅需要了解单一变量的数值分布特征,还需要 了解一个变量与另一个变量之间的关系。
例如,我们不仅想了解一个班级中同学们的性别结构,同时还想知道 不同性别的同学在某一问题上的态度是否不同。当不同性别的同学在该 问题上的态度有明显差异时,我们可以说,性别与态度这两个变量之间 存在相关关系。
1班(% )
班级 2班(% ) 3班(% )
总数
40.7
35.0
24.3 (123)
25.2
33.3
41.4 (111)
怎么解释?
一、列联表(contingency table)
根据因变量方向计算百分比举例
研究某城市破裂家庭(自变量)对青少年犯罪行为 (因变量)的影响。如何抽样?假定该城市的全部青 少年中,未犯罪的青少年有54400名,有越轨行为的青 少年960名。
二、相关系数( ) correlation coefficient
消减误差比例(proportionate reduction in error) , 简称为PRE 测量法。 相关分析的目的之一在于用一个变量去预测或解释另一个变量。
为什么我们班同学的身高会有那么大的差异?当我们对这一现象毫无 所知的时候,随便说出一个同学的名字,让你猜他的身高,这个时候难免 会有误差。
犯罪青少年 未犯罪青少年 合计
146
45
191
334
499
833
480
544
1024
犯罪青少年 未犯罪青少年 合计
破裂家庭(% ) 76.4 和好家庭(% ) 40.0
23.6
(191) 破裂家庭
60.0
(833) 和好家庭

RC表资料分析讲义

RC表资料分析讲义

49.468
1
.000
Fisher's Exact Test
.000
.000
Linear-by-Linear Association
56.621
1
.000
N of Valid Cases
376
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8. 24.
第一节 四格表的Pearson 2 检验
一、 2 检验的基本思想 基本思想是衡量实际频数和理论频数之间的偏离度。 检验统计量的意义和算法可用基本公式来说明:
2
R
C
( Arc Trc )2
(A T)2
r 1 c1
Trc
T
8.2
Arc表示R×C表中第 r 行(r=1,2,…,R)第c列(c=1 ,2,…,C) 位置上的实际频数,简称实际数A;Trc 表示与Arc相应(同位置)的理论频数(频数期望值), 简称理论数T。
使 用 SPSS 软 件 , 以 处理、疗效及例数 为变量名,建立2行 2 列 如 图 10-6 的 数 据 文件
选择Analyze Descriptive Statistics Crosstable
选处理组进入 Rows[s]框, 安慰组进入 Column[s] 框, 击Statistics按 钮,
2 n( ad bc n / 2)2
(a b)(c d )(a c)(b d )
71( 26 2 7 36 71/ 2)2

SPSS列联表分析

SPSS列联表分析

例3: 以下是胃癌真菌病因研究中3种食物样品的真菌检出率,比较3种食物真菌检出率有无差异.
本例中SPSS提示没有理论频数小于5,且最小的理论频数为8.00,故直接选择Pearson 卡方结果,即χ2=22.841,P<0.001,提示三种食物中真菌检出率不同.此时还需要进一步考虑三种食物真菌检出率到底谁与谁之间的差异存在统计学意义,这里就需要用到卡方分割,通俗讲就是把RC列联表拆分成若干个四个表分别进行χ2检验,进而判断不同组两两比较差异是否用统计学意义,但是因为多组比较可能会增加犯I类错误概率,所以还需要对χ2检验的P值进行校正.常用Bonferroni法进行校正,本例中需要进行3次两两比较,校正的检验水准α=0.05/比较次数=0.05/3=0.0167,即当两两比较P<0.0167才能认为差异有统计学意义.
Kappa一致性检验
1、Kappa检验旨在评价两种方法是否存在一致性,或者是同一个研究者先后两次的诊断结果 2、Kappa检验会利用列联表的全部数据 3、Kappa检验可计算Kappa值用于评价一致性大小
配对χ2检验(McNemar检验)
1、配对χ2检验主要确定两种方法诊断结果是否有差别 2、配对χ2检验只利用“不一致“数据,如表中b和c 3、配对χ2检验只能给出两种方法差别是否具有统计学意义的判断
无效 疗效=1
好转 疗效=2
显效 疗效=3
治愈 疗效=4
合计
有效率%
甲法
24
26ห้องสมุดไป่ตู้
72
186
308
92.2
乙法
20
16
24
32
92
78.3
丙法
20
22
14
22

卡方检验与列联表

卡方检验与列联表
生物统计学·卡方检验与列联表
适合性检验
1. 零假设与备择假设 H0:实际观察次数之比符合9:3:3:1的理论比例。 HA:实际观察次数之比不符合9:3:3:1的理论比例。
2. 选择计算公式 由于本例的属性类别分类数 k=4, 自由 度df = k-1 = 4-1 = 3 > 1,故利用(1)式计算X2。
生物统计学 第10讲 卡方检验与列联表
2012.10
生物统计学·卡方检验与列联表
内容
卡方检验(Chi Squared Test, 2 Test) •2检验基本概念
• 适合性检验 • 独立性检验
- 列联表 (Contingency Table) - 2×2列联表 - R×C列联表
*总体 2检验 * 两两比较 2检验

n 1 S2
2
n 1 S 2
2
~
2 n 1
生物统计学·卡方检验与列联表
2分布
随自由度的增大, 曲线由偏斜渐趋于对称。df≥30
时, 2分布近似正态分布
生物统计学·卡方检验与列联表
2检验基本概念
计数资料2 检验的基本思想: 首先假设观察频数(O)与期望频数(E)没有差别,而X2 值表 示观察值与理论值的偏差程度。当n较大时,X2 统计量近似服 从n-1个自由度的2 分布。
多个因子属性类别数的不同而构成R×C列联表. 而适合性检验 只按某一因子的属性类别将如性别、表现型等次数资料归组。 2. 适合性检验按已知的属性分类理论或学说计算理论次数。独立 性检验在计算理论次数时没有现成的理论或学说可资利用,理 论次数是在两因子相互独立的假设下进行计算。 3. 在适合性检验中确定自由度时,只有一个约束条件:各理论次 数之和等于各实际次数之和,自由度为属性类别数减1; 独立性 检验的自由度为(R-1)(C-1)

Excel中RC样式引用详解

Excel中RC样式引用详解

Excel中R1C1样式引用详解这篇文章根据excelhome论坛中的两个帖子进行整理,稍作了修改。

以下内容来自第一个帖子,点击这里可以查看原文。

一、引用单元格:R1C1样式与A1样式比较DanBricklin和BobFrankston使用A1表示电子表格左上角的单元格,Mitch Kapor在Lotus 1-2-3中也是使用这种编址方案。

Microsoft试图改变这种趋势,采用了名为R1C1样式编址方案。

单元格A1称为R1C1,因为它位于第一行,第一列(Row 1, Column 1)。

在20世纪80年代和90年代初期,A1样式称为了标准,Microsoft公司认识到了危机,最终让excel接受了A1样式,并同时支持R1C1样式编址方案。

当前,excel默认使用A1样式。

为什么学习R1C1样式?答案是:1,excel的宏录制器采用的是R1C1样式录制公式。

2,R1C1样式比之A1样式有更高的效率,尤其是对于公式,编写的代码效率会更高。

3,在BVA编辑器中,创建数组公式或基于公式设置条件格式时,采用的是R1C1样式输入公式。

怎么切换R1C1样式?单击Ofice按钮选择Excel选项,在公式类别中选择复选框“R1C1引用样式”。

版面上唯一不同是列标A,B,C--变成数字1,2,3,单元格C5变为R5C2二、EXCEL公式的神奇之处如动画所示,Excel 能智能的填充公式,并向下复制,第一次看到一定感觉非常惊奇。

实际这并不惊奇,因为,Excel内部使用的是R1C1样式的公式,以A1样式显示地址和公式。

如果将动画所示的工作表切换成R1C1样式表示法,将发现C2:C7的公式都是形同的。

三、在VBA中采用A1样式与R1C1样式之比较如上述动画实例,如用A1样式编写代码,代码可以类似下面这样:Sub chengji()Dim Finalrow As IntegerFinalrow = Cells(Rows.Count, 2).End(xlUp).Row '求第二列数据行数Range("c2").Formula = "=a2*b2"Range("C2").Copy Destination:=Range("C2:C" & Finalrow) End Sub上述代码在第二行输入公式,再向下复制公式如果用R1C1样式只需一条语句就可整列输入公式Sub chengji()Dim Finalrow As IntegerFinalrow = Cells(Rows.Count, 2).End(xlUp).Row '求第二列数据行数Range("c2:c" & Finalrow).FormulaR1C1 = "=RC[-1]*RC[-2]" End Sub使用R1C1样式的优点是,所有C列的公式都是相同的,不需要改变四、怎么引用R1C1样式R1C1样式采用R来表示行,C来表示列4.1 样式的相对引用对于列正数表示向右移指定数量的列,负数反之。

RC表卡方检验

RC表卡方检验
2024年1月11日
(3) 相关性分析、线性趋势检验 从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):硬化级别 Columns(s):混浊程度 击Statistics按钮选择Chi-square、
Correlations(相关性)----- Somer’d 检验
Weight CΒιβλιοθήκη ses by框,框内选入“频数 ”,即指定该变量为频数变量
2024年1月11日
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):中医分型 击Statistics按钮选择Chi-square。
可认为行和列两等级变量之间存在一定的线性关系,即眼底
动脉硬化级别越高,老年环混浊程度越深。
2024年1月11日
第五节 多个样本率的两两比较
多个实验组与一个对照组比较 2×k表多组间的两两比较
2024年1月11日
多个样本率的两两比较
多个样本率(或构成比)的2检验,结
论为拒绝H0时,只能认为各总体率(或构 成比)之间总的来说有差别,常需要进一 步作“两两比较”,本节介绍用 Bonferroni法调整检验水准作两两比较。
2024年1月11日
相关性分析
结果分析: Spearman等级相关系数=0.214,近似概率P
=0.001<0.05,可认为行和列两等级变量之间的总体相关系 数不等于0,两变量之间有一定的相关关系。
2024年1月11日
线性趋势检验
结果分析: MH 2 =10.281,近似概率P=0.001<0.05,

套房控制逻辑表

套房控制逻辑表

-
-
√ √
-
-
-
-
√ * √ * -
√ √ √ √ √ √ * √ * √ * √ * √ * √ * √ * √ √ √ √ √ * √ * √ * √ * √ * √ * √ * √ * √ * √ * √
√ √ -
* √ * √ -
* √ * √ -
* √ * √ -
√ √ √ √ -
√ √ √ √ √ √ -
* √ * √ -
√ √ -
* √ * √ -
* √ * √ -
- 90% √ - 90% √ -
√ √ -
1. D,KO 2.
请稍候显示 请勿扰显示
-
-
-
-
-
-
-
-
-
-
-
-
---源自----
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-

-
√ -
-
-
-
说明: 打开门时,门磁联动打开廊灯1,延时1分钟自动关闭。省电模式时在门卡面板插入门卡,系统会进入欢迎模式, 并跟据照明控制逻辑自动开启预先定义的照明。空调将被复原至最近的设置(风扇速率和温度设定), 客人可手动控制照明及空调设备。 当门卡从门卡面板拔出后30秒,系统会进入省电模式, 所有照明设备将被关掉,而空调亦将被调至预先定义的温度设定及低速运行。所有照明设备 开关具备复位功能。当床头总控开关关闭时,所有照明设备将被关掉。此后按任一开关键,夜灯点亮,落地灯、台灯恢复通电;之后再按照明任一开关键,此开头控制的照明点亮;当再次打开总开关时,所有灯具回复熄灭前的状态。当”请勿打扰”开启时,门铃将不鸣响。床头调光阅读灯实现从0~100%调亮,100%~0变暗;大床房的床头调光阅读灯交叉照射及控制。当正常市电断电时,应急灯自动 点亮。√为执行动作,*为保持或回复之前状态。

列联表

列联表

.784
1
.376
N of Valid Cases
300
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.33.


Value 20.124b 18.652 20.953
20.033
df 1 1 1
1
Asy mp. Sig. (2-sided) .000 .000 .000
.000
Exact Sig. (2-sided)
.000
Exact Sig. (1-sided)
.000
N of Valid Cases
221
• 变量 X 条件下变量 Y 的分布,或在 变量 Y 条件下变量 X 的分布
• 每个具体的观察值称为条件频数
百分比分布
1. 条件频数反映了数据的分布,但不适合 进行对比
2. 为在相同的基数上进行比较,可以计算 相应的百分比,称为百分比分布。
行百分比分布
东部地区 西部地区 南部地区 北部地区 合计 愿意购买 24.4% 26.9% 20.4% 28.3% 100% 不愿意购买 22.7% 31.9% 23.4% 22.0% 100%
列百分比分布
东部地区 西部地区 南部地区 北部地区
愿意购买 68.0% 62.5% 63.35 71.8% 不愿意购买 32.0% 37.5% 36.7% 28.2%
合计 100% 100% 100% 100%
总百分比分布
东部地区 西部地区 南部地区 北部地区 合计 愿意购买 16.2% 17.8% 13.6% 18.8% 66.4% 不愿意购买 7.6% 10.7% 7.9% 7.4% 33.6%

第六章RC列联表

第六章RC列联表

(32 41.29) 2 (46 36.71) 2 (76 66.71) 2 (50 59.29) 2 41.29 36.71 66.71 59.29 7.1969
3、查临界值
4、结论 影响。
X y1 X1 X2 合计 O11 O21 O.1
2 0 ) 3.841 .05 (1
故以 0.05 水准接受原假设,两法的疗效差异 无统计学意义,不能认为甲法优于乙法.
6-3.2
R×C列联表中独立性检验
表 6-8
Y 合计
R×C列联表的一般数据格式:
X
y1
x1 O11(E11)
y2
O12(E12)
…..
…..
Yc
O1c(E1c) O1.
….
….
….
OR2(ER2) O.2
….
组别 甲法 有效 14( O11) 无效 1(O12) 合计 15(O1.)
乙法
合计
7 (O21)
21(O.1)
3(O22)
4(O.2)
10(O2. )
25(N)
四格表的确切概率法的一般步骤:
(1)列四格表:在周边合计O1.,O2.,O.1,O.2,N不变的情况下,依次 增减四格表中任一格子的数据,列出所有可能的四格表.
说明四年级与五年级的学生近视眼患病率差别没有统计学意义。
三、配对的四格表
例3 用甲、乙两种方法检验鼻咽癌患者93例,两法都是阳性的有45例, 都是阴性的有20例。甲法阳性但乙法阴性的有22例,甲法阴性但乙法阳 性的有6例,结果如下表。试问两种方法的阳性检出率有无差异?
表6-5 两种方法检验结果比较表
….. ….
……

列联表数据的分析

列联表数据的分析
H0的概率,称为Fisher的精确检验。
例2
两种药治疗效果的数据
方法 有效 治疗药 5 对照药 2
无效 合计
2
7
4
6
问两种药疗效差异有无统计学意义?
例3 今随机调查三个民族的血型情况,试分
析三个民族构成血型是否相同?p60
A
B
O
AB 合计
傣族 112 150 205
40 507
佤族 200 112 135
100
问两种方法疗效差异有无统计学意义?
卡方检验思想
1建立检验假设H0:各组率(比)相等。 2计算卡方。 3求得P值。 4进行决策。 确定检验水平α,
若P<α,则拒绝H0,认为各组总体率 (比)不同,称差异有统计学意义。否 则不拒绝H0。
CHISS软件的实现
统计→统计推断→双向无序列联表 → 反应变量:有效、无效 →确认
疗法 综合 电子 清音
治愈 186 32 22
显效 72 24 14
好转 无效
26
24
16
20
22
20
合计 308 92 78
表4 用两种方法测定某抗体间接血凝结果
滤片 -
纸法

8
+
0
++
0
+++ 0
血清法
&43;++
0
1
0
10
1
0
1
26
2
1
0
6
合计
9 11 29 7
表5 眼晶状体混浊度与年龄的数据
程度 + ++ +++

RC列联表

RC列联表
列联表类型
可选用的统计分析方法
(一般四格表
Fisher的精确检验(通用)
校正的卡方检验(N>40,1<T≤5)、一般卡方检验(N>40,1<T≤5)
(2)队列研究四格表
先视为一般四格表,计算RR并用MH卡方检验之
(3)病例-对照研究四格表
先视为一般四格表,计算OR并用MH卡方检验之
(4)配对设计四格表
有金标准活隐含金标准时,可用配对设计McNemar卡方检验之
(5)双向无序R×C列联表
当小于5的理论频数的个数未超过总格子数的1/5时,用一般卡方检验,否则用Fisher的精确检验。
(6)结果变量为单向有序的R×C列联表
可用秩和检验或Ridit分析或有序变量的Logistic回归分析。

如何在SAS中实现R×C列联表的两两比较

如何在SAS中实现R×C列联表的两两比较

A14-如何在SAS中实现R×C列联表的两两比较内容来自网络,侵删在分析R×C列联表时,在卡方检验有统计意义的情况下常常需要做进一步的多重比较。

可以采用的方法为1)卡方分割(具体见本人另外一篇文章《R×C行列表卡方值分割的概念及运用》)将原表卡方值分割成独立的子卡方值,分割后的子卡方值和对应的自由度相加会和原表的卡方值和自由度相等。

2)或者采用彼此之间非独立的两两比较。

但是两两比较的卡方值和对应的自由度相加不会等于原表卡方值和自由度,所以此类比较不能称为卡方分割法。

尽管后者更为灵活但需要调整多重比较的次数以避免增加第一类错误。

本文将具体讲解如何在SAS中实现R×C列联表的两两比较。

1.研究数据-血型和疾病类型假定某医学课题想研究血型(O,A,B)和疾病类型(Peptic Ulcer, Gastric Cancer,Control)是否相互关联, 具体临床数据见表1。

表1:血型和疾病类型行列表Disease TypeBloodType Peptic Ulcer(I)-1 Gastric Cancer(II)-2 Control(III)-3 Total O-1983(14.024)383(4.9139)2892(1.4159)4258A-2679(9.0743)416(4.5484)2625(0.679)3720B-3134(4.6663)84(0.2695)570(0.9519)788Totals17968836087N=87662.初步分析我们先用SAS/PROC FREQ 和PROC CORRESP 先对数据做初步的分析,来判断行列变量之间的关系。

CELLCHI2 选项是计算按公式2-1计算每个单元格在总体值的组成。

2χij ijijji E OE C 2,)(-=(2-1)proc freq data=paper14;weight count;table r*c/chisq cellchi2nopercent;run;proc corresp data=paper14;weight count;les r, c;tabrun;表2 – 卡方检验结果Table of r by cr cFrequencyCell Chi-SquareRow PctCol Pct 123Total198314.02423.0954.733834.91398.9943.3728921.415967.9247.51425826799.074318.2537.814164.548411.1847.1126250.67970.5643.12372031344.666317.017.46840.269510.669.515700.951972.349.36788Total 179688360878766 Statistics for Table of r by cStatistic DF Value Prob ------------------------------------------------------ Chi-Square 4 40.5434 <.0001 Likelihood Ratio Chi-Square 4 40.6401 <.0001 Mantel-Haenszel Chi-Square 1 21.0035 <.0001 Sample Size = 8766从表2中可以看出第1行(血型O)的卡方检验分值在所有行中所占比重最高((14.024+4.9139+1.4159)/40.5434≈50%);第1列(Peptic Ulcer(I))的卡方检验分值在所有列中所占比重最高((14.024+9.0743+4.6663)/40.5434≈68.5%)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
mar卡方检验之
(5)双向无序R×C列联表
当小于5的理论频数的个数未超过总格子数的1/5时,用一般卡方检验,否则用Fisher的精确检验。
(6)结果变量为单向有序的R×C列联表
可用秩和检验或Ridit分析或有序变量的Logistic回归分析。
列联表类型
可选用的统计分析方法
(1)一般四格表
Fisher的精确检验(通用)
校正的卡方检验(N>40,1<T≤5)、一般卡方检验(N>40,1<T≤5)
(2)队列研究四格表
先视为一般四格表,计算RR并用MH卡方检验之
(3)病例-对照研究四格表
先视为一般四格表,计算OR并用MH卡方检验之
(4)配对设计四格表
相关文档
最新文档