R×C表卡方检验
研究生统计学讲义第7讲R×C表资料分析
![研究生统计学讲义第7讲R×C表资料分析](https://img.taocdn.com/s3/m/ef72b107360cba1aa811dad3.png)
2.配对四格表资料的独立性 2 检验 H0为配对的两种 属性相互独立,彼此无关。目的是推断配对的两种属 性(因素)是否有关。独立性的对立面就是相关,配对 四格表的独立性检验即行列属性的相关性检验。在配 对两法相关即不独立时,可认为差异无统计意义。在 配对两法无相关即独立时,可认为差异有统计意义。 统计量仍用四格表的 2 检验公式(见表10.3),如两种 属性有关,可进而确定关系的密切程度。
表8-7是分层四格表,如使用SPSS11.5统计软件:以 分组、疗效、中心,建立数据文件L10.8.sav以后,
(1)先加权频数变量,操作过程和界面同例10.2: →Data, →Weight Cases, 选择⊙Weight Cases by, 将例数送入Frequency Variable框,→OK。
R
2
C
( Arc Trc )2
(A T)2
8.2
r 1 c1
Trc
T
式中Arc表示R×C表中第 r 行(r=1,2,…,R)第c列 (c=1,2,…,C) 位置上的实际频数,简称实际数,
简记为A;Trc表示与Arc相应(同位置)的理论频数(频数
期望值),简称理论数,简记为T。
4
理论数是根据检验假设 H0 来确定的,H0 为比较 的各组处理效果相同,均等于合计的处理效果,据 此推出第 r 行第c 列位置上理论数的计算公式为:
0.6735 ×376=253.24
西药组的有效理论数T21=100×345/376=91.76; 同 理 , 合 计 无 效 率 为 31/376=8.24% , T12=22.76 , T22=8.24。
7
表8.1为成组设计(即完全随机设计)的四格表,表中 的基本数据A11,A12,A21,A22分别取271,5,74,26 。本例系两样本率比较,先假设两种药物的疗效相同
如何在SAS中实现R×C列联表的两两比较
![如何在SAS中实现R×C列联表的两两比较](https://img.taocdn.com/s3/m/d83a6f1252ea551810a68745.png)
A14-如何在SAS中实现R×C列联表的两两比较内容来自网络,侵删在分析R×C列联表时,在卡方检验有统计意义的情况下常常需要做进一步的多重比较。
可以采用的方法为1)卡方分割(具体见本人另外一篇文章《R×C行列表卡方值分割的概念及运用》)将原表卡方值分割成独立的子卡方值,分割后的子卡方值和对应的自由度相加会和原表的卡方值和自由度相等。
2)或者采用彼此之间非独立的两两比较。
但是两两比较的卡方值和对应的自由度相加不会等于原表卡方值和自由度,所以此类比较不能称为卡方分割法。
尽管后者更为灵活但需要调整多重比较的次数以避免增加第一类错误。
本文将具体讲解如何在SAS中实现R×C列联表的两两比较。
1.研究数据-血型和疾病类型假定某医学课题想研究血型(O,A,B)和疾病类型(Peptic Ulcer, Gastric Cancer,Control)是否相互关联, 具体临床数据见表1。
表1:血型和疾病类型行列表Disease TypeBloodType Peptic Ulcer(I)-1 Gastric Cancer(II)-2 Control(III)-3 Total O-1983(14.024)383(4.9139)2892(1.4159)4258A-2679(9.0743)416(4.5484)2625(0.679)3720B-3134(4.6663)84(0.2695)570(0.9519)788Totals17968836087N=87662.初步分析我们先用SAS/PROC FREQ 和PROC CORRESP 先对数据做初步的分析,来判断行列变量之间的关系。
CELLCHI2 选项是计算按公式2-1计算每个单元格在总体值的组成。
2χij ijijji E OE C 2,)(-=(2-1)proc freq data=paper14;weight count;table r*c/chisq cellchi2nopercent;run;proc corresp data=paper14;weight count;les r, c;tabrun;表2 – 卡方检验结果Table of r by cr cFrequencyCell Chi-SquareRow PctCol Pct 123Total198314.02423.0954.733834.91398.9943.3728921.415967.9247.51425826799.074318.2537.814164.548411.1847.1126250.67970.5643.12372031344.666317.017.46840.269510.669.515700.951972.349.36788Total 179688360878766 Statistics for Table of r by cStatistic DF Value Prob ------------------------------------------------------ Chi-Square 4 40.5434 <.0001 Likelihood Ratio Chi-Square 4 40.6401 <.0001 Mantel-Haenszel Chi-Square 1 21.0035 <.0001 Sample Size = 8766从表2中可以看出第1行(血型O)的卡方检验分值在所有行中所占比重最高((14.024+4.9139+1.4159)/40.5434≈50%);第1列(Peptic Ulcer(I))的卡方检验分值在所有列中所占比重最高((14.024+9.0743+4.6663)/40.5434≈68.5%)。
卡方检验
![卡方检验](https://img.taocdn.com/s3/m/6ee47841c850ad02de804155.png)
四格表2检验的校正公式
2界值表是根据连续性的2分布计算出来的,但原 始数据是分类资料,不是连续的,由此计算的 2 值也是不连续的,它仅仅是连续性的2分布的一种 近似。 n≥40&T ≥5时,这种近似效果较好。 但在样本例数较少或出现理论频数小于5时,算出 的2值可能偏大,既求出的概率P值可能偏小,此 时须根据具体情况作不同的处理。
实际频数:表内各格数字为实际资料的数字。
2 检验的基本思想
实际频数和理论频数差异的大小可以用 2 值的大 小来说明,当样本量n和各个按检验假设计算的理 ) 论频数T都足够大时,比如n≥40,T≥5, (A T值近 T 似于2分布,n越大,近似程度越好。
2
2值的计算公式如下:
(A T ) 2 2= T
2 2
(a c)(c d ) (b d )(c d ) c d n n (a c)(c d ) (b d )(c d ) n n (ad bc) 2 n a b c d a c b d
R×C表资料的2检验
R×C表资料的2检验可进行多个率、多组构 成比之间的比较及两个分类变量的关联性分 析。
R×C表资料的2检验的计算公式:
2 ARC (A T ) 2 = =n ( 1) T nR nC 2
ν=(R-1)(C-1)
配对设计资料的2检验
配对设计资料特点:对同一样本的每 一对象分别用两种方法处理,观察其 阳性或阴性结果,调查或实验设计数 据等。
配对设计资料的一般形式
变量1
变量2
阳性 阴性
合计
阳性
阴性 合计
卡方检验
![卡方检验](https://img.taocdn.com/s3/m/232f0b14a26925c52cc5bfff.png)
2 检验
Crosstabs
WUST
Crosstabs-- 2检验
1 四格表资料的2检验– 结果释 – 界面说明2 配对资料的2检验
– 界面说明 – 结果解释
3 行×列表的2检验
– 界面说明 – 结果解释
WUST
一、四格表的 2检验
1 界面说明 2 分析实例 3 结果解释
合计
未愈合 8 20 28
愈合 54 44 98
合计 62 64 126
WUST
步骤:
1. Data ==>weight cases Weight cases by: Frequency Variable 框:
count Ok
1. Analyze==> Descriptive Statistics==>Crosstabs
软组织炎型
混合型
合计
儿童组
50
48
成人组
105
10
合计
155
58
18
72
188
7
23
145
25
95
333
WUST
四格表资料
1. 主要用于两个样本率的比较。 2. 资料的录入格式。
两个分类变量:行变量、列变量(定义 values)
一个频数变量:通常是例数
WUST
例1 某医生用国产呋喃硝胺治疗 十二指肠溃疡,以甲氰咪胍作为 对照组,问两种方法治疗效果有 无差别?2by2.sav
处理 呋喃硝胺 甲氰咪胍
2. 在某牧区观察慢性布鲁氏病患者植物血凝素 皮肤试验反应,资料如下,问活动型与稳定型 布氏患者反应阳性率有无差别?
WUST
3 1979年某地爆发松毛虫病,333例患者按年龄 以14岁为界分成2组,资料如表,试考察两组病
X2检验
![X2检验](https://img.taocdn.com/s3/m/429c67f419e8b8f67c1cb93f.png)
谢谢!
51(A+C) 39(B+D) 90(A+B+C+D)
2.相关样本四格表卡方检验
2
(A D )
AD
2
A,D为四格表中两次 实验或调查中分类项 目不同的那两个格的 实计次数。
100名学生先后测验两次,结果如下:
测验1
错 对
测验2 错
对 60
40 100
5(A) 55(B)
25(C) 15(D) 30 70
1. H :
0
H:
1
2.计算理论次数 3.计算卡方值 4.计算自由度 5.根据自由度和显著水平找出相应的卡方临界值
6.得出结论
二、检验假设分布的概率
假设某因素各项分类的次数分布为正态,故其理论次数的计算 应按正态分布概率,分别计算各项分类的理论次数。即先按正 态分布理论计算各项分类应有的概率再乘以总数,便得到各项 分类的理论次数。 事先分布不是理论分布而是经验分布,亦可按此经验分布计算 概率,再乘以总数便可得到理论次数。
小计
113
109
222
计数数据的合并
一、两格表及四格表数据的合并 1.简单合并 条件:分表小样本齐性;各分表某特征的相应比率接近。 2. X2相加法 即将各分表的X2值相加,查自由度为分表数目的X2表,确定显著性水 平。反应不灵敏。 二、R×C表数据的合并 1.简单合并法 2.分表理论次数合并法
某班有学生50人,体检结果按一定标准划分为甲乙丙三类, 其中甲类16人,乙类24人,丙类10人,问该班学生的身体状 况是否符合正态分布?
理论次数计算方法:按正态分布概率计算 按正态分布,正负3σ可认为包括了全体,那么各等级所占的横坐标应该 相同为2σ,故: 甲级: 乙级: 丙级: 因此,各等级的理论次数应为各部分理论上的概率乘以总人数。
卡方检验解释
![卡方检验解释](https://img.taocdn.com/s3/m/7798cbce4431b90d6d85c767.png)
2(1 96 9. 690.48)25(55.4 13.52)22(67.5 483.52)2 87(.26112.48)
16.4 2(112 61..8 69 6 0.5 45 8 1.4261.4 138.7 5 1.26)34.3283.52
12.48
(21)2 (1)1
以 = 1 查 附 表 8 的 2 界 值 表 得 P 0 . 005 。 按 0 . 05 检 验 水 准 拒 绝 H 0 , 接 受 H1, 肺 癌 患 者 癌 胚 抗 原 的 阳性率显著高于健康人,提示可能具有临床诊断价 值。
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
表7-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
卡方检验解释
主讲内容
第一 第二 第三 第四 第五 第六 第七
2 概述——基本思想 2×2表卡方检验 配对四格表卡方检验 R×C表卡方检验 Fisher确切概率检验 多个样本率的多重比较 有序分组资料的线性趋势检验
卡方检验 实验
![卡方检验 实验](https://img.taocdn.com/s3/m/b999b8ff81c758f5f61f6764.png)
2 四格表χ 检验的适用条件及其公式
适用条件 直接法 基本公式
2
(A T) T
2
四格表专用公式
2 ( ad bc ) n 2 (a b)(c d )(a c)(b d )
T≥5 且n≥40
1≤T<5 且n≥40 T<1 或n<40
校正法
2
( A T 0.5) 2 T
2 2
则 :
配对χ2检验:
1. b+c≥40时,直接法计算:
2 ( b c ) 2 bc
ν=1
McNemar检验 ( McNemar’s test )
2.当b+c<40时,应作连续性校正,即校正法计算:
2
( b c 1) 2 bc
ν=1
式中b与c分别代表两种方法处理结果不同部 分的实际频数。
有关,欲推断甲法和乙法的总体阳性率是否相 等,只需比较B(b来自的总体)和 C(c来自 的总体)是否相等即可。
bc bc b c 2 2 (A T) b c 2 2 2 bc bc b c T 2 2
处理 2
+ a c m1=a+c b d m2=b+d
合计 n1=a+b n2=c+d n=a+b+c+d (固定值)
设计特点:两份样本实质上是一样的,不是互相独立的。 研究目的:推断两处理的阳性概率有无差别。 a+b 处理1的阳性率= n a+c 处理2的阳性率= n
配对χ2检验的基本原理:
可见,两种方法阳性率的差别只与b和 c
作业
• • • • P347页 课题四 课题五 课题六
计数资料常用检验方法
![计数资料常用检验方法](https://img.taocdn.com/s3/m/20f939e4c67da26925c52cc58bd63186bceb92cb.png)
计数资料行×列(R ×C)表卡方检验 公式:
X2=35.81> , 差异有显著性,P<0.01,可以认为三组疗效不同,中西药结合组较其他两组高,若要进一步作两两比较,可分成三个四格表再进行比较。
中西药结合组
组别
有效
无效
合计
46
12
02
Pearson列联系数(P)
Cramer(修正)列联系数(C)
演讲人姓名
列联表计数资料的相关分析数据格式 (PEMS软件包)
卡方值 = 74.4015
自由度 v = 4
概率 P = 0.0000
Pearson 列联系数 = 0.2597
各个格子的理论数均大于 5
结果
列联表计数资料的相关分析.一致性检验.Kappa值(PEMS软件包)
66
12
78
0.05,差异无统计学意义,可以认为甲、乙两组有效率相同,如用X2值一般公式计算X2=2.85
(3) 、当总例数n>40,但有理论数0<T<1,或总例数n<40,有实际观察数为0的情况,此时应采用确切概率法直接算出概率P
两种药物治疗结果
组别
治愈
未愈
合计
新药
5(1.82)
、当总例数n>40,1<T<5时,由于理论数偏小,往往使得X2值偏大,此时可应用四格表X2值校正公式:
甲 、乙两组有效率比较
表中有一个理论数 4.62((30×12)/78=4.62)大于1小于5,可采用X2值校正公式计算
分组
有效数
无效数
合计数
甲组
38
10
48
乙组
SPSS超详细操作:卡方检验(R×C列联表)
![SPSS超详细操作:卡方检验(R×C列联表)](https://img.taocdn.com/s3/m/304b8d23bc64783e0912a21614791711cc7979a2.png)
SPSS超详细操作:卡⽅检验(R×C列联表)医咖会之前推送过⼀些卡⽅检验相关的⽂章,包括:卡⽅检验(2x2)、卡⽅检验(2xC)、配对卡⽅检验、分层卡⽅检验等。
今天我们再和⼤家分享⼀下,如何⽤SPSS来做RxC列联表的卡⽅检验。
⼀、问题与数据研究者拟分析购房⼈与购房类型的关系,共招募了在过去12个⽉中有过购房记录的333位受试者,收集了购房⼈类型(buyer_type)和房屋类型(property_type)的变量信息。
其中研究对象类型按照单⾝男性(single male)、单⾝⼥性(single female)、已婚两⼈(married couple)和多⼈家庭(family)分类;房屋类型按照楼房(flat)、平房(bungalow)、独栋别墅(detached house)和联排别墅(terrace)分类,部分数据如下图。
其中,Individual scores for each paticipant(左图)列出了每⼀个研究对象的情况,⽽Total count data (frequencies)(右图)则是对相同情况研究对象的数据进⾏了汇总。
⼆、对问题的分析研究者想分析多种购房⼈类型与多种房屋类型的关系,建议使⽤卡⽅检验(R×C),但需要先满⾜3项假设:假设1:存在两个⽆序多分类变量,如本研究中购房⼈类型和房屋类型均为⽆序分类变量。
假设2:具有相互独⽴的观测值,如本研究中各位研究对象的信息都是独⽴的,不会相互⼲扰。
假设3:样本量⾜够⼤,最⼩的样本量要求为分析中的任⼀期望频数⼤于5。
本研究数据符合假设1和假设2,那么应该如何检验假设3,并进⾏卡⽅检验(R×C)呢?三、SPSS操作1. 数据加权如果数据是汇总格式(如上图中的Total count data),则在进⾏卡⽅检验之前,需要先对数据加权。
如果数据是个案格式(如上图中的Individual scores for each paticipant),则可以跳过“数据加权”步骤,直接进⾏卡⽅检验的SPSS操作。
卡方检验
![卡方检验](https://img.taocdn.com/s3/m/f3b4b50be87101f69e3195f8.png)
实际(A) 理论(T)
+ 127 70.168
231 287.832
合计 358 358
Chi-Square =57.252
关联性分析
• 行×列表的关联
R × C表资料Chi-Square检验注意
• • • • 应用条件; 多重比较问题 关联性分析问题 其他
– 双向无序资料的分析 – 单向有序资料的分析 – 双向有序、属性不同资料的分析 – 双向有序、属性相同资料的分析
四格表资料的确切概率法
(a b)!(c d )!(a c)!(b d )! p a!b!c!d!n!
两个样本构成比比较,有2行C列,称为2×C表 多个样本构成比比较,有R 行C列,称为R ×C表
检验统计量
A n( 1) nR nC
2
2
(行数 1)(列数 1)
多个样本率(比)比较的实例
多个样本率间的多重比较
• Bonferroni法 基本思想:为保证犯第I类错误的概率总和不 超过ALPHA,调整每一两两比较的检验水准
第一节
2× 2表
2
检验
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价) 资料:两样本的两分类个体数排列成四 格表资料
四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
2
分布是一连续型分布,而四格
2
表资料属离散型分布,由此计算得 的 2 统计量的抽样分布亦呈离散
rxc列联表卡方检验步骤
![rxc列联表卡方检验步骤](https://img.taocdn.com/s3/m/71fd3ff868dc5022aaea998fcc22bcd126ff421e.png)
r×c列联表卡方检验步骤如下:
1.数据收集:首先,你需要收集数据。
数据通常以列联表的形式
呈现,其中行代表一个分类变量,列代表另一个分类变量。
2.构建期望频数表:接下来,你需要构建期望频数表。
这可以通
过以下公式完成:
期望频数=行数×列数总样本数期望频数=总样本数行数×列数
3.计算卡方值:然后,你可以使用卡方检验公式来计算卡方值。
这个公式比较了每个单元格的实际频数与期望频数之间的差异。
卡方值=∑(实际频数−期望频数)2期望频数卡方值=∑期望频数
(实际频数−期望频数)2
4.决定显著性水平:显著性水平(通常为α)决定了你愿意接受的
错误的阳性结论的概率。
常见的显著性水平有0.05和0.01。
5.解读结果:如果卡方值大于临界值(由显著性水平和自由度决
定),则可以拒绝零假设,认为两个分类变量之间存在关系。
否
则,不能拒绝零假设,认为两个分类变量之间可能没有关系。
6.考虑其他因素:在解读结果时,还需要考虑其他因素,如列联
表的大小、效应大小等。
通过以上步骤,你可以进行r×c列联表卡方检验并得出结论。
(仅供参考)如何在SAS中实现R×C列联表的两两比较
![(仅供参考)如何在SAS中实现R×C列联表的两两比较](https://img.taocdn.com/s3/m/b728748a08a1284ac9504348.png)
A14-如何在SAS中实现R×C列联表的两两比较内容来自网络,侵删在分析R×C列联表时,在卡方检验有统计意义的情况下常常需要做进一步的多重比较。
可以采用的方法为1)卡方分割(具体见本人另外一篇文章《R×C行列表卡方值分割的概念及运用》)将原表卡方值分割成独立的子卡方值,分割后的子卡方值和对应的自由度相加会和原表的卡方值和自由度相等。
2)或者采用彼此之间非独立的两两比较。
但是两两比较的卡方值和对应的自由度相加不会等于原表卡方值和自由度,所以此类比较不能称为卡方分割法。
尽管后者更为灵活但需要调整多重比较的次数以避免增加第一类错误。
本文将具体讲解如何在SAS中实现R×C列联表的两两比较。
1.研究数据-血型和疾病类型假定某医学课题想研究血型(O,A,B)和疾病类型(Peptic Ulcer, Gastric Cancer,Control)是否相互关联, 具体临床数据见表1。
表1:血型和疾病类型行列表Disease TypeBloodType Peptic Ulcer(I)-1 Gastric Cancer(II)-2 Control(III)-3 Total O-1983(14.024)383(4.9139)2892(1.4159)4258A-2679(9.0743)416(4.5484)2625(0.679)3720B-3134(4.6663)84(0.2695)570(0.9519)788Totals17968836087N=87662.初步分析我们先用SAS/PROC FREQ 和PROC CORRESP 先对数据做初步的分析,来判断行列变量之间的关系。
CELLCHI2 选项是计算按公式2-1计算每个单元格在总体值的组成。
2χij ijijji E OE C 2,)(-=(2-1)proc freq data=paper14;weight count;table r*c/chisq cellchi2nopercent;run;proc corresp data=paper14;weight count;les r, c;tabrun;表2 – 卡方检验结果Table of r by cr cFrequencyCell Chi-SquareRow PctCol Pct 123Total198314.02423.0954.733834.91398.9943.3728921.415967.9247.51425826799.074318.2537.814164.548411.1847.1126250.67970.5643.12372031344.666317.017.46840.269510.669.515700.951972.349.36788Total 179688360878766 Statistics for Table of r by cStatistic DF Value Prob ------------------------------------------------------ Chi-Square 4 40.5434 <.0001 Likelihood Ratio Chi-Square 4 40.6401 <.0001 Mantel-Haenszel Chi-Square 1 21.0035 <.0001 Sample Size = 8766从表2中可以看出第1行(血型O)的卡方检验分值在所有行中所占比重最高((14.024+4.9139+1.4159)/40.5434≈50%);第1列(Peptic Ulcer(I))的卡方检验分值在所有列中所占比重最高((14.024+9.0743+4.6663)/40.5434≈68.5%)。
卡方检验
![卡方检验](https://img.taocdn.com/s3/m/ab4555ddad51f01dc281f12d.png)
第九章 2χ检验[教学要求]掌握:单个样本分布的拟合优度检验;独立样本2×2列联表资料的χ2检验;独立样本R ×C 列联表资料的χ2检验;配对2×2列联表资料的χ2检验。
熟悉:配对R × R 列联表资料的χ2检验;四格表资料的Fisher 确切概率法。
了解:连续型随机变量的χ2分布;分类数据χ2检验的基本思想。
[重点难点]第一节2χ分布和拟合优度检验一、χ2分布基本概念:χ2分布是一种连续型随机变量的概率分布,如果12,,,Z Z Z ν 是v 个相互独立的标准正态分布随机变量,则22221νZ Z Z +++ 的分布称为服从自由度为ν的χ2分布。
2χ分布的概率密度曲线的形状依赖于自由度ν的大小。
二、拟合优度χ2检验的基本思想拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理论分布。
2χ值反映了样本实际频率分布与理论分布的符合程度。
三、χ2检验的基本公式大样本时检验统计量∑=-=ki ii i T T A 122)(χ近似地服从χ2分布,自由度为ν= k -1-(计算T i 时利用样本资料估计的参数个数)其中,A i 和T i 分别为实际观察频数和0H 成立时的理论频数,k 为频数分布的类别总数。
四、拟合优度χ2检验注意事项1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。
2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为∑=--=ki ii i T T A 122)5.0(χ第二节 独立样本2×2列联表资料的χ2检验一、2×2列联表资料χ2检验目的两独立样本率差异的比较。
即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。
二、统计量计算公式可直接使用χ2检验基本公式也可使用等价的专用公式或校正公式。
专用公式22()()()()()ad bc n a b c d a c b d χ-=++++校正公式22(||/2)()()()()ad bc n n a b c d a c b d χ--=++++自由度ν=1。
医学统计学第3版 卡方检验
![医学统计学第3版 卡方检验](https://img.taocdn.com/s3/m/8e6e3b64f46527d3240ce091.png)
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量:
2
应用:定性资料
8
第一节 2分布和拟合优度检验
一、2分布
2分布是一种连续型随机变量的概率分布。
如果Z服从标准正态分布,那么Z2服从自由度为
1的2分布, 其概率密度在(0,+∞)区间上表 现为L型,如图7-1对应于自由度=1的曲线,取 较小值的可能性较大,取较大值的可能性较小。
9
χ2分布(chi-square distribution)
0.5 0.4 0.3
1 f ( ) 2( / 2) 2
2
2
( / 2 1)
e
2 / 2
ß Ý · ×
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
13
拟合优度检验
2.计算检验统计量
实际观察到的频数用A表示,根据H0确定的 理论频数用T表示,则大样本时统计量,自由度 =K-1-(利用的参数个数)
2 ( A T ) 2 i i Ti i 1 k
( A T )2 T
2
14
拟合优度检验
以上两个公式2检验的基本公式,所有其它
11
2分布
图7-1, 2分布的形状依赖于自由度ν的大小, 当自由度ν>2时,随着ν的增加,曲线逐渐 趋于对称,当自由度ν趋于∞时,2分布逼 近正态分布。各种自由度的2分布右侧尾 2 部面积为α时的临界值记为 ,
R×C表卡方检验
![R×C表卡方检验](https://img.taocdn.com/s3/m/6e2e7e655ef7ba0d4b733b42.png)
2020年月27日
(1) 新复方与安慰剂比较:列出表A,
2=30.50,P=0.000,按α’=0.025水准
拒绝H0,可以认为新复方治疗高血压有效。
表A 新复方与安慰剂比较
药物
有效
无效
新复方
35
5
安慰剂
7
25
合计
42
30
合计 40 32 72
2020年4月27日
(2)降压药与安慰剂比较:列出表B,
2020年4月27日
R×C表2 检验应注意的问题
❖2.多组比较时,若效应有强弱的等级,如+,++
,+++,最好采用后面的非参数检验方法。 2检
验只能反映其构成比有无差异,不能比较效应的 平均水平。 ❖3.行列两种属性皆有序时,可考虑趋势检验或 等级相关分析。
❖4.多个率比较的2检验,结论为拒绝H0时、需
2020年4月27日
相关性分析
结果分析: Spearman等级相关系数=0.214,近似概率P
=0.001<0.05,可认为行和列两等级变量之间的总体相关系 数不等于0,两变量之间有一定的相关关系。
2020年4月27日
线性趋势检验
结果分析: MH 2 =10.281,近似概率P=0.001<0.05,
拒绝H0,可以认为三种疗法效果不同。
2020年4月27日
三、两组或多组构成比的比较
例8-5 用三种治疗方法治疗199例消化性 溃疡住院病人资料如表8-6,试分析三组 病人按4种中医分型的构成比有无差别。
2020年4月27日
表8-6 三种消化性溃疡住院病人四种证型的构成
中医分型 疗法 肝胃不和 胃阴不和 脾胃虚寒 寒热夹杂 合计
R×C表卡方检验
![R×C表卡方检验](https://img.taocdn.com/s3/m/adb627372af90242a895e5d6.png)
表8-6 三种消化性溃疡住院病人四种证型的构成
中医分型 疗法 肝胃不和 胃阴不和 脾胃虚寒 寒热夹杂 合计
生胃宁素 7
片ቤተ መጻሕፍቲ ባይዱ
中药组
4
15
29
37
88
12
16
19
51
西药组
3
5
15
37
60
合计
14
32
60
93
199
2020年2月29日
H0:三种疗法病人的中医分型总体构成相同( 疗法与证型无关)
有效
无效
合计
有效率 (%)
新复方
35
5
40
87.50
降压药
20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.70
2020年2月29日
❖ H0:π1=π2=π3,三种药物治疗高血压病总体 有效率相等
❖ H1:三个总体率不全相等 α=0.05
2
102
352 62 40
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
2020年2月29日
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):中医分型 击Statistics按钮选择Chi-square。
52 40 40
232 40 32
1
32.736
df (3 1) (2 1) 2
最新第四 r×c表卡方检验 第五 fisher确切概率检验ppt课件
![最新第四 r×c表卡方检验 第五 fisher确切概率检验ppt课件](https://img.taocdn.com/s3/m/dfdb13f4aaea998fcc220ed8.png)
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
①两只大鼠均死亡(甲+乙+)数(a); ②两只均生存(甲-乙-)数(d); ③其中一只死亡(甲+乙- )数(b); ④其中一只死亡(甲-乙+)数 (c)。
表7-7 两组患者尿路疼痛原因的分布
分 组
治 疗 组 对 照 组 合 计
尿 路 感 染 34 29 63
尿 路 疼 痛 原 因 器 械 损 伤 29 35 64
其 它 9 8 17
合 计
72 72 144
2. 求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有
2 144(1)13.40222929222923258 726创3创7创2647217726372647217
=0.05
已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有
2 c
(12 3 1)2 12 3
4.27
查附表
8,
2 0.025,1
5.02
,
2 0.05,1
3.84
,得
0.025<P<0.05,按
=0.05
水准拒绝
H0,接
受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 b>c)。
小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
由公式(7-1)还可以看出: 2 值的大小还取决于( A T ) 2
卡方检验
![卡方检验](https://img.taocdn.com/s3/m/1d460af20c22590102029d7d.png)
表7-1 两种疗法疗效的比较的四格表(four-fold table)
分组
试验组 对照组 合计
疗效
有效 无效
99
5
75
21
174
26
合计
104 96 200
有效率
95.20% 78.13% 87.00%
πA = πB
pA ≠ pB
pA = pB?
πA ≠ πB ?
表7-1 两种疗法疗效的比较的四格表(four-fold table)
u 2 仅在自由度为1时
适用条件
普通四格表资料的适用条件:
1. n≥40,且T≥5 专用公式勿需校正 2. n≥40,而1≤T<5时,用连续性校正公式
——Yates校正公式 一种建议:条件(1)亦做校正。 3. 当n<40或T<1时,Fisher精确检验 (Fisher exact test) 4. χ2接近χ2界值时或P≈0.05时, 亦用Fisher精确概率法
T11= (a+b)×pc= (a+b)×[(a+c.)/ n]=nRnC/n =90.48 T12=13.52 T21=83.52 T22=12.48
如果假设检验成立,A与T不应该相差太大。 理论上可以证明:
2
(A T )2 T
服从χ2分布(附后)。 计算出χ2值后,查χ2界值表判断这么大的χ2
例7-2
1. 建立假设,确定检验水准
H0:π1=π2 H1:π1≠π2
α=0.05
2. 计算检验统计量
– 判断适用条件:n? – 正确选用公式
Tmin?
3. 确定P值,作出推断结论
Fisher确切概率法
以7-4为例 1. 建立假设,确定检验水准 2. 检验统计量——直接计算概率
R×C表卡方检验
![R×C表卡方检验](https://img.taocdn.com/s3/m/313d04466c85ec3a87c2c55d.png)
❖ (3) 2检验
从菜单选择
Analyze→Descriptive Statistics→Crosstable
指定 Row(s):疗法 Columns(s):疗效 击Statistics按钮选择Chi-square。
输出结果
结果分析:Pearson 2 =32.736,双侧P=0.000<0.05,
9.60
df (3 1) (4 1) 6
2 =9.60< 2 0.1,6=10.64,P>0.1,
按α=0.05水准,不拒绝H0,即不能认为三组病 人中医各型的构成比不同.
1.建立数据文件
❖ 在SPSS数据编辑窗,建立数据文件Li8-4.sav。
❖ 行变量:“疗法”,Values为:1=“生胃宁素 片”,2=“中药组” ,3=“西药组” ;
T
nR nC
❖ 自由度= (R1)(C1)
二、多个样本率的比较
❖ 例8-4 ( P419题18)研究新复方治疗高血压病 效果的临床试验,并与标准对照药物降压片和 安慰剂作对照,结果如表8-5,比较三组效果。
表8-5 三种药物治疗高血压病的有效率
组别
疗效
有效
无效
合计
有效率 (%)
新复方
35
5
40
87.50
拒绝H0,可以认为三种疗法效果不同。
三、两组或多组构成比的比较
❖ 例8-5 用三种治疗方法治疗199例消化性溃疡 住院病人资料如表8-6,试分析三组病人按4 种中医分型的构成比有无差别。
表8-6 三种消化性溃疡住院病人四种证型的构成
中医分型 疗法 肝胃不和 胃阴不和 脾胃虚寒 寒热夹杂 合计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 =9.60< 2 0.1,6=10.64,P>0.1, 按α=0.0病5水人准中,医不各拒型绝的H构0成,比即不不同能.认为三组
Q Technology limited
1.建立数据文件
Q Tech
在SPSS数据编辑窗,建立数据文件Li8-4.sav。
行变量:“疗法”,Values为:1=“生胃宁素 片”,2=“中药组” ,3=“西药组” ;
Q Technology limited
Q Tech
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):疗效 击Statistics按钮选择Chi-square。
Q Technology limited
血压病效果不同。
Q Technology limited
1.建立数据文件
Q Tech
在SPSS数据编辑窗,建立数据文件题18.sav 。
行变量:“组别”,Values为:1=“新复方 ”,2=“降压片” ,3=“安慰剂” ;
列变量:“疗效”,Values为:1=“有效” ,2=“无效;
频数变量:“频数”。
Q Technology limited
2. spss操作过程
Q Tech
(1)在spss中调出数据文件题18.sav (2)频数变量加权。 从菜单选择
Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频 数”,即指定该变量为频数变量
Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频 数”,即指定该变量为频数变量
Q Technology limited
Q Tech
(3) 2检验
从菜单选择 Analyze→Descriptive
Statistics→Crosstable 指定 Row(s):疗法 Columns(s):中医分型 击Statistics按钮选择Chi-square。
Q Technology limited
Q Tech
表8-6 三种消化性溃疡住院病人四种证型的构成
中医分型 疗法 肝胃不和 胃阴不和 脾药组
4
15
29
37
12
16
19
西药组
3
5
15
37
合计
14
32
60
93
合计 88
51 60 199
Q Technology limited
Q Technology limited
Q Tech
表8-5 三种药物治疗高血压病的有效率
组别 新复方
疗效
有效
无效
35
5
合计 40
有效率 (%)
87.50
降压药
20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.70
Q Technology limited
H0:π1=π2=π3,三种药物治疗高血压病总体有Q Tech 效率相等
简称R×C表。
R×C表2检验的应用形式有:
1. 多个样本率的比较(如例p419题18的 3×2表)
2. 两组或多组构成比的比较(如例8-4的 3×4表)
Q Technology limited
一、R×C 表2 检验通用公式 Q Tech
理论频数T
nR nC
n 代入基本公式
可推导出:
输出结果 Q Tech
结果分析:Pearson 2 =32.736,双侧P= 0.000<0.05,拒绝H0,可以认为三种疗法效果不同。
Q Technology limited
三、两组或多组构成比的比较 Q Tech
例8-5 用三种治疗方法治疗199例消化 性溃疡住院病人资料如表8-6,试分析 三组病人按4种中医分型的构成比有无 差别。
基本公式 通用公式
2 ( A T 2 ) 2 n( A2 1)
T
nR nC
自由度= (R1)(C1)
Q Technology limited
二、多个样本率的比较
Q Tech
例8-4 ( P419题18)研究新复方治疗高 血压病效果的临床试验,并与标准对照 药物降压片和安慰剂作对照,结果如表 8-5,比较三组效果。
Q Tech
第三节 R×C表资料的 2检验
R×C表卡方检验的通用公式
多个样本率的比较 两组或多组构成比的比较
R×C表卡方检验应注意的问题
Q Technology limited
R×C列联表
Q Tech
前述四格表,即2×2表,是最简单的一种 R×C表形式。因为其基本数据有R行C列, 故通称R×C列联表(contingency table) ,
H0:三种疗法病人的中医分型总体构成相同( Q Tech 疗法与证型无关)
H1:三组病人中医分型总体构成不全相同(疗 法与证型有关) ,α=0.05
2
199
72 88 14
152 88 32
372 60 93
1
9.60
df (3 1) (4 1) 6
Q Technology limited
输出结果 Q Tech
理论数小于5的格子数为2(占16.7%),最小理论数为3.59
Q Technology limited
结果分析
Q Tech
表下方提示理论频数小于5的单元格有2 个,最小理论频数为3.59<5,说明可用 Pearson卡方检验。
列变量:“中医分型”,Values为:1=“肝胃 不和”,2=“胃阴不和”,3=“脾胃虚寒”, 4=“寒热夹杂”;
频数变量:“频数”。
Q Technology limited
2. spss操作过程
Q Tech
(1)在spss中调出数据文件Li84.sav
(2)频数变量加权。 从菜单选择
H1:三个总体率不全相等 α=0.05
2
102
352 62 40
52 40 40
232 40 32
1
32.736
df (3 1) (2 1) 2
2 =32.736 > 2 0.005,2=10.60,P<0.005,按
α=0.05水准拒绝H0,即可以认为三种药物治疗高