X2检验的基本思想

合集下载

医学统计学之卡方x2检验

医学统计学之卡方x2检验

举例
买彩票
奖项 中奖概率
T
A
一等 1% 10 0
0
二等 5% 50 0
0
三等 10% 100 20
2%
四等 20% 200 180
18%
五等 64% 640 800
80%
二、基本原理
基本思想是检验实际频数和理论频数的差别是否 由抽样误差所引起的,由样本率来推断总体率。
x2反映了实际频数于理论频数的吻合程度,x2值
α=0.05。
T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8
(2)求检验统计量值
2 (20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 8.40
作χ2检验后所得概率P接近检验水准α,需要
计数资料的统计推断
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
2 检验的应用
①检验两个样本率之间差别的显著性; ②检验多个样本率或构成比之间差别的
显著性; ③配对计数资料的比较; ④检验两个双向无序分类变量是否存在
关联。
某医生想观察一种新药对流感的预防效 果,进行了如下的研究,问此药是否有 效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220

X2检验-spss

X2检验-spss

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。

在分析时可以产生二维至n维列联表,并计算相应的百分数指标。

统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。

如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。

Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

医学统计学第二版高等教育出版社课后习题答案

医学统计学第二版高等教育出版社课后习题答案

第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能够根据样本估计。

显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

医学统计学定性资料的统计分析-χ2检验

医学统计学定性资料的统计分析-χ2检验

29 41
48.28 39.02

H0:1=2; H1:12; =0.05。 本例a格的理论频数最小,T11=1216/41=4.68<5, n>40,故考虑用校正公式计算2 值。
2 C
( 2 15 1014 41/ 2) 12 2916 25
2
41
2 2.36 0.05,1 3.84
(二)2检验的基本思想
例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出 血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例 发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 表中基本数据是a,b,c,d,其余数 据都是从这四个基本数据推算出 表4-6-1 131例胃癌患者治疗后5年存活率的比较 来的,这种资料称为四格表资料。 存活率(%) 存活数 死亡数 合计治疗数
(即多个率或构成比的比较)
上述两个样本率比较的资料,其基本数据只 有2行2列,称为2 ×2表或四格表资料。当基 本数据超过2行或2列的资料,就称为行×列 表或 R × C表资料。行×列表资料的2检验 主要用于多个样本率或多个构成比之间的比 较。
2 值的计算可按前述基本公式( 2 =∑(A-
2

计算统计量Z :
z
0.33 0.25
0.25 (1 0.25) / 300
3.20

. 确定P 值和判断结果:
Z0.01=2.326,得P<0.01,按=0.05水 准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于 20%,即老年患者较一般患者易出血.
(二)两样本率的比较
3.确定P 和判断结果:=(2-1)×(2-1)= 1;查2界 值表,20.05=3.84, 所以P>0.05,按=0.05水准不拒绝H0,差别无统计 学意义。故尚不能认为单纯手术疗法与联合疗法对胃 癌患者治疗效果有差别。

第7章 x2检验

第7章 x2检验

例7-3:某实验室采用两种方法对58名可疑 红斑狼疮患者的血清抗体进行测定,问:两 方法测定结果阳性检出率是否有差别?
表7-3 两种方法的检测结果 免疫荧光法 + - 乳胶凝集法
合计
+ 11(a) 2(c) 13
- 12(b) 33(d) 45
合计 23 35
58
检测结果一致: (a)免+乳+ ,(d) 免-乳检测结果不一致:(b) 免+乳- , (c)免-乳+ 比较两种检测方法有无差异时,只需比较不一致的 结果 。
感染率 18.18 45.45 27.27
一、基本思想
1.各组合概率Pi的计算 周边合计不变的条件下,表内4个实际频数 变动的组合数共有“周边合计中最小数+1”
表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计 9 24 33 27.27
公式:
b c 40
2 ( b c ) 2 x , bc b c 40
v 1
(7 7)
(| b c | 1) x , bc
2 2
v 1
(7 8)
1.建立检验的假设,确定检验水准 H0:b=c ;H1:b c =0.05 2.计算 χ2 统计量
b+c=2+12=14<40
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
2.累计概率P的计算 1)单侧检验:现有样本四格表及其以左的所 有四格表组合的累积概率为左侧概率(PL); 现有样本四格表及其以右的所有四格表组合的 累积概率为右侧概率(PR)。 H1为π1>π2,则P单侧 =PR; 若H1为π1<π2,则P单侧=PL 2.双侧检验: 计算满足Pi ≤P*条件下的各种组合之四格表 的累计概率。

X2检验

X2检验

基本步骤:
提出假设 计算理论次数 计算卡方(基本公式) 计算自由度 结合自由度与显著水平找出卡方临界值 比较数据得出结论
配合度检验
实际频数(观察频数):在实验或调查中得到的计数资料。
理论次数(期望次数):是指根据概率原理、某种理论、某种 理论次数分布或经验次数分布计算出来的次数。
当单元格的人数过少时:
单元格合并法(如调整变量的分类方式);
增加样本数;
去除样本法(次数少的类别不具有研究价值时,但推广结论时 要注意);
使用校正公式(只有两项分类的配合度检验,应用连续性校正 公式计算;如果三项分类及以上时出现某一单元格内的理论次 数小于5,用基本公式即可)。
卡方检验的类别
f0i 2 fxifyi
1)
同质性检验
一、单因素分类数据的同质性检验 二、列联表形式的同质性检验
同质性检验可以分析几种因素之间是否真有实质上的 差异,或者判断几次重复实验的结果是否同质。
是对两个样本同一个变量的分布状况的检验,是对几 个样本数据是否同质作出判断。
1.计算各个样本组的X2值和自由度
性别
学业水平 中等以上 中等以下 男 23(A) 17(B) 40(A+B) 女 28(C) 22(D) 50(C+D)
51(A+C) 39(B+D) 90(A+B+C+D)
2.相关样本四格表卡方检验
(A D )2
2 A D
A,D为四格表中两次 实验或调查中分类项 目不同的那两个格的 实计次数。
X2检验
简单讲,卡方检验方法检验的是样本观测次数(或百分比)与 理论或总体次数(或百分比)的差异性。
应用X2检验分析数据时,对计数数据总体的分布形态不作任何 假设,因此,X2验被视为是非参数检验的一种。

整理后的2008广东省统计学精华和部分选择题答案![1]

整理后的2008广东省统计学精华和部分选择题答案![1]

2008广东省统计学老师点题部分和答案选择题1、配对设计t检验的统计假设为:B. 差数的均数来自μ=0的总体2、两组比较作t检验的统计假设为:D.X1,X2来自μ1=μ2的两个总体3、假设检验中当P=0.05时,结论为:A.差异有统计学意义4、为了由样本推断总体,样本应当是:E. 总体中有代表性的一部分5、计量资料、计数资料和等级资料的关系有:C.等级资料兼有计量资料和计数资料的一些性质6、某研究者准备通过分析800人的血压资料以评价当地高血压患病情况,问可以可以考虑将血压测量值按哪种变量类型进行处理:D.以上均可(A.计量资料B计数资料.C.等级资料)7、概率是描述某随机事件发生可能性大小的数值,以下对概率的描述哪项错误:E.其值必须由某一统计量对应得概率分布表中得到8、以下哪些属于计量资料:ABCDE(A.身高的测定值;B.体重的测定值;C.血压的测定值;D.脉搏数;E.白细胞数)9、均数和标准差的关系是:E. s越小,x对各变量值的代表性越好10、描述一组偏态分布资料的变异度,以下列哪个指标为好:B.四分位数间距11、正态曲线下、横轴上,从均数μ到μ+1.96σ的面积为:D.47.5%12、计算某抗体滴度的平均水平,一般宜选择:B.几何均数13、用均数与标准差可全面描述下列哪种质料的特征:C.正态分布和近似正态分布14、比较身高和体重两组数据变异度大小宜采用:A.变异系数15、计算124例链球菌中毒的平均潜伏期,一般宜选择:C.中位数16、óx表示:C.样本均数的标准差17、单因素方差分析中,若处理因素无作用,则理论上应该有:C.F=118、两样本均数差别的假设检验用t检验的条件是:B.两总体方差相等;E.两总体均符合正态分布19、标准误的应用包括:B.估计总体均数的可信区间;E.表示抽样误差的大小20、行×列表的X平方检验应注意:B.若有五分之一以上格子的理论数小于5,则要考虑合理并组21、在医学科研中率的标准化,经常采用全国人口的性别年龄构成,其理由是:A.这样便于进行比较22、某医院的资料,计算了各种疾病所占的比例,该指标为:B.构成比23、某医师欲比较三种疗法治疗某病的效果,中药加针灸组20例,其中15例好转,单纯中药组治疗21例,其中12例好转,西药组治疗23例其中18例好转。

X2检验

X2检验

第七章X2检验Chi-square testX2分布——计数资料第一节四格表资料的X2检验一、X2检验的基本思想1、X2分布(1)X2分布是一种连续型分布:X2分布(chi-squaredistribution)只有一个参数,即自由度。

当自由度V《2时,曲线呈L形随着V的增加,曲线逐渐趋于对称当自由度V—00无穷时,X2分布趋近正态分布(2)X2分布的一个基本性质是它的可加性:(X1+X2)——X2(V1+V2)(3)X2分布的界值:X2值愈大,P值愈小;反之,X2值愈小,P值愈大。

2、X2检验的基本思想四格表(fourfold table)资料PearsonX2——X2={Σ(A-T)2/T } V =(行数-1)(列数-1)A为实际频数(actual frequency)T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。

T(RC)=nRnC/nT(RC)为第R行(row)第C列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总列数。

X2值反映了实际频数与理论频数的吻合程度。

3、X2检验的步骤H0::π1=π2,即试验组与对照组——总体有效率相等H1::π1≠π2,即——————————————不等ɑ=0.05——T值——V——P值二、四格表资料X2检验的专用公式X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c)a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d.四格表资料X2检验的校正公式三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c)(1)当n》40且所有的T》5时,用X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,用四格表资料X2检验的校正公式。

(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。

x2检验法

x2检验法

2χ检验法2χ检验法是一种针对总体分布的假设检验。

当总体X 的分布未知时,我们根据一组样本12,,...,nx x x 的值检验关于总体分布的假设:0H :总体X 的分布函数为F(x);(1)若总体X 是离散的,则以上假设相当于0H :总体X 的分布率为()i i P X x p ==; (2)若总体X 是连续的,则以上假设相当于0H :总体X 的概率密度为()f x ;基本思想:将随机实验可能的结果的全体Ω分成k 个互不相容的事件12,,...,,()k i i A A A p A p =。

现重复作同一实验n 次,记事件A i 出现的频率为/i f n ,则当假设H 0为真且n 足够大时,/i f n 与i p 之间应该差异很小。

定理:若n 充分大(n>=50),则当H 0为真时总有2221()(1)ki i i if np k r np χχ=-=--∑,r 为被估计的参数的个数。

结论:对于假设0H (总体X 的分布函数为F(x)),当2221()(1)ki i i if np k r np αχχ=-=--≥∑时,我们认为原假设0H 不成立。

(α称为置信水平,通常取α=0.05)例1.婴儿出生时刻某医院为了研究一天中婴儿出生时刻的分布规律,对2880名婴儿进行了调查,据此分析婴儿出生时解:0H :婴儿出生时刻服从一天内的均匀分布。

记A i 表示婴儿出生时刻落在第i 小时(i=0,1,…,23),则对均匀分布有()1/24i P A =。

利用Excel 很容易计算出221()40.8333ki i i if np np χ=-==∑,在置信水平1-α=0.95下,利用Mathematica计算20.05(23)χ(若查表则更快捷)如下:调入统计函数库 取2(23)χ分布 调入代数函数库解不等式结果为35.1725验证所得结果由于40.8333>35.1725,故假设H 0不成立,即认为婴儿出生时刻不服从均匀分布。

【统计分析】x2检验

【统计分析】x2检验

表 10-6
三种药物治疗老年 2 型糖尿病的疗效
有效
无效
合计
35
21
56
17
13
30
29
1
30
81
35
116
有效率(%) 62.5 56.7 96.7 69.8
单向有序R×C表
有两种形式
一种是R×C表中的分组变量(如年龄组)是有序的, 而指标变量(如传染病的类型)是无序的。其研究目 的通常是分析不同年龄组各种传染病的构成情况,此 种单向有序R×C表可用行×列表资料 χ2 检验进行分 析。
α=0.05
2. 计算检验统计
2 b c 12 2 11 12 4.92
bc
2 11
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验
公式与普通四格表检验公式相同
1. 建立假设 H0:两法的结果无相关 H1:两法的结果相关
α=0.05 2. 计算检验统计
2
a
ad bc2 n ca bc d b
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
双向无序R×C表
若研究目的为多个样本率(构成比)的比较, 可用行×列表资料 χ2 检验; 若研究目的为分析两个分类变量直接有无关联 性,可用行×列表资料 χ2 检验及列联系数进 行分析。
组别 降糖 1 号 玉泉丸 格列本脲 合计
x2检验基本思想
组别
+

合计
A
a
B
c
合计
m1

007 第七章 X2检验

007 第七章 X2检验

表7-4 两种方法检验结果 甲法(病理) + + - 合计 130(a) 11(c) 141 乙 法(超声) - 75(b) 41 (d) 116 205 52 257 合计
这是配对设计计数资料,表中两法的差别是由b和 c 两格数据来反映。总体中 b 和 c 对应的数据可用 B 和C 表示。
配对X2检验计算公式:


H0 :胃十二指肠疾病患者与健康输血员血型总体构成比相同 H1 :胃十二指肠疾病患者与健康输血员血型总体构成比不同 α=0.05 按公式
有效率(%)
治疗组 对照组 合 计
200 190 390 160 148
160 148 308 160 148
80.00 77.89 78.97 40 42
200 190
二、X2检验基本思想 X2 值的计算方法(通用公式):
2 ( A T ) x2 T
式中A为实际数,T为理论数,是根据H0的假设 推算出来。
2 ( b c ) x2 , v 1 bc
若b+c<40:
2 (| b c | 1) x2 , v 1 bc
H0:两种方法总体检出率相等,即B=C; H1:两种方法总体检出率不相等,即B≠C; α=0.05
2 2 ( b c ) (75 11) x2 47.63 bc 75 11
疗法 阴转人数 未阴转人数 合计 阴转率(%)
───────────────────────────── 甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7 ───────────────────────────── 合计 71 62 133 53.4 ━━━━━━━━━━━━━━━━━━━━━

医学统计学X2检验

医学统计学X2检验
2
2
(68 30 22 58) 178 2.00 90 88 126 52
2
3、查X2 界值表确定P值 按 V =1,查附表5,X2界值表得: X20.05,1 =3.84 X20. 1,1 =2.71 X20.25,1 =1.32 X20.1,1 > X2 > X20.25,1, 0.25 > P>0.1 4、推断结论
63.71
26.29
62.29
25.71
= 2.00
3、查X2 界值表确定P值 按 V =1,查附表5,X2界值表得: X20.05,1 =3.84 X20. 1,1 =2.71 X20.25,1 =1.32 X20.1,1 > X2 > X20.25,1, 0.25 > P>0.1 4、推断结论
V=1 ,查
x
2
2 界值表得: x0.005 ,1 =7.88,
2 2 x 0.005 ,1 , P<0.005 > x
按α=0.05水准,拒绝H0,接受H1,故可认为甲 乙两法的血清学阳性检出率不同,甲法的阳性 检出率较高。 注意:当a和d的数字特别大而b和c的数字较小 时,即使检验结果有统计学意义,而实际意义 也不大。故配对四格表 X2检验一般用于检验样 本含量不太大的资料。
X2 检验过程
1、建立假设 H0:π1=π2 H1:π1≠π2 α=0.05 2、计算X2值(用基本公式计算) T11=(90×126)/178=63.71 T12=90-63.71=26.29 T21=126-63.71=62.29 T22=88-62.29=25.71
2 2 2 2 68 63 . 71 22 26 . 29 58 62 . 29 30 25 . 71 2

统计学x2和p值计算过程

统计学x2和p值计算过程

统计学x2和p值计算过程统计学中X^2(卡方)检验和P值的计算过程是用于判断观察值与理论分布是否有显著差异的一种常用统计方法。

本文将详细介绍X^2检验和P值计算的过程。

一、X^2(卡方)检验概述X^2(卡方)检验是一种非参数统计方法,适用于观测数据是分类变量的情况。

它的核心思想是将观测值与理论值进行比较,通过计算卡方值来判断它们之间的差异程度。

计算具体过程如下:1.建立假设:在进行X^2检验时,首先需要建立原假设和备择假设。

原假设(H0)通常为“观测值与理论分布没有显著差异”,备择假设(H1)则通常为“观测值与理论分布存在显著差异”。

2.构建列联表:X^2检验通常使用列联表(Contingency Table)来整理数据,列联表是一个二维表格,行列分别代表两个变量的不同取值,交叉单元中的数值表示对应取值下的观测频数。

3.计算期望值:期望值是指在原假设成立的情况下,理论上每个交叉单元中的期望频数。

计算期望值的公式为:期望频数=(对应行的总频数*对应列的总频数)/总频数。

4.计算卡方值:计算卡方值的公式为:X^2=Σ(观测频数-期望频数)^2/期望频数。

计算得到的卡方值越大,观测值与理论分布之间的差异越大。

5.判断显著性:判断观测值与理论分布之间的差异是否显著,需要结合自由度和显著性水平进行判断。

计算卡方值后,可以查阅卡方分布表,根据初始设定的显著性水平(通常为0.05),确定拒绝域。

6.计算P值:P值是指在原假设成立的情况下,观察到当前或者更极端情况下的概率。

根据卡方分布的性质,可以通过查表或利用统计软件计算出对应的P 值。

如果P值小于设定的显著性水平,就拒绝原假设;否则,不能拒绝原假设。

二、P值计算的方法在进行X^2检验时,计算P值的方法有两种:查表法和计算器法。

下面将分别介绍这两种方法。

1.查表法:查表法是通过查找卡方分布表,确定对应卡方值所对应的P值。

卡方分布表通常提供不同自由度(df,自由度等于行数减1乘以列数减1)和显著性水平下的卡方临界值。

卡方检验

卡方检验

X
2
b c 1
bc
2
b c 2
bc
– 检验步骤如下:
• 1.检验假设
Ho:B=C,H1:B≠C,α=0.05
17
• 2.计算χ2值
• •
X
2
b c 1 5 10 1
2
2
bc
5 10
1.066
3.确定概率P值和判断结果 配对四格表资料的自由度v=1,查 χ2值表,χ20.05(1)=3.84,χ2 <χ20.05(1),P>0.05,不能拒绝Ho, 根据本资料尚不能认为两种方法检查糖尿病效果有何不同。 • 四、行x列表资料的χ2检验 • 行x列表资料(data of R x C table)指有两个或两个以上比 较的组,记录的观察结果也有两个或两个以上,如比较两格 治疗组的疗效,观察结果为有效、无效和死亡。行x列表资料 的χ2检验解决两个以上的率(或构成比)差异的比较
7


• • • • •
将实际数和理论数代入公式即可计算出检验统计量χ2值。 χ2值的大小反映了实际数与理论数的相差情况,若无效假设H0成 立,则理论数和实际数相差不应该太大,较大的χ2值出现概率太 小。根据资料计算的χ2越大,就越有理由推翻无效假设H0。 χ2值的大小与格子数也有关,格子数越多,则自由度(ν )越大, χ2值也越大。若χ2值> χ20.05(v)(根据自由度v和检验水准α查表 χ2值表得出),则可按α=0.05得检验水准拒绝H0成立的无效假设, 按下表作出统计结论 χ2值 P值和统计结论 χ2 值 P值 统计结论 <χ20.05(v) >0.05 不拒绝H0,差异无统计学意义 ≥χ20.05(v) 0.05 拒绝H0,接受H1差异有统计学意义 ≥χ20.01(v) 0.01 拒绝H0,接受H1,差异有统计学意义
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

除以相应的理论频数,即得统计量x2值。
(A-T)2 x2=∑ T
3、确定概率P值:根据x2的自由度υ=(R-1)(C-1), 查x2界值表。 4、判断结果
如果不能拒绝H0,则认为两个样本来自相同的总体,两
样本率的差异在统计学上无显著性;若拒绝H0,认为两样本 来自不同总体,两样本率的差异在统计学上具有显著性。 x2界值与检验假设的关系
四格表资料确切概率法的计算步骤 1、在四格表周边合计数不变的条件下,列出四个实际
频数a、b、c、d变动的组合情况,共列“周边合计中最小数
+1”个。 2、计算实际D*与各种组合的D* D* =ad-bc 3、计算实际概率与各组合的概率:pi (a+b)!(c+d)!(a+c)!(b+d) ! Pi= a! b! c! d! 4、计算同时满足|Di|≥0实际D*和Pi≤实际P*条件的四格 表的累计概率。
6
50
17
301
55
141
78
492
四格表资料的Fisher确切概率法 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV
的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非
预防组,结果见表。问两组新生儿的HBV总体感染率有无 差别? 两组新生儿HBV感染率的比较 组别 预防注射组 非预防组 合计 阳性 4 5 9 阴性 18 6 24 合计 22 11 33 感染率(%) 18.18 45.45 27.27
当υ≥2时,一般不作校正。
x2
(1A-T1-0.5)2 C=∑ T
(n) (1ad-bc1- )2 2 x2C=∑ (a+b) (c+d) (a+c) (b+d) 注意,最小理论频数TRC的判断:R行与C列中, 行合计数中的最小值与列合计中的最小值所对应格子 的理论频数最小。
配对四格表资料的x2检验 配对设计是将受试对象按某些特征或条件配成对子, 然后分别把每个对中的两个受试对象随机分配对实验组和
例:两疗法治疗乙型脑炎重症患者的治愈率如下表,问 两种疗法的疗效有无差别? 分组 中西医结合组 中医组 合计 病例数 100 200 300 治愈数 50 70 120 治愈率(%) 50 35 40
例:某地从15个大米样品及45个玉米样品中分别检出 黄曲霉毒素的样品有1个及15个,检出率分别为6.67%和 33.33%,问当地粮食中玉米受黄曲霉菌污染是否比大米严
99(90.48)a 5(13.52)b 75(83.52)c 21(12.48)d 174(a+c) 26(b+d)
x2检验的基本步骤
1、建立检验假设,确定检验水准 H0:π1=π2 假设两样本率所代表的两个总体是同一总 体。 H1:π1≠π2 两个样本来自不同的总体 α=0.05 2、计算检验统计量:首先计算每一格子的理论频数, 再计算每一个格子的实际观察频数与理论频数差的平方并
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米
松(对照组)降低颅内压的疗效。将200例颅内压增高症患者 随机分为两组。问两组降低颅内压的总体有效率有无差别?
两组降低颅内压有效率的比较
组别
试验组 对照组 合计
有效
无效
合计
104(a+b) 96(c+d) 200(n)
有效率(%)
95.20 78.13 87.00
x2值反映了实际频数与理论频数的吻合程度。若检验假
设H0成立,实际频数与理论频数的差值会小,则x2值也会小;
反之,若检验假设H0不成立,实际频数与理论频数的差值会 2 2值也会大。x2值的大小还取决于 (A-T) 个数的 大,则x T (A-T)2 多少(严格地说是自由度υ的大小)。由于各 T 皆是正值,故自由度υ愈大,x2值也会愈大;所以只有考虑 了自由度υ的影响,x2值才能正确地反映实际频数A和理论频 数T的吻合程度。
3、计算检验统计量x2值 x2= (99-90.48)2 (5-13.52)2 (75-83.52)2 (21-12.48)2 + + + 13.52 83.52 12.48 90.48 =12.86
4、确定P值判断结果: 以υ=1查x2界值表得P<0.005,按α=0.05水准拒绝H0, 接受H1,可认为两组降低颅内压总体有效率不等。
对照组,这种实验能缩小受试对象间的个体差异,减少实
验误差,提高实验效率。 和计量资料的配对一样,配对设计有同源配对和异源 配对,只是计量资料的配对其结果是数值变量;而计数资 料的配对结果是分类变量。计数资料的配对设计常用于两 种检验方法、培养方法、诊断方法等的比较。
配对四格表资料示意 甲法 + + a 乙法 - b a+b 合计
χ2检验的基本思想 1899年统计学家K.Pearson提出一种度量实际观察计数
与原假设条件下的期望频数间偏差的统计量,称为
pearson’s χ2检验计量。该统计量定义为:
式中χ为希腊字母,读为“chi”,x2表示Pearson’s x2检验统
计量。为了与其他x2统计量的公Fra bibliotek相区别,常称其为x2检
当四格表资料中出现n<40或T<1,或用基本公
式与专用公式计算出的x2值所得的概率P≈α时,需用 四格表资料的确切概率法。
例 7-4的Fisher确切概率法计算表
i 1 2 3 4 5* 6 7 8 9 10 a 0 1 2 3 4 5 6 7 8 9 四格表组合 b c 22 21 20 19 18 17 16 15 14 13 9 8 7 6 5 4 3 2 1 0 d 2 3 4 5 6 7 8 9 10 11 Di=ad-bc -198 -165 -132 -99 -66* -33 0 33 66 99 0.09120390 0.01289752 Pi 0.00000143 0.00009412 0.00197656 0.01844785* 0.08762728
四格表资料x2检验的基本步骤——基本公式法 1、假设H0:π1=π2 即试验组与对照组降低颅内压的总
体有效率相等。
H1:π1≠π2 即试验组与对照组降低颅内压的总体有效
率不等。
α=0.05 2、计算理论值TRC: T11=104×174/200=90.48 T12=104-90.48=13.52 T21=174-90.48=83.52 T22=26-13.52=12.48
重?
四格表资料x2检验的校正公式 四格表资料x2检验的基本要求
1、当n≥40且所有的T≥5时,用x2检验的基本公式或四格
表资料x2检验的专用公式;当P≈α时,改用四格表资料的 Fisher确切概率法。 2、当n≥但有1≤T<5时,用四格表资料x2检验的校正公 式;或改用四格表资料的Fisher确切概率法。 3、当n<40,或T<1时,用四格表资料的Fisher确切概 率法。 4、x2连续性校正仅用于υ=1的四格表资料,尤其是n小时。
曲线呈L型;②随着自由度的增加,曲线逐渐趋于对称;③当自
由度→∞时,x2分布趋向正态分布。 3、x2分布的可加性:如果两个独立的随机变量x1和x2分别 服从自由度υ1和υ2的x2分布,那么它们的和(x1+x2)也服从自由 度( υ1+ υ2)的x2分布。 4、x2分布的分位数:当自由度r确定后,x2分布曲线下右侧 尾部的面积为α时,横轴上相应的x2值即为x2分布的分位数,记 着x2σ,υ 5、x2值愈大,P值愈小;x2值愈小,P值愈大。
5、双向有序分类资料的关联性检验:为R×C列
例:某矿工医院探讨矽肺不同期次患者的胸部平片密
度变化,492例患者资料整理成如下表,问矽肺患者肺门 密度的增加与期次有无关系? 不同期次矽肺患者肺门密度级别分布
矽肺期次
+
肺门密度级别 ++ +++
合计 14
72
I
II
43
1
188
96
245
169
III
合计

合计
c
a+c
2
d
b+d
c+d
n(a+b+c+d)
(b-c) x2= b+c
b+c≥40
(|b-c|-1)2 x2= b+c
b+c<40
行×列表资料的X2检验:
A2 一、基本公式: 2=n(∑ x -1) nRnC 二、基本数据有五种情况: 1、多个样本率的比较:为R行2列 2、两个样本构成比的比较:为2行C列 3、多个样本的构成比比较:为R×C列 4、双向无序分类资料的关联性检验:为R×C列
验统计量的基本公式。O表示实际观察的频数。E表示无效 假设下的期望频数。
X2检验的应用 1、检验两个或多个率(或均成 比)间的差异; 2、判断两种属性或现象间是否 存在关联性; 3、了解实际分布与某种理论分 布是否吻合; 4、判断两个数列间是否存在差 异。
x2分布:
1、 x2分布是一种连续型分布,其密度函数为f( X2 ,υ)。 2、 x2分布的形状依赖于自由度的大小:①当自由度≤2时,
四格表资料x2检验的专用公式法
四格表资料示意 有 某某组 a(A11) 无 b(A12) 合计 a+b=n1·
某某组
合 计
c(A21)
a+c=n· 1
d(A22)
b+d=n· 2
c+d=n2·
a+b+c+d=n
(ad-bc)2n x2= (a+b) (c+d) (a+c) (b+d) (99×21-5×75)2200 上例x2= =12.86 104×96×174×26
相关文档
最新文档