计数资料统计推断X2检验-预防医学

合集下载

统计学x2检验

统计学x2检验

第六章χ2检验在科学研究中,除了分析计量资料(连续性资料)以外,还常常需要对次数资料、等级资料进行分析。

等级资料实际上也是一种次数资料。

次数资料(离散型资料)的统计分析方法不同于服从正态分布的计量资料,假设检验通常都采用χ2检验。

第一节2χ统计量与2χ分布一、2χ统计量的意义为了便于理解,现结合一实例说明2χ (读作卡方)统计量的意义。

根据遗传学理论,动物的性别比例是1:1。

统计某羊场一年所产的876只羔羊中,有公羔428只,母羔448只。

按1:1的性别比例计算,公、母羔均应为438只。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表6-1。

表6-1 羔羊性别实际观察次数与理论次数性别实际观察次数O理论次数E O-E (O-E)2/E 公428(O1)438(E1)-10 0.2283母448(O2)438(E2)10 0.2283合计876 876 0 0.4566从表6-1看到,实际观察次数与理论次数存在一定的差异,这里公、母各相差10只。

这个差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

为了避免正、负抵消,可将两个差数O1-E1、O2-E2平方后再相加,即计算∑(O-E)2,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

但利用∑(O-E)2表示实际观察次数与理论次数的偏离程度尚有不足。

例如某一组实际观察次数为505、理论次数为500,相差5;而另一组实际观察次数为26、 理论次数为21,相差亦为5。

显然这两组实际观察次数与理论次数的偏离程度是不同的。

因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。

x2检验——精选推荐

x2检验——精选推荐

x2检验本章重点1.熟悉x2检验的基本思想。

2.掌握x2检验在四格表资料、行×列表资料中的应用。

3.掌握配对计数资料的x2检验。

χ2 检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用: χ2 检验的适用范围:1.推断两个或两个以上总体率或构成比之间有无差异;2.配对计数资料差异的显著性。

检验统计量:χ2应用:计数资料第一节 四格表资料的χ2 检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料一、四格表资料的基本公式x2检验基本思想检验“实际数”和假设“理论数”的差异是否是由于抽样误差引起(两个样本率的差异体现在“实际数”和假设“理论数”的差异中)。

实际数,用四格表表示,称为四格表资料,分别为a 、b 、c 、d ,其他的数据是从这四个实际数推算出来的,称为理论数(表中括号内的数据)。

实际数用A 表示,理论数T 表示。

A :表示实际频数,即实际观察到的例数。

T :理论频数,即如果假设检验成立,应该观察到的例数。

TRC :第R 行C 列的理论频数nR :相应的行合计,nC :相应的列合计n 为总例数检验统计量χ2 值反映了实际频数与理论频数的吻合程度。

Χ2检验是检验实际数与理论数差异程度的指标。

A 与T 的值越接近, χ2越小,相反,实际数与理论数之间的差数越大, χ2值也就越大。

所得χ2值如果小于界值的χ2,P>0.05,即接受了原假设,可认为两组人群的治疗效果差异无统计学意义。

反之,如果所得χ2值大于查表所得χ2值,则P<0.05,即差异有统计学意义。

自由度计算公式Χ2值的大小,除了取决于A-T 的差值外,还取决于格子数的多少,格子数越多, χ2值越大,只有排除了这种影响, χ2值才能正确反映A 与T 的吻合程度,因此,在查χ2表时,要考虑自由度的大小。

22(), ()(1)A T Tχν-=∑=-行数-1列数 R C RC n n T n=计算公式:V=(行-1)(列-1) 四格表资料由2行2列组成,V=(2-1)(2-1)=1自由度即自由变动的范围,由于四格表周边的合计数已经固定,因此只要算出任一格的理论数,其余三个格子的理论数就没有自由变动的余地了,四格表的自由度V=1。

X2检验

X2检验

X2检验:对心理和教育研究中收集到的计数数据进行统计分析,一般应用属性统计方法,因为这类数据时按照事物属性进行多项分类的。

另外,对这些计数数据分析是根据X2分布,故称这类统计分析方法为X2检验.描述统计:主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件失误的性质.推论统计:主要研究如何通过局部数据所提供的信息,推论总体的情形。

.单侧检验:强调某一方向的检验叫做单侧检验.双侧检验:只强调差异而不强调方向性的检验称为双侧检验.参数:总体的那些特性称为参数。

又称为丛悌参数,是描述一个总体情况的统计指标。

.统计检验力:其他条件不变的情况下,u1与u0的距离改变,引起1-β的改变,所以称1-β为统计检验力标准正态分布:标准正态分布是正态分布的一种,平均数为0,标准差为1.F分布:设有两个正太分布的总体,其平均数与方差分别为u1,σ21及u2,σ22从这两个总体分别随机抽取容量n1及n2的样本每个样本都可计算出X2值,这样可以得到无限多个21与X22,每个X2随机变量各除以对应的自由度d f1与d f2之比,称为F比率。

这无限多个F的分布称为F分布.品质相关:两个变量只划分为不同的品质类别,故而得名。

.集中量数:数据的集中趋势就是数据分布中大量数据向某方向集中的程度用来描述这一数据特点的统计量称为集中量数1参数估计:指对参数模型下的估计。

2统计误差:误差是测得值与真值之间的差值,统计误差归纳起来可分为两类:测量误差与抽样误差。

3 抽样分布:是从同一总体内抽取的不同样本的统计量的概率分布。

4 二项分布:是指试验仅有两种不同性质结果的概率分布。

5 区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

6 无偏估计:如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。

第五章 χ2检验

第五章 χ2检验

χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。

医学统计学9 χ2检验

医学统计学9 χ2检验
1)有效者应为26(41/70)=15.2; 2) 无效者为26(29/70)=10.8; 同理,对照组的44例颅内压增高症患者中 1)有效者应为44(41/70)=25.8; 2)无效者为44(29/70)=18.2。
卡方检验的基本原理
反映实际频数与理论频数的吻合程度可用统计量
A
T T
2
来表示
案例分析
某医院采用甲乙两种方法测定60例结核杆菌阳性率, 如下图。试问这两种检测方法阳性率是否相同。
测定方法 阳性数 阴性数 合计
阳性率
甲法
42
18
60
70.0%
乙法
23
37
60
38.3%
合计
65
55
120
54.2%
错误的方法
根据2*2四格表卡方检验方法进行 可求得 2 =12.62, p<0.001;
2
(ad bc)2n
(a b)(a c)(bd )(c d )
c2
(
29 26 5 2 42
2 5 )( 26 9 )( 2 26 )( 5
9
)
5.49
x2,1 3.84
P 0.05
结论与之相反。
配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有差别有成组设 计和配对设计一样,计数资料推断两个总体率(构 成比)是否有差别也有成组设计和配对设计,即四 格表资料和配对四格表资料。
若检验假设H0:π1=π2成立,四个格子的实际频 数A与理论频数T 相差不应该很大,即统计量不
应该很大。如果上述统计量值很大,从而怀疑H0 的正确性,继而拒绝H0,接受其对立假设H1,即 π1≠π2 。
这个统计量就称为卡方统计量。

χ2检验.

χ2检验.

甲组 乙组 合计
a c a+c
四格表的专用公式及校正公式

χ2=
(ad - bc) n (a b)(c d)(a c)(b d)
2

χ2=
( ad bc n/2) n (a b)(c d)(a c)(b d)
2
配对计数资料的卡方检验
2 ( b c ) 2 , 1 , (b c) 40 bc 2 ( b c 1 ) c2 , 1 , (b c) 40 bc
实习 计数资料的统计推断


明确率的抽样误差的意义 学会率的标准误的计算方法,并能正确 用于计数资料的分析 2 学会率的u检验、 检验的计算方法,并 正确动用假设检验对计数资料进行分析 评价。
四格表资料的χ2检验

主要用于两个样本率(或构成比)的假 设检验。

表11-1 四格表数据格式
阳性 阴性 b d b+d 合计 a+b=n1 c+d=n2 a+b+c+d= n 率pi a/n1 c/n2 (a+c)/n
27 18
45
22 12
34
行×列(R×C)表资料的χ2检验

χ2= n(

A2 1 n n ) R C
n为总例数 , A为每个格子的实际频数 , nR和 nC分别为与A同行和同列的合计数。
υ =(R-1)(C-1)

22.为比较槟榔煎剂和阿的平驱绦虫的 效果,对45名绦虫患者进行治疗,其结 果如下,问两药疗效是否相同?
槟榔煎剂和阿的平驱绦虫治疗的结果
药物
槟榔煎剂 阿 的 平 合 计

(完整word版)卫生统计学重点整理-预防医学

(完整word版)卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。

否则称为异质(heterogeneity)的或者间杂的。

3.变异(variation):同质事物之间的差别称为变异。

[没有个体变异,就没有统计学!]4.总体(population):根据研究目的所确定的同质观察单位的全体。

5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。

6.样本含量(sample size):样本中包含的观察单位个数。

7.参数(parameter):反映总体特征的指标。

特点:未知、唯一,希腊字母表示,如总体均数、总体率等。

8.统计量(statistic):根据样本观察值计算出来的指标。

特点:已知、不唯一,拉丁字母表示,如样本均数、样本率等。

9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。

10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value).11.资料(data):变量值的集合称之为资料.12.定量资料(quantitative data):变量值是定量的,表现为数值大小。

特点:一般有度、量、衡单位,一般属连续性资料。

13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。

特点:一般无度、量、衡单位,一般属于离散型资料。

可进一步分为计数资料和等级资料。

14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。

可进一步分为二项分类资料和无序多项分类资料.15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点各组观察单位所得的资料。

第七章 X2检验(医学统计学)

第七章 X2检验(医学统计学)

∵ P=0.2668>0.05,∴ 在α=0.05水准上,不拒
绝H0,故尚不能两型患者的反应阳性率有差别。 四格表检验小结 1、当T>5(所有格子),且 n>40时,应用 2 ( A T ) x2 T 或
2 ( ad bc ) n 2 x (a b)(c d )(a c )(b d )
α=0.05
按公式
X2=2.56
2 A x 2 n( 1) n R nC
计算

2 2 x0 2 . 37 x V=(2-1)(4-1)=3 , , .5, 3 0.25, 3 4.11 ,0.5>P>0.25
──────────────────── ━━━━━━━━━━━━━━━━━━━━━━
1、建立假设
H0:π1=π2
H1:π1≠π2 α=0.05
2、计算X2值
因T11=3.84<5, 故需要使用校正公式
用专用公式:a=1、 b=14 、 c=10 、 d=18
x

2
( ad bc n / 2) n
|A-T|值的四格表的P值,将其相加,即得到检验
概率P。
双侧检验:
对所有 |A-T|值等于及大于样本
|A-T|值的四格表P值相加;
单侧检验:按检验目的,取阳性数增大或减小一
侧的|A-T|值等于及大于样本|A-T|值四格表;
四格表概率P的计算公式
(a+b)!(c+d)!(a+c)!(b+d)! P=──────────── a!b!c!d!n!
各种组合的四格表: 样本四格表
0 15 15 1 14 15 2 13 15 3 12 15 4 11 15

计数资料的统计描述与统计推断

计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数


病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3

【统计分析】x2检验

【统计分析】x2检验

表 10-6
三种药物治疗老年 2 型糖尿病的疗效
有效
无效
合计
35
21
56
17
13
30
29
1
30
81
35
116
有效率(%) 62.5 56.7 96.7 69.8
单向有序R×C表
有两种形式
一种是R×C表中的分组变量(如年龄组)是有序的, 而指标变量(如传染病的类型)是无序的。其研究目 的通常是分析不同年龄组各种传染病的构成情况,此 种单向有序R×C表可用行×列表资料 χ2 检验进行分 析。
α=0.05
2. 计算检验统计
2 b c 12 2 11 12 4.92
bc
2 11
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验
公式与普通四格表检验公式相同
1. 建立假设 H0:两法的结果无相关 H1:两法的结果相关
α=0.05 2. 计算检验统计
2
a
ad bc2 n ca bc d b
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
双向无序R×C表
若研究目的为多个样本率(构成比)的比较, 可用行×列表资料 χ2 检验; 若研究目的为分析两个分类变量直接有无关联 性,可用行×列表资料 χ2 检验及列联系数进 行分析。
组别 降糖 1 号 玉泉丸 格列本脲 合计
x2检验基本思想
组别
+

合计
A
a
B
c
合计
m1

医学统计学计量资料的统计推断

医学统计学计量资料的统计推断

医学统计学计量资料的统计推断主要内容:标准误t 分布总体均数的估计假设检验均数的 t检验、u 检验、方差分析几个重要概念的回顾:计量资料:总体:样本:统计量:参数:统计推断:参数估计、假设检验第一节均数的抽样误差与总体均数的估计欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。

由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。

一、均数的抽样误差与标准误一、均数的抽样误差与标准误抽样误差:由于抽样引起的样本统计量与总体参数之间的差异X数理统计推理和中心极限定理表明:1、从正态总体N(??,??2)中,随机抽取例数为n的样本,样本均数??X 也服从正态分布;即使从偏态总体抽样,当n足够大时??X也近似正态分布。

2、从均数为??,标准差为??的正态或偏态总体中抽取例数为n的样本,样本均数??X的总体均数也为??,标准差为X标准误含义:样本均数的标准差计算:(标准误的估计值)注意: X 、S??X均为样本均数的标准误标准误意义:反映抽样误差的大小。

标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。

标准误用途:衡量抽样误差大小估计总体均数可信区间用于假设检验二 t 分布对正态变量样本均数??X做正态变换(u变换):X 常未知而用S??X估计,则为t变换:二、 t 分布t值的分布即为t分布t 分布的曲线:与??有关t分布与标准正态分布的比较1、二者都是单峰分布,以0为中心左右对称2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。

当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→??时,t分布完全成为标准正态分布t 界值表(附表9-1 )t??/2,??:表示自由度为??,双侧概率P为??时t的界值t分布曲线下面积的规律:中间95%的t值:- t0.05/2,?? ?? t0.05/2,??中间99%的t值:- t0.01/2,?? ?? t0.01/2,??单尾概率:一侧尾部面积双尾概率:双侧尾部面积(1) 自由度(ν)一定时,p与t成反比;(2) 概率(p)一定时,ν与t成反比;三总体均数的估计统计推断:用样本信息推论总体特征。

X2检验简单教程一学就会

X2检验简单教程一学就会

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

Contingency coefficient复选框:即列联系数,其值界于0~1之间;Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间;Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。

计量资料统计推断(t检验)-预防医学-课件

计量资料统计推断(t检验)-预防医学-课件

02
t检验的步骤
建立假设
假设检验的基本思想
设立原假设的依据
在假设检验中,通常先设立一个原假 设,然后基于样本数据对原假设进行 检验,判断是否拒绝原假设。
原假设的设立通常基于已有的研究结 果、理论或实践经验,并且原假设应 该是一个可以验证的命题。
原假设与备择假设
原假设通常是研究者想要否定的假设 ,备择假设则是研究者想要接受的假 设。
p值是用于判断是否拒绝原假设 的统计量,p值越小,说明样本 数据与原假设之间的差异越大,
越有理由拒绝原假设。
显著性水平
显著性水平是预先设定的一个临 界值,用于判断是否拒绝原假设
,通常取0.05或0.01。
结论的表述
根据p值与显著性水平的比较结 果,可以得出是否拒绝原假设的 结论,并进一步解释结果的意义
断实验处理或条件改变对数据的影响。
两独立样本t检验
总结词
用于比较两个独立样本的平均值是否存 在显著性差异。
VS
详细描述
两独立样本t检验,也称为两组独立样本t 检验,是统计学中常用的方法之一,用于 比较两个独立样本的平均值是否存在显著 差异。这种方法常用于比较不同组对象的 数据、不同条件下的独立测量等。通过计 算t统计量,我们可以判断两组独立样本 的均值是否存在显著差异,从而推断不同 组别或条件对数据的影响。在进行两独立 样本t检验时,需要注意样本来自的总体 是否具有方差齐性和正态分布等统计假设 ,以确保检验结果的准确性和可靠性。
t检验的适用范围
• t检验适用于样本量较小、数据分布情况未知或总体标准差未知的情况。在预防医学领域,t检验常用于比较两组人群的生理 指标、行为习惯等计量资料的差异。
t检验的假设条件
• 假设条件包括:样本数据来自正态分布总体、总体 方差齐性、独立样本等。在进行t检验之前,需要检 验样本数据是否满足这些假设条件,以确保统计推 断的准确性。

医学统计学X2检验概要93页PPT

医学统计学X2检验概要93页PPT

39、没有不老的誓言,没有不变的承 诺,踏 上旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
ቤተ መጻሕፍቲ ባይዱ 66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
医学统计学X2检验概要
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。

第九章-x2 检验

第九章-x2 检验

106(d) … … …
+ …… +
43
• 检验基本公式(Mc-Nemar test) :
(b - c) x = (b + c)
2
2 2
2
(b+c>40时)
( b - c - 1) (b+c<40时) x = (b + c)
44
48(a)
A培养基 B培养基
24(b) + + … +
20(c) -
(21 15.2) 2 (5 10.8) 2 15.2 10.8 8.40
20
确定概率:
计算自由度:
v=(行-1)(列-1)=(2-1)(2-1)=1 查x2值表: x20.05(1)=3.84 现:x2=8.40>5.63 则: p<0.01
21
x20.01(1)=5.63
判定结果:
2 2 2
47
3、确定概率: v=1
查x2值表:x20.05(1)=3.84 x20.50(1)=0.45
现: 0.36<0.45 则: p>0.50 4、判定结果:
按α =0.05的水准, p>0.50,不拒绝H0。 尚不能认为两种培养基的培养结果不同。
B培养基
注意: 一 一 配对
41
可能出现的结果:
a b + c d -
A培养基 B培养基
+
+
-
+
-
42
A培养基
B培养基 + 48(a) 20(c) 68 24(b) 106(d) 130
合计 72 126 198

医学统计学-第九章计数资料的参数估计与卡方检验

医学统计学-第九章计数资料的参数估计与卡方检验

率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2

第六章χ2检验

第六章χ2检验
公式为:
ν=(行数-1)(列数-1)
=(R-1)(C-1)
7. χ2界值特点:在同一自由度下, χ2 值 越 大 , 相 应 的 概 率 P 值 越 小 ; χ2值越小,相应的概率P值越大。
8. X2分布是一种连续型分布:按X2分布 的密度函数f(X2,v)可给出自由度v=1,2, 3,……的一簇X2分布曲线(图7—1)。由 X2分布曲线可见,X2分布的形状依赖于 自由度V的大小:①当自由度v≤2,时, 曲线呈L型;②随着v的增加,曲线逐渐 趋于对称;③当自由度 v→∞时,X2分布 趋向正态分布。
一致性检验(计算Kappa值) 。
-+
+ ++ +++ 合计
++ +++
5.当多个样本率(或构成比)比较的χ2
检验,结论为拒绝检验假设,只能认 为各总体率(或总体构成比)之间总 的说来有差别,但不能说明它们彼此 之间都有差别,或某两者之间有差别。
若想进一步了解哪两者的差别有
统计学意义,可用χ2分割。(例6.7)
4.χ2值的含义:反映了实际频数与理 论频数的吻合程度。
χ2值永远是正值。(即χ2≥0)
5. χ2检验判别准则:
若 χ2<χ20.05(ν) , 则 P>0.05,不拒绝 无效假设H0;
若χ2≥χ20.05(ν) ,则P<0.05,拒绝无效 假设H0,接受H1 。
6. χ2分布的参数:自由度。其计算
(二) 四格表资料χ2检验专用公式:
(n≥40且所有的T≥5)
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
l 例6.1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

疗法 治愈 未治愈 合计
甲药 20
5 25
乙药 18
12 30
合计 38
17
简表示意
55
+ - 合计 甲 a b a+b 乙 c d c+d 合计 a+c b+d N
医学ppt
5
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数:
T=
nR××nC N
nR 为行合计数 = 1n7C.3为列合计数
若所有格子的 T>5,且 N>40,可检验不必校正 若有1<T<5,且 N>40,可检验需用校正公式 若有T<1或 N<40时,不可作四格表卡方检验
医学ppt
11
二、假设检验
例:为比较两种治疗方法哪一种较好,某医师用 甲药治疗患者25例,治愈率80%;用乙药治疗同类 患者30例,治愈60%。问两种治疗效果是否不同?
17
合计 25 30 55
医学ppt
7
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数:
30×38 T= 55 = 20.7
疗法 甲药 乙药 合计
治愈 20(17.3) 18( )
38
未治愈 5( 7.7 ) 12( )
17
合计 25 30 55
医学ppt
8
一、准备工作
(二)判断能否作检验,是否需要校正
1、H0:π1=π2 H1:π1≠π2 α=0.05
2、本X例2=四格(T(均a+>××b5(),a(cd总+-×-合db)c计(a)××2+数N c>))(4b0+,2×d故) 采用正常公式
+ - 合计 甲 2a0 b5 a2+5b 乙 1c8 1d2 a3+0d 合计 a3+8c b1+7d 5N5
计数资料的假设检验
卡方检验(X2检验)
王晓明
1
教学目标
掌握四格表、配对资料卡方检验方法 熟悉行X列表卡方检验方法
医学ppt
2
计数资料的假设检验
X2检验用途广泛,常用的有三种。
➢ 四格表X2检验:
用于比较两个样本率或构成比
➢ 行×列表X2检验:
用于比较多个样本率或构成比
➢ 配对X2检验:
用于配对资料比较
1、计算理论数:
30×17 T= 55 = 9.3
疗法 甲药 乙药 合计
治愈 20(17.3) 18(20.7)
38
未治愈 5( 7.7 ) 12( )
17
合计 25 30 55
医学ppt
9
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数:
T=
nR×nC N
疗法
治愈
未治愈 合计
甲药 20(17.3) 5(7.7) 25
乙药 18(20.7) 12(9.3) 30
合计
38
17
55
本例四个理论数均>5,总合计数>40
医学ppt
10
一、准备工作
(二)判断能否作检验,是否需要校正
疗法
治愈
未治愈 合计
甲药 20(17.3) 5(7.7) 25 乙药 1ຫໍສະໝຸດ (20.7) 12(9.3) 30
合计
38
17
55
根据最小理论数和总合计数判断
阿的平
18
10
55.6
一、准备工作 (1) +
甲 24 乙 10 合计 34
- 3
合计 27
(2) Tmin=
11×18 45
8 18
=4.4
11
45
1<Tmin < 5,故用校正公式
医学ppt
14
二、假设检验
1、H0:π1=π2 H1:π1≠π2 α=0.05
2、 X2=
(│ad-bc│-N/2)2 N (a+b)(c+d)(a+c)(b+d)
医学ppt
3
四格表X2检验
一、准备工作
(一)列分析表
例:为比较两种治疗方法哪一种较好,某医师用 甲药治疗患者25例,治愈率80%;用乙药治疗同类 患者30例,治愈60%。问两种治疗效果是否不同?
疗法 治愈 未治愈 合计
甲药 20
5
25
乙药 18
12
30
合计 38
17
55
医学ppt
4
一、准备工作
(一)列分析表
医学ppt
12
二、假设检验
例1:为比较两种治疗方法哪一种较好,某医师用 甲药治疗患者25例,治愈率80%;用乙药治疗同类 患者30例,治愈60%。问两种治疗效果是否不同?
1、H0:π1=π2 H1:π1≠π2 α=0.05
2、 X2=2.55
3、ν=(R-1)(C-1)=1 查表得X20.05(1)=3.84
N 为总合计数
疗法 甲药 乙药 合计
治愈 20( ) 18( )
38
未治愈 5( ) 12( )
17
合计 25 30 55
医学ppt
6
一、准备工作
(二)判断能否作检验,是否需要校正
1、计算理论数: ×
T=
= 7.7
疗法 甲药 乙药 合计
治愈 20(17.3) 18( )
38
未治愈 5( ) 12( )
居室朝向 患病人数 无病人数

180
200
西、西南
14
16
东、东南
120
84
北、东北、西北
65
33
合计
379
333
合计 380
30 204
98 712
患病率(%) 47.4 46.7 58.8 66.3 53.2
= (│24×8-10×3│-45/2)2×45 27×18×34×11
=4.82
+ - 合计
甲 24 3 27
乙 10 8 18
合计 34 11 45
医学ppt
15
二、假设检验
1、H0:π1=π2 H1:π1≠π2 α=0.05
2、X2=
(│ad-bc│-N/2)2 N (a+b)(c+d)(a+c)(b+d)
任何格子的T>1。 1<T<5的格子数不得超过总格子数的1/5。
Ω 如果出现上述任何一种情况,可采用下列措施
扩大样本继续调查,直至T符合要求。 将性质相近的邻行或邻列合并,使T符合要求 将T不符合要求的行或列去除
医学ppt
17
行×列表X2检验
例:胡氏等某年在北京进行住宅日照卫生标准研 究,对214幢楼房婴幼儿712人体检,检出轻度佝偻病 患儿379例,列表如下,请分析儿童佝偻病与房屋朝 向有无关系。
∵2.55<3.84 ∴P>0.05
95%
4、可以认为两药疗效相同。
医学ppt
0 2.55 3.84 13
四格表卡方检验
例二:为比较槟榔煎剂和阿的平驱绦虫的效果, 对45名绦虫患者进行治疗,结果如下表,问两药 疗效是否相同?
药物
治 疗 有 效 有效率 人 数 人 数 (%)
槟榔煎剂 27
24
88.9
= (│24×8-10×3│-45/2)2×45 27×18×34×11
=4.82
95%
3、 ν=1
X20.05(1)=3.84
∵ X2 > 3.84 ∴P < 0.05
0
3.84
4、可以认为两药疗效不同,槟榔煎剂疗效较好。
医学ppt
16
行×列表卡方检验
Ω 适用于两个以上的率或构成比的比较 Ω R×C表卡方检验对资料的要求:
相关文档
最新文档