计数资料的统计描述及卡方检验
计数资料统计分析卡方检验
统计量
应用条件:b+c≥40 时 应用条件:b+c<40时
独立样本与配对样本的区别 资料仅供参考,不当之处,请联系改正。
例8.11 有28份咽喉涂抹标本,把每份标本一分为二,分别接种在 甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况。问两种 培养基的阳性检出率是否相等?
配对资料的数据格式
随机资料的数据格式
合计
9
未治愈 2 6 8
合计 9 8 17
治愈率(%) 77.78 25.00 52.94
P=0.057
资料仅供参考,不当之处,请联系改正。
配对资料 2 检验(McNemar检验)
实验设计形式:配对设计 数据类型:定性(计数)资料
例:现有198份痰标本,每份标本资料分仅供别参考,用不当之A处,、请联B系改两正。种培养基培养结核菌
资料仅供参考,不当之处,请联系改正。
四格表 2 检验的确切概率检验法
➢ 例:有17名腰椎间盘脱出资料症仅供参患考,不当者之处,,请联系其改正。中有9人志愿接受一种新 的疗法,治愈率为77.78%,其它8人接受保守疗法,治愈率为
25.00%,问:两种疗法的疗效是否有差别?
疗 法 治愈
新疗法 7
保守疗法 2
资料仅供参考,不当之处,请联系改正。
行x列表 2检验
2检验不仅能用于由两个样本率来推断两个总体率是否 相同,还可以用于检验多个样本率或构成比以推断多个总
体率或构成比是否相同。将2检验用于行×列表资料的 方法又称为行×列表2检验。 行×列表2检验的简化公式为:
2 n(
A2 1)
nRnC
自由度为:v=(行数-1)(列数-1)
资料仅供参考,不当之处,请联系改正。
计数资料的描述和x2检验
(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
中国医科大学研究生医学统计学 第五讲 计数资料及卡方检验2
(四)注意资料的可比性 用以比较的资料应是同质的,除 了要比较的处理因素外,其它条件应 基本相同。对于不同时期、地区、条 件下的资料应注意是否齐同。
• (五)对比不同时期资料应注意客观 条件是否相同 例如,疾病报告制度完善和资料完整 的地区或年份,发病率可以“升高”; 居民因医疗普及,就诊机会增加,或诊 断技术提高,也会引起发病率“升高” 。因此在分析讨论时,应根据各方面情 形全面考虑,慎重对待。
2 ( A T ) 2 RC RC TRC
=
[b- (b+c)/2]2
+
[c- (b+c)/2]2
(b+c)/2 [(c- b)/2]2 (b+c)/2
(b+c)/2
= [ (b-c)/2]2 +
(b+c)/2
= (b-c)2/2
(b+c)/2
(b c) 2 bc
H0:总体B = C H1:总体B≠C α= 0.05 b + c = 12 + 2 = 14 < 40。
本资料若不校正时,X2=4.35,P<0.05,结 论与之相反。
最小理论频数TRC的判断: R行与C列中,行合计数中的最小 值与列合计数中的最小值所对应
格子的理论频数最小。
如本例,第2行与第2列所对应的格子 理论频数最小(4.67)。
第二节 配对设计的四格表资料的χ2检验
(一)配对四格表形式 B 甲种属性 + 合计 A乙种属性 + 合计 a b a+b c d c+d a+c b+d n=a+b+c+d
无效 b d b+d
计数资料的统计描述与卡方检验
25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
卡方检验
计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18
计数资料常用检验方法
.219
1
.640
N of Valid Cases
24
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum exp is 2.50.
三组疗法有效率比较
分组 有效数 无效数 合计
在R×C表中,如T<5的格子数超过基本格 子的1/5时,不能直接用R×C表公式。
两组病人某项指标分级构成
组别 I 甲组 72
II III 28 5
IV
合
计
2(1.46) 107
乙组 74
32 6
1(1.54) 113
合计 146 60 11 3
220
表中有两个基本格子的理论数小于5
处理的方法 ①增加观察单位数目 ②合并相邻的两列(或两 行) ③去掉某行或某列
计数资料常用检验方法
BIM
当两组样本较大(n>100), 而率又不太小时(比如np或n(1p)均大于5,此时率的分布近似正 态分布),可选择u检验(或X2
检验)见公式
1.计数资料两大样本u检验
u=
p1 − p2
PQ( 1 + 1 )
n1 n2
或 u =
p1 − p2 , u = 1.96, P = 0.05
Value Pearson Chi-Square 4.326b Continuity Correctaio 4.067
Asymp. Sig. Exact Sig. Exact Sig.
df
(2-sided) (2-sided) (1-sided)
计数资料描述和χ2检验
四、动态数列及其分析指标
动态数列是一系列按时间顺序排列起来的 统计指标(指标可以是绝对数、相对数或平 均数),用以观察和比较该事物在时间上的 变化和发展趋势。
表5-9 某医院1991-2019年日门诊量
年份 1991 1992 1993 1994
日门诊人次 指标符号(ai)
1200
a0
1500
a1
例5-6 经研究表明,女性原发行性骨质疏松随年龄 增长患病率增高。2019年某省在城市和农村分别 抽样调查了50岁以上的老年妇女776例和789例, 这些人中患有原发性骨质疏松症者城市为322例, 农村为335例,总患病率分别为41.5%和42.5%。 由于本次调查的城乡老年妇女的年龄构成不同,请 对总患病率进行标准化,然后比较。
动态数列的分析不仅可以总结过去,而且可以 进行预测,即根据平均发展速度的公式,计算几 年后达到的指标值。
如:预测2019年的日门诊量
根据资料可知2019年的日门诊量为a10,平均 发展速度为:n an a0 1.141
1 0a 1 01 2 0 01 .1 4 1 a 1 04 4 8 8
第二节 χ2检验
计数资料的描述和χ2检验
第一节 计数资料的统计描述
一、常用相对数
相对数:两个有关联的数值之比就称为相对数, 用以说明事物的相对水平。
常用的相对数: 强度相对数(率)、结构相对数(构成比)、相对比
表5-2 已婚育龄妇女不同情况下放环失败率的比较
放环情况 放环人数 失败人数 失败人数比(%) 失败率(%)
二、四格表资料的确切概率法
Fisher确切概率法的理论依据是超几何分布,
三、率的标准化
表5-4 甲乙两种疗法治疗某病的治愈率比较
计数资料常用检验方法
计数资料行×列(R ×C)表卡方检验 公式:
X2=35.81> , 差异有显著性,P<0.01,可以认为三组疗效不同,中西药结合组较其他两组高,若要进一步作两两比较,可分成三个四格表再进行比较。
中西药结合组
组别
有效
无效
合计
46
12
02
Pearson列联系数(P)
Cramer(修正)列联系数(C)
演讲人姓名
列联表计数资料的相关分析数据格式 (PEMS软件包)
卡方值 = 74.4015
自由度 v = 4
概率 P = 0.0000
Pearson 列联系数 = 0.2597
各个格子的理论数均大于 5
结果
列联表计数资料的相关分析.一致性检验.Kappa值(PEMS软件包)
66
12
78
0.05,差异无统计学意义,可以认为甲、乙两组有效率相同,如用X2值一般公式计算X2=2.85
(3) 、当总例数n>40,但有理论数0<T<1,或总例数n<40,有实际观察数为0的情况,此时应采用确切概率法直接算出概率P
两种药物治疗结果
组别
治愈
未愈
合计
新药
5(1.82)
、当总例数n>40,1<T<5时,由于理论数偏小,往往使得X2值偏大,此时可应用四格表X2值校正公式:
甲 、乙两组有效率比较
表中有一个理论数 4.62((30×12)/78=4.62)大于1小于5,可采用X2值校正公式计算
分组
有效数
无效数
合计数
甲组
38
10
48
乙组
计数资料的数据分析
计数资料的数据分析1、四格表资料(1)简单四格表资料i.非配对的四格表资料例:比较A、B两种疗法治愈率,数据如下:分析目的:A、B疗法有效率是否有差异?数据如用通用符号表示:分析方法:Pearson 卡方检验其中,Oi 表示观察数,Ei表示理论期望数, n 格子数(这里等于4)Yates'连续性校正关联分析:计算A疗法有效率相对于B疗法的优势比Odds Ratio (比值比)= (a/b) / (b/d) = (ad)/(bc) = (20*14)/(16*10) = 1.75易侕统计软件输入界面:易侕统计软件输出结果:ii. 配对的四格表资料例:比较A、B两种疗法治愈率,配对设计,每个病人与另一个年龄、性别、病程等相同的病人配对,一个用 A疗法治疗,另一个病人用B疗法治疗,数据如下分析目的:A、B疗法有效率是否有差异?: H0:A、B疗法有效率相同,即p b=p c数据如用通用符号表示:McNemar 卡方检验Edwards 连续性校正:McNemar精确检验:总共有b+c (8+4=12)不一致的对子数,按H0,理论上b与c出现的概率相同,即b占(b+c)的比例为50%,相当于OR=b/c=1。
实际观察到的OR = b/c = 8/4 =2,计算出现8/4 或更极端的情况(9/3,10/2,11/1,12/0)的概率。
易侕统计软件输入界面:易侕统计软件输出结果:McNemar 配对四格表卡方检验(2)诊断试验四格表资料分析目的:分析试验结果与真实情况(金标准)的吻合程度。
金标准是指当前公认的诊断疾病最可靠的标准方法,可正确区分“有病”或“无病”。
数据如用通用符号表示:分析指标:1. 检测患病率(prevalence)是指被检测的全部对象中,检测出来的患者的比例。
即:检测患病率 = (a+b)/(a+b+c+d)2. 实际患病率(prevalence)是指被检测的全部对象中,真正患者的比例。
卡方检验详述
卡方检验什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。
它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
卡方检验的基本原理卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。
该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。
根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。
如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
卡方值的计算与意义χ2值表示观察值与理论值之问的偏离程度。
计算这种偏离程度的基本思路如下。
(1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。
(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。
因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。
(3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。
考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家Karl Pearson在1900年首次提出的,因此也称之为Pearson χ2,其计算公式为:其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。
统计学方法卡方检验描述
统计学方法卡方检验描述引言统计学是科学研究中不可或缺的一个工具,其应用广泛,包括了推断统计学和假设检验。
在统计学中,卡方检验是一种重要的方法,能够用来判断两个离散变量之间是否存在关联。
本文将详细介绍卡方检验的原理、应用场景、步骤以及其在统计分析中的重要性。
卡方检验的原理卡方检验,全称卡方独立性检验,是由卡尔·皮尔逊提出的一种统计方法。
其原理基于对观察值与期望值之间的差异进行比较,以判断两个变量之间是否存在关联。
卡方检验的基本思想是通过比较实际观察到的频数与期望频数之间的差异,来判断两个变量之间的关系。
具体而言,对于给定的统计样本,我们可以计算出每一组的期望频数,然后使用卡方检验统计量来衡量实际观察频数与期望频数之间的差异。
如果差异足够大,我们就可以认为两个变量之间存在关联。
卡方检验的应用场景卡方检验在实际应用中具有广泛的应用场景,特别适用于以下情况:1.检验两个离散变量之间是否存在关联。
例如,研究两个疾病之间的关联性、两个药物之间的疗效差异等。
2.检验两个分类变量之间是否存在关联。
例如,研究性别与是否吸烟之间的关系、教育程度与收入水平之间的关系等。
3.对样本数据进行拟合优度检验。
例如,将观察到的频数与理论上的频数进行比较,判断数据是否符合特定的分布。
4.检验数据的独立性。
例如,检验调查结果是否受到回答者特定属性的影响。
卡方检验的步骤卡方检验主要包括以下几个步骤:步骤一:建立假设在进行卡方检验前,我们首先需要建立起原假设和备择假设。
通常情况下,原假设是两个变量之间没有关联,备择假设是两个变量之间存在关联。
步骤二:计算期望频数计算期望频数是卡方检验的关键步骤之一。
通过使用样本中的观察频数和总体的比例,我们可以计算出每一组的期望频数。
步骤三:计算卡方检验统计量卡方检验统计量是衡量观察频数和期望频数之间差异的指标。
常见的卡方检验统计量包括皮尔逊卡方统计量和对数似然比统计量。
步骤四:确定显著性水平和自由度根据问题的要求和样本的特点,确定显著性水平和自由度。
医学统计学-第九章计数资料的参数估计与卡方检验
率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
计数资料的统计描述与卡方检验PPT共83页
•
29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•
30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的பைடு நூலகம்情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
83
计数资料的统计描述与卡方检验
•
26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
•
27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克
•
28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯
计数资料和计量资料的统计方法
计数资料和计量资料的统计方法一、引言统计学是应用数学的一门学科,它研究那些规律性现象和在自然和社会科学过程中数字数据的收集、分析、解释和推断的方法。
统计学是一门非常重要的学科,在现代科技、工程和商业领域中具有广泛的应用。
在统计学中,数据可以分为计数资料和计量资料两类。
计数资料是指数据只能计算某个特定事件发生的次数或频率,这种数据通常表现为分类变量的形式。
而计量资料是指这样的数据,可以通过数值结构来描述它们的数量或大小,这种数据通常表现为连续或离散变量的形式。
本文旨在介绍计数资料和计量资料的统计方法,以帮助读者更好地理解这两种类型的数据并能够正确应用其相关的统计方法。
二、计数资料计数资料又称分类资料。
计数资料的数据量统计通常以频数或百分比来进行。
频数是指某个特定事件在数据集中出现的次数,而百分比是指这些事件在数据集中的出现频率。
这些计数资料通常可以用柱状图或饼图来进行可视化呈现。
在计数资料的统计分析中,最常见的是用卡方检验来判断两个或多个分类变量是否存在显著关联。
通过比较两种不同的口罩在不同寿命期间的感染率,我们可以使用卡方检验来检验它们之间是否存在显著差异。
除了卡方检验外,在计数资料的统计分析中还有一些常用的量。
我们可以使用似然比比率来比较两个或多个不同的模型,以及使用警戒区分析来评估两个或多个分类变量之间的关系。
三、计量资料计量资料又称数值资料或连续资料。
计量资料的数据通常用平均值、标准差和相关系数等指标来进行描述。
这些指标可以帮助我们更好地了解数据的中心趋势和数据之间的变异情况。
计量资料通常可以用直方图或箱线图等图表来进行可视化呈现。
在计量资料的统计分析中,最常用的是使用t检验或ANOVA分析来比较组间或样本间的差异。
在医学试验中,我们可以使用t检验来比较用药组和对照组之间的差异。
线性回归和相关性分析也是常用的计量资料分析方法,可以用来探究变量之间的关系和相关性。
四、结论五、计数资料的实例计数资料的实例非常丰富。
卡方检验的统计描述
卡方检验的统计描述
嘿,大家好呀!今天咱来聊聊卡方检验的统计描述。
就说我上次去动物园玩的时候吧,我在猴山那观察猴子。
哎呀呀,那些猴子可太有意思啦!它们有的在树上窜来窜去,有的在地上找吃的。
我就特别好奇,这些猴子的行为有没有什么规律呢?
这时候我就想到了卡方检验。
就好比说,我想知道猴子喜欢在树上的多还是在地上的多。
我就把观察到的猴子数量按照在树上和在地上进行分类统计。
然后呢,通过卡方检验,就能看看这种分布是不是有显著差异啦。
如果卡方值很大,那就说明猴子在树上和地上的分布很不一样,可能它们有特别的偏好或者受到了某些因素的影响。
但要是卡方值比较小呢,那就可能说明猴子在树上和地上的分布比较随机,没什么特别的规律。
你看,卡方检验不就像是我们在探索这些小猴子们生活中的秘密一样嘛。
通过它,我们可以更好地理解和描述这些现象。
好啦,这就是我对卡方检验的统计描述的理解啦,从动物园里的小猴子身上感受到的哦!下次你们去动物园的时候,也可以试着观察观察,说不定也能发现一些有趣的现象,然后用卡方检验来分析分析呢!哈哈!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1 2 3 4 5 6 7 8 9
年龄 (岁)
35 44 26 25 41 45 50 28 31
性别
身高 (m)
血型
心电图
尿WBC
女 1.65 A
正常
-
男 1.74 B
正常
-
男 1.80 O
正常
+
女 1.61 AB 正常
率又包括频率指标(frequency)和强度指标 (rate),用来测量一定时期内,某人群特 定事件发生的频率或强度。
• 率=(发生某现象的观察单位数)/(某时间段 可能发生某现象的观察单位数)
• 常用百分率(感染率)、千分率、10万分 率(肿瘤发病率)表示。
✓率是一个动态指标,在观察期内看特定人群 中某事件的变化。
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析
本例OR=0.44。
OR、RR临床(实际)意义
• OR、RR>1,表明暴露因素为危险因素,偏 离1越远,表示危险性越强
• 0<OR、RR<1,表明暴露因素为保护因素, 离0越近,表示保护性越强
• OR、RR=1,表明暴露因素与结果无关
–是一个静态指标
–无时间单位
3、相对比 (ratio)
相对比是A、B两个指标之比,是比较两独立事件数 量大小关系指标(独立指互不包含):比=A/B
– 两个指标可性质相同,可不同;绝对数、相对数或平均数。 – 是一个静态指标,反映一特定时间(time point)的情况。 – 无时间单位
计数资料的统计描述:率与比的综合应用 例1 某医院院内感染汇总分析
60
40
轻 100 5
5% 1000 100
50
合计 1100 185 16.8% 1600 220 110
计算标准化感染比(SIR)=(实际感染数与预期感
染数比)=220/110=2;SIR<1, 表示被标化组的感染 率低于标准组; SIR>1, 表示被标化组的感染率高 于标准组。
2、标准化率的注意事项
月份 1月份 2月份 3月份 4月份 5月份 6月份 合计
出院人数 584 571 714 748 942 1095
感染人数 8 10 12 16 21 24 91
感染率 1.37 1.75 1.68 2.14 2.23 2.19
构成比 8.8 11.0 13.2 17.6 23.0 26.4
相对比 -1.28 1.23 1.56 1.63 1.60
注意:暴露因素和结果的赋值标准化:1表示暴露, 0表示未暴露;1表示感染,0表示未感染。否则结 论可能刚好相反。
相对危险度与比数比的关系
例6:治疗组感染率=10/100=0.1;对照组感染率0.2
RR=0.5 OR=0.44
例7:治疗组感染率=5/100=0.05;对照组感染率 =10/100=0.1
绝对危险度实例计算
• 对于感染率研究: 绝对危险度为:20%-10%=0.1 (常用百分数表示:10%)
• 治疗能使感染率的危险度减少10%左右
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR)
* 二分类变量: 0,1
* 有序多分类:多采用等间距赋值
如 -、+、++、+++(0、1、2、3)
* 少量非线性关系有序多分类赋值:考虑哑变量
* 无序多分类变量赋值: A、B、AB、O
12
3
4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
例4 甲、乙两个医院感染率比较
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 感染数 感染率
重 800 160
20% 100 30 30%
中 200
20
10% 400 60 15%
轻 100
5
5% 1000 100 10%
合计 1100 185 16.8% 1500 190 12.7%
1、标准化法的基本方法
计数资料的分类
• 无序分类: 二项或二分类:对立、不相容的两类。 如疗效:病死与未愈,感染与否等。 多项或多分类:互不相容的多类。 如感染部位、感染分型等
• 有序分类:类间不相容且有程度差别。 如疗效:痊愈、显效、好转、无效。
特点:无度量衡单位;定性测量
计数资料的分类赋值
在赋值时应考虑类型而定。
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT)
• 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类:
<5mmHg
无效
5-10mmHg
有效
10-20mmHg
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
RR=0.5 OR=0.48
• 当率较低,如小于10%时, RR值与OR值近似相等。 率值越小(罕发事件),越接近。
• 对大规模临床随机对照试验:OR、RR可使用。
3、绝对危险度(率差)
•对照组感染率40%,试验组20%,RR=0.5? •对照组感染率10%,试验组5%,RR=0.5?
AR为两个率的绝对差值:即对照组率-治 疗组率
轻 100 5
5% 100 10
合计 1100 185 16.8% 1100 280
30% 15%
10% 12.7%
25.4%
2)、间接法:分组标准率
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 实际 预期 感染数 感染数
重 800 160 20% 100
30
20
中 200 20 10% 400
✓率有时间单位—观察时间影响率的大小。
反应停销售量 畸形儿发生率
与医院感染有关的率
• 医院感染发生率 • 医院感染罹患率 • 医院感染患病率(即现患率)
医院感染发生率
• 是指一定时间内某人群中新发病例的频率。
– 公式=(同一时期内新发生医院感染例数/同一时期内处于 危险中病人数)×100%
– 或公式=(同期新发生医院感染例数/同期住院病人人数或 出院病人数)×100%
0.5 0 工人 干部 职员 军人 农民 教师
直条图(bar 条形图):分类变量资料的频数图, 条与条间独立,顺序可不固定。与Histgram不同
饼图/圆饼图/圆图/pie图
百分条图 (percent bar)
工人
干部
1
职员
军人
农民
教师
0%
50%
100%
(二)率、比 (构成比、相对比)
1、率 (rate, frequency)
(三)、计数资料统计描述的 注意事项
1. 计算率时要求分母不宜过小。少于10 例则直接描述。
例2 血清TPS检出率与消化道肿瘤淋巴结转移关系
肿瘤
淋巴结转移
n TPS 阳性率
食管癌 7
7
100
胃癌 9
6
66.7
大肠癌 10
7
70.0
合计 26 20
76.9
(7/7),(6/9),7/10,0/1
无淋巴结转移
实例(例5)分析
组别 未感染 感染 合计 感染率
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析。
RR计算的实例演示
• 治疗组发生感染的危险度(率) =10/100=0.10
• 对照组发生感染的危险度(率) =20/100=0.20
• 相对危险度(RR)=0.5
部分原始数据
9名感染病例的职业状况
编号
性别
身高 职业状况
1
女
1.65
教师
2
男
1.74
工人
3
男
1.80
职员
4
女
1.61
农民
职业状况 工人 干部 职员
频数 3 2 1
5
男
1.71
工人
6
女
1.58
工人
7
女
1.60
干部
8
男
1.76
干部
9
女
1.62
军人
军人
1
农民
1
教师
1
合计
9
2、直条图
3.5 3
2.5 2
1.5 1
• 率与比可用来描述某事件发生机会的大小。
• 二分类变量资料描述
–相对危险度(RR)与比数比(OR)是用来描述 两组间事件发生的机会之比。
• 当事件的发生机会较大时,RR与OR相差较大;当为罕 发事件时, RR OR。
–绝对危险度是指率差,NNT为避免一例不良事件 发生而需要治疗的病例数。
二、计数资料的假设检验
✓条件:比较双方应同质、同时、同地,比较 的两组应选用同一标准。
✓标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。
✓总体标准化率比较也需进行假设检验。
(五)以率/比基础的二级指标
• 相对危险度(RR) • 比数比(OR) • 绝对危险度(AR) • NNT 用来表达危险度的大小或关联程度