临床研究常用统计方法概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

临床研究常用统计方法概述

金雪娟周俊时智英葛均波

(复旦大学附属中山医院,上海市心血管病研究所,上海200032)经过周密设计和科学实施的临床研究还需要规范的数据管理和统计分析,才能得到可靠的结论。随着

计算机技术和统计分析软件发展,近年来,统计理论和方法发展非常迅速。临床医师日常繁忙的工作使得

他们很少有时间系统学习医学统计理论,及时了解一些实用、有效的新方法。在此,我们介绍目前临床研

究最常用的一些统计分析方法,以实用、易懂为原则,重点综述各种方法的适用条件。

1 几个基本概念和统计量

1.1数据的类型

数据(Data)是统计分析的基础。统计分析方法的选择取决于不同的数据类型。最常见的数据类型有两

种,分类数据(Categorical Data) 或称定性数据(Qualitative Data) 和定量数据(Quantitative Data) 或称

计量数据(Numerical Data)。

分类数据类型:分类数据的分层大于2时,又称为多分类数据(Polytomous Data)。分类数据类型有

无序(Nominal Categorial) 和有序(Ordinal Categorieal) 。无序数据如性别(男、女)、血型(A、B、0、AB 型)等。有序数据如肿瘤的分级(I级、II级、III级)、疼痛的程度(轻、中、重)等,以及在临床研究设计中,经常看到的“非常好、好、一般、差”这样的数据类型。不同类型的分类数据在统计分析方法上也不同,并不是大家所熟悉的x2检验所能全部涵盖的。

定量数据类型:包括连续性数据(Continuous Data),如身高、体重以及不连续性数据(Discrete Data) 如妇女的产次,疾病的复发次数等。

1.2常用的描述性统计量

最常用的描述集中趋势的统计量为算术均数(Arithmetic Mean),但其值易受极端值影响。可以采用

中位数(Median)、修整均数(Trimmed Mean ,去除最大和最小值后的算术均数)或Winsorized 均数(Winsorized Mean ,极端值用最接近的非极端值替代后的算术均数)来代替。对于数值呈几何分布的资

料,则可采用几何均数(Geometric Mean)。

临床研究论文中常采用均数土标准差或均数土标准误来表示定量数据的分布特征。标准差

(Standard Deviation) 为方差(Variance)的平方根,表示个体数值与样本均数间的离散程度;标准误

(Standard Error)为均数的标准差,表示样本统计量与总体参数间的离散程度,标准误越小,总体均数的

95%可信区间(confident interval ,CI)越窄,也就是说样本均数对总体均数的代表性越好。虽然不同的统计学家对论文中应该引用哪种表达方式有争议,但两种方式均用于描述正态分布的计量数据。在医学论文中,采用标准差或标准误应该说明。对于非对称数据只用均数土标准差或标准误表达是不恰当的,

可以采用中位数结合四分位数间距(Inter-quartile Range) 表示。

1.3 显著性水平(a)和P值

为了说明统计学显著性差异,通常把P值与参考值a比较,如果P

存在统计学显著性差异)。a水平通常选用0.05,其实0.05并非是一个具有魔力的数字,其它常用的a值还有0.01和0.10等,甚至在某些特殊的情况下,a值可以取0.20等。a值说明I类错误的概率,如a等

于0.05,则I类错误的概率为5%(拒绝正确H0的概率)。研究论文报告结果时,应该把a和P值,同时加以说明。

参阅已经发表的文献,常发现这样的问题,研究者设立了A、B和C组3个组,在统计检验时,先把

A与B比较,然后B与C比较,再A与C比较,这是需要极力避免的。多重比较会增加I类错误的概率。假设有K个中心,同时参与某临床实验,如果按各个中心分别统计,则 a = 1 - ( 1 - 0.05 ) K 。当K等于

1、2、3、4时,a值依次为0.050、0.098、0.243、0.185,随着独立检验次数的增加,a值也增加。

1.4统计分析软件的选择

统计软件非常多,目前临床研究常用并且比较权威的统计软件有SAS(Statistics AnalysisSystem)、SPSS(Statistical Package for the Social Science) 、STATA(Statisties / Data Analysis) 和Splus 等。STATA灵巧方便,价格也能为个人用户所承受。SSPS的菜单式操作,使用简便,而且介绍SPSS的书籍比较多,目前已经成为国内非统计专业人员统计的首选软件。SAS是主要针对专业统计用户设计的软件,

在数据处理和统计分析领域,被誉为国际上的标准软件系统。国际上大部分著名高校和生物统计机构均使用SAS作为统计分析工具,一些最新的统计方法在SPSS和STAT中没有包括,需要选用SAS处理。

2临床研究常用统计方法选择的原则

2.1单组资料的分析

如果数据呈正态分布,则采用单样本t检验(One-Sample Test);如果数据呈非正态分布,可以采用

相应的非参数统计方法Wilcoxon 符号等级检验(Wilcoxon Signed-Rank Test) 。

2.2两组资料的分析

首先,需要判别数据为定量数据还是分类数据。如果是定量数据,数据的分布特征呈正态,则选择两

样本t检验(Two-Sample Test);如果定量数据呈非正态分布,则选择Wilcoxon 等级和检验(Wileoxon Rank Sum Test)。

对于分类数据,卡方检验(Chi-Square Test)被广泛运用。但值得注意的是,如果行列表中有1/5以

上的格子理论频数小于5,或有飞个格子理论频数小于1,卡方检验将导致分析的偏性。此时,可以采用Fishe's 精确概率法(Fishe's Exact Test) 计算P 值。

2.3三组或以上资料的分析

与两组资料分析类似,如果数据为定量资料呈正态分布,则采用单因素方差分析(One way ANOVA);

如果定量数据,呈非正态分布,则选择Kruskal 一Wallis检验(Kruskal 一Wallis Test)。

对于分类数据,多分类无序数据采用卡方检验(Chi-Square Test)或Fish's精确概率法;多分类有序

相关文档
最新文档