临床研究常用统计方法概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床研究常用统计方法概述
金雪娟周俊时智英葛均波
(复旦大学附属中山医院,上海市心血管病研究所,上海200032)经过周密设计和科学实施的临床研究还需要规范的数据管理和统计分析,才能得到可靠的结论。随着
计算机技术和统计分析软件发展,近年来,统计理论和方法发展非常迅速。临床医师日常繁忙的工作使得
他们很少有时间系统学习医学统计理论,及时了解一些实用、有效的新方法。在此,我们介绍目前临床研
究最常用的一些统计分析方法,以实用、易懂为原则,重点综述各种方法的适用条件。
1 几个基本概念和统计量
1.1数据的类型
数据(Data)是统计分析的基础。统计分析方法的选择取决于不同的数据类型。最常见的数据类型有两
种,分类数据(Categorical Data) 或称定性数据(Qualitative Data) 和定量数据(Quantitative Data) 或称
计量数据(Numerical Data)。
分类数据类型:分类数据的分层大于2时,又称为多分类数据(Polytomous Data)。分类数据类型有
无序(Nominal Categorial) 和有序(Ordinal Categorieal) 。无序数据如性别(男、女)、血型(A、B、0、AB 型)等。有序数据如肿瘤的分级(I级、II级、III级)、疼痛的程度(轻、中、重)等,以及在临床研究设计中,经常看到的“非常好、好、一般、差”这样的数据类型。不同类型的分类数据在统计分析方法上也不同,并不是大家所熟悉的x2检验所能全部涵盖的。
定量数据类型:包括连续性数据(Continuous Data),如身高、体重以及不连续性数据(Discrete Data) 如妇女的产次,疾病的复发次数等。
1.2常用的描述性统计量
最常用的描述集中趋势的统计量为算术均数(Arithmetic Mean),但其值易受极端值影响。可以采用
中位数(Median)、修整均数(Trimmed Mean ,去除最大和最小值后的算术均数)或Winsorized 均数(Winsorized Mean ,极端值用最接近的非极端值替代后的算术均数)来代替。对于数值呈几何分布的资
料,则可采用几何均数(Geometric Mean)。
临床研究论文中常采用均数土标准差或均数土标准误来表示定量数据的分布特征。标准差
(Standard Deviation) 为方差(Variance)的平方根,表示个体数值与样本均数间的离散程度;标准误
(Standard Error)为均数的标准差,表示样本统计量与总体参数间的离散程度,标准误越小,总体均数的
95%可信区间(confident interval ,CI)越窄,也就是说样本均数对总体均数的代表性越好。虽然不同的统计学家对论文中应该引用哪种表达方式有争议,但两种方式均用于描述正态分布的计量数据。在医学论文中,采用标准差或标准误应该说明。对于非对称数据只用均数土标准差或标准误表达是不恰当的,
可以采用中位数结合四分位数间距(Inter-quartile Range) 表示。
1.3 显著性水平(a)和P值