临床科研统计方法与选择范文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床科研统计方法与选择
临床科研中数据的处理和统计方法是临床研究得出结论的步骤之一。而描述临床数据,应用正确的统计方法是获得正确的临床科研结果的前提。本文从描述数据到统计方法的选择介绍临床科研论文中常用的统计方法、基本概念。
一、数据的种类
1. 数据种类:临床上的数据通常可简单地分成计量资料、等级资料和分类资料(计数资料) 三种类型。
计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。
等级资料指有一定级别的数据,如:
临床疗效分为治愈、显效、好转、无效,
临床检验结果分为- 、+ 、+ + 、+ + + ,
疼痛等症状的严重程度分为0 (无疼痛) 、1(轻度) 、2 (中度) 、3 (重度) 等,
等级资料又称为半定量资料。
分类资料指各数据之间没有顺序或等级关系,而是归于一定属性,可以是两类,也可以是多类。
如性别资料,按男性和女性分类,计算男性与女性各有多少例;
职业资料,按工人、农民、职员等归类,计算各自的例数;
随访结果资料,按生存或死亡归类,计算各自的例数;
接受干预措施资料,按用试验药物、用安慰剂归类;
是否存在吸烟、饮酒、幽门螺杆菌( Hp) 感染等暴露因素,按吸烟、不吸烟,饮酒、不饮酒, Hp ( + ) 、Hp( - ) 归类等。
2. 数据的类别转换:计量资料可以根据需要或一定的标准分成两个或数个等级而变成计数或等级资料。
如年龄资料是计量资料,但可以按大于65 岁、45~65 岁、小于45 岁分为老、中、青年3 类而转变为等级资料或计数资料。但需要注意的是:
①计量资料转换为等级资料或计数资料比较简单,但从等级资料或计数资料就无法再转换成计量资料,因此,在临床上收集数据或计算机储存数据时,应考虑收集或储存计量资料,只有在数据处理时根据需要再转换为等级资料或计数资料。
②对两组病人的某项指标进行统计学检验时,数据从计量转换为计数或等级资料,统计的效率也可能
下降。
二、数据的统计描述
对于临床研究数据,通常我们不可能在论文中或在报道告诉读者每一个病人的具体特征。我们需要知道这批数据的特征,一方面便于描述,另一方面便于两组数据或特征的差异比较,这就是统计描述。
1. 计量资料(数据) 的统计描述:计量资料的特征通常包括中心位置与离散程度。
中心位置通常用均数来描述,如
一组病人的年龄、体重、血红蛋白、白蛋白、胆红素、肌酐和尿素氮等,
要求是这类数据应该服从正态分布;
如果数据经对数转换后呈正态分布,则可以用几何均数表示其中心位置,如
HBsAg 滴度(1∶8 ,1∶16 ,1∶32 ,1∶64) ;
对于偏态数据,通常用中位数表示其中心位置,如
研究急性肝炎时AL T、AST 等范围从数十到上千变动较大,且每个病人的变化情况不一致。
正态分布的数据离散程度可用标准差来描述;
对于偏态数据,可以用4 分位范围(inter2quartile range , IQR) 描述离散程度,即:
IQR 为第25 百分位数(P25) ~第75 百分位数(P75) 。
2. 计数资料(数据) 的统计描述:计数资料在分类时可以计算各类别在总数中的比重或百分比,称为构成比,如性别资料,100 例病人中,60 例男性,40 例女性,可表示为男性占60 % ,女性占40 %;
如果数据分为发生或不发生,如死亡、患病等,则可计算其死亡率、发病率等指标,表示其发生的强度,称率。
构成比一般不能说明发生强度。
临床上有很多率实际上只是个比例(构成比) 。如患病率是一个比例,由于历史原因,仍称为患病率。所以不能将构成比混为发病率来说明发生强度。当两个率进行比较时,如果某一指标足以对率的大小有影响(如年龄对死亡率) ,而该指标的组成(如年龄构成) 在两组内不同,则需要对该指标进行标准化。
3. 等级资料的统计描述:根据数据可以用构成比或率来计算。如临床疗效可表示为治愈率、好转率等。腹痛根据程度分为无、轻、中、重,可计算各程度的构成比。即用各种程度病人数除以总病例数,各构成比之和应为100 %。
4. 比数、优势比、相对危险度:在病因学研究中,是暴露因素与疾病之间的联系强度的指标。
比数是阳性率与阴性率之比。相对危险度(RR) 是两种暴露条件下发病率之比,如研究Hp 感染与胃癌的关系,采用前瞻性队列研究,按Hp( + ) 与Hp ( - ) 分为2 组观察若干年后胃癌的发生率,计算两组的发病率之比即估计相对危险度。
优势比(OR) 是在病例对照研究中表示暴露与疾病发生之间的相关程度,是RR的近似值,如同样研究,采用病例对照设计,按胃癌与非胃癌分为两组,调查两组病人发病前Hp 感染情况,评价Hp 感染与胃癌之间的关系需用优势比。
三、定量数据的统计学检验
临床研究中要进行两个样本或多个样本间差异的统计学检验,以判定差异是真实存在或者由于抽样误差引起。
1. t 检验与方差分析:对于分组呈正态分布的定量资料,如为两组比较,可用t 检验。
t 检验有2 种方法,取决于资料是成组比较还是配对比较。
临床科研中对每一病人治疗前后的比较:如应用利胆药物后胆红素水平前后的比较;应用保肝药物后
白蛋白水平的前后比较等多属于配对比较。
临床上许多研究无法配对,如新药与对照药物的比较,通常都是治疗组与对照组进行成组比较。在选用t 检验时,这两种t 检验的方法是不同的。
对两组以上(多组) 资料比较,则选用方差分析;方差分析也有二种方法,取决于研究设计。
如研究血液放置时间对血糖测定值的影响,对8 名健康人抽血后将每一个体的血液分为4 份,分别放置0 、45 、90 、135 min 后测定血糖浓度,这种设计每4 份血糖测定值均来自同一个体,称为随机区组随机,需要用随机区组分差分析。
同样,如果我们的目的是比较三种不同降血糖药物的治疗效果,采用随机化方法将病人分为三组,每种药物应用于一组病人,三组病人最终的血糖比较则用完全随机设计方差分析。需要注意的是,各组样本含量相等与不相等时,由于组间离均差平方和计算方法略有差别,所选用方差分析计算公式也不一样。
需要指出的是,配对或配伍组设计比成组或完全随机设计的优点是对某一因素进行控制,如上述4 份血糖结果,除了放置的时间外,其余因素都一样(来自同一人) ,从而减少了偏倚误差,提高统计效率。
在进行方差分析时,如对A、B、C 三种药物的疗效进行比较时,无效假设为三组疗效相同,即H0 :A = B = C ,差异有统计意义而推翻此无效假设时,其备选假设H1 为三种药物的疗效全不相同或不全相同,这时并