论文中统计结果的表达及解释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

论文中统计结果的表达
及解释
集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)
《中华消化外科杂志》对P值规范化表述的要求根据中华医学会杂志社的要求,根据人民卫生出版社的全国高等学校教材《卫生统计学》第5版,报告统计学检验的结论时,对P值小于或等于检验水准(一般为0.05)的情况,一律描述为“差异有统计学意义”,同时写明P的具体数值或相应的不等式,在用不等式表示P值的情况下,一般情况下选用P>0.05、P<0.05和P<0.01 三种表达方式即可满足需要,无须再细分为P<0.001或<0.0001。

不再采用将P<0.05描述为“差异有显着意义”(或差异有显着性)”,或将P<0.01描述为“差异有非常显着意义(或差异有非常显着性)”的表达方式。

______________________________________________
论文中统计结果的表达及解释
【摘要】统计学是生物医学研究所必需的重要手段, 生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用。

生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分都涉及统计结果的表达和解释, 统计学是专业结论成立与否的重要依据。

统计学应用不当不仅影响论文的科学性, 还有可能得出错误的专业结论。

【关键词】统计学科研论文统计分析统计表达
近年来, 统计学在生物医学科研中的应用越来越受到重视, 统计分析结果的表达及解释已成为医学科研论文中不可缺少的重要组成部分。

除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外, 统计学是评价论文质量优劣的重要依据, 然而国内生物医学论文中统计学应用仍存在着较为严重的问题[1-4], 如2003年某大学学报拟发表论着中统计方法误用率为57%[3]。

细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位[5], 但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题, 作者的统计学应用水平有待进一步提高。

许多生物医学杂
志, 如国外着名杂志JAMA、新英格兰医学杂志(NEJM)和英国医学杂志(BMJ)等, 以及国内中华医学会系列杂志及细胞与分子免疫学杂志等, 对来稿都有统计学表达的基本要求或统计学指导原则。

国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学表达的基本要求。

生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成, 各个部分或多或少都涉及到统计结果的表达和解释问题。

例如在论文的“引言”部分需要给出文献复习的综合结果, 如文献报告的组间差别及P值等。

其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分[6]。

1 摘要
“摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。

如处理组和对照组的均数(中位数)、标准差(标准误)、率、 P值, 或2组均数(率)之差、 95%可信区间、 OR值及多个观察指标的相关系数等。

这些数据是循证医学Meta分析的基本依据。

2 材料和方法
“材料和方法”中的统计学描述包括以下两个方面。

2.1 描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。

尤其应具体地描述研究对象的来源和选择方法(如是否配对、随机抽样), 包括观察对象的基本情况、有无随机分组(随机抽样)、随机化分组方法、样本含量及其估计的依据等。

对于非随机化分组的观察性研究(含调查研究), 还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。

对于临床试验, 还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、有无失访及失访的比例、有无“知情同意”、疗效评价是否采用“盲法”(“单盲”、“双盲”或“多盲”)等。

2.2 描述统计分析方法与统计计算软件论文中用到的所有统计分析方法都要说明, 且需指出在何处用了何种方法。

统计计算软件一般给出名称即可, 如SPSS、 SAS等。

然而, 有些论文却把统计学当做“修饰物”, 论文中没有用到的统计分析方法也都一一罗列出来, 甚至有的形态学研究不需要统计学分析, 却也给出了“P值”。

在这里, 有些作者错误地认为, 只要给出了“P值”, 就标志用了统计学, 却不管统计学用得是否正确。

事实上, 误用或滥用统计学不仅不能提高论文的质量, 反而会大大降低论文的科学性!
2.3 研究设计常见的主要问题 (1)研究目的不分主次, 试图通过一次试验回答多个问题, 测量指标多, 样本小, 试验前未进行样本含量估计, 对研究对象的来源和选择方法不做任何说明或只做非常简单的说明, 统计分析方法没有任何说明, 尤其是一些特殊的统计方法。

例如, 动物实验没有随机化分组, 或只说明经随机化分组, 未说明具体的随机化分组方法(如完全随机、配对或分层随机分组等); (2)观察对比的研究轻率使用“随机选择对照”、“随机抽取健康儿童××例”等用语, 对比组间的均衡性未交代或组间不做比较, 只说明组间均衡, 未给出反映均衡性的统计指标的具体数据以及所用的统计分析方法; (3)临床试验没有报告伦理学要求对随机化分组的限制与改动、受试者的代表性、依从性、
是否有失访等, 疗效评价未说明是否采用“盲法”, 或只说明采用了“盲法”, 未说明是受试者遮蔽还是评价者遮蔽等; (4)实验或试验的样本量非常小, 如每组3例, 却不说明任何理由等等。

3 结果
统计学分析结果主要用统计指标(统计量)表示。

统计指标比较多且需分组比较时, 常常须借助统计图表。

3.1 统计量在生物医学论文中, 对不同类型的研究资料需用不同的统计指标进行描述。

对细胞与分子生物学实验中的常见观测指标, 如TRAIL表达、 mRNA表达水平、光密度值(OD值)、吸光度值(A值)、百分比含量及抑制率等, 常作为计量数据(计量资料)
进行统计描述与分析。

对于计量资料, 当资料为近似正态(或对称)分布时, 可用算术均数x和标准差s描述; 在没有变异指标或精确性指标的情况下, 不宜单独使用均数。

在“±”后直接写具体数值而无标准误或标准差的符号表示, 如16.4±2.3, 容易引起混淆。

配对t 检验, 应给出差数的均数及标准误(或标准差)。

当资料为偏态时, 应采用中位数Md和四分位数间距QR来描述, 而不宜用x和s。

用非参数统计分析方法处理的资料, 数据的中心位置用中位数表示, 散布范围(如95%的散布范围)用百分位数表示。

此外, 若对原始数据进行了变量转换, 则原始数据的均数及标准差不能很好地反映数据的中心位置及其散布范围, 不必将其列出。

对于计数资料, 常用的统计指标有率和构成比(百分比)。

使用百分比时, 分母要交待清楚。

小样本资料不宜计算百分比。

实际工作中统计指标应用常见的问题有: 计量资料不管是否近似服从正态分布, 统统用x±s描述研究结果的数据特征; 分子生物学或细胞实验(如ELISA法、 MTT法、 RT PCR 法、免疫细胞化学法、蛋白质印迹分析法等)数据用x±s表示, 其样本量(例数)n在“材料和方法”或“结果”中未交代; 计数资料统计指标率和构成比(百分比)容易混淆, 常将构成比误用为率来说明事物发生的强度; 率和构成比的分母太小, 却计算相对数来进行描述和比较。

分母太小时, 率(构成比)的可靠性不能保证。

因此, 在这种情况下, 宜直接用绝对数进行描述而不宜计算相对数。

当计量资料符合正态分布条件时, 约有68%的观察数据在x±s的范围内, 约有95%的观察数据在x±2s的范围内。

当数据不符合正态分布时, 就没有这些特征了。

3.2 假设检验的结果表达不仅要给出P值, 还要给出检验统计量的实际值, 如u 值、 t值、χ2值等。

描述统计量, 如均数、率、相关系数, 无论检验结果是否有统计学意义, 均应列出。

0.05水平是常用的检验水准, 但P为0.04或0.06时, 与0.05并无太大差别, 得出的
结论也理应一致, 不应有本质上的差别。

用P>0.05作为不“显着”(统计学意义)的表达
方式容易使读者(也包括作者)误解, 由于统计软件的普及, 因此提倡报告P的具体数值
(精确P值), 如P=0.018或P=0.436等。

如果提供精确P值实在有困难, 应给出实际的χ
2值、 t值、 F值和相应的自由度, 以便他人在Meta分析时转换为精确P值。

3.3 统计图表统计图表是研究结果统计表达的重要手段, 统计图便于读者直观了解
研究结果, 并且提倡用图来显示个体值的散布情况, 如相关和回归分析的散点图。

同一个体
值不同时间的重复测量值最好连成曲线, 不同组别的个体值(均值)随时间变化的曲线亦可
标在同一个图上。

提倡采用误差条图(或线图), 但由均数加减标准误绘出的误差条图, 仅
能描述68%的可信区间, 不能误解为95%的可信区间。

医学论文中要求采用“三线”表。

数值结果按列(行)放置, 位数要对齐, 不要出现交
*换行的情况。

不同类型数据(如均数、标准误)要有标目, 表中应列出相应的观察例数。

大量统计结果的表达要运用统计表或统计图, 实际应用中统计图表还存在一些问题, 主
要有: (1)图形类别的选择与资料性质不符; (2)纵横两轴的等距离尺度不代表等差数据(算
术尺度)或等比数据(对数尺度); (3)无图例或标目; (4)条图的纵轴起点不为0、横轴的刻度为算术刻度、排列顺序未按指标值大小(或自然顺序)排列; (5)圆图各部分未按比例
大小或自然顺序顺时针方向排列(其他项放最后)、起点位置不在12时或9时; (6)统计
表的标目不明确, 主辞和宾辞倒置或混淆, 表中存在斜线或竖线, 数据为“0”、无数据或
缺失数据时留有空白, 同一指标小数位数(精度)不一致、小数点(位)未对齐等图表不
规范问题。

3.4 数据精确度一般来说, 数据精确度只要足以区分个体差异即可, 并非小数位数
越多越好。

表示观测结果时, 2个数的小数位数应一致, 如5.4±0.62, 应写成5.4±0.6,
平均值(x)与标准差(s)的位数, 除取决于测量仪器的精密度外, 还取决于样本内个体的变异,
一般按s3而定, 例如(3825.3±610.6) g, 其中s3超过200 g, 平均值在百克的位上波动, 故应写成(3.8±0.6) kg。

与实际情况不符的精确度并不能增加论文的价值, 反而降低了论文的可读性与可信程度。

从计算器或计算机得到的计算结果需要四舍五入。

计量资料的统计指标(x、 s、中位数、百分位数等)要保留的小数位数, 应该与原始数据记录的小数位数相同。

均数的有效位数通常不应比原始数据的有效位数多, 但标准差或标准误必要时需多增加一个位数。

计数资料的百分比保留1位小数, 一般不超过2位小数; 病死率、发病率按惯例选择比例基数, 如1000‰, 10000/万和10万/10万等, 或自行选择合适的比例基数, 使率的整数部分至少有1位有效数字; 相关系数保留2位小数; 精确概率P值一般没必要给出四位小数, 有时甚至保留两位小数也可以; 检验统计量, 如χ2值、 t值保留2位小数即可。

当样本数小于100时, 小数位数的多少并不能增加精确度, 应避免取过多的小数位数。

注意, 以上要求仅适用于表达最终的统计结果, 数据在分析之前或分析过程中不能舍入。

在表达t值、χ2值或r值时, 有2位小数就足够了。

3.5 常用统计专业术语一些常用的统计专业术语, 要注意不能作为普通名词使用, 如参数(parameter)、可信区间(confidence interval)、相关(correlation)、发病率(morbidity)、患病率(prevalence rate)、非参数法(non parametric
statistics)、百分位数(percentile)、灵敏度(sensitivity)、特异度(specificity)等。

4 讨论
“统计学”是“专业结论成立与否的重要依据”[2]。

统计学分析结果的解释主要集中在论文的“讨论”部分。

作者往往要在“讨论”部分引用统计结果作为支持其新发现、新结果、新观点的统计学依据, 对统计结果理解和解释上的偏差, 可能导致专业结论上的错误。

4.1 假设检验结果的解释假设检验是在“无效假设”正确的前提下(如施加干预以前, 组间无差别或观察对象来自同一总体), 用P值大小说明实际观察结果是否符合“无效
假设”。

P值小(如P<0.05), 则怀疑“无效假设”的正确性; P值大(如P>0.05), 则不
能拒绝“无效假设”。

但不能把P值理解为处理无效的概率。

要注意区分“统计学显着”和“生物学(或医学)显着”是2种不同的结论。

不可一得
到P<0.05就认为有实际意义, 而不管其生物学效应有多大。

组间生物学效应很小时(如DC Ag TDLNC组比DC TDLNC组CD3+ T细胞含量仅提高了0.7%[7]), 大样本量也可能使统计结果“显着”。

例如肝硬化患者外周血IP10水平与ALT水平的Spearman相关系数
为0.2, 当n=100时, Spearman相关系数经假设检验“统计显着”(P<0.05), 但IP10水平与ALT水平相互只能解释4%的变异, 实际意义已经很小。

因此, 统计学意义上的“显着”并不等同于生物学上的差异“显着”。

同理, 也不能一看到P>0.05就认为某2种生物
学处理“无显着差异”, 甚至认为可以相互替代。

即使生物学上的差异“显着”, 当观察的
样本很小时, 也极有可能出现统计学上不“显着”的结果。

在医学论文中, 有一些P>0.05
的“阴性”结果, 检验效能不足是一个主要的原因。

综上所述, 有统计学意义的检验结果并不一定意味着确有生物学效应。

这里有两个原因, 一是总会有错判的危险性, P值越小错判的危险性越小; 二是假设检验为定性的检验结果
(是否拒绝无效假设)时, 专业上是否有意义还要看统计量的大小。

可信区间有助于假设检验结果的解释, 小样本时尤其如此。

由于可信区间反映了研究结
果的不确定性, 并可提示差别有无实际意义, 因此无论假设检验结果是否显着, 都可计算可
信区间, 如两均数差值的可信区间、相关系数的可信区间等。

将可信区间与不显着的结果
一起列出, 特别有启示作用。

4.2 关联与因果在观察性研究中, 变量间的关联(association)或组间差别可能是
因果关系(causation), 也可能是偏倚, 确定因果关系需要根据专业知识进行进一步的分
析研究。

例如, 有人曾观察到眼晶状体后纤维增生的新生儿, 注射促肾上腺皮质激素后, 治愈率75%, 说明促肾上腺皮质激素与患儿治愈有关联(前后比较: P<0.01)。

但随后进行的前瞻性的临床试验发现, 患儿脱离富氧环境后, 75%患儿自然痊愈(组间比较: P≈1.00)。

如果将观察结果解释为“注射促肾上腺皮质激素与患儿痊愈有因果联系”, 并以此作为统计学证据, 临床上大量使用促肾上腺皮质激素治疗新生儿眼晶状体后纤维增生, 会导致严重后果。

在随机对照研究中, 关联和组间差别可以解释为有概率保证的因果关系。

当变量都随时间而变化时, 变量间很容易出现虚假的相关关系, 必须特别加以小心。

4.3 预测与诊断试验在细胞与分子生物学检测(诊断)实验中, 常常遇到标准曲线(直线)的绘制, 即需要进行回归分析。

在回归分析中, 即使两变量间有显着关系, 但用回归方程从变量X推算Y的个体值, 仍可能不很精确。

预测的精确程度不能根据相关或回归系数来评价, 它需按不同的X值计算预测的个体Y值的容许区间(或Y值均数的可信区间)。

直线回归仅适用于用自变量X预测应变量Y, 而不是Y预测X。

具有高灵敏度、特异度的诊断检验, 不一定能达到诊断疾病的目的, 在人群发病率很低的情况下尤其如此, 而计算患者在诊断试验阳性人数中的比率(阳性预测值, PV+)会更有实用价值。

连续性变量也有类似诊断试验的问题。

通常把“异常”值定义为该变量“正常范围”以外的数值。

但如果实际患病率很低, 许多正常人的个体值在“正常范围”以外也是正常的。

异常者的判定应同时根据临床上和统计上的标准。

4.4 缺陷或不足要指出在研究设计和实施过程中有哪些不足。

若发现缺陷, 则应考虑这些缺陷对结果和解释可能产生的影响。

不能对缺陷或不足视而不见, 更不能寄希望于不被读者发现。

总之, 生物(医学)统计学是生物(医学)专业结论成立与否的重要依据。

生物医学研究者应重视统计研究设计及统计分析结果的表达和解释, 正确运用统计方法的前提是良好的实验设计。

如果实验前没有良好的设计, 或者设计存在错误, 那么, 即使使用高级的计算机和复杂的统计方法处理数据, 也只能得到错误的结论。

因此, 统计学问题的咨询应该在一个研究项目开始之前, 而不是在研究数据出来以后, 否则, 就象统计学家Fisher所告戒的一样: 实验完成后再找统计学家, 无异于请统计学家为实验进行“尸体解剖”, 统计学家或许只能告诉你实验失败的原因。

相关文档
最新文档