论文中统计结果的表达及解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《中华消化外科杂志》对P值规范化表述的要求
根据中华医学会杂志社的要求,根据人民卫生出版社的全国高等学校教材《卫生统计学》第5版,报告统计学检验的结论时,对P值小于或等于检验水准(一般为0.05)的情况,一律描述为“差异有统计学意义”,同时写明P的具体数值或相应的不等式,在用不等式表示P值的情况下,一般情况下选用P>0.05、P<0.05和P<0.01三种表达方式即可满足需要,无须再细分为P<0.001或<0.0001。不再采用将P<0.05描述为“差异有显着意义”(或差异有显着性)”,或将P<0.01描述为“差异有非常显着意义(或差异有非常显着性)”的表达方式。
______________________________________________
论文中统计结果的表达及解释
【摘要】统计学是生物医学研究所必需的重要手段,生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用。生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成,各个部分都涉及统计结果的表达和解释,统计学是专业结论成立与否的重要依据。统计学应用不当不仅影响论文的科学性,还有可能得出错误的专业结论。
【关键词】统计学科研论文统计分析统计表达
近年来,统计学在生物医学科研中的应用越来越受到重视,统计分析结果的表达及解释已成为医学科研论文中不可缺少的重要组成部分。除论文涉及的专业(如细胞与分子免疫学杂志为免疫学专业)和表述的文字2个方面外,统计学是评价论文质量优劣的重要依据,然而国内生物医学论文中统计学应用仍存在着较为严重的问题[1-4],如2003年某大学学报拟发表论着中统计方法误用率为57%[3]。细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位[5],但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题,作者的统计学应用水平有待进一步提高。许多生物医学杂志,如国外着名杂志JAMA、新英格
兰医学杂志(NEJM)和英国医学杂志(BMJ)等,以及国内中华医学会系列杂志及细胞与分子免疫学杂志等,对来稿都有统计学表达的基本要求或统计学指导原则。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学表达的基本要求。生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成,各个部分或多或少都涉及到统计结果的表达和解释问题。例如在论文的“引言”部分需要给出文献复习的综合结果,如文献报告的组间差别及P值等。其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分[6]。
1摘要
“摘要”中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差(标准误)、率、P值,或2组均数(率)之差、95%可信区间、OR值及多个观察指标的相关系数等。这些数据是循证医学Meta分析的基本依据。
2材料和方法
“材料和方法”中的统计学描述包括以下两个方面。
2.1描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。尤其应具体地描述研究对象的来源和选择方法(如是否配对、随机抽样),包括观察对象的基本情况、有无随机分组(随机抽样)、随机化分组方法、样本含量及其估计的依据等。对于非随机化分组的观察性研究(含调查研究),还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对于临床试验,还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、有无失访及失访的比例、有无“知情同意”、疗效评价是否采用“盲法”(“单盲”、“双盲”或“多盲”)等。
2.2描述统计分析方法与统计计算软件论文中用到的所有统计分析方法都要说
明,且需指出在何处用了何种方法。统计计算软件一般给出名称即可,如SPSS、SAS 等。然而,有些论文却把统计学当做“修饰物”,论文中没有用到的统计分析方法也都一一罗列出来,甚至有的形态学研究不需要统计学分析,却也给出了“P值”。在这里,有些作者错误地认为,只要给出了“P值”,就标志用了统计学,却不管统计学用得是否正确。事实上,误用或滥用统计学不仅不能提高论文的质量,反而会大大降低论文的科学性!
2.3研究设计常见的主要问题(1)研究目的不分主次,试图通过一次试验回答多个问题,测量指标多,样本小,试验前未进行样本含量估计,对研究对象的来源和选择方法不做任何说明或只做非常简单的说明,统计分析方法没有任何说明,尤其是一些特殊的统计方法。例如,动物实验没有随机化分组,或只说明经随机化分组,未说明具体的随机化分组方法(如完全随机、配对或分层随机分组等);(2)观察对比的研究轻率使用“随机选择对照”、“随机抽取健康儿童××例”等用语,对比组间的均衡性未交代或组间不做比较,只说明组间均衡,未给出反映均衡性的统计指标的具体数据以及所用的统计分析方法;(3)临床试验没有报告伦理学要求对随机化分组的限制与改动、受试者的代表性、依从性、是否有失访等,疗效评价未说明是否采用“盲法”,或只说明采用了“盲法”,未说明是受试者遮蔽还是评价者遮蔽等;(4)实验或试验的样本量非常小,如每组3例,却不说明任何理由等等。
3结果
统计学分析结果主要用统计指标(统计量)表示。统计指标比较多且需分组比较时,常常须借助统计图表。
3.1统计量在生物医学论文中,对不同类型的研究资料需用不同的统计指标进行描述。对细胞与分子生物学实验中的常见观测指标,如TRAIL表达、mRNA表达水平、光密度值(OD值)、吸光度值(A值)、百分比含量及抑制率等,常作为计量数据(计量资料)进行统计描述与分析。对于计量资料,当资料为近似正态(或对称)分布时,
可用算术均数x和标准差s描述;在没有变异指标或精确性指标的情况下,不宜单独使用均数。在“±”后直接写具体数值而无标准误或标准差的符号表示,如16.4±2.3,容易引起混淆。配对t检验,应给出差数的均数及标准误(或标准差)。当资料为偏态时,应采用中位数Md和四分位数间距QR来描述,而不宜用x和s。用非参数统计分析方法处理的资料,数据的中心位置用中位数表示,散布范围(如95%的散布范围)用百分位数表示。此外,若对原始数据进行了变量转换,则原始数据的均数及标准差不能很好地反映数据的中心位置及其散布范围,不必将其列出。
对于计数资料,常用的统计指标有率和构成比(百分比)。使用百分比时,分母要交待清楚。小样本资料不宜计算百分比。
实际工作中统计指标应用常见的问题有:计量资料不管是否近似服从正态分布,统统用x±s描述研究结果的数据特征;分子生物学或细胞实验(如ELISA法、MTT法、RT PCR法、免疫细胞化学法、蛋白质印迹分析法等)数据用x±s表示,其样本量(例数)n在“材料和方法”或“结果”中未交代;计数资料统计指标率和构成比(百分比)容易混淆,常将构成比误用为率来说明事物发生的强度;率和构成比的分母太小,却计算相对数来进行描述和比较。分母太小时,率(构成比)的可靠性不能保证。因此,在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。
当计量资料符合正态分布条件时,约有68%的观察数据在x±s的范围内,约有95%的观察数据在x±2s的范围内。当数据不符合正态分布时,就没有这些特征了。
3.2假设检验的结果表达不仅要给出P值,还要给出检验统计量的实际值,如u值、t值、χ2值等。描述统计量,如均数、率、相关系数,无论检验结果是否有统计学意义,均应列出。
0.05水平是常用的检验水准,但P为0.04或0.06时,与0.05并无太大差别,得出的结论也理应一致,不应有本质上的差别。用P>0.05作为不“显着”(统计学意义)的表达方式容易使读者(也包括作者)误解,由于统计软件的普及,因此提倡报告P