医学期刊统计学错误研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学期刊统计学错误研究

1统计设计存在的常见问题

统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则。

不遵循或不重视随机化原则

随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值。

缺少对照研究或对照组设计不合理

正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信。

均衡性原则掌握不够

均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。各组间越均衡,可比性越强。有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。具体表现在:有的文章对

治疗组与对照组的相应统一指标没有设在均衡的水平上。对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察。

重复的原则掌握不好

所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。虽然随机化是增强非处理因素均衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组的方法,也难以保证非处理因素的均衡一致。在随机化分组的基础上,只有样本例数足够大,才能使非处理因素均衡一致,同时也才能使抽样误差减小,增强样本对总体的代表性。一般来说,在随机分组的前提下,样本例数越大,各组之间非处理因素的均衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。一般说来,计数指标每组样本不得少于20~30例,计量指标每组样本不得少于5~10例。在多因素分析时,一般认为样本例数至少为观察指标的5~10倍。

样本的含量

样本的含量的大小直接影响到结论的可靠性。样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。故应在保证研究结果精确可靠的前提下,确定最小的样本量。如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。显然,有限的病例数不能充分说明该药是否有效,作者贸然得出结论,容易给他人造成假象甚至误导。

2统计方法选择与使用不当

在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。测定某个具体数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等许多物理诊断和化验检查的结果。目前,医学论文中计数资料最常用的统计方法为χ2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。均数与标准差分别是描述正态分布资料集中和离散趋势的指标。能否选用“均数±标准差”来描述某一资料的分布特征,关键看该资料是否符合正态分布。当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。有些作者在使用t 检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算

错误。

统计指标应用不当

描述计量资料的统计指标描

述计量资料的统计指标主要有平均数指标(算术均数、中位数M等)和变异指标(标准差s和四分位数间距Q等),在应用时一定要注意它们各自的适用范围。对于非对称分布资料,算术均数不能反映数据的平均水平,应采用中位数描述。一般地,正态资料或对称资料用描述,偏态资料用M和Q来描述。在不能确定数据的分布类型时,应选用M和Q进行统计描述。四分位数间距Q是75%分位数P75

和25%分位数P25之差,即Q=P75-P25,所谓百分位数Px是将全部观察值分为两部分,理论上x%的观察值比它小,(100-x)%的观察值比它大,中位数M是50%分位数

P50。、s、M、Px与Q可通过统计软件直接输出。

描述计数资料的统计指标描

述计数资料的统计指标有绝对数和相对数。绝对数是原始资料经汇总得到的小计或总计数。相对数是两个有关的绝对数之比,主要包括率和构成比(百分比)。医学论文中相对数应用的主要问题之一是分母较小。分母较小时,相对数的可靠性不能保证,在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。医学论文中相对数应用的主要问题之二是将构成比误用来说明事物发生的强度。构成比只能反映事物的内部构成,不能说明事物的发生强度。医学的研究对象主要是人以及与人体有关的各种因素。由于生物现象的变异较大,各种影响因素又错综复杂,研究常是抽样观察,使事物本质差异与抽样误差混杂,故需用统计方法透过偶然现象来探测其规律性。如果不能正确运用统计学方法,造成统计学上的偏差或失误,就很容易把本来成功的结果当成失败而放弃,或把失败的教训误认为

成功的结论而加以宣传。在进行科研设计时要严格遵循科学的统计学分析方法,不能留下隐患,否则,再高明的统计学专家和统计学软件也无法弥补科研设计缺

陷造成的损失。总之,统计学分析在医学研究和论文写作中意义重大。作者在撰写论文时,应注意识别、总结有代表性的、有借鉴意义的统计学领域的缺陷、失误或错误的多发点,特别留心易出现统计错误的险区,从而使论文中的统计学问

题减到最低限度。认真检查、仔细核验,尽量避免上述错误,必要时还可以请统计学专家帮助把关[12]。

统计方法描述或选择不当

统计方法选择非常重要,它直接影响结论的可靠性[12]。临床资料的结果变量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。如果是两组间的比较,则采用四格表χ2检验或其校正公式,如果是多组间率的比较,则采用

相关文档
最新文档