医学论文常见统计学错误与纠正

合集下载

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,统计分析方法的正确应用对于得出科学、可靠的结论至关重要。

然而,在实际的医学论文中,我们常常能发现各种各样的统计分析方法错误,这些错误不仅影响了研究结果的准确性和可信度,还可能导致错误的临床决策。

下面,我们就来详细梳理一下医学论文中常见的统计分析方法错误。

一、样本量不足样本量的大小直接关系到研究结果的可靠性和普遍性。

如果样本量过小,可能无法准确反映总体的特征,导致统计效能不足,从而得出错误的结论。

例如,在比较两种治疗方法的疗效时,如果每组的样本量只有十几例,那么很可能因为偶然因素而得出错误的差异结论。

二、数据类型错误医学研究中数据类型多种多样,包括计量数据(如身高、体重、血压等)、计数数据(如治愈人数、死亡人数等)和等级数据(如病情的轻、中、重)。

如果对数据类型的判断错误,就会选择错误的统计分析方法。

例如,将本来应该是计数数据的治愈率当作计量数据进行 t 检验,这是不正确的。

三、忽视数据分布许多统计方法都有其适用的数据分布条件。

例如,t 检验和方差分析要求数据服从正态分布。

如果数据不服从正态分布而强行使用这些方法,就会得出错误的结果。

在这种情况下,应该先对数据进行正态性检验,如果不满足正态分布,可以考虑使用非参数检验方法,如秩和检验。

四、多重比较问题在医学研究中,常常需要进行多个组之间的比较。

如果不注意控制多重比较带来的误差,就会增加得出错误阳性结果的概率。

例如,在比较多个药物剂量组的疗效时,如果不进行适当的校正(如 Bonferroni 校正),就可能因为多次比较而错误地认为存在显著差异。

五、相关与回归分析的错误相关分析用于研究两个变量之间的线性关系,但不能得出因果关系。

在医学论文中,有时会错误地将相关关系解释为因果关系。

回归分析中,自变量的选择、模型的拟合度评估等方面也容易出现错误。

例如,没有考虑自变量之间的共线性问题,导致回归结果不准确。

六、生存分析的错误生存分析常用于研究疾病的发生、发展和预后。

医学期刊论文中常见统计学错误

医学期刊论文中常见统计学错误
2 4
心肺血管病杂 志 2 0 1 4年 1 月第 3 3卷第 1期
J o u r n a l o f C a r d i 0 v a s c u l a r&P u l mo n a r  ̄ D i s e a s e s , J a n u a r y 2 0 1 4 , V o 1 . 3 3 , N 0 . 1
发症死 亡者 占 3例 ( 2 5 %) , 说 明术 后抗 凝 是 换瓣 术
[ 3] R o b e t r s WC .Mo r p h o l o g y i c f e a t u r e s o f t h e n o r m a l a n d a b n o ma r l
mi t r a l v a l v e . Am J Ca r d i o 1 .1 9 8 3. 5 1: 1 0 0 5.
[Байду номын сангаас4] Z i l e MR, T o m i t a M,I s h i h a r a K, e t 1. a C h a n g e s i n d i a s t o l i c f u n c ・
( L A D) : ( 6 8 . 4±6 . 5 ) m m等。 5 . 随访 结果 分 析
[ 2] G e n g Z J .A t e n y e a r s e x p e i r e n c e w i t h 6 1 3 mi t r a l v a l v e r e p l a c e —
me n t s . Ch u n g Hu a Wa i Ko Ts a C h i h, 1 9 8 9, 2 7: 5— 8.
本组患者术后 1 3年 的存 活率达 6 2 . 2 %, 该结

医学杂志论文中常见的统计学错误分析及对策

医学杂志论文中常见的统计学错误分析及对策

(1)忽视了t检验的使用条件;
(2)多个样本均数比较错误地用多个t 检验代替 方差分析;
(3)误用t检验分析重复测量设计资料
单样本t检验的应用条件:样本服从正态分
布;
成组t检验的应用条件:样本服从正态分布;
两样本的总体方差相等即方差齐性。
配对t检验的应用条件:差值服从正态分布。
这类错误是临床医学科研论文中定量资料分析中最 常见的错误, 而且是原则性错误, 会增加犯第一类 错误的概率。假设检验的案例一资料为不同年龄组 不同性别基础能耗情况, 原作者用t检验分别对各 组均数逐一进行比较, 得出在男女研究对象青年组 与中年、老年组的基础能耗差异有足够的样本作 前提,要在文章中描述清楚随机抽样的抽样总体、样本含 量、抽样方法,随机分组的随机方法、各组的样本含量与 基本特征等。医学科研论文中最普遍的问题是滥用“随 机”,只要是抽样或分组,不管实际是否采用了随机的方 法,在论文中均不谈采用了什么样的随机方法,就将“随 机”写上,将随机误解为随意、随便、不采用随机化处理 方法,导致结果缺乏可靠性。
某研究者为了研究三种不同值班情况孕妇的 早产发生情况, 作者在计算平均率时, 错误地将几 个率相加后取其平均值, 这种类型的错误也是临床 科研论文中常见的错误之一。
如计算计数资料的案例二中三种值班女工的 早产的合计发生率( 即平均率)时, 以( 2. 7+ 4. 8+ 10. 3) /3= 5. 9, 即平均发生率为5. 9%。
(2)统计图方面的主要错误有两个,其一,横坐标轴 上的刻度值不准确,等长的间隔代表的数量不等;在 直角坐标系中,从任何一个数值开始作为横轴或纵轴 上的第一个刻度值。其二,用条图或复式条图表达连续 性变量的变化趋势;
(3)统计表中数据的含义未表达清楚,令人费解;

医学论文中存在的问题及改进措施

医学论文中存在的问题及改进措施

缺乏合适的培训和指导
导师指导不足
一些医学论文的研究可能缺乏足够的导 师指导,导致研究者在研究设计和数据 分析等方面无法得到必要的帮助。
VS
培训课程缺失
一些医疗机构可能缺乏必要的培训课程, 导致研究者无法正确掌握医学研究的技能 和方法。
04
改进措施和建议
提高研究者能力水平
加强研究方法的培训
为研究者提供更多的培训和教育,使其掌握 科学的研究方法和技能,提高研究能力和水 平。
总结词
统计分析方法不当,结果解释牵强附会。
详细描述
论文的统计分析方法选择不恰当,如使用t检验代替卡方检验;此 外,作者对结果的解释过于主观和牵强,不能准确反映数据真实 情况。
06
结论与展望
研究结论总结
结论可靠
医学论文的研究结论应该是基于大量实验数据和严 谨的分析得出的,确保结论可靠。
结论明确
论文的结论应该明确,能够准确地回答研究问题或 假设。
研究背景和意义是医学论文的重要组成部分,但往 往被一些作者忽略或撰写得不够充分。
医学论文的研究背景应介绍研究领域的发展状况、 前人研究成果及存在的问题,以及本研究的意义和 价值。
研究目的和方法
研究目的是医学论文的重要内 容之一,但一些作者在撰写时 往往过于简单或不够明确。
研究目的应明确阐述本研究要 解决什么问题、达到什么目的 ,以及采用的方法和步骤。
结论具有可重复性
研究结论应该是可重复的,其他研究者可以通过同 样的方法验证结论的正确性。
研究不足与展望
80%
研究局限性
医学论文应该清楚地说明研究的 局限性,例如样本大小、研究时 间、研究方法等。
100%
需要进一步研究的问题

医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。

2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。

常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。

假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。

大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。

仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。

●鉴别研究因素的效应和自然发展结果。

例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。

常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。

医学论文中统计学处理常见问题及应对措施

医学论文中统计学处理常见问题及应对措施

医学论文中统计学处理常见问题及应对措施1存在问题1)统计软件名称和版本不全。

最常见的问题是作者只写统计软件名称而漏掉了统计软件版本。

2)统计数据描述含糊不清。

如笼统说“用-x±s 表示”,而不分定量资料或定性资料。

3)误用统计学方法并且统计方法描述不详细。

例如:对定量资料盲目套用t检验,多组均数比较没有采用方差分析和q检验;对定性资料,盲目套用χ2检验;非参数检验资料没有采用秩和检验或Ridit检验; 对回归分析没有结合专业知识和散点图选用合适的回归类型,而盲目套用简单直线回归分析;在逻辑上无明显相关的2个或2个以上指标检测结果勉强进行相关性分析等;对随访资料没有使用生存分析等。

另一个问题是统计学方法的描述不详细。

例如: 使用t检验,没有说明是完全随机设计资料的t检验, 还是配对设计资料的t检验;使用方差分析时,没有说明是完全随机设计资料的方差分析,还是随机区组设计资料的方差分析,或是巢式设计资料的方差分析;对于四格表资料,没有交代是一般四格表资料χ2检验, 还是四格表资料的校正的χ2检验。

4)假设检验结果的表达和解释中存在的问题。

假设检验的结果表达没有根据不同的统计分析方法, 给出相应的检验统计量的实际值及相应的值,如t检验的t值、方差分析的F值、卡方检验的χ2值、相关分析的相关系数及相应的r值等。

此外,统计结果的解释存在如下问题:假设检验是在“无效假设”正确(比如2种药物的疗效没有差异) 的前提下,用P值大小说明实际观察结果是否符合“无效假设”。

P值小(如P<0·05或P<0. 01)则怀疑“无效假设”的正确性,应得2种药物疗效的差异有统计学意义或差异有高度统计学意义的结论,而不应得差异显著或差异非常显著的结论;P值大(如P> 0·05),则不能拒绝“无效假设”,应得2种药物疗效的差异无统计学意义的结论,而不应得无差异的结论。

这是典型地把统计结论作为专业结论而犯的错误。

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,准确合理地运用统计分析方法对于得出可靠的研究结论至关重要。

然而,在实际的医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差,甚至得出错误的结论。

下面,我们就来详细探讨一下医学论文中常见的统计分析方法错误。

一、数据类型判断错误数据类型的正确判断是选择合适统计分析方法的基础。

医学研究中常见的数据类型包括计量资料、计数资料和等级资料。

然而,很多研究者在数据类型判断上出现失误。

例如,将原本应该是计数资料的数据(如疾病的治愈、好转、无效等)当成计量资料进行分析,错误地使用了均值和标准差等统计指标,而应该使用频率和百分比等指标,并采用卡方检验等方法。

二、样本量计算不合理样本量的大小直接影响到研究结果的可靠性和准确性。

一些医学论文在研究设计阶段没有充分考虑样本量的计算,导致样本量过小或过大。

样本量过小,可能会使研究结果缺乏统计学意义,无法检测出真实存在的差异;样本量过大,则会造成资源的浪费,同时增加研究的难度和成本。

正确的样本量计算应该综合考虑研究的设计类型、预期效应大小、检验水准和检验效能等因素。

三、选择错误的统计方法这是医学论文中常见的错误之一。

例如,对于两组独立样本的均数比较,应该使用 t 检验,但如果两组数据的方差不齐,就需要使用校正的 t 检验或者非参数检验方法(如 Wilcoxon 秩和检验)。

然而,很多研究者在这种情况下仍然使用了普通的 t 检验,导致结果不准确。

再比如,对于多组均数的比较,如果方差分析结果有统计学意义,还需要进一步进行多重比较。

但有些研究在这一步没有进行恰当的多重比较方法选择,导致结论不够准确。

四、忽视数据的正态性检验在进行某些统计分析(如 t 检验、方差分析等)时,要求数据服从正态分布。

然而,很多研究者在使用这些方法之前,没有对数据进行正态性检验。

如果数据不服从正态分布,却仍然使用基于正态分布假设的统计方法,就会得出错误的结论。

医学论文撰写中常见的统计学问题及其处理

医学论文撰写中常见的统计学问题及其处理

医学论文撰写中常见的统计学问题及其处理绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。

如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。

显然,经正确统计处理的结果可信度高,论文的质量也高。

据不完全统计,在难以发表的、巳凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中,约半数以上是由于统计错误致其结果与原文主要结论相违背。

如一文采用某新药引产,96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%(各2例),明显低于应用原药引产的19例,其产后出血与新生儿低Apgar评分发生率均为15.8%(各3例,x2=7.164, P?.001)。

故认为采用新药引产是一更安全的措施。

原药引产组例数偏少暂且不谈,该资料比较应采用精确法分析,结果是与原结果恰恰相反(P>0.05),这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。

类似问题文稿中还常有出现。

现就文稿中常见的统计问题及其相应的处理方法简述如下。

一、常用的统计术语统计学中常用的概念有总体与样本、随机化与概率、计量与计数、等级资料及正态与偏态分布资料、标准差与标准误等。

如某研究采用经会阴途径测定宫颈长度,以探讨不同宫颈长度与临产时间的关系。

结果显示35例宫颈长度为25〜34 mm者与32例宫颈长为15〜24 mm者临产时间的均值士标准差(士s)各为57.6±58.1与47.3±49.1小时。

该计量资料,经t检验显示t=0.780, P>0.05,并未提示不同宫颈长度的临产时间差异有显著意义;从标准差大于均值,显示各变量值离散程度大,呈偏态分布,故不能采用士,这一算术均数法计算均数。

经偏态转换成近似正态分布资料后结果是:35例与32例的临产时间各为34.5±4.1 与26.7±4.1小时,(t=7.778, P?.001),两组差异有极显著意义。

医学论文中的常见统计学错误

医学论文中的常见统计学错误
医学论文中 的常见统计学错误
中国疾病预防控制中心 金水高
精品课件
正确的统计学方法必须贯 穿于从课题的统计设计 到论文撰写的全过程。
精品课件
不管是实验室研究、临床研究还是现场调查, 其数据的归纳整理,都要列成一定的标准格 式,以便于进行计算机的录入及统计分析。 其基本要求为: 1. 横为记录,纵为变量 2. 对每个变量要起合适的变量名 3. 对分类变量中用字符表示的取值在进行计 算机录入时必须按照一定的规矩将其转换为 数值。
一、计数资料分析中的常见错误举例
1.率与构成比 2.某研究想了解筛查与自查相比发现的肝癌病例分期是 否存在差异,是否筛查更能发现早期肝癌病人。
精品课件
一、计数资料分析中的常见错误举例
1. 率与构成比(续)
精品课件
一、计数资料分析中的错误举例
2. 样本量/阳性例数较少时的统计分析
年龄别 123451015合计
对照(一水平) 1
1.56 3.56
0.86
二水平
0.64
1
0.44
1.81
三水平
0.28
2.28
1
4.14
四水平
1.16
精品课件
0.55 0.24
三、 Logistic 回归中的主要统计学错误
4. 比数比及相对危险度的正确解释 某文献在研究影响妇女产前检查的可能因素时,拟合了
一个Logistic回归模型。在进行分析后,认为‘由于 量纲相同’,可以由回归系数的绝对值‘直接判定’ 它们与产前检查关联强弱。其结论为:孕产期卫生知 识〉妇女文化程度〉妇女年龄〉丈夫文化程度〉丈夫 职业〉家庭距卫生院距离。
2.这些数据的属性:是定性还是定量资料。 确定了所关心的研究产出后,其它的变量就都可以解释为是这

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全

医学论文中常用统计分析方法错误大全在医学研究领域,准确和恰当的统计分析是得出可靠结论的关键。

然而,在众多医学论文中,却存在着各种各样的统计分析方法错误,这些错误可能会导致研究结果的偏差甚至错误解读,从而影响医学研究的质量和临床实践的指导价值。

接下来,我们就来详细探讨一下医学论文中常见的统计分析方法错误。

一、样本量计算错误样本量的合理计算对于研究的可靠性和有效性至关重要。

许多研究在设计阶段未能充分考虑研究的主要目的、预期效应大小、检验效能以及显著性水平等因素,导致样本量过小或过大。

样本量过小可能使研究无法检测到真实存在的差异,从而得出假阴性结论;样本量过大则会造成资源浪费,同时可能增加研究的复杂性和误差。

例如,在一项比较新药物与传统药物疗效的临床试验中,如果预期的疗效差异较小,而研究者没有充分考虑这一点,计算出的样本量不足,那么即使新药物实际上更有效,也可能由于样本量的限制而无法得出有统计学意义的结果。

二、数据类型错误医学研究中数据类型多样,包括计量资料(如身高、体重、血压等)、计数资料(如疾病的发生例数、治愈例数等)和等级资料(如疾病的严重程度分为轻、中、重)。

错误地判断数据类型会导致选择错误的统计分析方法。

例如,将原本属于计数资料的数据(如疾病的治愈与未治愈),错误地当作计量资料进行 t 检验,这样得出的结果是不准确的。

反之,将计量资料当作计数资料处理,也会造成同样的问题。

三、选择错误的统计检验方法不同的研究问题和数据类型需要相应的统计检验方法。

常见的错误包括:在多个组间比较时,错误地使用 t 检验而不是方差分析;在非正态分布的数据中使用参数检验方法;在不符合独立性假设的情况下使用独立样本检验等。

比如,在比较三种不同治疗方法对患者生存率的影响时,应该使用方差分析或非参数的KruskalWallis 检验,而不是多次进行两两t 检验,因为这样会增加一类错误(即假阳性)的概率。

四、忽视方差齐性检验在进行 t 检验和方差分析时,通常需要先进行方差齐性检验。

医学统计方法常见错误剖析

医学统计方法常见错误剖析

2. 统计量 分类变量与有序分类变量
构成比、率、比 数值变量 均数、标准差、最小值、最大值、中位数
在资料的表达和描述中,常见的错误有:
1.编制统计表时,分组标志(横标目)与观测指标 (纵标目)位置颠倒、线条过多或过少、数字的 小数点位数不一致或单位重复出现在数字之后, 最严重的问题是表中数据的含义未表达清楚,令 人费解。
132
合计 494 296
239
326 295 408 1029
双向有序且属性不同:等级相关分析
表9 两法检查室壁收缩运动的符合情况
对比法
冠心病人数
测定结果 核素法: 正常 减弱 异常 合计
正常
58
2
3
63
减弱
1
42
7
50
异常
8
9
17
34
合计
67
53
27
147
双向有序且属性相同:Kappa检验
实例 :A组20例经末梢静脉输注榄香稀乳均出现程度 不同的局部刺激症状及静脉炎,而B组20例经锁骨下 静脉穿刺置管输注均未出现任何局部刺激症状及静脉 炎。见表10。
表14 不同分娩方式与重症肝炎孕妇的结局
分娩方式 剖宫产 阴道分娩 合计
例数 9 13 22
存活 8 4 12
死亡 1 9 10
27.24, 9P0.007
误用一般χ2检验取代Fisher精确检验, 本例:P=0.011。
三、统计学结论注意事项:
1.区分统计“有统计学意义”与医学/临 床/生物学“有实际意义”。
解决方法
需降低每次检验的检验水平数值,若α=0.05,可令 α’=0.05/C,其中C等于比较的次数,本例C=3 采用 2分割法(要求分表的自由度等于总表的自由度、 分表的2值之和等于总表的2值)进一步分析。

医学论文常见统计学错误和期刊编辑应对策略分析

医学论文常见统计学错误和期刊编辑应对策略分析

医学论文常见统计学错误及期刊编辑应对策略分析总之,期刊学术影响力是一个动态过程,在不同的年限其变化趋势或规律可能不同。

在2003-2008年肝病期刊的学术影响力较高,高于CJCR期刊与医药卫生期刊,但仍存在基金论文比低、国际化程度低、发展不平衡等问题;其中(WJG》、《世界华人消化杂志》、《中华肝脏病杂志》的学术影响力居领先地位,但《世界华人消化杂志》的波动较大。

学术影响力变化趋势有5种,其中震荡上升是主要的。

医学论文常见统计学错误及期刊编辑应对策略分析罗明媚叶萍高岩医药150076摘要将近年来医学期刊论文中常见的统计学问题分为统计学方法的误用、不注明统计方法或统计量、不注明所应用的统计分析软件、统计表格的不规使用、率和比混淆等多个方面,并结合实例进行分析,指出目前医学期刊论文的统计学应用现状不容乐观。

从医学期刊编辑的角度提出编审在今后工作中的应对策略和努力方向。

医学统计学应用是医学科学研究中必需的手段,是医学论文中不可缺少的重要组成部分。

胡良平等认为,一篇医学论文的质量主要取决于专业、文字和统计学三个方面,但近年来医学期刊发表的论文中存在大量统计方法误用、统计描述不准确等现象,直接影响着科研结果的科学性和可靠性。

现对我国医学期刊刊载论文中存在的统计学问题进行简要分析,并谈谈为避免这些统计学错误的出现,医学科技期刊编辑在今后工作中的努力方向。

1医学论文中常见的统计学问题1.1统计学方法的误用医学统计中常用的统计学推论方法有很多种,主要是根据实验的数据类型和实验目的来确定使用哪种统计方法。

如,计量资料应用啦验或方差分析,计数资料则应选用x谶秩和检验,这对于医学科研工作者是最为基本的统计学知识。

1.1.1用槛验代替方差分析:处理因素不同,多个处理组均数比较采用凇验代替方差分析,使假阳性的概率增加,又使其检验效率减小,这是最为常见的统计学方法的误用。

如某刊201lt〕Z第8期一文中,将90ff0需剖宫产产妇随机分为A、B、C---组,观察不同剂量盐酸罗哌卡因对麻醉效果的影响,进行三组患者痛觉阻滞最高平面比较。

常见统计学错误与纠正

常见统计学错误与纠正

应当如何?
成功的随机化取决于: (1) 产生一个不可预见的分配序列; (2) “隐蔽” (allocation concealment )这个 序列,直到分配完毕(必须建立一个分配处 理的系统) 。 报告如何随机分组,如何“隐蔽” :谁做随 机序列,谁收病人,谁分药和发药;分组方 案如何保管……
Nature常见错误之一
多重比较: 对一组数据作多项比较时,必须 说明如何校正α 水平,以避免增大第一类错 误的机会
应当如何?
主要终点(primary end point) :只能一个 次要终点(secondary end point) : 可以几个, 但勿过多 Bonfferoni 校正 当同一组数据同时作k次分析时,若限定 犯假阳性错误的概率总共不超过 , 则每次分析要用 / k 来控制假阳性的概率。 例
0.05, k 10,
/ k 0.005
2. 事后分析,见机行事
事后分析(Post hoc analysis) 看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认 不鼓励事先并未计划的亚组分析和校正分析
为何不鼓励事后分析?
数据是现象,现象具有偶然性; 看到数据后进行的“分析”属于故作姿态, 变偶然为“必然” —— 忽悠! 看到数据后增加的“分析”,也属于多重 分析,增加假阳性的机会
南韩对比剂研究
仅分析一个指标时, P(假阳性) 0.05, P(一次分析不犯错误) 0.95 同时分析 2 个指标时, 2 P(两次分析均不犯错误) [ P(两次分析均不犯错误) ]
P(假阳性) 1 - 0.952 1 0.90 同时分析 3 个指标时, P(假阳性) 1- 0.953 1 0.86 0.14 同时分析 10 个指标时, 10 P(假阳性) 1 - 0.95 1 0.60 0.40

医学论文中常见的统计学错误0525

医学论文中常见的统计学错误0525

文章结果中的统计学方法表达
• • • • • 充分但不过分 内容: 使用软件名称、版本号、版权公司 各种资料的描述方法:计量、计数、等级 分析方法介绍有层次: 单因素到多因素、同一属性的共同表达 • 分析方法的分析条件和表达内容: 多因素的筛选条件和方法、表达结果的参数
结果解释
• P值的解释 • P值为由抽样导致对目前结论错误判断的可 能性,而并非实际显著性差别的大小,避免 只根据P值下“肯定”、“一定”、“显著 意义”的结论,以“有/无统计学意义”表达 • 阳性结论获得步骤: 统计学检验有意义 专业结论有意义 结果中需给出统计量和P值,结合样本描 述 结果下结论
• 常见问题 • (3)忽略了配对资料的特性 • 如用药前后的血压测量值采用成组t检验 而不是配对t检验。 • (4)忽略了重复测量资料特性 • 如用药后重复测量血压值大于2次,由于 每个人资料间的不独立性,应该采用重 复测量F检验或Frideman检验而不是F检 验或K-W检验。
统计分析-统计推断-单因素
统计分析-统计推断-单因素
计量资料 两组: 成组/t检验(或U检验)或Wilcoxon秩和检
验, 如年龄 t检验条件:每组正态分布 、两组方差齐性 对于两测量水平配对设计,采用配对t检验或配对秩 和检验。
• 大于等于两组:
• F检验或Kruskal-Wallis检验 • F检验条件:每组正态分布 、多组方差齐性 • 对于多组重复测量,采用重复测量F检验或Frideman • 秩和检验。
计数和等级资料 描述方法:例数、百分数表示
统计分析-统计描述
• 常见问题 1.非正态资料仍用均数、标准差描述。 例如:术中输血量508±1203ml,范围 200~3000ml,中位数982ml 2.标准误代替标准差 标准差:数据相对于均数的离散程度;标 准误:样本均数的变异程度。前者用于 常用于数据个体变异大小测量,后者用 于评估样本和总体的接近程度。

医学论文中常见统计学错误案例分析

医学论文中常见统计学错误案例分析

医学论文中常见统计学错误案例分析一、概述在医学研究领域,统计学方法的应用至关重要,它有助于科研人员对复杂数据进行深入的分析与解读,从而得出科学的结论。

由于统计学知识的复杂性和多样性,医学论文中常常会出现各种统计学错误。

这些错误不仅可能影响研究结果的准确性和可靠性,还可能误导读者对研究的理解和评价。

本文旨在通过分析医学论文中常见的统计学错误案例,揭示其产生原因和可能带来的后果,以提高医学科研人员和论文作者在统计学应用方面的准确性和规范性。

常见的医学论文统计学错误包括但不限于样本量计算不当、数据分布误判、统计方法选择错误、假设检验理解偏差、多重共线性问题以及P值解读不当等。

这些错误往往源于对统计学基本概念和方法理解不深入,或是忽视了对数据特征和实际研究问题的综合考量。

通过案例分析,我们可以更直观地了解这些错误在实际研究中的表现形式和潜在影响。

每个案例都将详细剖析错误发生的具体原因,并指出正确的处理方法或避免策略。

这将有助于医学科研人员和论文作者在今后的研究中更加谨慎地应用统计学方法,提高研究质量和学术水平。

本文还将强调加强统计学知识和技能的培训在医学科研中的重要性。

只有具备扎实的统计学基础,才能更好地理解和运用各种统计方法,避免或减少统计学错误的发生。

医学科研人员和论文作者应不断学习和更新统计学知识,提高自己在统计学应用方面的能力和素养。

1. 医学论文中统计学的重要性在医学研究中,统计学扮演着至关重要的角色。

它是确保研究设计合理性、数据收集和分析准确性以及结论可靠性的基石。

通过运用统计学方法,医学研究人员能够系统地评估治疗方法的疗效、疾病的发病机制和预后因素,从而为临床实践和政策制定提供科学依据。

统计学在医学论文中有助于确保研究的内部和外部有效性。

通过运用适当的统计学方法,研究人员可以控制潜在的混杂变量和偏倚,从而提高研究的准确性和可靠性。

这有助于避免由于研究设计不当或数据分析错误而导致的误导性结论。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学论文常见统计学错误与纠正一、设计与实施1.对象合格标准不明确●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;●事前未规定合格标准和排除标准,事后排除;●不报告按照合格标准和排除标准筛选对象的过程。

2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。

常见错误:终点指标过多, 大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”哪些指标可能有组间差异,必须心中有数。

假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”●指标多,实验工作量大。

大海捞针——碰运气,不是科研!●指标多,翻来覆去分析,制造假阳性!Nature杂志统计学指南:➢常见错误之一。

仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40➢常见错误之一(Nature) ----多重比较不校正多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)3 不重视对照为何必需对照?●消除非研究因素的混杂实验组和对照组受非研究因素的影响尽可能相同,使两组的差异主要反映研究因素的效应。

●鉴别研究因素的效应和自然发展结果。

例如,研究某药物对口腔溃疡模型兔的疗效,口腔溃疡有自愈的倾向,必须有对照扣除自愈效应。

常见错误➢没有对照!千方百计省去对照组,以减少一半工作量!? ω自身前后对照/历史对照/文献对照/ “标准”对照➢对照不当ω对照太弱:安慰剂对照/对照过强:西药+加中药~西药/对照剂量有争议:试验药,大剂量~对照药,中小剂量/对照基线不可比:试验组年轻、病轻~ 对照组年老、病重应当如何?ω事先明确研究假说,例如,新药比常规药好:以常规药为对照ω设计:研究组新药~ 对照组常规药可比性:基线可比、过程可比、终点可比ω保证可比性措施:干预性研究: 随机化观察性研究:匹配4样本量无根据ω干预性研究:“ 500 例患者随机分成两组……” 为什麽500 例?不多不少?500 例从天而降?现成送上门来?ω观察性研究:“ 10年期间A组3000例,B组258例……” ---- 有多少用多少!?应当如何?---- 报告最小样本量估算及其依据1. 比较两组测定值的均数依据:(1)预计欲比较的两总体参数的差值δ(2)预计总体标准差σ(3)允许出现假阳性结果的机会α(4)允许出现假阴性结果的机会β :例:格列美脲、格列苯脲对比研究以HbA1c 为主要终点报告依据✓欲检出HbA1c临床差异≥0.65%✓假定标准差为1.3%✓双侧检验水平0.05✓功效80% ω✓退出率20% 计算:157例2. 比较两组达标率依据:(1)预计一组发生某结局的百分比为π1(2)预计另一组发生某结局的百分比为α(3)允许犯假阳性错误的机会β(4)允许犯假阴性错误的机会π2例:格列美脲、格列苯脲对比研究以HbA1c达标为主要终点(1)预计一组发生某结局的百分比为45%(2)预计另一组发生某结局的百分比为25%(3)允许犯假阳性错误的机会α= 5%(4)允许犯假阴性错误的机会β= 20% 计算: 176 例5. 随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1) 消除分配处理有意或无意的偏倚。

(2) 为实施盲法创造条件。

(3) 使得有可能利用概率论来说明:各干预组之间的差异不大可能是偶然性造成的。

说错和做错ω将随机化当作“廉价名词”,实际没做,却写: “随机分成两组” ——科研道德?ω将“随意分组”当作随机化ω将“机械分组”当作随机化ω略去筛选过程,简单地报告将多少人随机分组ω略去实施过程中丢失对象,将最后两组人数说成是随机分组人数应当如何?ω成功的随机化取决于:(1) 产生一个不可预见的分配序列;(2) “隐蔽” (allocation concealment )这个序列,直到分配完毕(必须建立一个分配处理的系统) 。

ω报告如何随机分组,如何“隐蔽” :谁做随机序列,谁收病人,谁分药和发药;分组方案如何保管……随机化类型ω Simple randomisation (简单随机化) ω Blocked randomisation (区组随机化) ω Stratified randomisation (分层随机化) ω Minimisation (不均衡最小化)6. 避而不谈盲法常见错误ω如何“盲”?轻描淡写ω为何没有“盲”?不加说明ω普遍忽视盲法判定终点没有独立的终点判定委员会:专人、专职;盲法措施ω盲法实施效果如何?缺乏评价7. 量表的滥用ω医学研究中,量表的应用日益广泛:生存质量(quality of life, QOL)患者报告结局(patient report outcome, PRO) 美国FDA规定药品说明书必须有PRO内容。

ω国外已经研制了许多量表,可以借鉴;有些课题国外还没有适宜的量表,有待研制ω国内许多医学研究也开始采用量表测量临床疗效。

常见错误1.“引进国外量表”ω未经作者同意,声称是“xx量表的中文版”ω妄称文化调试,随意修改ω未曾考察中文版量表的信度、效度和反应度2.“自制量表”ω未经查阅文献和专家咨询,匆忙起草ω没有概念框架和基于概念框架的条目池ω没有试用和现场调查,没有心理测量学评价应当如何引进国外量表?ω联系原作者,征得同意;ω翻译-逆翻译,文化调试,与原作者共同修改、定稿;ω收集现场数据,评价信度、效度和反应度应当如何研制新量表?ω查阅文献、专家咨询……ω确定概念框架,领域、方面……ω根据概念框架建立条目池ω量表初稿ω小规模试用、修改ω收集现场调查数据ω评价量表,信度、效度、反应度……ω修改、定稿二、分析与结果8. 不考虑基线均衡与否ω不首先考察基线是否均衡ω不论基线均衡与否,一概使用单变量分析方法:比较百分比或均数:检验;比较均数:t 检验、非参数检验比较发生某事件的时间:Kaplan-Meier 方法χ 2应当如何?ω不论干预性研究还是观察性研究,数据分析的第一步总是考察基线是否均衡,列表报告ω若干预性研究许多变量基线不均衡----随机化失败!ω若观察性研究多个变量基线不均衡,很自然---- 从设计入手,认真解决!ω对付基线不均衡的统计学方法:(1) 分层(2) 匹配(3) 回归9. 缺失值处理不当三类缺失机制:ω完全随机缺失(missing completely at random, MCAR), 缺失完全由随机因素造成ω随机缺失(missing at random, MAR), 缺失与已有的观察结果有关ω非随机缺失(missing not at random,NAR), 缺失与当前观察到和尚未观察到的结果有关常见错误: 丢弃具有缺失值的个体?ω仅完全随机缺失才可丢弃有缺失值的个体ω临床试验中,若仅采用完整病例进行分析,违背Intention-To-Treat原则(ITT原则)ω仅在以下情况下考虑使用完整病例进行分析① 在探索性研究中,药物研发的初期阶段;② 在确证性试验中,作为次要结果的处理方法常见错误: 数据填补(data imputation)?ω仅在以下情况下方可填补① 相对小的缺失率(例如10%~15%)② 含有缺失值的变量对于所要研究的问题具有非常重要的意义;③ 有合理的假设和结转技术, 一般宜遵循保守原则ω不同填补方式产生的结论需进行敏感性分析10. 统计检验结论不当差异性检验零假设:两组(或多组)总体均数间没有差别对立假设:两组(或多组)总体均数间有差别检验水准α:若p <α“两组样本均数间的差异具有统计学意义(statistically significant)”--- “可以认为总体均数间有差别”若p ≥α“两组样本均数间的差异不具有统计学意义”---- “尚不能认为总体均数间有差别”常见错误ω若,“两组样本均数间的差异显著” ---- “总体均数不等” (忘记有假阳性可能!?)ω,“两组样本均数间的差异不显著” ---- “总体均数相等”小结ω医学论文常见统计学错误往往源于研究设计任何一项研究首先要明确定义目标总体;从目标总体选择对象要有细致的合格标准和排除标准; 总体和标准不清晰,切勿匆忙上阵;基于“杂乱” 对象的研究,一定不会有科学结论。

ω结局指标不是越多越好,主要指标只能一个; 次要指标可以多于一个,但不能过多; 结局指标过多,费力不讨好; 即便出现阳性结果,往往是假阳性,经不起重复。

ω科学研究必须有对照;对照的选取与研究的假说有关;对照不恰当,研究没有好下场。

ω样本量并非越大越好。

不论干预性研究还是观察性研究,都要事先估算最小样本量; 医学论文的“方法”部分必须有一段报告样本量及其确定的依据; 依据不可靠,估算的样本量自欺欺人。

ω随机化是保证研究真实性的重要措施,将随机化当作“廉价名词”,只说不做,或做而不严,不仅败坏科研道德,而且,往往导致研究失败。

ω临床试验涉及人,无论研究对象还是研究者有意无意受心理因素的影响,“盲法” 是削弱此类影响的重要措施; 研究终点的认定要尽量实施盲法。

ω医学研究中,量表的应用日益广泛。

引进国外量表或自制量表均属严肃的学术研究;按一定程序引进或研制的量表才能作科研的测量工具;非正规量表收集的数据缺乏科学性.ω数据分析的第一步必定是考察基线均衡与否;基线不均衡,没有可比性; 设计要保证基线均衡;一旦不均衡,常用分层、匹配和回归等统计方法。

ω统计检验的结论并非绝对肯定,也非绝对否定。

若在检验水准0.05 拒绝零假设,可说“差异具有统计学意义”, 但仍有可能出错。

若不能拒绝零假设,只能认为目前证据尚不足以支持“差异具有统计学意义”这一结论,不可因此而声称“无差异”。

ω有时想说明新药不亚于常规药,可进行“非劣效检验”ω有时想说明新药等效于常规药,必须进行“等效检验”;“等效检验”包含一个非劣效检验和一个非优效检验, 仅当既“非劣”又“非优” 时, 方能声称“等效”。

相关文档
最新文档