医学杂志论文中常见的统计学错误分析及对策精讲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对照ห้องสมุดไป่ตู้错误与对策
有些文章虽然设立了对照组,却使用非同 期对照或历史对照,组间的基础状况如性别、 年龄、病情等不一致,缺乏可比性。还有些作 者虽然设立了正常对照组,在分析的时候却未 考虑,使该设计失去了原有的意义。
样本量问题与对策
研究的实验单位要达到一定的数量,才能避免将个 别情况误认为普遍情况,将偶然性或巧合的现象当成 必然的规律,以致将实验结果错误地推广到群体。在
(2)无对照或对照设计不合理; (3)样本含量太少。
随机分组与随机抽样的错误
无论是随机抽样还是随机分组都要有足够的 样本作前提,要在文章中描述清楚随机抽样的抽 样总体、样本含量、抽样方法,随机分组的随机 方法、各组的样本含量与基本特征等。医学科研 论文中最普遍的问题是滥用“随机”,只要是抽 样或分组,不管实际是否采用了随机的方法,在论 文中均不谈采用了什么样的随机方法,就将“随 机”写上,将随机误解为随意、随便、不采用随 机化处理方法,导致结果缺乏可靠性。
计量资料的案例一
计量资料的案例一的分析与对策
各项指标的均数均大于2倍标准差, 说明资料 为偏态分布, 用均数、标准差描述资料的集中趋 势和离散程度显然是不妥当的,
案例一中只列出P 值, 也未说明具体的统计学 方法。
正确的做法应用中位数描述集中趋势, 用四分 位数间距表示离散程度。或者是将原始数值经 对数等转换后, 再计算转换值的平均数和标准差, 同时在表格中应该列出具体的统计量及P 值。
随机分组与随机抽样的错误的对策
随机化原则是由Fisher在创建实验设计理 论的过程中首先提出的,随机化原则是实验研 究中保证取得无偏估计的重要措施。随机化 方法由最初的抽签、掷硬币和抓阄等方法发 展到随机数字表、随机排列表和用计算机软 件或计算器产生的伪随机数。
对照的错误与对策
医学研究,尤其是实验设计的研究,需要 设立合适的对照组,只有设立了对照,才能消 除非处理因素对实验结果的影响,从而将所 关心的处理因素的效应分离出来。在论文 中应说明对照取自的总体,如何得来的,样本 含量多大? 是否与实验匹配或配伍,与试验 组的均衡性如何?
计量资料无论是否服从正态分布,统统用均数± 标准差描述研究结果的数据特征;
计数资料混淆率和构成比(百分比)的概念,常将构 成比误用为率来说明事物发生的强度;率和构成比 的分母太小,却计算相对数来进行描述和比较。
计量资料描述常见错误分析
(1)误用正态分布的描述性统计指标描述呈偏态分布
的资料(标准差>均数 )仍采用“ 均数±标准差”表 示,特别当表中采用标准误 取代标准差s时,前述的错 误很难被察觉出来 ;
假设检验的案例三
假设检验的案例三的分析与对策
本案例反映不同分娩方式重症肝炎孕妇 结局的比较。
原作者使用一般四格表卡方检验, 得: 卡 方值= 7. 24, P = 0. 007; 但观察了22例, 总例 数小于40, 不适合使用一般卡方检验。应用 Fisher精确概率检验法。
假设检验的案例三的分析与对策
配对t检验的应用条件:差值服从正态分 布。
假设检验的案例一
假设检验的案例一的分析与对策
这类错误是临床医学科研论文中定量资料分 析中最常见的错误, 而且是原则性错误, 会增 加犯第一类错误的概率。假设检验的案例一 资料为不同年龄组不同性别基础能耗情况, 原作者用t检验分别对各组均数逐一进行比 较, 得出在男女研究对象青年组与中年、老 年组的基础能耗差异有显著性。
假设检验中常见的统计学方法选择错误
定量资料进行假设检验的方法很多, 其常 见错误是:
(1)忽视t 检验和F (方差分析) 检验的前 提条件;
(2)误用t检验代替F 检验; (3)误用参数检验代替非参数检验; (4)各种方差分析混用。
假设检验中常见的统计学方法选择错误
计数资料统计分析的常见错误是: (1)错误选择了四格表卡方检验方法, 未 选用Fisher精确检验; (2)等级变量资料一律地使用卡方检验。
计数资料的案例二
计数资料的案例二的分析与对策
某研究者为了研究三种不同值班情况孕妇的早 产发生情况, 作者在计算平均率时, 错误地将几个率 相加后取其平均值, 这种类型的错误也是临床科研 论文中常见的错误之一。
如计算计数资料的案例二中三种值班女工的早 产的合计发生率( 即平均率)时, 以( 2. 7+ 4. 8+ 10. 3) /3= 5. 9, 即平均发生率为5. 9%。 正确的算法是: ( 94 /1547) × 100% = 6. 1%。
重复测量数据是指同一受试对象的同一指标 在不同时间点上进行多次测量所获得的资料, 常用来分析某项观察指标在不同时间点上的 变化特点, 这类资料在临床试验中较为常见。 本案例是两种不同处理方案对病人血浆ET 浓 度( pg /m l)变化比较, 分别在麻醉前、术毕、 术后24 h、术后48 h测量病人血浆ET浓度, 观 察两种处理方案对病人血浆ET浓度的影响及 变化趋势。
计量资料统计分析的常见错误 (1)忽视了t检验的使用条件;
(2)多个样本均数比较错误地用多个t 检验代替方差分析;
(3)误用t检验分析重复测量设计资料
t检验的使用条件
单样本t检验的应用条件:样本服从正 态分布;
成组t检验的应用条件:样本服从正态分 布;两样本的总体方差相等即方差齐性。
医学论文中,有些P>0.05的“阴性结果”,样本含量不
够致检验效能不足是一个主要的原因。实验之前不 进行样本含量估计会带来两个问题:一是杂志上论文
的发表偏倚,即当实验结果出现P<0.05的阳性结论,寄 交杂志社发表,若出现P>0.05的阴性结论,则锁进抽屉,
以至于有些医学期刊几乎找不到阴性结果的研究论 文。
(2)统计图方面的主要错误有两个,其一,横坐标轴上 的刻度值不准确,等长的间隔代表的数量不等;在直 角坐标系中,从任何一个数值开始作为横轴或纵轴上
的第一个刻度值。其二,用条图或复式条图表达连 续性变量的变化趋势;
(3)统计表中数据的含义未表达清楚,令人费解; (4)运用相对数时,混淆“百分比”与“百分率”;
计数资料描述性分析中的常见错误 (1)错误地将构成比当作率使用 (2)错误地计算平均率 (3)计算相对数时分母过小
计数资料的案例一
计数资料的案例一的分析与对策
研究者对计数资料的案例一资料进行分析, 认为“轮状病毒腹泻的发病率最高为43.1%,痢 疾次之28. 8%, 伤寒最低为13. 1%” 。这是将 构成比当作发病率使用的典型错误, 是临床科 研中最常见的错误之一。
假设检验的案例四的分析与对策
从本案例中可见到对照组“有效”的构成 比为28.57%,高于治疗组的“ 有效”构成比 17.64%, 而治疗组“ 显效”构成比76.47% 高 于对照组“显效”构成比50.00%, 另外显效 与有效在临床上都是表示治疗的有利效果, 盲 目合并会导致错误的结果。
假设检验的案例四的分析与对策
实际上表中所提供的信息, 只能用来说明在 该腹泻门诊就诊的521例病人中, 各种腹泻 病人所占的比重, 并不能反映出各自发病率 的高低, 而且计数资料的案例一所列的% 号也未指明是构成比还是发病率, 容易引起 歧义。正确的描述应该是在腹泻门诊病人 中, 轮状病毒引起的腹泻所占的比例最高, 伤寒最低。
本例正确的计算结果为P = 0. 011(双侧概率)。 很多分析人员认为两种方法分析的结果都是认 为不同分娩方式重症肝炎孕妇结局有差别, 但 统计学意义是不一样的, 因为P 值大小不一样, 拒绝和不拒绝无效假设的概率是不一样的。
假设检验的案例四
假设检验的案例四的分析与对策
本文作者将资料中三个等级中的“有效” 和“显效”合并, 使之成为二分变量。然后, 用 四格表卡方检验, 得卡方值=3.302, P=0.069, 作出两组治疗总有效率差异无统计学的结论 。原统计分析中将三个等级合并为两个等级, 导致信息丢失, 结果得出两处理组总疗效无显 著性差异的结论。
假设检验的案例二的分析与对策
原文作者用配对比较t检验对不同时间两个处 理方式血浆ET浓度的差异进行检验, 发现有统计 学差异, 并认为A 组术后ET浓度相对稳定, 术后 无明显升高。我们认为资料的统计处理不恰当, 因为这时一个典型的重复测量的多个样本均数 的比较, 故应该采用重复测量方差分析检验不同 处理组间和时间因素及处理因素与时间的交互 效应是否具有统计学意义, 如果差异有显著性, 然 后再作两均数间的两两比较。
正确显著性检验方法应该 用Ridit分析 或者非参数检验(秩和检验) 或者CMH检验 或者Logistic回归分析 本案例采用秩和检验分析, z= 2.27, P = 0.023, 差异有统计学意义, 说明治疗组的疗效优于对 照组。
研究设计中的常见错误
(1)随机分组与随机抽样没有真正遵循 随机化原则;
医学杂志论文中常见的统计学错误及对策
同济大学医学院 医学统计学教研室 艾自胜 2014-9-28
内容
(1)描述性分析中的常见错误 (2)假设检验中常见的统计学方法选择
错误 (3)研究设计中的常见错误 (4)纠正错误的对策
描述性分析中的常见错误
在医学论文中,对不同类型的研究资料需要用不 同的统计指标进行描述。实际工作中统计指标选择 常见的问题有:
假设检验的案例一的分析与对策
这种检验方法有误, 因为该资料为多组 基本均数间的比较, 正确的方法是用单因素 方差分析, 只有在方差分析有显著性的基础 上有必要再作均数间的两两比较, 用q检验, 而不是t检验, 同时假设检验的案例一中应该 列出方差分析的统计量F值及具体的P值。
假设检验的案例二
假设检验的案例二的分析与对策
样本量问题与对策
二是用P>0.05错误地支持“两种干预措
施效果相同”或“两种检测方法可以互相 替代”等结论。实际上,由于样本含量小,检
验效能不够,容易得到P>0.05的结果。
因此,提倡在试验前进行样本含量大小的 估计。
谢谢!