常见统计学错误共32页文档
医学论文常见统计学错误与纠正
医学论文常见统计学错误与纠正
一、设计与实施
1.对象合格标准不明确
●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;
●事前未规定合格标准和排除标准,事后排除;
●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”
生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”
许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”
哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”
●指标多,实验工作量大。大海捞针——碰运气,不是科研!
●指标多,翻来覆去分析,制造假阳性!
Nature杂志统计学指南:
➢常见错误之一。仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 λ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假阳性)=1 - 0.952 ≈ 0.10, 同时分析3 个指标时,P(假阳性)=1 - 0.953 ≈ 0.14 λ同时分析10
个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40
➢常见错误之一(Nature) ----多重比较不校正
多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)
论文撰写中常见的统计学问题及其处理
论文撰写中常见的统计学问题及其处理【摘要】
统计学在论文撰写中扮演着至关重要的角色,它影响着论文的质
量和可信度。在撰写论文过程中常见的统计学问题包括样本量的确定、数据处理方法的选择、结果的解释和呈现,以及如何避免常见的统计
学错误。解决这些问题需要早期咨询统计学专家,并且重视统计学在
论文中的作用和意义。只有正确处理统计学问题,才能确保论文的科
学性和准确性。建议学者们在撰写论文前要深入了解统计学知识,提
前咨询专家,以确保论文的统计学部分能够科学可靠地支撑研究结
论。
【关键词】
统计学、论文撰写、样本量、数据处理、分析方法、结果解释、
统计学错误、解决方法、重视意义、咨询专家。
1. 引言
1.1 统计学在论文撰写中的重要性
统计学在论文撰写中扮演着至关重要的角色。论文的质量很大程
度上取决于统计学的严谨性和正确性。统计学能够帮助研究者从大量
的数据中提取有效信息,得出科学的结论,并验证假设和研究问题。
在论文中,统计学的应用不仅可以帮助读者更好地理解研究结果,还
能提高研究的可信度和说服力。
统计学在论文撰写中的重要性体现在几个方面。通过统计学分析,研究者可以对研究问题进行量化和定量的描述,使研究结论更加客观
和可靠。统计学可以帮助研究者有效地处理大量的数据,提取有用信息,并进行数据的比较和推导。统计学还可以帮助研究者发现数据中
的规律性和趋势,从而指导下一步的研究方向和决策。
1.2 统计学问题对论文质量的影响
统计学问题对论文质量的影响非常重要,因为统计学是对数据进
行收集、分析和解释的科学方法。如果在论文撰写过程中出现统计学
医学论文常见统计学错误与纠正
医学论文常见统计学错误与纠正
一、设计与实施
1.对象合格标准不明确
●只报告来源和时间段,总体不清晰:大杂烩,得不到科学结论;
●事前未规定合格标准和排除标准,事后排除;
●不报告按照合格标准和排除标准筛选对象的过程。
2.结局指标多而杂--是事先规定的最重要的结局指标,通常以此为准来计算样本量。
常见错误:终点指标过多, 大海捞针
临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动?!”
生理、生化、组织学、基因,都做;“内容丰富,显得水平高?!”
许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标?!”
哪些指标可能有组间差异,必须心中有数。
假说:预计将要得到的结论——假说是科研的灵魂心中无数,不要“先上马再说”
●指标多,实验工作量大。大海捞针——碰运气,不是科研!
●指标多,翻来覆去分析,制造假阳性!
Nature杂志统计学指南:
➢常见错误之一。仅分析1个指标时,P(假阳性)=0.05,P(1次分析不犯错误)=0.95 ,同时分析2个指标时,P(2次分析均不犯错误) = [P(1 次分析不犯错误)] 2 P(假
阳性)=1 - 0.952 ≈ 0.10, 同时分析 3 个指标时, P(假阳性)=1 - 0.953 ≈ 0.14 同时分析 10个指标时,P(假阳性)=1 - 0.9510 ≈ 0. 40
➢常见错误之一(Nature) ----多重比较不校正
多重比较: 对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会---- Bonfferoni校正(α/k来校正,k为两两比较次数)
医学期刊论文中常见统计学错误
该资 料提示 小型 猪对 中度肝 素化 的反应较 家猪
N i sC ar R, l g s B , l n L, t a.Reai n n Hi e a s W J Nes C e 1 l o lt o
bewe n a tv t d ltig i d rn gipa t a d t e c iae cotn tme u g a o lsy n i n
n r l o cn c r n r a tr s He r ,2 0 o ma p r ie o o a y r i . ee a t 0 0,8 3:
33 3 8-45.
Va d r Gis e WJ L n o n e esn , ie f AM , c wa t RS e 1 S h rz , ta.
程度反 应更敏 感 。 小 型猪模 型 和家猪模 型之 间肝素应 用效 果 的差 异可能 与 2者 不 同 的生理 特 点 有关 , 提示 我 们 在 实
素. 心肺血管病杂志 ,0 3 2 :4 -4 . 20 ,2 2527 罗华 , 梁瑛. 素治疗肺 血栓栓塞症 达标剂量 与达 标 肝 时间初步研究 . 心肺血管病杂志 , 0 ,8 1812 2 9 2 : .8 . 0 7
Bic mpai lt o ph s hoy e oi e o t d tn s n oo tbi y f i o p rl h ln c ae se t i
[医学]医学研究中常见的统计学错误(季聪华)
“随机”的例数调整法(不推荐)
二、均数±标准差
•“均数±标准差”的描述用于符合正态或近似正态分 布的资料。前者表示集中趋势,后者表示离散趋势。 •可通过均数与标准差的相对大小来大致判断资料是否 符合正态分布。
二、均数±标准差
•错用1:偏态资料,用“均数±标准差”表示 •正确用法:偏态资料的描述用中位数(四分位间距)
五、卡方检验
•错用1:检验结果的错选 •正确用法:卡方检验有使用的前提条件,不符合前提 条件需要校正,或者采用精确概率法。 •当n≥40,所有理论值≥ 5时,用pearson卡方检验。 •当n≥40,1≤理论值<5时,用校正的卡方检验。 • n<40或有理论值<1,或P≈α时,用确切概率法。
五、卡方检验
• 3、在【拼音指南】对话框的【基准文字】 项可以看到x,在【拼音文字】项下第一行 输入“_”。
如何在WORD中写出 x
判断是否符合正态分布的方法
行业共识 均数与标准差的大小关系 正态性检验:正态性的判断不需要特别严格。 正态或近似正态,不要矫枉过正
三、独立样本t检验
•独立样本t检验用于两组正态或近似正态分布资料的 组间比较。
•错用2:用于单向有序资料 •正确用法:采用秩和检验或者Ridit分析法
组别
治愈
有效
无效
死亡
不加牛黄组 32Байду номын сангаас
医学期刊论文中常见统计学错误
[12]刘力生.中国高血压防治指南2010[J ].中华高血压杂志,
2011(08):701-743.
[13]Zhao W ,Wang L ,Lu X ,et al.A coding polymorphism of the
kallikrein 1gene is associated with essential hypertension :a tag-ging SNP-based association study in a Chinese Han population [J ].J Hypertens ,2007,25(9):1821-1827.
[14]Kellermeyer RW ,Graham RJ.Kinins --possible physiologic and
pathologic roles in man [J ].N Engl J Med ,1968,279(14):754-759.
[15]Kaplan AP ,Joseph K ,Silverberg M.Pathways for bradykinin
formation and inflammatory disease [J ].J Allergy Clin Immunol ,2002,109(2):195-209.
[16]Kellermeyer RW ,Graham RJ.Kinins --possible physiologic and
pathologic roles in man [J ].N Engl J Med ,1968,279(16):859-866.
统计学知识(一类错误和二类错误)
Type I and type II errors
(α) the error of rejecting a "correct" null hypothesis, and
(β) the error of not rejecting a "false" null hypothesis
In 1930, they elaborated on these two sources of error, remarking that "in testing hypotheses two considerations must be kept in view, (1) we must be able to reduce the chance of rejecting a true hypothesis to as low a value as desired; (2) the test must be so devised that it will reject the hypothesis tested when it is likely to be false"[1]
When an observer makes a Type I error in evaluating a sample against its parent population, s/he is mistakenly thinking that a statistical difference exists when in truth there is no statistical difference (or, to put another way, the null hypothesis is true but was mistakenly rejected). For example, imagine that a pregnancy test has produced a "positive" result (indicating that the woman taking the test is pregnant); if the woman is actually not pregnant though, then we say the test produced a "false positive". A Type II error, or a "false negative", is the error of failing to reject a null hypothesis when the alternative hypothesis is the true state of nature. For example, a type II error occurs if a pregnancy test reports "negative" when the woman is, in fact, pregnant.
医学论文中常用统计分析方法错误大全
0.50+0.49△▲ 1.62+0.62 1.01+0.48△
粘膜溃疡
1.81+0.62※
0.59+0.56△▲ 1.79+0.59 1.21+0.60△
总评分
15.76+3.11※
6.87+3.08△▲ 15.98+2.98 8.87+3.21△
※:与对照20组21/(3/G302)比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差22异有统 计学意义;▲:与对照组(G )比较,P<0.05,组间差异有统计学意义;
医学论文中常用的统计分析 方法误用辨析
一、实验设计存在的典型错误
二、计量资料分析常见的统计问题
三、计数资料分析常见的统计问题
四、直线相关与回归分析常见统计错误
五、统计分析方法表述问题
百度文库
六、统计表与统计图方面的问题
七、多元回归分析
2021/3/30
1
一、实验设计存在的典型错误
1.1 没有遵循随机原则
1.2 缺乏对照组
2.8 正确处理析因设计或嵌套设计定量资料
2021/3/30
16
2.1 忽视t检验的前提条件
文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见 表5。原文作者用t检验分析此资料。请问:这样做正确吗?
医学期刊论文中常见统计学错误
心肺血管病杂志 2 0 1 4年 3月第 3 3卷第 2期
J o u ma l o f C a r d / o v a S e U l a r &P u l m o n a r y D i s e a s e s , Ma r c h 2 0 1 4, v o 1 . 3 3 , Ⅳ 0 . 2
显差 别 , 手 术 已取得 满意 效果 。
参 考 文 献
杨思源 陈树 宝. 小 儿心脏病学 . 4版. 北京 : 人民卫生 出版社 ,
2 0 1 2: 3 4 4- 3 5 2.
心排 、 灌注肺 , 心律失常 , 水 电解质失衡等并发症 , 我 们采用肾上腺素 、 多 巴胺及硝酸甘油等多种血管活
果 良好 。
科治疗.中国胸心血管外科杂志.2 0 0 9 ,1 6: 3 3 6 - 3 3 8 .
J o n s a RA.Ea r l y p r i ma r y r e p a i r f o t e t r lo a g y o f Fa l l o t .S e mi n Th o —
平衡 , 同时保证 营养 的摄人及胶体 的补充。对于尿 量减 少 的 (<1 mL / k g , 持 续 3—4 h ) 患儿 , 在 排 除 容
量 不足后 , 应 积极 行 腹 膜 透 析 术 , 经 过 观察 我 们 发
医学期刊论文中常见统计学错误
心 肺 血管 病 杂 志 2 1 0 0年 1月第 2 9卷第 1期
Ju 1 f ad0ac1 oma 0 c rivsua P loayD sae J n a y2 0. 1 2 N0 1 r& um nr i ss a u r 01 Vo . 9. . e
.
gc e e o d n i i my c r il i e n t n n i rc Ptr e st n y o a d a h b r ai i hu o — ma s P s i e n :a o sbl me h n s c a im o de r s e my c r il f Pesd o ad a fncin. Cic l t n,20 0, 0 2 99 2 06. u to r u ai o 0 1 2, 5 — 6
[ 贺毅, 6] 张兆 琪 , 于薇 , . 等 小剂 量 多 巴酚 丁 胺 负荷 MRI
与 负荷 超 声 心 动 图检 测 存 活 心 肌 的 对 比研 究 , 中华 放 射 学杂 志 ,0 6 1 : 1 2 l 5 . 2 0 , l 1 5 一1 5 [ 王 春 梅 , 学思 , 智 红 , . 率 水 平 对 急 性 心 肌 梗 7] 吴 韩 等 心 死 患 者长 期 预 后 的 影 响 . 心肺 血 管 病 杂 志 ,0 7 2 : 2 0 ,8
wk.baidu.com
医学论文审稿中常见的统计学错误:相关回归分析方法的误用分析
例 3 某研究欲探讨 接受不 同时长的光子仪器治疗的女 ∞ % ∞
性患者痛经 阳性率情况 ,结果见表 1。
表 1 接受不 同时长治疗 的患者 阳性率
时 长 (min)
阳性率 (%)
分析 :原研究直接对时长和 阳性率两 变量 进行线性 回归 分析 ,由专业 知识判断可知 ,这一做 法并不正确 。我们应该首 先对两变量进行散 点图的绘 制 ,以了解变量 间的线性变化趋 势 。由原 文数据可知 ,数据分布既不 与 轴平行 ,也不与 y轴 平行 ,且 各个散点分 布不具有 明显 的曲线趋势 ,可考 虑进行
· 504 ·
中国药物与临床 2018年 3月第 18卷第 3期 Chinese Remedies& Clinics,M arch 2018,Vo1.18,No.3
—
—
—
—
线性相关 回归分 析。由此我们可知 ,在进行相关 回归分析 时, 必须先 画出散点 图 ,观察两 变量 间是否存在 线性趋势 ,若存 在再进 行相关 回归分析 。若两 变量 间呈 现的是某 种 曲线关 系 .则采用 直线 回归方程解 释变量 间关系是 不妥 的 ,即使经 假 设 检 验 验 证 其 有 统 计 学 意 义 也 是 错 误 的 。 1-4 相关系数太小时解释失误
统计学中的类型I和类型II错误
统计学中的类型I和类型II错误统计学是一门研究数据收集、分析和解释的学科。在统计学中,我们经常会遇到两种不同的错误类型:类型I错误和类型II错误。这两种错误类型在实际研究和决策过程中具有重要意义,本文将介绍统计学中的类型I和类型II错误,以及其对实践的影响。
一、类型I错误
类型I错误,又称为α错误,是指在进行假设检验时,拒绝了真实的无效假设(零假设)的错误。换句话说,类型I错误发生时,我们错误地认为有一个关联或差异存在,而事实上并没有。
在统计学中,我们进行假设检验来判断样本数据是否支持或拒绝某一假设。通常情况下,我们设置一个显著性水平(一般为0.05),当p 值小于显著性水平时,我们拒绝零假设,并得出结论。然而,如果我们设置了过高的显著性水平或者在多次重复试验中进行了多重假设检验,那么就会增加犯下类型I错误的风险。
类型I错误可能会导致假阳性结果的产生。例如,在药物实验中,如果我们错误地拒绝了药物对疾病没有治疗效果的零假设,那么我们可能会得出一个错误的结论,即认为该药物有效。这可能导致不必要的治疗和资源浪费。
二、类型II错误
类型II错误,又称为β错误,是指未能拒绝无效假设(零假设)的错误。换句话说,类型II错误发生时,我们无法检测到实际存在的关联或差异。
类型II错误通常与样本容量的大小有关。当样本容量过小,检验的功效就会降低,从而导致类型II错误的风险增加。另外,当效应大小较小或困难度较高时,也可能增加类型II错误的概率。
类型II错误可能会导致假阴性结果的出现。例如,在临床试验中,如果我们未能拒绝一种药物无效的零假设,可能会导致需要治疗的患者无法获得有效的药物。这可能延误或甚至危及患者的生命。
医学期刊论文中常见统计学错误
则不易被发 现。本组 2ห้องสมุดไป่ตู้为假 阴性 患者 , 但 血培 养 为 阳性 ,
随访经食道超声 分别发现 2 . 8 mm及 3 mm细小赘生 物。主
要 由于 m
分辨 力受 限 , 使 检 出率 降低 。而且赘 生 物越 大
活动度越好 , 较小 的赘生物呈疣状 附着 , 无 明显 自身运 动 , 故
T T E检查 较困难 , 但 随着 赘生 物 大小 的逐渐 增加 , 其 检 出率
亦越来越高 。虽然经食 道超声 检查 比经胸 超声 检查更 为敏
叶粘连 , 以瓣膜关 闭不全 为主。主 动脉瓣钙化 主要位 于瓣叶
主动脉 面 , 而钙化结节赘生物 限制瓣 叶活动 。风湿性 心脏 病 以瓣尖增厚 , 回声增强 , 粘 连为主 , 瓣膜脱垂较少 。而 赘生物
I u n g B, B a on r G.AP r o s p e e t i v e s u r v e y o f p a t i e n t s wi t h v a l v u l a r
察并结合 临床及辅 助检查做 出鉴别诊 断 。本组 病例 1 T r E误
本组 T 检出赘生物部位位 于受损瓣 膜及 人工瓣 膜之 上, 瓣膜关 闭不全产 生的反 流面 , 先心病 主要 位 于缺损分 流
1
1J
2
1 J
常见统计学错误(1)
• 误对Ⅰ型回归资料做相关分析 • 散点图并不反映直线趋势,仍作直线相关分析
• 误用相关系数 r 的假设检验来解释两检测方法的 符合程度 • 误用一般 2检验来说明线性趋势问题
百度文库
多元资料分析中存在的统计学错误
• • • • • 用一元分析取代多元分析 用单因素分析取代多因素分析 用单因素分析处理较复杂的资料 对生存资料不恰当的分析 多元回归分析中的策略错误
资料表达与描述中存在的统计学错误
• 误用正态分布法描述呈偏态分布的资料 • 以“比”代“率”或以“率”代“比” • 计算相对数时分母太小
• 统计表不规范:纵、横标目颠倒,统计表中数据含义不清、 同一表中表达不同的内容
• 统计图不规范:同一个复式条图表达多个指标、用复式条 图表达适合用线图表达的资料、用线图表达适合用复式条 图表达的资料、统计图坐标轴上的刻度不符合数学原则。
定量资料分析中存在的统计学错误
• • • • • • 应用参数统计分析方法分析非参数资料 2 检验分析定量资料 用 用成组设计资料的 t 检验分析配对设计的资料 用 t 检验分析多样本均数的资料 用 t检验和一般方差分析处理带有协变量的资料 用单因素多水平设计资料的方差分析处理析因设 计资料或具有一个重复测量的两因素设计资料
定性资料分析中存在的统计学错误
• 误用定量资料统计分析方法,如:误用 t 检验分 析四格表资料、双向无序列联表资料、单向有序 列联表资料
医学期刊论文中常见统计学错误
一
方 . 三 好 ” 人 的 理 想 与 现 实 . 华 医 学 信 息 导 “ 病 中
报 ,06 2 :4 2 0 ,1 2 .
强对 社 区居 民使 用 急 救 系 统 的认 知教 育 , 发 生 急 在 性疾病 时 能首先 选用 E MS系统 救 助 , 疑 是 降低 心 无 脑血管 病病 死率 的重 要措 施之 一 。
1 统 计 表 达 和 描 述 方 面 存 在 的错 误 :1 统 计 表 中 数 据 的 含 义 未 表 达 清 楚 , 人 费 解 。 ( ) 计 图 方 面 的 主 要 错 误 有 2 . () 令 2统 个 , 一 , 坐 标 轴 上 的 刻 度 值 是 随 意 标 上 去 的 , 长 的 间 隔 代 表 的数 量 不 等 , 直 角 坐 标 系 中 , 任 何 一 个 数 值 开 始 作 为 横 其 横 等 在 从
堕 蟹 苤查
生 !旦 2 卷第 4期 Ju a o C ri a u r u o a i ae, l 2 1 o 2 . 04 9 or l f a o s l &P l nr Ds ssJ y 00 V 1 9 N . n dv ca m y e u .
25 6
周永 等 统 计表 明 , 患 者 向医 院转 诊 的转 运 在 方式 中 , 用 出租 车 占 3 . % , 用 急 诊 ( MS 转 选 49 使 E ) 运 的 比 例 排 序 依 次 是 : 海 ( 9 3 ) 北 京 上 3. % 、 ( 2 3 ) 广 州 ( 2 8 ) 非 省会 城 市 ( 2 0 ) 3 .% 、 2. % 及 2. % 。 其 中 , 京 和上海 以急 救 中心 转 运 为 主 。通 过 E 北 MS 方 式 从 发 病 到 就 诊 的 时 间 <2 h者 的 比 例 为 3 . % , 其他 转运 方 式 到 院 患 者 比较 差 异 有 统 计 84 与
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人的差异在于业余时间
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——乌ห้องสมุดไป่ตู้斯基
谢谢!