医学论文统计学表达与审核
2统计结果在医学论文中的正确表达
讲座内容
一、“摘要”的统计表达
二、“引言”的统计表达 三、“材料与方法”的统计表达
四、“结果”的统计表达
五、“讨论”的统计表达
一、“摘要”的统计表达
报告研究结果的重要统计指标量(统计量的数值、
可信区间及假设检验结果)
均数,标准差,或中位数,最小值和最大值
率,或两组均数(率)之差 多个观察指标的相关系数等 统计量、P值、95%可信区间、OR值等
面对复杂的医学问题怎样处理?
“当人类科学探索者在问 题的丛林中遇到难以逾越的障 碍时,唯有统计工具可为其开 辟一条前进的通道”。
Francis Galton (1822.2.16~1911.1.17)
---英国著名遗传学家、统计学家Galton
经济学家、人口学家马寅初
学者不能离开统计学而研学;
政治家不能离开统计学而施政; 事业家不能离开统计学而执业;
医学论文的结构
一、文题
二、作者及其工作单位
三、摘要(Abstract) 四、关键词 五、前言(Introduction)
据粗略统计,在医 学期刊发表的研究论著 中,2/3以上存在统计 结果的表达和解释问题 。
六、材料与方法(Materials and Methods)
七、结果(Results)
八、讨论(Discussion) 九、其他
给出影响因素的均衡性分析结果,如年龄、性别、病情、病 程等的均衡性分析结果(统计指标)。
样本量估计的依据:参考文献、参数、公式或软件等。
实验设计中的统计设计
随机、对照、重复
采用何种设计模型
处理因素及水平的设置
非处理因素的控制
实验效应的评价指标(outcome measures):所用评价指标及
医学论文中的统计学处理与基本要求
[ J ] .J I mmu n o l Me t h o d s , 1 9 8 7 ,1 0 0 ( 1 — 2 ) : 1 7 3 — 1 7 9 . [ 7 ] Wa n g C W, Kl i o n s k y D J .Th e mo l e c u l a r me c h a n i s m o f a u t o p h a g y [ J ] .Mo l Me d , 2 0 0 3 , 9 ( 3 ~4 ) : 6 5 — 7 6 . [ 8 ] Mi z u s h i ma N, S u g i t a H,Y o s h i mo r i T, e t a 1 .A n e w p r o t e i n c o n —
du c e s a u t o ph a g y a n d r e d u c e s t o x i c i t y o f p o l y g l u t a mi n e e xp a ns i o n s
i n f l y a n d mo u s e mo d e l s o f Hu n t i n g t o n d i s e a s e[ J ] . Na t Ge n e t ,
是特 异性 识别该 抗原 决定 基 的。We s t e r n b l o t 和细 胞
好 的抗人 At g 5单 克 隆 抗体 , 为进 一 步研 究 其 与 宫 颈
癌关 系及在 临床 上 的应用 奠定 了基础 。
【ቤተ መጻሕፍቲ ባይዱ参 考 文献 】
E 1 ] Mi z u s h i ma N, L e v i n e B, C u e r v o AM , e t a 1 . Au t o p h a g y f i g h t s d i s —
统计分析结果在论文中的正确表达
二、“结果”的统计表达
4、假设检验结果的表达
(1)假设检验统计结论的表述,宜用“差异无统计 学意义”或“差异有统计学意义”,避免过去采用的 “差异无显著性”或“差异有显著性”表述方式。
保留的小数位数,应与原始数据记录的小数位数相同。 (2)计数资料的百分比保留一位小数,一般不超过两 位小数。 (3)检验统计量,如X2值、t值一般保留两位或三位 小数。
二、“结果”的统计表达
3、选择正确的统计描述指标
(1)计量资料常用 x s 描述研究结果的数据特 征,但必须注意前提是要求数据近似服从正态分布。 如数据明显偏态,应采用中位数和四分位数间距描述 数据特征。
4、论文中采用的统计分析方法和统计计算的软件名称 也要在“材料与方法”中说明。一般的常用统计方法简 单说明即可,如X2检验、t检验、单变量方差分析(ANOVA) 等,对一些特殊的统计方法,如多元回归分析、 Logistic回归分析、因子分析、生存分析、重复测量资 料方差分析等,要同时给出相应的参考文献。统计计算 软件一般给出名称即可,如EXCEL、SPSS、SAS等,但对 于一些特殊的计算,要给出软件的过程名,如重复测量 资 料 方 差 分 析 采 用 SPSS / GLM , 曲 线 回 归 拟 合 采 用 SPSS/Nonlinear.
51
27.3
86
46.0
2
1.0
48
干预前(n=173)
人数
%
22
12.7
医学论文中的统计学表述
医学论文中的统计学表述医学文献中统计学的应用z 医学论文中,普遍使用统计分析。
如:NEJM 杂志1990年有89%的文章使用统计分析。
z 国外的生物医学杂志通常都有专门的统计学审稿人。
z 1996年,我国申报科技成果的4586篇科研论文中,统计使用率达76%,而数据分析误用率达55.7%。
国外生物医学杂志投稿统一要求Uniform Requirements for Manuscripts Submitted to Biomedical JournalsThe International Committee of Medical Journal Editors (ICMJE), 第一版:BMJ 1991; 302: 338-41.第五版:N Engl J Med 1997; 336:309-316第六版:J Epidemiol Community Health. 2004; 58(9): 731–733.论文中的统计学表述论文结构:●引言(Introduction)明确阐述研究目的(objective)●方法(Methods )阐述统计设计思路及所用统计方法●结果(Results )表述实验(观察)数据的统计分析结果●讨论(Discussion )根据统计分析结果展开论述(材料和)方法●研究对象(subjects)9来源9入选标准和排除标准9总例数9基本情况描述(如人的年龄、性别等;动物的种系、年龄、性别、体重等)●统计设计方法■调查设计•何种研究方法(前瞻性、回顾性、横断面研究等)•样本容量,抽样方法及过程•数据质量及偏倚(bias)的控制■实验设计•采用何种设计方法(如自身配对设计、成组设计、交叉设计、析因设计等)•随机化方法及各组样本容量(n)(材料和)方法■临床试验设计:•随机化方法及各组样本容量(n )•纳入和排除标准•盲法•随访(失访情况的详细阐述)•处理标准(治疗或诊断标准)●实验效应的评价指标(outcome measures)•所用评价指标及其测量方法•测量误差的控制及评价(如多中心、多测量者、多测量仪器等问题)(材料和)方法●统计方法及统计软件(方法部分的最后一段)■一般采用双侧检验,单侧检验须特别说明,并阐述理由;■采用权威的统计软件并注明版次:SPSS 19.0, SAS 6.0, STATA 10.0, BMDP, SYSTAT, SPLM 等;■统计方法具体、确切;(材料和)方法计量资料的统计分析方法一组单样本t 检验两组多组配对设计配对t 检验成组设计两独立样本t 检验配伍组设计配伍组方差分析成组设计单因素方差分析重复测量重复测量ANOVA 多重比较:SNK, LSD, Scheffe, Duncan等级资料的统计分析方法两组多组配对设计Wicoxon 符号秩和检验成组设计Mann-Whitney 检验配伍组设计Friedman 检验成组设计Kruskall Wallis 检验计数资料的统计分析方法一组单样本率的u 检验两组多个率或构成比的比较χ2检验配对设计McNemar 检验成组设计χ2检验相关与回归分析方法相关: Pearson 线性相关(正态分布资料),Spearman 相关(偏态分布或等级资料)回归分析:线性回归/非线性回归logistic 回归:—条件logistic 回归—非条件logistic 回归Cox 回归结果●统计描述■计量资料:n, ±S ( ±SE),有的还给出min 、max 、CV 。
论文中统计结果的表达及解释
中华消化外科杂志对P值规范化表述的要求根据中华医学会杂志社的要求;根据人民卫生出版社的全国高等学校教材卫生统计学第5版;报告统计学检验的结论时;对P值小于或等于检验水准一般为0.05的情况;一律描述为“差异有统计学意义”;同时写明P的具体数值或相应的不等式;在用不等式表示P值的情况下;一般情况下选用P>0.05、P<0.05和P<0.01 三种表达方式即可满足需要;无须再细分为P<0.001或<0.0001..不再采用将P<0.05描述为“差异有显着意义”或差异有显着性”;或将P<0.01描述为“差异有非常显着意义或差异有非常显着性”的表达方式..______________________________________________论文中统计结果的表达及解释摘要统计学是生物医学研究所必需的重要手段; 生物医学研究的实验设计、资料收集、数据处理分析以及结论都离不开统计学应用..生物医学研究论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成; 各个部分都涉及统计结果的表达和解释; 统计学是专业结论成立与否的重要依据..统计学应用不当不仅影响论文的科学性; 还有可能得出错误的专业结论..关键词统计学科研论文统计分析统计表达近年来; 统计学在生物医学科研中的应用越来越受到重视; 统计分析结果的表达及解释已成为医学科研论文中不可缺少的重要组成部分..除论文涉及的专业如细胞与分子免疫学杂志为免疫学专业和表述的文字2个方面外; 统计学是评价论文质量优劣的重要依据; 然而国内生物医学论文中统计学应用仍存在着较为严重的问题1-4; 如2003年某大学学报拟发表论着中统计方法误用率为57%3..细胞与分子免疫学杂志虽然在国内生物医学系列杂志中具有较高的学术地位5; 但拟发表及刊出论文在科研设计、统计学分析、结果解释等方面也不同程度地存在一些问题; 作者的统计学应用水平有待进一步提高..许多生物医学杂志; 如国外着名杂志JAMA、新英格兰医学杂志NEJM和英国医学杂志BMJ等; 以及国内中华医学会系列杂志及细胞与分子免疫学杂志等; 对来稿都有统计学表达的基本要求或统计学指导原则..国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求中也包含了统计学表达的基本要求..生物医学研究性论文主要由摘要、引言、材料与方法、结果和讨论5个部分组成; 各个部分或多或少都涉及到统计结果的表达和解释问题..例如在论文的“引言”部分需要给出文献复习的综合结果; 如文献报告的组间差别及P值等..其他重要的统计表达和解释主要集中在论文的“摘要”、“材料和方法”、“结果”及“讨论”4个部分6..1 摘要“摘要”中要有表示研究结果的重要统计指标统计量的数值、可信区间及假设检验结果P值..如处理组和对照组的均数中位数、标准差标准误、率、 P值; 或2组均数率之差、 95%可信区间、 OR值及多个观察指标的相关系数等..这些数据是循证医学Meta分析的基本依据..2 材料和方法“材料和方法”中的统计学描述包括以下两个方面..2.1 描述研究设计的内容内容包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等..尤其应具体地描述研究对象的来源和选择方法如是否配对、随机抽样; 包括观察对象的基本情况、有无随机分组随机抽样、随机化分组方法、样本含量及其估计的依据等..对于非随机化分组的观察性研究含调查研究; 还应给出影响因素如年龄、性别、病情的均衡性分析结果..对于临床试验; 还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、依从性如何、有无失访及失访的比例、有无“知情同意”、疗效评价是否采用“盲法”“单盲”、“双盲”或“多盲”等..2.2 描述统计分析方法与统计计算软件论文中用到的所有统计分析方法都要说明; 且需指出在何处用了何种方法..统计计算软件一般给出名称即可; 如SPSS、 SAS等..然而; 有些论文却把统计学当做“修饰物”; 论文中没有用到的统计分析方法也都一一罗列出来; 甚至有的形态学研究不需要统计学分析; 却也给出了“P值”..在这里; 有些作者错误地认为;只要给出了“P值”; 就标志用了统计学; 却不管统计学用得是否正确..事实上; 误用或滥用统计学不仅不能提高论文的质量; 反而会大大降低论文的科学性2.3 研究设计常见的主要问题 1研究目的不分主次; 试图通过一次试验回答多个问题; 测量指标多; 样本小; 试验前未进行样本含量估计; 对研究对象的来源和选择方法不做任何说明或只做非常简单的说明; 统计分析方法没有任何说明; 尤其是一些特殊的统计方法..例如; 动物实验没有随机化分组; 或只说明经随机化分组; 未说明具体的随机化分组方法如完全随机、配对或分层随机分组等; 2观察对比的研究轻率使用“随机选择对照”、“随机抽取健康儿童××例”等用语; 对比组间的均衡性未交代或组间不做比较; 只说明组间均衡; 未给出反映均衡性的统计指标的具体数据以及所用的统计分析方法; 3临床试验没有报告伦理学要求对随机化分组的限制与改动、受试者的代表性、依从性、是否有失访等; 疗效评价未说明是否采用“盲法”; 或只说明采用了“盲法”; 未说明是受试者遮蔽还是评价者遮蔽等; 4实验或试验的样本量非常小; 如每组3例; 却不说明任何理由等等..3 结果统计学分析结果主要用统计指标统计量表示..统计指标比较多且需分组比较时; 常常须借助统计图表..3.1 统计量在生物医学论文中; 对不同类型的研究资料需用不同的统计指标进行描述..对细胞与分子生物学实验中的常见观测指标; 如TRAIL表达、 mRNA表达水平、光密度值OD值、吸光度值A值、百分比含量及抑制率等; 常作为计量数据计量资料进行统计描述与分析..对于计量资料; 当资料为近似正态或对称分布时; 可用算术均数x和标准差s描述; 在没有变异指标或精确性指标的情况下; 不宜单独使用均数..在“±”后直接写具体数值而无标准误或标准差的符号表示; 如16.4±2.3; 容易引起混淆..配对t检验; 应给出差数的均数及标准误或标准差..当资料为偏态时; 应采用中位数Md和四分位数间距QR来描述; 而不宜用x和s..用非参数统计分析方法处理的资料; 数据的中心位置用中位数表示; 散布范围如95%的散布范围用百分位数表示..此外; 若对原始数据进行了变量转换; 则原始数据的均数及标准差不能很好地反映数据的中心位置及其散布范围; 不必将其列出..对于计数资料; 常用的统计指标有率和构成比百分比..使用百分比时; 分母要交待清楚..小样本资料不宜计算百分比..实际工作中统计指标应用常见的问题有: 计量资料不管是否近似服从正态分布; 统统用x±s描述研究结果的数据特征; 分子生物学或细胞实验如ELISA法、 MTT法、 RT PCR法、免疫细胞化学法、蛋白质印迹分析法等数据用x±s表示; 其样本量例数n在“材料和方法”或“结果”中未交代; 计数资料统计指标率和构成比百分比容易混淆; 常将构成比误用为率来说明事物发生的强度; 率和构成比的分母太小; 却计算相对数来进行描述和比较..分母太小时; 率构成比的可靠性不能保证..因此; 在这种情况下; 宜直接用绝对数进行描述而不宜计算相对数..当计量资料符合正态分布条件时; 约有68%的观察数据在x±s的范围内; 约有95%的观察数据在x±2s的范围内..当数据不符合正态分布时; 就没有这些特征了..3.2 假设检验的结果表达不仅要给出P值; 还要给出检验统计量的实际值; 如u值、t值、χ2值等..描述统计量; 如均数、率、相关系数; 无论检验结果是否有统计学意义; 均应列出..0.05水平是常用的检验水准; 但P为0.04或0.06时; 与0.05并无太大差别; 得出的结论也理应一致; 不应有本质上的差别..用P>0.05作为不“显着”统计学意义的表达方式容易使读者也包括作者误解; 由于统计软件的普及; 因此提倡报告P的具体数值精确P值; 如P=0.018或P=0.436等..如果提供精确P值实在有困难; 应给出实际的χ2值、 t值、 F值和相应的自由度; 以便他人在Meta分析时转换为精确P值..3.3 统计图表统计图表是研究结果统计表达的重要手段; 统计图便于读者直观了解研究结果; 并且提倡用图来显示个体值的散布情况; 如相关和回归分析的散点图..同一个体值不同时间的重复测量值最好连成曲线; 不同组别的个体值均值随时间变化的曲线亦可标在同一个图上..提倡采用误差条图或线图; 但由均数加减标准误绘出的误差条图; 仅能描述68%的可信区间; 不能误解为95%的可信区间..医学论文中要求采用“三线”表..数值结果按列行放置; 位数要对齐; 不要出现交换行的情况..不同类型数据如均数、标准误要有标目; 表中应列出相应的观察例数..大量统计结果的表达要运用统计表或统计图; 实际应用中统计图表还存在一些问题; 主要有: 1图形类别的选择与资料性质不符; 2纵横两轴的等距离尺度不代表等差数据算术尺度或等比数据对数尺度; 3无图例或标目; 4条图的纵轴起点不为0、横轴的刻度为算术刻度、排列顺序未按指标值大小或自然顺序排列; 5圆图各部分未按比例大小或自然顺序顺时针方向排列其他项放最后、起点位置不在12时或9时; 6统计表的标目不明确; 主辞和宾辞倒置或混淆; 表中存在斜线或竖线; 数据为“0”、无数据或缺失数据时留有空白; 同一指标小数位数精度不一致、小数点位未对齐等图表不规范问题..3.4 数据精确度一般来说; 数据精确度只要足以区分个体差异即可; 并非小数位数越多越好..表示观测结果时; 2个数的小数位数应一致; 如5.4±0.62; 应写成5.4±0.6; 平均值x与标准差s的位数; 除取决于测量仪器的精密度外; 还取决于样本内个体的变异; 一般按s3而定; 例如3825.3±610.6 g; 其中s3超过200 g; 平均值在百克的位上波动; 故应写成3.8±0.6 kg..与实际情况不符的精确度并不能增加论文的价值; 反而降低了论文的可读性与可信程度..从计算器或计算机得到的计算结果需要四舍五入..计量资料的统计指标x、 s、中位数、百分位数等要保留的小数位数; 应该与原始数据记录的小数位数相同..均数的有效位数通常不应比原始数据的有效位数多; 但标准差或标准误必要时需多增加一个位数..计数资料的百分比保留1位小数; 一般不超过2位小数; 病死率、发病率按惯例选择比例基数; 如1000‰; 10000/万和10万/10万等; 或自行选择合适的比例基数; 使率的整数部分至少有1位有效数字; 相关系数保留2位小数; 精确概率P值一般没必要给出四位小数; 有时甚至保留两位小数也可以; 检验统计量; 如χ2值、 t值保留2位小数即可..当样本数小于100时; 小数位数的多少并不能增加精确度; 应避免取过多的小数位数..注意; 以上要求仅适用于表达最终的统计结果; 数据在分析之前或分析过程中不能舍入..在表达t值、χ2值或r值时; 有2位小数就足够了..3.5 常用统计专业术语一些常用的统计专业术语; 要注意不能作为普通名词使用; 如参数parameter、可信区间confidence interval、相关correlation、发病率morbidity、患病率prevalence rate、非参数法non parametric statistics、百分位数percentile、灵敏度sensitivity、特异度specificity等..4 讨论“统计学”是“专业结论成立与否的重要依据”2..统计学分析结果的解释主要集中在论文的“讨论”部分..作者往往要在“讨论”部分引用统计结果作为支持其新发现、新结果、新观点的统计学依据; 对统计结果理解和解释上的偏差; 可能导致专业结论上的错误..4.1 假设检验结果的解释假设检验是在“无效假设”正确的前提下如施加干预以前; 组间无差别或观察对象来自同一总体; 用P值大小说明实际观察结果是否符合“无效假设”..P 值小如P<0.05; 则怀疑“无效假设”的正确性; P值大如P>0.05; 则不能拒绝“无效假设”..但不能把P值理解为处理无效的概率..要注意区分“统计学显着”和“生物学或医学显着”是2种不同的结论..不可一得到P<0.05就认为有实际意义; 而不管其生物学效应有多大..组间生物学效应很小时如DC Ag TDLNC 组比DC TDLNC组CD3+ T细胞含量仅提高了0.7%7; 大样本量也可能使统计结果“显着”..例如肝硬化患者外周血IP10水平与ALT水平的Spearman相关系数为0.2; 当n=100时; Spearman相关系数经假设检验“统计显着”P<0.05; 但IP10水平与ALT水平相互只能解释4%的变异; 实际意义已经很小..因此; 统计学意义上的“显着”并不等同于生物学上的差异“显着”..同理; 也不能一看到P>0.05就认为某2种生物学处理“无显着差异”; 甚至认为可以相互替代..即使生物学上的差异“显着”; 当观察的样本很小时; 也极有可能出现统计学上不“显着”的结果..在医学论文中; 有一些P>0.05的“阴性”结果; 检验效能不足是一个主要的原因..综上所述; 有统计学意义的检验结果并不一定意味着确有生物学效应..这里有两个原因; 一是总会有错判的危险性; P值越小错判的危险性越小; 二是假设检验为定性的检验结果是否拒绝无效假设时; 专业上是否有意义还要看统计量的大小..可信区间有助于假设检验结果的解释; 小样本时尤其如此..由于可信区间反映了研究结果的不确定性; 并可提示差别有无实际意义; 因此无论假设检验结果是否显着; 都可计算可信区间; 如两均数差值的可信区间、相关系数的可信区间等..将可信区间与不显着的结果一起列出; 特别有启示作用..4.2 关联与因果在观察性研究中; 变量间的关联association或组间差别可能是因果关系causation; 也可能是偏倚; 确定因果关系需要根据专业知识进行进一步的分析研究..例如; 有人曾观察到眼晶状体后纤维增生的新生儿; 注射促肾上腺皮质激素后; 治愈率75%; 说明促肾上腺皮质激素与患儿治愈有关联前后比较: P<0.01..但随后进行的前瞻性的临床试验发现; 患儿脱离富氧环境后; 75%患儿自然痊愈组间比较: P≈1.00..如果将观察结果解释为“注射促肾上腺皮质激素与患儿痊愈有因果联系”; 并以此作为统计学证据; 临床上大量使用促肾上腺皮质激素治疗新生儿眼晶状体后纤维增生; 会导致严重后果..在随机对照研究中; 关联和组间差别可以解释为有概率保证的因果关系..当变量都随时间而变化时; 变量间很容易出现虚假的相关关系; 必须特别加以小心..4.3 预测与诊断试验在细胞与分子生物学检测诊断实验中; 常常遇到标准曲线直线的绘制; 即需要进行回归分析..在回归分析中; 即使两变量间有显着关系; 但用回归方程从变量X推算Y的个体值; 仍可能不很精确..预测的精确程度不能根据相关或回归系数来评价; 它需按不同的X值计算预测的个体Y值的容许区间或Y值均数的可信区间..直线回归仅适用于用自变量X预测应变量Y; 而不是Y预测X..具有高灵敏度、特异度的诊断检验; 不一定能达到诊断疾病的目的; 在人群发病率很低的情况下尤其如此; 而计算患者在诊断试验阳性人数中的比率阳性预测值; PV+会更有实用价值..连续性变量也有类似诊断试验的问题..通常把“异常”值定义为该变量“正常范围”以外的数值..但如果实际患病率很低; 许多正常人的个体值在“正常范围”以外也是正常的..异常者的判定应同时根据临床上和统计上的标准..4.4 缺陷或不足要指出在研究设计和实施过程中有哪些不足..若发现缺陷; 则应考虑这些缺陷对结果和解释可能产生的影响..不能对缺陷或不足视而不见; 更不能寄希望于不被读者发现..总之; 生物医学统计学是生物医学专业结论成立与否的重要依据..生物医学研究者应重视统计研究设计及统计分析结果的表达和解释; 正确运用统计方法的前提是良好的实验设计..如果实验前没有良好的设计; 或者设计存在错误; 那么; 即使使用高级的计算机和复杂的统计方法处理数据; 也只能得到错误的结论..因此; 统计学问题的咨询应该在一个研究项目开始之前; 而不是在研究数据出来以后; 否则; 就象统计学家Fisher所告戒的一样: 实验完成后再找统计学家; 无异于请统计学家为实验进行“尸体解剖”; 统计学家或许只能告诉你实验失败的原因..。
医学论文中材料和方法部分应注意的统计学问题
医学论文中材料和方法部分应注意的统计学问题医学论文的正文中,“材料和方法”作为重要组成部分,医学统计学的应用贯穿于其中,作者投稿后,期刊编辑会对该部分内容中的统计学问题分别进行审查,一旦发现统计学错误,稿件就会被退回。
因此,为避免因为该部分统计学问题被退稿,医刊汇编译认为,作者应在论文撰写时,注意论文“材料和方法”部分内容中常出现的统计学问题,特别是对稿件退修中编辑提出的统计学方法修改意见要引起足够的重视。
医学论文中所涉及的统计学方法,通常会在“材料和方法”中作为一个比较独立的部分予以专门介绍,这部分应该包括统计软件的介绍、数据表达方式的介绍、检验方法的交代和检验水准的设定等至少四方面的内容。
除了有些论文中会遗漏全部或部分这方面内容外,其他常见的问题还有以下几个:1.统计软件介绍中没有提及版本。
版本是软件名称的组成部分,版本不同,软件就不同,如SPSS统计软件就有十几种版本,所以在介绍统计软件时不能缺少版本的介绍。
2.对数据表达方式的描述比较笼统,没有对定量资料和定性资料的数据表达方式分别予以介绍。
不同的资料类型,其数据表达方式不同,如正态分布的定量资料应该用均数±标准差来表示,偏态分布的定量资料用中位数和四分位间距表示,定性资料应该用比、构成比和率来表示,对于不同类型数据的表达方式均应分别予以说明。
3.检验方法交代得不够全面。
t检验和卡方检验是研究中经常用到的统计方法,作者一般会予以交代,但仔细审查文中的“结果”部分时,发现作者还用了其他检验方法,如相关分析、回归分析等,但在统计学方法中却往往没有交代,另外t检验还分为两独立样本的t 检验、配对t检验等,卡方检验还分为四格表卡方检验、R×C表卡方检验、配对卡方检验等,均应明确而具体地予以说明。
4.检验水准α不作介绍。
α值是预先规定的判断小概率事件的概率尺度,不同的研究目的,α值设定的大小不同,所以应该介绍本研究所采用的α值,并明确是双侧检验还是单侧检验。
医学SCI论文统计学处理与方法选择
一、关于统计学处理在进行统计学处理时,首先要明白研究资料是计数资料还是计量资料,尽管是一个常识性的问题,但仍有不少作者搞混了。
先分类再计数的资料叫计数资料,如A组30例,B组32例,可根据研究目的计算出阳性率、治愈率等。
测定某项具体数值的资料叫计量资料,如身高、体重、脉搏、血压等许多物理诊断和化验结果。
在医学科研论文中,计数资料最常用的统计学方法是检验,计量资料最常用的是t检验。
在研究设计时,就应根据研究资料的特点,决定假设检验的方法。
在处理资料时,因均数和标准差是用来描述正态分布资料集中和离散趋势的指标,可否采用均数±标准差描述研究资料的分布特征,首先要看资料是否是正态分布,如果资料不是正态分布或者方差不齐时,应对资料进行转换处理,使其符合正态分布,方差齐性后采用t检验或方差分析,达不到上述要求,用秩和检验。
有的研究资料数据庞大,只能在表格描述中用阿.拉伯数字或特殊符号表示与比较对象的P值,如P>0.05,P<0.05,P<0.01,无法一一给出具体的P值。
但有的作者既不交代使用的统计学方法,也不给出具体的P值,直接列出P<0.05或P>0.05,认为差异有统计学意义或无统计学意义,使读者对无法判断结果的可靠性。
关于统计学方法的选择一、两组或多组计量数据的比较1.两组数据:1)大样本数据或服从正态分布的小样本数据(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布数据,则用成组的Wilcoxon秩和检验2. 多组数据:1)若大样本数据或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布数据或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
医学论文中统计学内容表达的一般要求
医学论文中统计学内容表达的一般要求----医学统计分析相信大家在临床科研工作中一定遇到过这样的问题:如何在我的医学论文中恰当地报告统计学的有关内容?随着国内外医学期刊审稿标准的日益提高,医学论文统计结果的标准化报告变得越来越重要。
今天,小编就跟大家一起分享一下医学论文中统计学内容表达的一般要求。
医学论文除了必备高度概括研究内容的“题目”外,其主体结构主要是由“摘要”、“对象与方法”(有时用“材料与方法”)、“结果”和“讨论”所组成。
在论文的不同部分几乎都会涉及到统计学的内容。
一、“题目”及“摘要”中的统计学内容报告“题目”要求简明扼要,能体现出研究设计的特点。
在临床实验报告的“题目”中应能显露出研究设计的信息,比如是平行、交叉或析因设计,是安慰剂对照还是阳性对照,是开放研究还是盲法研究,是否为双盲研究等。
“摘要”是论文核心内容的浓缩,此部分应提供研究设计的信息,表示研究结果的主要统计量的数值、可信区间及假设检验结果,叙述要精炼。
二、“对象与方法”中的统计学内容报告在此部分中要把统计学的内容充分反映出来,主要包括以下几个方面:1、统计研究设计的类型和主要做法。
如果属于实验设计,应该指出采用的是完全随机设计、配对设计、交叉设计还是其他类型的设计,给出处理因素及水平、各组样本含量及随机化方法等;如果属于临床试验设计,应指出采用的是随机平行设计、交叉设计、析因设计等,属于第几期临床试验,样本含量如何估计,受试对象如何分组,采用了何种盲法措施等。
2、研究对象的选择及观测方法。
应明确研究对象的特征,有明确的入选和排除标准,确定的主要和次要指标。
研究指标的观察方法和测量技术要给予详细说明,以便让读者理解各种措施的合理性和可靠性,并使他人可重复。
3、数据管理及统计分析方法。
对数据收集和整理过程中使用的方法,以及在此过程中使用的质量控制方法进行描述。
三、“结果”中的统计学内容报告此部分包括了描述和分析两方面内容,可以用文字、表格和图展示研究结果。
医学论文中统计学处理的有关要求
医学论文中统计学处理的有关要求
1.统计研究设计:应交代计研究设计的名称和主要法。
如调查设计,实验设计,临床试验设计;主要做法应围绕4个基本原则概要说明,尤其要交代如何制重要非试验因素的干扰和影响。
2.资料的表达与描述:用x±s表达近服从正态分布的定量资、用M表达呈偏态分布定量资料;用统计表时,要合理排纵横标目,并将据的含义表达清楚;用统图时,所用统计图类型应与资料性质相匹配,并使轴上刻度值的标法符合数学原则;用相对数时,分不宜小于20,要注意分百分率与百分比。
3.统分析方法的选择:对于定量资料,应根据所采用的设计型、资料所具备的条和分析目的,选用适的统计分析方法,不应盲套用t检验和单因素方差分析;于定性资料,应根据所采用的计类型、定性变量性质和频数所具备的条件以及析目的,选用合适的统分析方法,不应盲目套用χ2验。
对于回归分析,应结合专知识和散布图,选用合适的归类型,不应盲目套用简单直线回分析,对具有重复实验数据回归分析资料,不应简单化理;对于多因素、多指标资,要在一元分析的础上,尽可能运用多元统计析方法,以便对因素之间的互作用和多指标之间的内在联作出全面、合理的解释和评价。
4.统计结的解释和表达:当Plt;0.05时,应说比组之间的差异具有显性的意义,而不应说对比组之具有显著性的差别;应写明所统计分析方法的具体名称,统计量的具体,应尽可能给出具体P值;涉及到总体参数时,在给出显著性检结果的同时,再给出95%置信区间。
2024年当前医学论文中的一些统计学问题(上)
2024年当前医学论文中的一些统计学问题(上)随着医学研究的不断深入和发展,医学论文作为研究成果的主要载体,其质量和准确性受到了广泛关注。
然而,在医学论文的撰写过程中,统计学的应用及其相关问题的处理常常成为关注的焦点。
本文将探讨当前医学论文中常见的统计学问题,并分析这些问题可能对研究结果和论文质量造成的影响。
一、统计方法的选择不当在医学研究中,正确的统计方法选择对研究结果的准确性和可靠性至关重要。
然而,在实际操作中,研究者往往因为对统计知识掌握不足或误解,导致选择了不合适的统计方法。
这包括但不限于误用参数统计方法处理非参数数据、未能充分考虑数据的分布特性和变量间的相关性等。
因此,医学论文中常出现统计方法选择不当的问题,这可能导致研究结论的偏倚或误导。
二、样本量不足与过度抽样样本量是医学研究中一个极为关键的因素,它直接影响研究结果的稳定性和可靠性。
然而,在实际操作中,研究者常常因为资源限制或时间紧迫等原因,导致样本量不足或过度抽样。
样本量不足可能导致研究结果的偶然性增大,而过度抽样则可能引入不必要的误差和偏差。
因此,如何在有限的资源条件下合理选择样本量,是医学论文撰写中需要重点关注的问题。
三、统计软件的选择与使用问题随着科技的发展,越来越多的统计软件被应用于医学研究中。
然而,统计软件的选择和使用也成为了一个不可忽视的问题。
一些研究者可能因为对统计软件不熟悉或误解,导致选择了不适合的软件或错误的操作方式。
这可能导致统计结果的错误或偏差,进而影响整个研究的准确性和可靠性。
因此,在医学论文撰写中,研究者需要加强对统计软件的学习和掌握,确保统计结果的准确性和可靠性。
四、统计结果的解读与呈现问题统计结果的解读和呈现是医学论文中的重要环节。
然而,在实际操作中,研究者往往因为对统计知识理解不足或表达不清,导致统计结果解读错误或呈现不当。
例如,研究者可能误将统计显著性等同于实际意义的重要性,或未能充分考虑其他影响因素对结果的潜在影响。
统计结果在论文中的正确表达
两组均数(率)之差或者OR值,95%可信区间
(CI);
多个观察指标的相关系数及其P 值等.
材料与方法 Materials and Methods
研究设计方案 (Design of Research Methods) 统计表达 统计分析方法及软件 (Analysis Methods and Software) 目的:以使读者确认论文中所有统计分析结果的 可靠性和研究结论的合理性。
率或比
(Rate or Ratio)
关于 X S
应用条件:只有属于正态分布的数据才可以表示
为 X S ,虽属于正态分布,但 X S 出现负数 (即 x <s时,如血清 X S 出现负数)时不能用
X S
表示,此时宜用最大值、最小值、四分位间
距和中位数。
P 值的表达
传统表达
P >0.05 记为“NS”, P≤0.05 记为“*”,
统计表的应用:自明性
统计表的应用:自明性
原则:选择最恰当的统计指标准确描述资料的特征。 正态分布 (Normal Distribution) 非正态分布
(Non-normal Distribution)
计量资料 (Measurement Data) 计数资料 (Count Data)
X S
Md , ( P25 , P75 )
统计分析方法及软件 (Analysis Methods and Software)
常用统计方法简单说明:
如 检验、t 检验、单因素方差分析(ANOVA)、多 因素方差分析;
2
特殊的统计方法给出相应的参考文献: 如聚类分析(Cluster)、生存分析(Survival Analysis)等;
医学科研和论文撰写中常用的数据处理和统计分析方法
• 整群抽样法:先将总体按某个标志分成若干群,然后随机地
抽取若干群,并由抽中群中全部个体组成样本。
医学科研和论文撰写中常用的数据处理和统计分析方法
第8页
几个常见分布
• 分类变量分布类型
– 二项分布:观察单位含有相互对立一个结果,观察单 位观察结果相互独立(如:治愈/未治愈、传染/未传染)
Whitney秩和检验
• 成组设计多个样本比较秩和检验:H检验法(Kruskal-Wallis
法)
• 多个样本间两两比较秩和检验 • 配伍组设计多个样本比较秩和检验
医学科研和论文撰写中常用的数据处理和统计分析方法
第13页
Hale Waihona Puke 医学统计学方法• 利用统计学原理和方法研究医学领域中生物、理化、社会、心理等原因
可靠度,如x线对肺癌诊疗。
• 临床疗效分析比较 如几个药品疗效比较,视资料性质作显著性检验。 • 现象间关联情况分析如眼PSRT与屈光度关系,用线形相关和回归分析。 • 人群归类、评价,可选取判别分析、聚类分析、主成份分析等。
医学科研和论文撰写中常用的数据处理和统计分析方法
第19页
样本含量
• 统计学是对研究样本进行抽象归纳科学,没有足够样本量就不可能得
– 四格表卡方检验要求样本量大于40,方格中理论数大于5(n~>40,t>5), 若不符合则用校正卡方检验或准确概率法。行x列表卡方检验要求理论数 均大于1且小于5者不超出表中数1/5,若不符合则改用其它方法(合理合 并)。
– 正常值范围确实定:观察数量应尽可能多于100例;需分组者,各组人数 也是如此(标本起源困难时酌情降低)。若为偏态分布,应以百分位数计算, 则例数应≥120例。
“医学论文审稿中常见”资料汇总
“医学论文审稿中常见”资料汇总目录一、医学论文审稿中常见的统计学错误定量资料统计方法的误用分析二、医学论文审稿中常见的统计学错误重复测量方法的误用分析三、医学论文审稿中常见的统计学错误相关回归分析方法的误用分析四、医学论文审稿中常见的统计学错误2检验的误用分析医学论文审稿中常见的统计学错误定量资料统计方法的误用分析在医学研究领域,正确地理解和使用统计学方法对于论文的质量和可靠性至关重要。
然而,在实际审稿过程中,我们发现定量资料的统计方法误用是一个常见的问题。
以下将对这些问题进行详细的分析,并提供正确的使用方法。
对于定量数据,正确地描述是统计分析的基础。
常见的问题包括对数据的总结不全面、遗漏关键信息以及使用不恰当的描述方法。
例如,简单地给出平均数和标准差而忽略中位数和四分位数,或者错误地使用算术平均数而非几何平均数等。
正确的做法是针对数据的特点选择恰当的描述方式,同时给出必要的统计指标,如均值、中位数、标准差、四分位数等。
t检验是医学论文中常用的统计方法,但在审稿过程中经常发现其误用。
主要问题包括未满足正态性和同方差假设的情况下使用t检验,以及将t检验用于比较两个相关样本的均值。
正确的做法是,在应用t检验前,首先要检查数据是否满足正态性和同方差假设,同时要了解t检验只能用于比较两个独立样本的均值。
回归分析是研究变量之间关系的重要方法,但在医学论文中经常出现误用。
常见的问题包括将非线性关系强行拟合为线性关系,遗漏自变量,以及违反回归假设。
正确的做法是,在建立回归模型前,要对数据的分布和变量之间的关系进行充分的了解,选择合适的回归模型,并仔细检查回归假设是否满足。
生存分析是一种用于研究生存时间影响因素的方法,但在医学论文中也存在误用现象。
常见的问题包括使用错误的生存时间衡量指标(如直接使用死亡人数而非生存时间),错误地解读竞争风险等。
正确的做法是,首先了解生存分析的基本原理和方法,选择正确的生存时间衡量指标,如生存率、中位生存时间等,同时也要正确地理解和处理竞争风险。
医学论文中统计学处理的有关要求
医学论文中统计学处理的有关要求医学论文中统计学处理的要求引言:医学研究的目的是为了揭示疾病的发生机制、评估治疗手段的疗效以及进行流行病学调查等。
而统计学是医学研究中不可或缺的一部分,它可以通过数学的方法对实验数据进行处理和解释,帮助研究者得出可靠的结论。
本文将介绍医学论文中统计学处理的要求。
数据收集和处理:在医学研究中,数据的收集是非常重要的一步。
一般通过临床观察、实验实施或病例调查等方法来收集数据。
在收集数据时,应遵循一定的规范,如使用标准的问卷、记录详细的实验过程等,以确保数据的可靠性和准确性。
同时,必须保护受试者的隐私和权益。
数据的统计描述和展示:在医学论文中,对数据进行统计描述和展示是十分重要的。
一般可通过平均值、标准差、中位数等来描述数据集的集中趋势和离散程度。
此外,还应该利用图表来直观地展示数据的分布情况,如直方图、饼图、散点图等。
这些统计描述和展示方法有助于读者更好地理解数据。
假设检验和置信区间:在医学论文中,常常需要对数据进行假设检验。
假设检验是用来判断两个或多个数据集之间是否存在显著差异的统计方法。
在进行假设检验时,需设定原假设和备择假设,并选择适当的检验方法进行分析。
此外,还应计算置信区间,以提供数据估计的范围。
相关性分析和回归分析:在医学研究中,常常需要通过相关性分析来研究不同因素之间的关系。
相关性分析可以通过计算相关系数来衡量两个变量之间的相关程度。
此外,回归分析可以用来建立模型,预测变量之间的关系,并且可以用来控制其他因素的影响。
生存分析:在某些医学研究中,需要研究患者的生存时间或事件发生时间。
生存分析可以通过生存曲线、生存率和风险比等指标来描述。
常用的生存分析方法有Kaplan-Meier法和Cox比例风险模型。
统计学软件的使用:在医学论文中,经常需要借助统计学软件进行数据处理和分析。
如SPSS、SAS、R等。
因此,研究者应熟练掌握统计学软件的使用方法。
结论:统计学处理在医学论文中起到了不可或缺的作用。
医学科研论文初审时统计学错误的发现技巧
现论文进行了多组间 的 两 两 比 较 , 但却仍然以修正 , 前的 0. 或者 为 则也属于 统 计 学 的 错 误, 0 5 0. 0 1 α 应退给作者重新计算 。 值得一提的是 , 假设检 验 最 终 用 P 值 与 检 验 水 应该正确理解 P 值的意义 , 准α 进行比较来下结论 , 拒绝 H0 只是说明差异不为零 , 而 P 值小于α 也只是 有差 异 ”的 结 论 犯 错 误 的 概 率 小 于 α, 说明下这个 “ 而 P 值的大小并不反映差异的程度 , 将 p <0. 0 5说 , 差异显著 ” 将 p < 0. 差异非 常 显 成是 “ 0 1 说成是 “ 著” 都是不对的 , α 的大小应该是在计算P 值之前就 确定好的 , 然后通过计算出 来 的 P 值 与 其 比 较 来 下 “ 差异有统计学意义 ”或 者 “ 差 异 无 统 计 学 意 义 ”的
2 / 校正后的α= 校正前的α C R 2 , , 是组数 就是组数 取 的组合数 即所有 R CR R 2 [ 2 4] , 例如一个 5 个处理 处理组两两对比有 C R 种情况 组的资料 , 在检验总的概率时选用的α 为0. 在作 0 5,
两两对比时 , 则修正后的检 5组共有1 0种对比情况 , / 如果在审稿 中 , 发 验水准取α = 0. 0 5 1 0 = 0. 0 0 5。
第 8 卷第 5 期 邓强庭 : 医学科研论文初审时统计学错误的发现技巧
2 6 9
避孕套 ”等 。 但是如果研究指标并非互相独立而是 例如将疗 效 分 为 “ 无 效、 好 转、 显 效、 治 有递进关系 , 愈 ”或者 临 床 检 验 结 果 中 常 用 的 “ -、 ±、 +、 ++、 ” , , 这种资料的研究指标是 有 序 的 并 不 应 该选 +++
卫生医学论文中常见的统计学问题探究
卫生医学论文中常见的统计学问题探究刘成秀山东省日照市东港区妇幼保健院山东省日照市 276800摘要:在卫生医学论文的写作中,需要借助统计学方法对文中的医学数据进行分析,而统计学处理的正确与否会直接影响科研结果的可靠性,使论文的发表更具有代表性及科学性。
但是在卫生医学论文的初审过程中发现,作者普遍存在着统计学应用性能差的表现。
本文就卫生医学论文中现常出现的统计学问题进行归纳总结,以期减少论文写作中统计学错误事件的发生率,提高卫生医学论文的编校质量,保障科研结果的可靠性及科学性。
关键词:论文写作;卫生医学;统计学;常见问题医学论文作为医学工作人员进行学术交流的重要手段,其在进行论文撰写和科学研究的时候都需要应用到统计学方法对相关的数据分析,因此,医学的统计学在医学的科研中占有着举足轻重的地位[1]。
医学统计学是一门将研究的数据收集后,采用概率论和数理统计学的方法进行整理及分析的学科。
通常用于医学现象内的规律总结,也被用于医学理论及实践的临床指导。
如果医学的科研人员在进行论文编写的时候,未能仔细的钻研统计学的相关知识或未请教专业的统计学人员,一味盲目的套用统计学方法,那么往往会造成统计学的应用方法及数据处理错误,如模型的设计、变量的纳入、结果的描述等用错的情况出现,因此,正确的使用统计学分析是对一个医学科研人员最基本的要求[2]。
本文就卫生医学论文中常见的统计学问题作一综述,希冀对科研工作者的论文撰写有所帮助。
1设计常见问题一个完整的研究设计应该包含有研究的目的、对象、方法、结果等,遵循的四大原则有对照、随机、均衡及重复,统计设计是医学论文中整个研究过程中最重要的一环节。
目前,研究设计中常见的问题有以下几点:1.1分组未遵循随机化原则在样本充足的前提下,研究对象的抽样及分组都应遵循随机化原则,即随机抽样、随机分组,并交代清楚随机方法,随机后各组样本的基本数量、特征等。
随机并不等于随意或随便,不可盲目的使用随机而使研究结果没有科学性。
医学论文统计学处理常见问题及建议
《山东大学学报(医学版)》统计学基本要求本刊重视统计学审查,对于存在明显统计学问题的稿件不予接受。
对于通过同行专家评审的稿件,将送统计学专家评审。
请认真核对稿件是否符合下列要求:1 请参照本刊新近刊出的论文格式撰写、修改稿件。
2 保证数据真实可靠,必要时请作者提供原始数据。
3 请按照全国高等医药院校教材的要求使用统计学术语,如成组t 检验、配对t 检验不能笼统地写作t 检验,单因素方差分析、重复测量设计资料的方差分析、析因设计资料的方差分析不能笼统地写作方差分析,“差异有统计学意义”不能写作“差异显著”、“有显著性差异”。
正确拼写英文单词,如Spearman 秩相关、Wilcoxon 符号秩检验、Kruskal-Wallis H 检验、Bonferroni 法、Fisher 确切概率法、Kaplan-Meier 法、log-rank 检验等。
4 统计学符号用斜体,如n ,t ,F ,Z ,r ,P 等。
不能用X 2代替2χ,不能用X ±S 或x ±s 代替s x ±。
5 根据设计类型、资料性质和研究目的,选用合适的统计分析方法,定量资料不能盲目套用t 检验和单因素方差分析,定性资料不能盲目套用2χ检验。
6 对于定量资料,根据正态分布检验结果选择合适的描述方法。
正态分布资料以s x ±表示,偏态分布资料以M [P 25,P 75]表示。
避免出现x 与s 相近,甚至s 远大于x 的描述。
7 要给出具体的统计量和P 值,如2χ=8.688,P =0.034;F =1.929,P =0.167。
统计软件计算结果有时会出现P =0.000,在论文中应写为P <0.001。
8 一般情况下,在“资料与方法”最后将“统计学处理”作为一项独立内容介绍,包括统计软件及版本、统计描述及统计推断方法、检验水准等。
如:1.3 统计学处理 应用SPSS 22.0软件,大鼠滑膜RANKL 蛋白的表达以s x ±表示。
研究生毕业论文统计审核实践与体会论文
研究生毕业论文统计审核实践与体会论文研究生毕业论文统计审核的实践与体会论文在医学论文写作中统计学表述几乎与专业表述具有相同的重要性因此论文中统计学表述的质量会直接影响整个论文的质量我校通过对以往研究生毕业论文的抽查评估发现存在大量统计学表述方面的缺陷严重地影响了毕业论文的质量基于这种情况我校研究生学院决定从年开始委托生物统计学系对研究生的毕业论文进行统计审核通过两年的实践我们有许多切身感受和体验希望借此机会做一总结以供同行参考和指正研究生毕业论文统计审核的规定和实施我校研究生学院于年底正式发文规定自年1月1日开始凡南方医科大学的研究生毕业论文必须先经过生物统计学系进行统计学审核在审核通过并获得“统计学处理合格证明”后方可送外审继而申请答辩换言之如果毕业论文统计审核不合格将延期毕业或放弃申请学位统计审核的实施由一场“研究生毕业论文的统计审核与规范”讲座拉开了序幕这样的讲座通常安排在毕业年份的前一年年底目的是使研究生对统计审核有一个正确的理肖解并为研究生如何把握论文写作中的统计学表述提供指南讲座大致包括审核规定、审评参考提纲和学位论文试论情感语言节目主持人万峰、钟晓的语言特点基于园本课程开发背景下研究教师教育理念的形新生儿高胆红素血症护理相关因素分析及对策试析价值多元化背景下学生价值观的引导试论高等职业院校高等数学课程改革争议试论中职《外科护理学》的情境式教学试析高校教师职业道德建设问题研究经济学和经济法基础课程融通教学小针刀治疗颈椎病疗效观察手术侧卧位适宜度的研究评阅中常见的统计学问题等三个方面1.审核规定:要求研究生提交打印的论文隐去本人和导师的姓名及专业方向等内容以便于盲评同时提交电子版原始数据格式与所使用的统计软件一致采用盲审制度即审评人与送审人不接触由专人负责接收送审论文并随机分配给审评教师规定的初审时间一般为7个工作日复审时间为3个工作日如时间紧急者可按加紧处理对于某些不涉及统计分析的专业论文如图像和个案报道等将出具“不涉及统计分析”的证明可见所有的毕业论文无论什么专业都必须经过统计审核即使可能与统计学无关2.审评参考提纲:此部分主要根据论文结构即摘要、材料与方法、结果和讨论介绍如何进行统计学方面的表述给出详细的引导如P值应尽可能精确(至少保留三位小数)临床试验中研究对象的纳入标准和排除标准在“材料与方法”部分的最后一节单独交代统计学处理等等由于此部分内容在硕士第一学年的统计学课程中有专门讲授故以复习和强调为主3.学位论文评阅中常见的统计学问题:讲述此类问题的主要目的是使研究生对一些明显和严重的统计学错误有深刻印象以避免在自已的论文中重复这样的错误同时也会减轻评阅教师的工作负担研究生毕业论文评阅中发现的统计学问题与年我系统计审核研究生毕业论文1192篇其中博士论文435篇涉及统计推断和不涉及或只涉及统计描述的分别为398篇(91.5%)和37篇(8.5硕士论文757篇涉及和不涉及统计推断的分别为649篇(85.7%)和108篇(14.3如果除去我校生物医学工程学院的研究生主要从事图像研究不涉及统计内容以外其余专业的毕业论文有91.3%(1047/1147)涉及统计推断1.统计错误发生的频数:每篇论文中发生统计错误的种类见表1多数论文发生的统计错误在1_7种之间最高达15种之多平均每篇硕士和博士论文出现的统计错误分别为3.5种和3.7种表1年每篇毕业论文发生统计错误种类的数量分布2.统计错误发生的种类:我们将论文中的统计错误概括为4个方面(表2)即统计表述不规范或不充分(93.03%)、统计设计及其阐述错误(18.05%).统计方法误用或未用(43.84%)和统计计算错误(8.60%)按发生比例高低前10位的统计错误种类依次为:统计软件和统计方法交代不够(54.53%),缺P值或P值不精确(50.14%),缺检验统计量(44.13%),统计术语不规范(28.27%),制表不规范(27.98%),统计表给出的信息不完整(18.24%),该用重复测量的方差分析却用了单向方差分析(490%),其他统计学方法使用不当(11.75%),统计量的符号使用不规范(11.75%),该用析因分析却用了单向方差分析(9.46%).研究生对统计审核的看法在统计审核同时我们还对毕业研究生关于统计审核的看法进行了调查调查方法为现场自填式问卷调查时机选择在研究生通过论文审核并开据合格证明后问卷分两个方面共7个条目第一方面3个条目有关研究生对统计审核老师的满意度;第二方面4个条目有关研究生对统计审核的看法1.研究生对统计审核老师的满意度对问题“审核老师的态度是否满意”:很满意的有586人(89.7%),满意的60人(9.2%),一般的7人没人选择不满意和很不满意对问题“疑问的解释是否满意”很满意的有555人(85.1%),满意的82人(126%),一般的有12(1.8%)人,有3人(0.5%)不满意对问题“审核速度是否满意”很满意的有485人(74.2满意的132人(20.2一般的29人(4.4%)不满意及很不满意的有8人(1.3%)2.研究生对统计审核的看法对问题“对毕业的统计审评是否必要”:认为很有必要的474人(72.7%)必要的163人(25.0%)即认为统计审核必要以上的占97.7%,有15人(23%)认为有无均可或没必要对问题“统计审核对学生的毕业论文是否有帮助”:认为有很大帮助的560人(85.9%),有帮助的91人(14.0%),无帮助的1人(0.2%)对问题”统计审核是否使学生在统计学应用方面有进步”认为有很大进步的458人(70.5%)进步的191人(29.4%)无进步的1人(0.2%)对问题“统计审核对学生将来的论文写作是否有帮助”:认为有很大帮助的550人(84.9%),有帮助的98人(15.1%),无人否认有帮助研究生毕业论文统计审核的意义我们认为研究生毕业论文的统计审核具有以下意义:1.可以帮助纠正论文中的统计错误提高研究生毕业论文的质量2.有助于遏制弄虚作假现象由于审核中要求提交原始数据一定程度上阻遏了编造数据的行为3.为统计专业积累了丰富的实际数据每年600多名毕业生意味着600多项课题这是非常珍贵的统计数据当然需要说明的是我们有义务对这些数据保密除非得到研究者本人的同意4.统计审核也促进了教师业务素质的提高由于教师在审核中会遇到大量以前未曾接触的统计问题促使教师学习和应用新方法解决此类问题从而提高了自身的素质5.对研究生论文开展综合性基础医学实验提高中医药专业研究生专业学位研究生“政产学研”合作培养模式的创浅议发挥开放性实验室在医学研究生实验教学中浅谈研究生科技论文英语写作能力培养的方法浅谈打造自主探究式研究生思想政治教育工程试论我国公共管理硕士研究生教育质量研究研究生统计学专业英语课程教学实践与思考探析研究生文献阅读研讨课教学评价体系浅谈以发展的视角看研究生教材出版研究生英文文献导读课程教学探析的规范具有明显的正面影响也对毕业研究生今后的专业发展起到了良好的促进作用6.统计审核工作可以形成制度性延续由于统计老师为统计审核付出的大量艰辛劳动得到了99%以上研究生的肯定而且98%以上的研究生认为统计审核很有必要或有必要这为统计审核作为一种长期制度奠定了良好基础总之研究生毕业论文的统计审核既是必要的又是可行的统计审核之后的思考1.统计表述的规范有待加强尽管我们在研究生统计学教学中专门讲述了医学论文环境法学研究影响性因素实证分析基于CSSCI法学基于CSSCI(2000―)的我国新闻学与传播学学科知基于SCILAB与Tcl/Tk构建中学几何教学的方式分析ActaMathematicaScientia(EnglishSeries)JournalofMaterialsScienceTechnol ogyJournalofGeographicalSciencesAdvancesinAtmosphericSciencesChineseGe ographicalScienceScienceChinaEarthSciencesScienceChina中的统计学表述规范在研究生毕业的前一个学期专门进行了此方面的引导但绝大多数论文(93.03%)仍然出现了统计学表述不规范的现象说明我们强调的还不够有必要今后通过教学和讲座等形式进一步加强此方面的引导同时将相关内容放在我系网站上以便研究生随时查阅2避免出现不可挽回的统计错误研究设计是毕业论文的一个关键环节一旦在临近毕业时才发现存在设计方面的致命错误将会直接影响研究生的毕业同时也为统计审定带了相当困难因此我们需要特别引导研究生在开题时充分咨询统计教师以免因研究设计缺陷而招致失败3.针对容易发生的统计方法应用错误改进教学毕业论文中涉及重复测量的方差分析、析因分析、协方差分析、多重比较等方法较多错误主要体现在用单向方差分析及t检验替代上述方法因此有必要在今后的教学中加强上述方法的讲述及错误案例的讲评减少此类问题的发生?。