第八讲 统计学方法误用与辨析-2013硕士

合集下载

常见统计学错误(2013)[文字可编辑]

常见统计学错误(2013)[文字可编辑]
犯假阳性错误的概率总共不超过 ? , 则每次分析要用 ? / k 来控制假阳性的概率。
例 ? ? 0.05, k ? 10, ? / k ? 0.005
2. 事后分析,见机行事
?事后分析(Post hoc analysis ) 看到数据之后才想起来做的分析 其结果往往不能被进一步研究所确认
?不鼓励事先并未计划的亚组分析和校正分析
为何不鼓励事后分析?
?数据是现象,现象具有偶然性; 看到数据后进行的“分析”属于故作姿态, 变偶然为“必然” —— 忽悠!
?看到数据后增加的“分析”,也属于多重 分析,增加假阳性的机会
应当如何?
?必要的亚组分析有助于发现适应症,指导 个体化治疗;必要的校正分析有助于消除 混杂偏倚,公平、公正地比较疗效
做法 1:单因素方差分析?!
F =0.701,P>0.5, 均数间差别无统计学意义
为什麽不对?
有负初衷 —— 探讨反应随剂量变化的趋势 * 由多个剂量组的比较只能得知均数间是否有差异 * 有统计学差异也不等于有剂量 -反应关系
做法 2: 反应的均数关于剂量作回归分析 ?!
62
60
58
56
54
噬菌率(均数)
常见统计学错误与纠正
---- 设计与分析
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2013年12月
1. 终点指标过多, 大海捞针
?临床试验时,不知道哪个指标在组与组间有差 异; “确定某个指标后,万一组间没有差异,岂 不被动!”
?生理、生化、组织学、基因,都做; “内容丰富,显得水平高!”
?许多仪器一下子可以做许多项目; “许多项目一一分析,哪个有意义,就报告 哪个指标标”
0.20 ? 0.08

【医学科技论文】医学科技论文统计学误用分析

【医学科技论文】医学科技论文统计学误用分析

医学科技论文统计学误用分析1统计学应用中存在的常见问题1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。

但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。

SNK法与LSD法虽然并非等价,实质是一致的。

SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。

比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。

1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。

特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。

这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。

统计路径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P<0.05可得出随着病种级别的升高,检测指标逐渐升高的趋势。

1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。

医学稿件中常见统计学方法误用辨析

医学稿件中常见统计学方法误用辨析

医学稿件中常见统计学方法误用辨析章新生;姚仁斌;刘璐;刘畅;马启【摘要】目的:提高医学科研工作者对医学资料常用统计学方法的认识和应用能力.方法:对医学原始稿件中常见的一般χ2替代四格表确切概率法、配对χ2检验和校正χ2检验,用χ2检验替代秩和检验(uc、Hc)和处理相关性分析,两两t检验替代方差分析和q检验,t检验替代配对t检验的误用进行辨析.结果:误用χ2检验主要是未结合实际情况和统计分析的目的来正确选用统计学方法;误用t检验主要是未充分理解研究资料是否满足参数检验的条件,以及不能正确判断计量资料所对应的实验设计类型.结论:医学科研工作者应进一步学习和掌握最基本统计学分析方法的概念和经典统计学方法的使用要求.%Objective:To investigate the teacher-oriented anxiety among college students. Methods:A total of 1 079 college students and 100 teachers selected from four universities were inquired by Self-Rating Anxiety Scale (SAS) and a self-designed questionnaire.Results: The anxiety score of the college students was higher than that of normal people ( P < 0.05 ). The general anxiety rate of the students was 12.42%. One hundred and thirty-four students demonstrated anxiety,126 of whom were in a mild state and 8 were in a moderate to severe state. About students and teachers considered that the incidence of students' anxiety was closely correlated with teachers' improper teaching concept and performance as well as their lack of mental health knowledge. Conclusions:The prevalence of anxiety is rather high among college students,which is mainly induced by teachers' improper teaching concept and behavior as well as their lack of mental health knowledge. It issuggested that more attention should be paid to the teacher-oriented anxiety in college students'.【期刊名称】《蚌埠医学院学报》【年(卷),期】2011(036)006【总页数】4页(P653-656)【关键词】医学统计方法;医学论文;χ2检验;t检验【作者】章新生;姚仁斌;刘璐;刘畅;马启【作者单位】蚌埠医学院,学报编辑部,安徽,蚌埠,233030;蚌埠医学院,学报编辑部,安徽,蚌埠,233030;蚌埠医学院,学报编辑部,安徽,蚌埠,233030;蚌埠医学院,学报编辑部,安徽,蚌埠,233030;蚌埠医学院,学报编辑部,安徽,蚌埠,233030【正文语种】中文【中图分类】R-32医学期刊是宣传和传播生物医学科研成果重任的载体,正确评价期刊来源稿件的好坏是保证期刊质量的重要一环。

统计方法选择与常见的误用PPT课件

统计方法选择与常见的误用PPT课件

十、把“随便”当“随机”
实例:从动物室买回20只动物后,先抓10作为第 一组(实验组),剩下为第二组(对照组)。 小贴士:何为随机分组?在没有分组之前,谁
都有同等的机会被分到实验组或对照组。
随机:某事件可能发生也可能不发生。
第40页/共58页
实验设计的随机化分组方法 ●半随机化:按就诊(入院)顺序、生日、 住院号等; ●简单随机化:投硬币、抽签、随机数字 ●随机区组 ●分层随机
第34页/共58页
八、多样本均数比较,采用多个t检验比较
后果:犯一类错误的概率增大。
小贴士: 多样本均数比较应用方差分析及其两 两比较(当不满足方差分析条件时:改用秩和 检验)
第35页/共58页
九、相对数误用
错误一:以比代率
如某论文叙述“某病 男41例,女43例,年 龄3-62岁,3-40岁68 例,占81%,反映本 病青壮年、少年发病 率高。”显然是错误 的。又如某文章作者 根据表1资料认为沙 眼在20一岁组的患病 率最高,以后随着年 龄增大而减少,显然, 也是非常错误的。
分母 应用
患病率:现患病例数 发病率:平均人口数 患病率:受检人数 发病率:用于急性疾病 患病率:用于慢性疾病
第38页/共58页
错误四:计算率的分母太小
后果:结果不稳定;或给人以错误的印象。 例:治疗2例,2例治愈,治愈率100%。
小贴士:直接报告绝对数。 例如:治疗5人,3人治愈
第39页/共58页
部分: 1
2
3
4
5
样本的编号:3、7、11、15、19 (从3号开始,每间隔4抽1个)
第46页/共58页
2、系统抽样优缺点 优点: 1)易于理解、执行
2)易得到一个按比例分配的样本 3)抽样误差小于单纯随机抽样 缺点:1)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,系统抽样 将产生明显偏性。 2)各个观察单位不是彼此独立的,无可靠的方法估计抽样误差。

误用统计学方法的例子

误用统计学方法的例子

误用统计学方法的例子统计学方法是一种重要的工具,可以帮助我们对数据进行分析和推断,以提供决策的依据。

然而,在实际应用中,由于误解、操作失误或其他原因,可能会出现误用统计学方法的情况。

下面将举几个例子来说明误用统计学方法的情况。

首先,小样本情况下的假设检验。

统计学中的假设检验是一种常用的方法,用于判断样本数据是否支持某种假设。

然而,当样本容量很小且变异较大时,假设检验可能会产生错误的结果。

例如,某个科研团队对一种新药的疗效进行实验,仅依靠10个病例进行研究,并得到了阳性的结果。

他们错误地使用假设检验来宣称这种新药具有明显的疗效,而忽略了样本容量较小的问题。

其次,对于显著性水平的误解。

显著性水平是在假设检验中用来衡量样本数据与原假设之间差异的大小。

通常,我们将显著性水平设定为0.05,即5%的水平。

然而,有些人可能会错误地认为,只要p值小于0.05,就可以拒绝原假设。

例如,某个市场营销团队进行了一个广告宣传实验,发现观看广告的人群比未观看广告的人群购买率高,并得到了p值为0.04的结果。

他们错误地认为这个结果意味着广告宣传对销售额具有显著影响。

然而,由于样本容量较小或其他原因,这个结果可能只是一个偶然的巧合,而不具有实际意义。

此外,样本选择偏差也是一种常见的误用统计学方法的情况。

样本选择偏差是指在进行统计分析时,样本的选择并不代表总体的特征,从而导致结果的不准确。

例如,某个政治调查机构想要了解人们对一项政策的态度,但只选择了年收入较高的人群进行调查。

结果显示这个政策得到了广泛支持,然而这个结论可能并不代表整个人群的意见。

这种误用统计学方法的情况会导致结果的偏差,进而对决策产生误导。

最后,统计推断的误用也是一种常见情况。

统计推断可以根据样本中的数据推断总体的特征。

然而,在实际应用中,有些人可能会将推断的结果过度扩展到其他情境中。

例如,某个研究团队通过对一群大学生进行问卷调查发现,睡眠时间和学习效果呈正相关关系。

统计错误分析

统计错误分析

4定量资料统计分析方面存在的统计学错误4.1忽视t检验和方差分析的前提条件4.1.1忽视t检验的前提条件例16原文题目:重症急性胰腺炎并发肝功能不全的临床研究。

实验数据见表5[4]。

原文作者用t检验分析此资料。

请问:这样做正确吗?表5两组患者血清淀粉酶、肌酐和乳酸脱氢酶水平的比较(略)*P<0.05,与重症急性胰腺炎肝功能不全组比较。

对差错的辨析与释疑对表5数据进行方差齐性检验,可发现2组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析,须采用相应的非参数检验方法。

4.1.2忽视方差分析的前提条件例17原文题目:川芎嗪对心室快速起搏心力衰竭实验犬心房颤动及心房纤维化的影响。

原作者将健康杂种犬21只,随机分为3组:正常对照组、充血性心力衰竭模型组和川芎嗪治疗组,每组7只[1 3]。

请问:用配对设计定量资料的t检验处理此定量资料合适吗?对差错的辨析与释疑原作者用配对t检验处理此设计下的定量资料是错误的。

此实验分3组,应为单因素三水平设计定量资料,应在检查是否符合方差分析的3个前提条件“独立性”、“正态性”和“方差齐性”后,根据情况选用合适的分析方法。

根据原文陈述,原作者在进行统计分析时,将充血性心力衰竭模型组和川芎嗪治疗组在模型建立之前所测得的血液标本指标,均归入正常对照组进行统计学分析,意在增大正常对照组的样本含量,严格地说,这样做违反了方差分析的“独立”条件。

4.2误用t检验处理均数间的多重比较例18原文题目:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。

原作者实验共分3组:空白对照组、模型组、姜黄素组,实验数据见表6[5]。

统计分析时计量资料均数用x±s表示,组间比较采用t检验。

请问:统计分析方法选用得正确吗?表6姜黄素对重组人表皮生长因子诱导的小牛晶状体上皮细胞增殖细胞内C a2+、c AMP和cGMP浓度的影响(略)**P<0.01,与空白对照组比较;△△P<0.01,与模型组比较。

中医药论文中常见统计学分析方法应用错误辨析

中医药论文中常见统计学分析方法应用错误辨析

医学论文中常用统计分析方法误用辨析医学统计学的地位◆医学统计学如今是热门科学。

美国食物和药品管理局(Food and Drug Administration, FDA )和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制定有关政策的民意调查、数据分析、决策预测等都需要统计学家的直接参与。

由统计学家指导研究设计、数据分析乃至准备呈递给FDA的报告。

◆在我国,医学统计学也越来越受到学术界和有识之士的重视。

医学统计学的地位医学论文中统计分析的应用现状在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。

但医学论文中尚存在各种统计分析方法应用上的问题,统计学缺陷涉及面:国外约50%,国内80%以上。

主要有:研究设计不合理(设计水平低下);分析方法选用不得当(方法使用错误);应用条件不遵循;样本含量不满足统计学要求;结果解释不合理(推断过于肯定);统计报告(报告项目不全)。

由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机统计软件现象。

①不管统计分析方法的前提条件是否満足,将数据直接代入计算机软件中,使得出的结果与实际相差甚远。

②现有的统计软件使用不太方便,造成用户的误用。

作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。

中国医学杂志的调查结果◆中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种。

◆据统计:中华系列医学杂志发表的论文中有统计问题或错误的达到70%。

国际著名医学杂志有统计问题或错误也达50%。

----<医学统计学基础与典型错误辨析>(胡良平主编军事医科院出版2003年)国外权威医学期刊调查结果•Glantz调查了1977年《Circulation Research》和《Circulation》杂志中发表的文章,在使用统计学方法的文章中具有统计学问题或错误的分别有61%和44%。

统计方法选择与常见的误用

统计方法选择与常见的误用
小贴士:
有理论数T<1的格,或1< T<5的格数超过 总格数的1/5,应采用适当的处理方法,否则, 会导致分析的偏性。
错误三:多组率的两两比较采用一般四格表X2 检验。
小贴士: 应采用 2 分割法。
七、单向有序资料(等级资料)仍用X2检验
小贴士: 单向有序资料比较应用秩和检验 等级资料
疗效有 无差别
9.47 100.00
一、未对资料进行统计分析就下结论
(最低级的错误)
一些文章仅计算均数、率等指标,没
有进行必要的统计分析,就进行比较,下结
论。
组别 例数 均数 标准差
甲组 20 2.13 0.98
乙组 20 2.33 1.04
结论:乙组高于甲组。 (t=0.3259, p=0.5351)
甲组(n=180) 乙组(n=120) P值
资料:来自广西医科大学学报,2006,23(6):940
现象二:“简略法” :计量资料比较采用t检验; 计数资料比较采用X2检验。配对设计与成组设计 数据的统计方法就不同,如果只说用了t检验,则 很难判断其正确性。
现象三:有的文章中只提一句“经统计学处理”后, 就写出结论;有的甚至干脆不提“统计”二字,直 接用P值说明问题了事。
X±S
X±S
甲指标 3.48±1.65 4.76±2.52
0.10
两均数相差1.28
乙指标 5.23±1.12 6.38±1.21
0.01
两均数相差1.15
差值大小
u x1 x2 s x1 x2
x1 x2
s12
s
2 2
n1 n2
变异度
抽样误差大小
例数多少
是否拒绝H0,取决于: 1、被研究的事物有无本质的差异; 2、抽样误差大小:

中医药论文中常见统计学分析方法应用错误辨析

中医药论文中常见统计学分析方法应用错误辨析

04 中医药论文中统计学分析 方法应用错误的案例分析
样本量估算错误的案例分析
总结词
样本量估算不足或过大
详细描述
在中医药研究中,样本量估算的准确性对于 研究结果的可靠性至关重要。如果样本量过 小,会导致结果不稳定;而样本量过大则会 增加研究成本和时间。例如,某项研究在评 估中药治疗某疾病的疗效时,由于样本量估 算不足,导致未能得出阳性结果。
设立独立的统计学审查环节
在论文发表前,设立独立的统计学审查环节,由专业统计学专家对论文的统计 分析方法进行审核,确保其科学性和准确性。
建立数据监管机制
建立数据监管机制,对研究过程的数据收集、整理、分析等环节进行监管,确 保数据的真实性和可靠性。
建立完善的学术评价体系
引入统计学评价标准
在学术评价体系中引入统计学评价标 准,对论文的统计分析方法、结果解 释等进行评估,提高论文的科学性和 可信度。
统计分析方法选择不当的案例分析
总结词
统计分析方法选择不当或使用错误
详细描述
选择合适的统计分析方法对于中医药研究结 果的可信度至关重要。如果方法选择不当或 使用错误,会导致结果偏差或误导。例如, 某项研究在比较两种中药制剂的疗效时,未 使用适当的统计分析方法对非正态分布的数
据进行处理,导致结果解读困难。
详细描述
随机分组是保证研究结果准确性的重要步骤,如果分组方法不正确 或不充分,可能导致组间不均衡,影响结果的可靠性。
纠正方法
采用适当的随机分组方法,如简单随机、区组随机或分层随机,并确 保组间均衡性。
统计分析方法选择不当的辨析与纠正
01
02
03
总结词
统计分析方法选择不当或 使用错误
详细描述

医学统计学论文错误辨析报告ppt课件

医学统计学论文错误辨析报告ppt课件
11
【错误三】对计量资料应当根据是否符合正态分布 而采用不同的描述方法,符合者一般采用“均数± 标准差” 或“均数±标准误” 表示,而不符合者 则采用中位数和四分位间距来进行表示,不按上述 规定进行描述者均属于错误描述。文中对于平均年 龄,平均病程等计量资料未经正态性检验而直接将 数据描述成“均数±标准差” 或“均数±标准误”。 【正确做法】将实际测得的年龄,病程等计量资料 进行正态性检查,如数据服从正态分布,则可将数 据描述成“均数±标准差” 或“均数±标准误”;
单击此处添加段落文字内容
●实验分组不合理 ●样本含量过少
●组间基线资料的均衡性检验
单击此处添加段落字内容
●用“重复取样”替代“独立 重复实验
4
二、计数资料分析方法的常见错误
1
不满足连续性χ 2检验条件时未做校正
2
误用χ 2检验分析结果变量为有序变量的资料
3
误用χ 2检验回答相关性问题
4
误用χ 2检验取代Fisher精确检验
8
【错误一】作者对上表采用的统计学方法是X2检验,这是错误的。该 资料属于单项有序的RXC表,属于等级资料,对于等级资料科采用
Ridit分析或秩和检验,而不应用RXC的X2检验,RXC表的X2检验只能 两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别
。所以对上表采用的正确方法应该是Ridit分析或秩和检验。 【正确做法】单项有序行×列表应使用秩和检验。 (1)建立假设: H0:两组临床疗效分布相同; H1:两组临床疗效分布不同。取α =0.05。 (2)计算: 1)编秩:将两组数据按等级顺序由小到大统一编制。 2)求各组秩和 3)得出结论
5
对R×C表直接分割进行两两比较

常见的统计方法误用

常见的统计方法误用

常见的统计方法误用
常见的统计方法误用
选摘自《东南大学学报(医学版)》,2001,Vol.20,No.3,作者:何梅彦
一、等级资料用卡方检验代替秩和检验
卡方检验主要用于计数资料的显著性检验。

在卡方检验中,各项的秩序任意排列所得的值相同,判断结果也相同。

但等级资料有强弱之分,不能任意排列,只能从强到弱或从弱到强。

卡方检验没有考虑到等级的强弱信息,而秩和检验考虑到了这一点。

单项有序分类资料应使用秩和检验。

二、计量资料方差不齐时,仍用t检验或方差分析
这一错误在医学论文中较常见。

有许多作者忽略了数据的方差齐性,不经检验直接使用t检验或方差分析。

当各样本组经方差齐性检验方差不齐时,可采用以下3种方法来处理:(1)用非参数检验方法;(2)用近似法(如t'检验);(3)采用变量变换法,使其方差呈齐性。

三、四格表卡方检验忽略使用条件
四格表卡方检验的条件为n>40,且理论频数T> 5。

四格
表资料如n>40,但1<T<5时,则需用校正卡方检验。

当n<40,或T<1,则需用四格表确切概率计算法。

经校正或使用确切概率法,有些P值会发生变化,结论也会不同。

在作计数资料统计处理时,一定要注意这个问题,才能得到正确的结果。

第十讲-统计学方法误用与辨析

第十讲-统计学方法误用与辨析

X 2.9467
2013-9-17 7
One-Sample Test Test Value = 3.1 95% Confidence Interval of the Difference Lower Upper -.2586 -.0481
肺活量
t -3.207
df 11
Sig. (2-tailed) .008
2013-9-17
11
用两种方案降低血清胆固醇(mmol/L) 的效果
饮食疗法 受试者 1 2 3 4 5 6 7 8 9 10 11 12 试验前 6.11 6.81 6.48 7.59 6.42 6.94 9.17 7.33 6.94 7.67 8.15 6.60 试验后 6.00 6.83 6.49 7.28 6.30 6.64 8.42 7.00 6.58 7.22 6.57 6.17 受试者 1 2 3 4 5 6 7 8 9 10 11 12 药物疗法 试验前 6.90 6.40 6.48 7.00 6.53 6.70 9.10 7.31 6.96 6.81 8.16 6.89 试验后 6.93 6.35 6.41 7.10 6.41 6.68 9.05 6.83 6.91 6.73 7.65 6.52
的,但并不是多组有效率彼此之间 均不相同。若要明确哪两组间不 同,还需进一步作多组间的两两比 较。
2013-9-17
22
(Bonferroni的思想)
不同剂量有效率间的两两比较 对比组 1.0mg vs. 2.5mg 1.0mg vs. 5.0mg 2.5mg vs. 5.0mg 四格表2 值 P 值 4.38 7.19 0.54 0.036 0.007 0.463 检验水准修正值 0.017 0.017 0.017

统计方法选择与常见的误用60页文档

统计方法选择与常见的误用60页文档

谢谢!
60
统方法选择与常见的误用
41、俯仰终宇宙,不乐复何如。 42、夏日长抱饥,寒夜无被眠。 43、不戚戚于贫贱,不汲汲于富贵。 44、欲言无予和,挥杯劝孤影。 45、盛年不重来,一日难再晨。及时 当勉励 ,岁月 不待人 。

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭

27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰

28、知之者不如好之者,好之者不如乐之者。——孔子

29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇

30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华

统计方法选择与常见的误用共60页PPT

统计方法选择与常见的误用共60页PPT
统计方法选择与常见的误用
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生
谢谢!
51、 天 下 之 事 常成 于困约 ,而败 于奢靡 。——陆 游 52、 生 命 不 等 于是呼 吸,生 命是活 动。——卢 梭
53、 伟 大 的 事 业,需 要决心 ,能力 ,组织 和责任 感。 ——易 卜 生 54、 唯 书 籍 不 朽。——乔 特
55、 为 中 华

关于统计误用问题及解决办法

关于统计误用问题及解决办法

关于统计误用问题及解决办法
严抗美;吴扬
【期刊名称】《中国合作经济》
【年(卷),期】2004(000)008
【摘要】所谓统计误用,可以定义为违背统计原理及统计规律对统计方法和技术的错误运用。

统计误用一般可分为无意误用和有意误用。

无意误用指运用了错误的统计方法,使用者通常是外行或者是学之不精者,而有意误用(滥用)指熟练掌握统计方法和技术,但却有意肢解、曲解甚至有意违背统计规律。

使用者大都是内行或者是深知此道者,往往
【总页数】2页(P43-44)
【作者】严抗美;吴扬
【作者单位】安徽蚌埠职工大学;安徽铜陵经济管理学院
【正文语种】中文
【中图分类】F222.7
【相关文献】
1.从体育统计误用透视高校体育统计教育 [J], 李健;祁国鹰;王锡群
2.医学论文审稿中常见的统计学错误:定量资料统计方法的误用分析 [J], 张军锋;董海原
3.统计知识误用实例在医学统计教学中的应用 [J], 赵红宇;周宪君;赵岩;步楠;高洪亮
4.从医学期刊中统计学误用谈医学统计学教学 [J], 兰晓霞;李凌;惠武利;胡役兰
5.内科学硕士学位论文中统计学方法应用及误用调查 [J], 栾珊;张凌云;邵翠华因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2013­10­21
2
夏老师的小结
2004年暨南大学79份医学硕士毕业论文统计错误分析 常见错误 出错论文数 出错比例(%) 仅给出P值 29 36.71 统计图表不合要求 6 7.59 实验设计缺陷 7 8.86 假设检验方法误用 21 26.58
2013­10­21
新生儿死亡与出生体重的关系 体重 1000~ 2500~ 4000~ 合计 出生数 死亡数 10921 193261 5373 208925 构成比(%) 死亡率(‰) 51.18 46.83 1.99 100.00 119.91 5.84 8.93 11.54 1234 1129 48 2411
饮食疗法 受试者 1 2 3 4 5 6 7 8 9 10 11 12 试验前 6.11 6.81 6.48 7.59 6.42 6.94 9.17 7.33 6.94 7.67 8.15 6.60 试验后 6.00 6.83 6.49 7.28 6.30 6.64 8.42 7.00 6.58 7.22 6.57 6.17 受试者 1 2 3 4 5 6 7 8 9 10 11 12 药物疗法 试验前 6.90 6.40 6.48 7.00 6.53 6.70 9.10 7.31 6.96 6.81 8.16 6.89 试验后 6.93 6.35 6.41 7.10 6.41 6.68 9.05 6.83 6.91 6.73 7.65 6.52
2013­10­21
16
2004 年甲、乙两间医院患者(标准化)住院天数比较 科 内 妇 儿 外 合 别 科 科 科 科 计 标准组住院人数 700 870 600 800 2970 甲 理论住院天数 45710 35148 10440 11440 =34.59 X 甲 乙 理论住院天数 35280 32016 8700 9600 =28.82 X 乙
81.0 87.0 71.0 74.0 63.0 75.0 74.0 72.0 79.0 71.0 72.5 73.0
152.0 153.0 158.0 150.0 144.0 160.5 158.0 154.0 153.0 159.5
44.5 46.5 48.5 50.5 36.5 54.5 49.0 50.5 40.0 52.0
肺活量
t 3.068
df 11
Sig. (2­tailed) .011
Mean Difference .14667
2013­10­21
8
怎样理解 P ?
A. 是无效假设H0 成立的概率 B. 是备择假设H1 成立的概率 C. 是无效假设H0 成立,我们却错误地拒绝
2013­10­21
12
实例三16岁不同地区中学生的发育状况
Hotelling T 2 检验, 《医学统计学与电脑实验》(第四版) p.240,主编:方积乾,上海科技出版社
甲 受试者 1 2 3 4 5 6 7 8 9 10 11 12
2013­10­21
乙 重 胸 围 受试者 1 2 3 4 5 6 7 8 9 10 11 12
2013­10­21
20
某药不同剂量的镇痛效果 剂 量 1.0mg 2.5mg 5.0mg 合 计 镇痛效果 有效 3 (7.36) 11 (9.81) 12 (8.83) 26 无效 12 ( 7.64) 9 (10.19) 6 ( 9.17) 27 合 计 有效率(%) 15 20 18 53 20.00 55.00 66.67 49.06
X = 2. 9467
2013­10­21 7
One­Sample Test Test Value = 3.1 95% Confidence Interval of the Difference Lower Upper ­.2586 ­.0481
肺活量
t ­3.207
甲城市 乙城市 合计
2013­10­21
18
2 67 28 7 5 193 2 + c = 600 ( + + + 300 ´ 347 300 ´ 161 300 ´ 56 300 ´ 25 300 ´11 2 2 2 2 2 154 94 28 18 6 + ­1) + + + 300 ´ 347 300 ´ 161 300 ´ 56 300 ´ 25 300 ´ 11
2013­10­21
4 Biblioteka 国外情形美国医学会杂志(JAMA) 对来稿作过统 计学评价。149篇投稿论文中,仅有28%可 以接受,67%有统计缺陷但尚可以纠正, 5%不可救药。 一般的医学杂志情形就更糟。据国外 对不同医学杂志发表论文的调查,有统计错 误的论文的百分比最高达72%,最低也有 20%。
进一步分析:
¨ 多组中至少有两组的有效率是不同
的,但并不是多组有效率彼此之间 均不相同。若要明确哪两组间不 同,还需进一步作多组间的两两比 较。
2013­10­21
22
(Bonferroni的思想)
不同剂量有效率间的两两比较 对比组 1.0mg vs. 2.5mg 1.0mg vs. 5.0mg 2.5mg vs. 5.0mg 四格表c2 值 P 值 4.38 7.19 0.54 0.036 0.007 0.463 检验水准修正值 0.017 0.017 0.017
13









171.0 175.0 159.0 155.5 152.0 158.5 154.5 164.0 165.0 164.5 159.0 164.0
58.5 65.0 38.0 45.0 35.0 44.5 44.5 51.0 55.0 46.0 48.0 46.5
论文撰写中常见 统计学问题及其辨析
中山大学公共卫生学院 医学统计与流行病学系 张晋昕 2013.10.16
2013­10­21
1
统计学家的感慨
英国著名统计学家Yates F(1902~1994) 和Healy M J R(1924~)曾指出:“非常痛 心地看到,由于数据分析的缺陷和错误, 那么好的生物研究工作面临着被葬送的危 险 ”。
2 2 2 2 2 2 3 12 11 9 12 6 c 2 = 53( + + + + + - 1) = 7.584 15 ´ 26 15 ´ 27 20 ´ 26 20 ´ 27 18 ´ 26 18 ´ 27
c
2 0. 05 ( 2 )
= 5 . 99
21
2013­10­21
74.0 80.0 73.5 87.0 68.0 86.0 84.0 76.0 70.0 76.0
1. 统计描述
两组褥疮愈合时间(天)对比 组 别 愈合时间( X ± s ) 13.4±26.3 7.5±14.7
猪皮组 对照组
2013­10­21
14
2. 以“比”代“率”?
它的概率 D. 是无效假设H0 成立的前提下,出现当前 抽样结局以及更极端情形的概率 p.50 ,第3行。
2013­10­21
9
假设检验中的P 和α
¨ α是事先设定的小概率事件水平,是一
次检验中,甘愿冒的风险。
¨ P是一次检验中,实际冒的风险。 ¨ 小概率事件,具有现实的不可能性。 ¨ P<0.05,P<0.01, P<0.001。 P<0.0001?
实例二
为了比较特殊饮食疗法与药物疗法 降低血清胆固醇的效果,将24名志愿者 完全随机地分成两组,接受降胆固醇试 验,受试者在试验前后各测量一次血清 胆固醇(mmol/L),结果如表1,试判 断两种治疗方案的降胆固醇效果。
2013­10­21
11
用两种方案降低血清胆固醇(mmol/L) 的效果
2013­10­21 5
世界许多著名医学杂志,如JAMA, 新英格兰医学杂志(NEJM)和英国医 学杂志(BMJ)对来稿都有统计学要求 或统计学指导。国际生物医学杂志编辑 协会在其《生物医学期刊投稿的统一要 求》中也包含了统计学要求。
2013­10­21
6
实例一
某一次调查拟了解两个民族的身体状 况,结果发现两组人群的肺活量有不同。 A 民族的肺活量均值为 3.1L , B 民族的肺 活量均值为2.8L。研究结束后,发现有12 份调查表资料未被输入计算机,可以认定 这12名个体属于同一民族,可否根据统计 学知识判断他们属于哪一个民族? 2.65 2.78 2.79 2.85 2.88 2.94 2.98 2.99 3.05 3.08 3.15 3.22
3
国内情形
《中华医学杂志》、《中华内科杂志》、 《中华外科杂志》、《中华妇产科杂志》、 《中华儿科杂志》595篇论文的调查结果显 示,相对数误用为11.2%,抽样方法误用 15.9%,统计图表误用11.7%。 徐勇勇等对申报科技成果的4586篇科研 论文进行核查,统计方法使用率为76.0%, 数据分析方法误用达55.7%。
df 11
Sig. (2­tailed) .008
Mean Difference ­.15333
One­Sample Test Test Value = 2.8 95% Confidence Interval of the Difference Lower Upper .0414 .2519
2013­10­21
17
4. 卡方检验之一 (目的不同,方法不同)
¨ 某研究者欲比较甲、乙两城市空气质量
状况,在甲、乙两城市各测定了300个采 样点,得下表数据,试比较两城市空气 质量之优劣。
甲、乙两城市空气质量状况比较 组 别 空气质量类别 优 193 154 347 良 67 94 161 轻度污染 中度污染 28 28 56 7 18 25 重度污染 5 6 11 合计 300 300 600
相关文档
最新文档