科研设计与统计常见错误解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)、描述性统计
描述性统计分析是统计检验的基础,能提供资 料的总体特征,不论在最后的论文报告中描述性 统计分析的结果占多大的比重,它都是实际的资 料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量 提供重要的信息, 发现原始资料中的错误
忽略必须的描述性统计分析 是导致统计方法应用不当的原因。
(2)、统计分析中变量的选择
变量的确定:
研究的目的是相看哪两个变量之间的关 系(不妨假设一因,一果)
例 ;高血压为因,冠心病为果
A.明确变量的性质
重点和首要的看变量是否为正态分布 分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、 尿微量白蛋白,骨密度等都常为非正态分 布。 非正态分布的变量是不能以原始资料进 行参数统计分析,此时不进行正态化处理, 得出结论会面目全非。
选题必须具有科学性。所提出的新问题、新假 设、新思路必须要符合客观规律。 临床实践是临床科研选题的源泉: 在日常临床实践中,人们无时无刻不面临着许 多诊断、治疗、病因和预后估计等问题,诊断 方法和治疗措施有待于科学的系统评价,这些课 题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不 仅涉及生物医学,而且涉及临床经济学和医学 社会等,这一方面有许多有待研究的临床问题。
变量的梯度是成功的关键。
4、设定恰当的入选和排除标准
恰当的入选和排除标准 可防止混杂因素的干
扰,保证研究结果的科学性,这是在各项研 究遵守的。
例如,看血压与胰岛关系,不可纳入有心功障碍 及肾病患者,否则可结果会有偏差。
4、设定恰当的入选和排除标准
入组的研究对象的准入指标,是保证研究 质量的最重要和最基本的条件,在研究设计 和发表的论著中务必详细交代。 但这种选入排除标准应是实事求是的而不 是过于苛求。
有的放矢 无病呻吟
二、研究设计
科研设计是科研的灵魂 严密的设计是取得有价值结果的先决条件 从这个意义上说没有‚设计‛就没有科研。 不少回顾性分析,内容包罗万象,是研究无主题的反映: 研究者在研究之初对研究要解决的问题即主攻方向心中无 数,对研究所报的态度是’逮着什么算什么’,并不是想 通过研究解决某一特定的问题,或不知道通过研究能解决 什么问题。 这些研究缺乏严格的设计或无设计,这类研究即使有重 要的发现也属偶然。
在制订纳入和排除标准时,在保证研究质量的 前题下,一定要考虑研究成果的代表性和研究结果 推广的受益面。 例:有一重点课题仅考虑入组病例诊断的严格性 排除标准竟设计了17项
合格的纳入对象约占整个患该病人群的10%左右
90%左右的患者被排除掉。
即使该研究的结果有高度的内在真实性(internal validity), 其代表性也仅为10%左右。
选题就是要正确地发现和提出问题 这些问题有的来自于临床实践 有的来自文献资料 所谓正确就是这些提出的问题要符合科学的认识规律
提出新问题、新假设比完成一项科研工作更难 没有好的科研假设,再好的科研方法也不会有好的科 研成果。
例: 提出新问题
医生的共识----冠心病来自已知危险因素。 但是无已知危险因素的人为什么发生冠心病? 冠心病人群血同型半胱氨酸水平显著升高, 那末同性半胱氨酸是否是冠心病新的危险因素? 使之下降发生冠心病危险是否会下降?
妇女健康倡议研究(WHI)
-----再好的研究也有缺陷! 忽略了HRT最明显的益处: (缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松) 没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以 上是没有绝经期症状的老年妇女。不具有HRT适应症 结论不应随意扩大(品种,剂量,种族) 与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的
2.样本含量的估计
队列研究属前瞻性研究,应考虑到失 访的可能性,故一般需再加10%的样本量。 失访率40%以上,其研究的真实性就会受 到严重怀疑。如果失访与暴露或疾病都有 联系,那么即使随访率达到80%以上也难 以防止偏倚的发生。
3. 从生物学医学原理选择持定的合理人群
(不犯人群结构错误) 研究对象中所观察变量的梯度
“前瞻性‛研究,无前瞻性的设计
几年前做了几万人的糖尿病普查 , 发现了 400 例糖尿病和500 例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇 文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐 量低减。
写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素.
这种研究是残缺不全的随访 ,并不是前瞻性研究 ,缺点是难 以弥补的。 高达 50% 的失访率会造成严重的信息偏差 ( information Bias ) : 若是有问题的人’召之即来’ , 则发病率会被高估 ; 若严重者已去医院看病不来参加,来的只有轻的病人,则会低 估疾病的发病率。
例如糖尿病人群中 有许多人合并了高血压、高血脂病 不少人已用药物治疗 治疗中有的长期坚持用药,有人仅偶尔用药 有人血压或血脂一直控制很好,有些人时好时差 此时不论以随访的血压、血脂指标,还是以末次 随访的指标分析,都不能反映干预对疾病的影响。 这些重要混杂因素的干扰,分析的结果常会远离 实际情况.
三. 统计分析
在我国临床科研的统计学应用中,在统计方法 的选择上存在过分强调统计检验而忽略统计学估计 的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别 有统计学意义,而较少对测定值进行 95% 可信区间 估计,提及样本量估计及抽样方法、样本代表性问 题的文章就更少了 在 80 年代初期,国外医学杂志针对类似的情况 曾进行广泛的讨论,提出应重视区间估计的意义而 不能将注意力集中在P值是否小于0.05上。
终点事件过少
有些研究者为了某种原因,希望尽早发表自己 研究的结果,仅随访极短的时间 ( 半年或一年 ) ,仅 有几个或十几个终点事件(如死亡)就进行多因素 分析,寻找危险因素。
终点事件过少的这种分析看上去可能条条是道, 但其结果往往是不可靠的。应延长随访时间,增加 终点事件后再分析 Navigntor 研究设计出现 1000 个终点事体时才结题。
从简单到复杂
最基本的分析形式为单个因素的不匹配不分 层资料组间比较的分析 这是病例对照研究推断性统计的基础。 可比较病例组与对照之间危险因素的分布情况, 分析其危险因素与患病之间的联系。
由于病例和对照只是总体的代表, 无法直接计 算真实的患病率,也就无法直接计算RR值,可以 估计相对危险度OR,用以来代替RR。
选题----同型半胱氨酸是否是冠心病新的危险因素?
临床科研选题的原则
首先是研究的问题要涉及我国的常见病、多发 病、危害人民健康较严重的疾病。 第二个原则是所选的课题要有创造性和先进性, 要选择前人没有解决或没有完全解决的问题。研 究的结果应该是前人不明了或不完全明了的。
开拓性(独创性)研究最有价值。 发展性研究,争鸣性研究也有一定的价值 没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。
现在大多数的国际医学刊物发表的论文中要 求作者同时给出点估计、区间估计和具体的检验 统计值,如相对危险度(Relative Risk , RR, RR值 就是暴露人群发病机与非暴露人群发病机率之比, 即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。 诸如95%可信限的区间估计可以提供更多有价值 的信息 但在我国临床科研的统计学应用中尚未引起足 够的重视。片面地认为越复杂的统计方法越好, 而忽视统计检验方法的适用性和恰当性。
为保证科研的成功 , 一个完整的科研设计应 包括以下几项内容:
有理论或实用价值的选题 选择合适的研究对象 制定可靠的测量指标 选择科学的统计分析方法
若能对结果做恰当的描述,则会得出符合实 际的结论。
随机化分组在大多数情况下十分重要, 但随机化并非总是有利的和有道理的。
在某些情况下有比随机化更重要的东西那 就是要满足适应症的要求。 适应症不合理,随机化反使结果变糟。
没达到‚狭窄‛切点, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。
(二)、选择试验效果测试指标:
对测量的方法和指标的要求
① 敏感性要好:对于治疗出现的客观反应,要能敏感地发现 并能量度,其敏感性越高越好; ② ③
(二)、选择试验效果测试指标: 选择要求
关联性:指标与研究目的有本质的联系,应能确切反映处理 因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药 物疗效。 灵敏性:指标能正确反映效应变化的最小数量或最小水平 。 特异性:对治疗反应的阳性结果要能准确地测量和确定,其 特异性越强越好;尽量选用客观指标作为主要观察指标。 精确性:包含准确度(效度)和精密度(信度)两个方面。 稳定性:变异程度 经济可行:在考虑敏感性和特异性的基础上,应从各种方法 比较中,选择经济及可行性良好的测试方法和指标。 指标的选择要少而精
过度严格的选择会有轻型病人被排除, 使研究结果出现偏差。
例:冠心病与胰岛素的关系 仅用冠脉造影资料作为诊断标准 结果发现 冠脉造影(-)者:FINS 22 mm/ml 冠脉造影(+)者:FINS 23 mm/ml 结论是冠心病与胰岛素无关 问题出在什么地方?
问题出在‚诊断标准‛:
冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素!! 或有轻度狭窄但达不到‚狭窄的定义‛的切点
科研设计与统计常见错误 解析
中日友好医院 李光伟
一、选题
临床科研系指以病人为研究对象的医学科学研究 其目的是为了提高诊断水平和治疗效果,改善预 后和对疾病病因做宏观研究。
选题是临床科研的起点 体现科研设计和实施的指导思想 影响临床科研工作的全过程 因此在科研过程中自始至终处于主导地位。 从这个角度来说,选题比科研方法更重要。
(一). 研究对象的选择
要想证实研究者的思想,确定入选和 排除标准,选择合理的研究对象是关键 的一环。
1.
1. 研究对象要有代表性
做疾病患病率的调查,随机化的原则可 保证研究样本是总体人群的‚缩影‛,从而 避免结果失真。 从某一局部地区‚整体人体‛调查出的 ‚率‛如推广到普遍认群,应说明该局部的 ‚整体‛人群与全局的人群结构相似。
1.
1. 研究对象要有代表性
随机化抽样的缺点是研究对象地域较为分散, 每个单位仅有少量病例,这对于干预治疗的前瞻 性研究的病人管理极为不利,耗费更多人力,常 使研究无法进行。
而在人群较多的社区进行‚整群‛调查,会 在相对较小的地域找到较大样本,从而有利干预 治疗的管理。如果其人群结构接近全局的人群, 其统计的‚率‛也有重要参考价值。
最后一个原则是可行性,指研究课题主要 技术指标实现的可能性。 选题时必须考虑完成课题的条件,包括人 力、物力等,如果这些条件不能满足或根 本没有条件,即使所选课题有创造性、科 学性又具有临床价值,也ቤተ መጻሕፍቲ ባይዱ望于成功。
临床科研选题时应注意几点:
前沿 , 新颖,最好实用 ( 近 5-10 年有无类似
工作,或存在某些问题) 涉及人群健康的重大问题(发病危险因素, 提出新的诊断方法) 建立新实验方法(提供研究新手段) 确定新药疗效及副作用
例1, 看生长激素水平与身高的关系: 对25—74岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。
研究肥胖与糖尿病的关系 不能仅选择超重和肥胖的人群(BMI 25-30) 因为(BMI 25-27) 与(BMI 27-30)的人群糖尿病的患病率 可能无明显差别, 但与BMI〈24人群差别会很显著
女性激素补充治疗的循证研究
(妇女健康倡议研究WHI) 19世纪70年代结论: 雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎 缩,防止骨质疏松。但不会增加子宫内膜癌危险。
WHI(大规模,多中心,随机对照)结论:
雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防, 预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少! 心脏事件 29%,卒中 41%,乳腺癌 26%, 结肠癌 37%,髋骨骨折 34%