医学统计学案例辨析及参考答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学
案例辨析及参考答案
目录
目录 (2)
第1章绪论 (3)
第2章统计描述 (5)
第3章概率分布 (9)
第4章参数估计 (12)
第5章假设检验 (14)
第6章两样本定量资料的比较 (16)
第7章多组定量资料的比较 (19)
第8章定性资料的比较 (22)
第9章关联性分析 (25)
第10章简单线性回归分析 (27)
第11章多重线性回归分析 (30)
第12章实验设计 (33)
第13章临床试验设计 (35)
第14章调查设计 (36)
第15章样本含量估计 (38)
第16章随机区组设计和析因设计资料的分析 (41)
第17章重复测量设计和交叉设计资料的分析 (43)
第18章 Logistic回归 (46)
第19章生存分析 (50)
第20章对数线性模型在高维列联表资料分析中的应用 (53)
第21章多元统计方法简介 (56)
第22章时间序列分析 (57)
第24章基因表达谱分析的生物信息学方法 (59)
第25章 Meta分析 (60)
第26章医学论文的统计学报告要求 (64)
第1章绪论
案例辨析及参考答案
案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。请问其结论合理吗?为什么?应该如何?
案例辨析①样本不能代表总体。总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选”的意思,不符合统计学要求。
正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
案例1-2两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。结论是:A药优于B药。请问其结论合理吗?为什么?应该如何?
案例辨析①A药样本仅5例,样本含量太少;②得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;③未明确研究目的和研究结果将被使用的范围。
正确做法①应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的Ⅱ期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;②从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度。
案例1-3某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(40~73岁)。根据高血压的病程将患者分为三组,Ⅰ组高血压病期<10年,Ⅱ组高血压病期10~20年,Ⅲ组高血压病期>20年。另选取53名体检健康的职工为对照组。观测两组尿视黄醇结合蛋白(retinal binding protein, RBP)、
微量白蛋白(microalbumin, mALB)、β2 微球蛋白(β2 microglobulin, β2-MG)和N -乙酰-β-D-氨基葡萄糖苷酶(N -acetyl-β-D-glucosaminidase, NAG)四项定量指标的取值。结论为:尿RBP 、mALB 、β2-MG 和NAG 是原发性高血压患者肾小球、肾小管早期损害的敏感指标。请辨析这样设计实验存在什么问题?正确的做法是什么?
案例辨析 研究对象的选取在病例组和对照组之间存在不均衡性,即两组受试者之间,除了一组患有高血压,另一组未患高血压以外,在其他很多与评价高血压可能导致坏影响的方面都不一致。
对照组选取的是53名体检健康的职工,未明确写出平均年龄以及年龄所在的范围,也未交代性别构成情况。但由我国现行的退休制度可知,在职职工的年龄通常在18~60岁之间,平均年龄大约40岁。由临床医学基本常识可知,很多因素(比如年龄、性别等)不仅对血压有影响(通常是随着年龄的增大,血压有升高的趋势),而且对肾功能也有一定程度的影响;况且,高血压患者与健康职工还在“体力和脑力劳动强度、生活方式、心理和精神的紧张程度等诸多方面不具有可比性,而这些重要的非实验因素可能对肾功能也存在不同程度的影响。总之,原研究者所选取的病例组与对照组在很多重要的非实验因素方面(特别是年龄)不具有可比性,降低了结论的说服力。
正确做法 欲探讨高血压早期肾损害的监控指标,应根据高血压患者病程所分的三个组确定受试者的年龄段,从患者所取自的人群范围内随机选取一定数量的正常健康人(而不应仅局限在原研究者所在单位内),将正常健康人也分成相应的三个年龄段,并应尽可能确保在每个年龄段中,病例组与对照组受试者在其他重要非实验因素方面(如性别构成、体力和脑力劳动强度、生活方式、心理和精神的紧张程度等)均衡一致,采用相应的统计分析方法去比较定量指标的测定结果之间的差别,其结论才具有较高的可信度。
案例1-4 某部队共有1 200人,在某段时间内患某病的人数有120人,其中男性114人,女性6人。某卫生员进行统计分析后说,经假设检验,该病的两性发病率(114/120=95%与6/120=5%)之间的差别有统计学意义,由此得出结论:“该病男性易得”。你对这个结论有何看法?若结论是错误的,那么,错误的实质是什么?正确的做法是什么?
案例辨析 这个结论是错误的!因为在这1 200人中,究竟有多少男性和多少女性并不清楚,无法计算男性发病的频率和女性发病的频率。假如其中有1 194名男性和6名女性,则男性发病率为(120/1 194)⨯100% = 10.05%,而女性全部发病(女性总例数太少,不宜用百分之百发病率来描述)。显然,原来的结论是不成立的。该卫生员所犯错误的实质是将发病人员中性别的频率错误地当作人群中发病的频率了,因而得出毫无根据的错误结论。
正确做法 若这1 200人是从一个总体中抽出来的样本,要弄清在这1 200人中男、女人数各是多少,设分别为男n 和女n ,然后,分别计算男性和女性的发病频率,即
%100120⨯=
男男n P ,%1006
⨯=女
女n P ;要想得出两个发病频率之间的差别是否能反映总体的情况,还应进行统计推断(即进行假设检验,此处从略)。