颜虹的医学统计学案例选
《医学统计学》教学大纲(医学检验)
《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
分享医学统计学科研实验中的几个小故事
医学统计学是一门很值得医生朋友们学习的科学。
只要熟练掌握了,绝大多数的科学研究都不在话下。
然而,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。
很多医生朋友在学习医学统计学时,都抱着一副“比葫芦画瓢”的态度,试图套用统计学方法来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。
笔者在这里和大家分享几则与医学统计学相关的小故事,并加以分析说明,希望可以帮助大家学到更多的知识。
1、甲经历数十年的研究,动用了各种高精尖的研究手段,发现了一个新的蛋白(命名为蛋白A)。
在肝癌患者中展开的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相关性,其相关程度之好,几乎可以用“一塌糊涂”来形容,相关系数达到了0.99(P<0.0001)。
甲欣喜若狂,尽管蛋白A的检测过程还十分繁琐,检测费用还十分高,但是甲还是把持不住内心的激动,日夜兼程地撰写论文,宣称自己找到了一个新的肝癌标志物。
乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:统计结果表明蛋白A和AFP的相关性十分明显。
如果是这样,在临床实践中,通过检测AFP完全就可以得知蛋白A的浓度了,蛋白A在肝癌中的临床价值完全可以被AFP代替,还不说蛋白A的检测过程繁琐,费用太高的问题,你说蛋白A还有什么价值?小故事大道理:统计学阳性的结果未必是“好结果”。
2.甲发明了两套诊断肺癌的方案,分别命名为A和B。
为了明确这两种方到底谁“更胜一筹”,甲找了100个肺癌患者和100个疑似肺癌患者(结核、肺炎等),分别用A、B两套方案去进行鉴别诊断。
在200个研究对象中(100个肺癌和100个非肺癌),方案A正确了100回,准确率50%,方案B仅仅正确了50回,准确率仅为25%。
卡方检验表明:方案A和B准确率之间的差异有统计学意义(P<0.01)。
很明显,方案A的准确性要高于方案B。
甲赶紧发表论文,指出:方案A诊断肺癌的准确性优于方案B。
医学统计学参考答案 颜虹第二版
《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
医学统计学案例分析(1)
案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药 6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。
(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。
(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。
医学统计学参考答案 颜虹第二版
《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。
颜虹-医学统计学案例选
医学统计学案例选第一章绪论部分案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。
简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。
你发现了什么问题,应如何修改?你的收获是什么?第二章实验设计部分案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(河南中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。
将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。
请讨论该分组方法是否随机?案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。
而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。
A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩张宫颈后吸宫。
作者认为该法“符合随机分配法则”。
请讨论对照组的设置是否合适?案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。
得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。
医学统计学课后习题答案.
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《医学统计学》计算题答案
《医学统计学》最佳选择题和计算分析题答案教材:孙振球,徐勇勇主编. 医学统计学. 第4版. 北京:人民卫生出版社,2014最佳选择题答案第二章计量资料的统计描述(第20-21页)(1)D (2)C (3)D (4)D (5)C (6)E (7)E (8)D (9)E (10)B第三章总体均数的估计与假设检验(第43-44页)(1)E (2)C (3)E (4)E (5)B (6)E (7)D (8)E (9)D (10)C第四章多个样本均数比较的方差分析(第63-64页)(1)D (2)C (3)D (4)A (5)C (6)A (7)A第五章计数资料的统计描述(第20-21页)(1)B (2)D (3)A (4)A (5)E (6)D (7)C (8)E (9)B (10)D第六章几种离散型变量的分布及其应用(第94页)(1)A (2) 不要求(3) 不要求(4)E (5)不要求(6)不要求第七章c2检验(第112-113页)(1)D (2)C (3)C (4)A (5)不要求(6)A (7)不要求第八章秩转换的非参数检验(第128页)(1)E (2)D (3)D (4)D (5)A (6)C第九章双变量回归与相关(第151-152页)(1)B (2)E (3)C (4)C (5)不要求(6)D (7)B (8) 不要求第十章统计表与统计图(第163-164页)(1)B (2)D (3)B (4)E (5)选项有误 (6)D (7)E (8)D (9)C (10)C 注:第(5)题的选项是(箱式图),但5个选项中没有“箱式图”。
第十九章生存分析(第300页)(1)A (2) E (3)B (4)D (5)D第三十四章观察性研究设计(第544-545页)(1)C (2)C (3)C (4)C (5)D (6)C (7)A (8)D (9)D (10)A (11)E (12)E (13)B (14)A (15)B第三十六章试验研究设计(第582页)(1)D (2)D (3)D (4)E (5)A (6)D第三十七章临床试验研究设计(第603-604页)(1)C (2)C (3)C (4)D计算分析题参考答案第二章计量资料的统计描述计算分析题(P21)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
医学统计学课后习题答案.
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学精品教学精卫中心检索实例
抑郁症/全部树/TH(+)-限定:Meta分析 检索到16篇
扩展检索策略:
#1 抑郁症/全部树/TH(+) #2 抗抑郁药/全部树/AD/AE/CT/PO/TU #3 #1 OR #2
#4 系统评价 OR 系统性评价 OR 系统综 述 OR 系统性综述 OR (英文题目 :systematic review ) OR (英文题目 :meta analysis ) OR (英文题目:meta analyses ) OR meta分析 OR 主成分分析 OR 系统性分析 OR 汇总分析 OR副主题词 #6 Meta分析(主题)/全部树/全部副主 题词
#7 #4 OR #5 OR #6 #8 #3 AND #7 检索到36篇
举例2: 抑郁症 治疗有 关的随 机对照 试验
扩展检索策略
#1 抑郁症/全部树/TH(+) #2 抗抑郁药/全部树/AD/AE/CT/PO/TU #3 #1 OR #2
举例:PubMed检索
例3:抑郁症治疗的系统评价(meta分析)
Depressive Disorder AND systematic[sb]
抑郁症治疗的系统评价 PubMed初步 检索策略
#1 Depressive Disorder /TH(+) #2 Antidepressive Agents /TU(+) #3 (#1 AND #2) AND systematic[sb]
注意 :数据年限:2019~
(( "Depressive Disorder/diet therapy"[Mesh] OR "Depressive Disorder/drug therapy"[Mesh] OR "Depressive Disorder/surgery"[Mesh] OR "Depressive Disorder/therapy"[Mesh] )) AND ( "Antidepressive Agents/administration and dosage"[Mesh] OR "Antidepressive Agents/adverse effects"[Mesh] OR "Antidepressive Agents/poisoning"[Mesh] OR "Antidepressive Agents/therapeutic use"[Mesh] OR "Antidepressive Agents/toxicity"[Mesh] ) AND systematic[sb]
医学统计学例题-例8-2
例8-2为研究克拉霉素的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。
给予不同的处理后,观察抑菌圈的直径,结果见表8-7,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?表8-7 28个平板给予不同处理后的抑菌圈直径(mm)X区组SL SH TL THj1 18.02 19.41 18.00 19.46 18.722 18.12 20.2 18.91 20.38 19.403 18.09 19.56 18.21 19.64 18.884 18.30 19.41 18.24 19.50 18.865 18.26 19.59 18.11 19.56 18.886 18.02 20.12 18.13 19.60 18.977 18.23 19.94 18.06 19.54 18.94n7 7 7 7 28(N) iX18.15 19.75 18.24 19.67 18.95(ij X) i2S0.013 0.111 0.095 0.102 0.668(2S) i引自:方积乾主编. 卫生统计学,第五版. 北京:人民卫生出版社,2003解本例中总例数N=28,区组数n =7,处理因素水平数g =4。
根据研究设计的方法和数据特点,我们选择随机区组设计的方差分析方法进行分析。
1.建立假设、确定检验水准对处理组H0:μSL=μSH=μTL=μTH(4个处理组的处理效果相同)H1:μSL,μSH,μTL与μTH不全相等(4个处理组的处理效果不全相同)对区组H0:μ1=μ2=…=μ6=μ7(菌源对抑菌圈的直径大小没有影响)H1:μ1,μ2,…,μ7不全相等(菌源对抑菌圈的直径大小有影响)α=0.052. 计算检验统计量F值将表8-7的计算结果带入表8-6中,得方差分析表,如表8-8所示。
医学统计学案例分析 (1)
案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药 6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。
(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。
(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。
颜虹医学统计学SAS程序实例
data ex04_01;input x @@;cards;219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 ;;;run;proc format;value a 90-<110='90-' 110-<130='110-' 130-<150='130-' 150-<170='150-' 170-<190='170-' 190-<210='190-' 210-<230='210-'230-<250='230-' 250-<270='250-' 270-<290='270-';proc univariate normal;var x;run;proc freq ;format x a.;table x;run;data ex04_02;input eyesight @@;cards;0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5;;;run;proc format;value eye 0-1='0-1' 2-3='2-3' 4-5='4-5';run;proc freq;format eyesight eye.;table eyesight;run;data ex04_03;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70 ;;;run;proc means n mean ;var weight;run;data ex04_04;input group $ f x0 @@;fx0=f*x0;cards;90~ 2 100110~ 3 120130~8 140150~17 160170~20 180190~15 200210~8 220230~ 5 240250~ 2 260270~ 1 280;;;run;proc print;sum f x0 fx0;run;proc univariate noprint;var f fx0;output out=out sum=sumf sumfx0;run;data d;set out;mean=sumfx0/sumf;run;data ex04_05;input x @@;lgx=log10(x);cards;11 9 35 5 9 8 3 10 12 8;;;run;proc means n mean;var lgx;output out=out mean=mean n=n;run;data d;set out;gmean=exp(mean*log(10));run;proc print data=d;run;data ex04_06;input x @@;lgx=log10(x);cards;10 20 40 80 80 160 160 320 320 640;;;run;proc means n mean;var lgx;output out=out mean=mean n=n;run;data d; set out; gmean=exp(mean*log(10)); run;proc print data=d;run;data ex04_07;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70 ;;;run;proc means n median ;var weight;run;data ex04_08;input x @@;cards;3 5 8 8 9 9 10 11 12 35;;;run;proc means n median;var x;run;data ex04_09;input x f @@;lgx=log10(x);cards;2.5 1 7.5 2 12.5 4 17.5 6 22.5 7 27.5 932.5 13 37.5 23 42.5 34 47.5 2;;;run;proc means n mean median;var x;weight f;run;proc means n mean noprint;var lgx; weight f;output out=out mean=mean n=n;run;data d;set out;gmean=exp(mean*log(10));run;proc print data=d;run;data ex04_10;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70;;;run;proc means n max min range ;var weight;run;data ex04_11;input x f @@;cards;2.5 1 7.5 2 12.5 417.5 6 22.5 7 27.5 932.5 13 37.5 23 42.5 34 47.5 2 ;;;run;proc univariate ;var x;weight f;run;data ex04_12;input x @@;cards;11 9 35 5 9 8 3 10 12 8;;;run;proc means n q1 q3 qrange;var x;run;data ex04_13;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70;;;run;proc means n var ;var weight;run;data ex04_14;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70;;;run;proc means n std;var weight;run;data ex04_15;input weight @@;cards;65 62 50 78 65 45 51 74 60 62 88 50 74 66 70;;;run;proc means n mean std cv;var weight;run;data ex04_15a;input height @@;cards;171 169 157 183 160 155 165 174 166 170 186 154 160 159 161;;;run;proc means n mean std cv;var height;run;data ex04_16;a=14750;b=810;p=a/b/10;run;proc print;run;data ex04_17;input type wt @@;cards;1 502 403 304 205 10;;;run;proc format;value type 1='恶性肿瘤' 2='循环系统疾病' 3='呼吸系统疾病' 4='消化系统疾病' 5='传染病';run;proc freq;format type type.; weight wt;table type;run;data ex04_18;n=2300;x=68;p=x/n*100;run;proc print;run;data ex04_19;n=12500;x=59;p=x/n*100;run;proc print;run;data ex04_20;input y smk wt; cards;1 1 101 2 22 1 902 2 48run;proc freq;weight wt;table smk*y/relrisk; run;data ex04_21;input y smk wt; cards;1 1 101 2 22 1 902 2 48run;proc freq;weight wt;table smk*y/relrisk;run;data ex5_5;do x=12;p1=probbnml(0.6,20,x);p2=probbnml(0.6,20,x-1);p=p1-p2;output;end;proc print;var x p;run;data ex5_7;do x=30;p1=probbnml(0.005,10000,x);p2=probbnml(0.005,10000,x-1);p=p1-p2;output;end;proc print;var x p;run;data ex5_7;d=probbnml(0.005,10000,65);p=d;proc print;var p;run;data ex5_8;d=poisson(10,4);p1=1-d;p2=poisson(10,15);proc print;var p1 p2;run;data ex06_03;n=9;mean=121.44;std=5.75;t=tinv(0.975,n-1);pts=t*std/sqrt(n);lclm=mean-pts;uclm=mean+pts;proc print;var lclm uclm;run;data ex06_04;n=90;mean=4.18;std=0.29;t=tinv(0.975,n-1);pts=t*std/sqrt(n);lclm=mean-pts;uclm=mean+pts;proc print;var lclm uclm;run;data ex06_05;n1=37;n2=35;m1=5.2;m2=3.8;s1=0.9;s2=0.8;ss1=s1**2*(n1-1);ss2=s2**2*(n2-1);sc2=(ss1+ss2)/(n1+n2-2); se=sqrt(sc2*(1/n1+1/n2)); t=tinv(0.975,n1+n2-2); lclm=(m1-m2)-t*se; uclm=(m1-m2)+t*se; proc print;var t se lclm uclm;run;data ex06_08;n=106;np=62;t=tinv(0.975,n-1);p=np/n;ss=p*(1-p);sp=sqrt(ss/n);lclm=p-t*sp;uclm=p+t*sp;proc print;var lclm uclm;run;data ex06_09;n1=100;x1=80;n2=100;x2=50;t=tinv(0.975,n1-1);p1=x1/n1;p2=x2/n2;ss1=p1*(1-p1)/n1;ss2=p2*(1-p2)/n2;sp=sqrt(ss1+ss2);lclm=(p1-p2)-t*sp;uclm=(p1-p2)+t*sp;proc print;var lclm uclm;run;data ex06_11;x=360;lclm=x-1.96*sqrt(x);uclm=x+1.96*sqrt(x);proc print;var lclm uclm;run;data ex07_1;n=75; mean=74.2; s=6.5; mu=72;u=(mean-mu)/(s/sqrt(n));p=2*(1-probnorm(u));ods rtf file='d:\test\sas07-1.rtf';proc print;var n mean s u p;run;quit;ods rtf close;data ex07_2;n1=48;mean1=3427.8; s1=448.1;n2=48; mean2=3361.9; s2=400.1;u=(mean1-mean2)/(sqrt(s1*s1/n1+s2*s2/n2)); p=2*(1-probnorm(u));ods rtf file='d:\test\sas07-2.rtf';proc print;var n1 mean1 s1 n2 mean2 s2 u p;run;quit;ods rtf close;data ex07_3;n=1396;count=363;rate=count/n;pai=0.235; u=(rate-pai)/sqrt(0.235*(1-0.235)/n);p=2*(1-probnorm(u));ods rtf file='d:\test\sas07-3.rtf';proc print;var n count rate pai u p;run;quit;ods rtf close;data ex07_4;n1=765; count1=53; n2=882; count2=22; rate1=count1/n1;rate2=count2/n2;pai=(count1+count2)/(n1+n2);se=sqrt(pai*(1-pai)*(1/n1+1/n2));u=(rate1-rate2)/sqrt(pai*(1-pai)*(1/n1+1/n2)); p=2*(1-probnorm(u));proc print;var n1 n2 rate1 rate2 se u p;run;quit;data ex07_5;n=75; mean=74.2; s=6.5; mu=72;u=(mean-mu)/(s/sqrt(n));p=(1-probnorm(u));ods rtf file='d:\test\sas07-5.rtf';proc print;var n mean s u p;run;quit;ods rtf close;data ex07_6;n1=765; count1=53; n2=882; count2=22; rate1=count1/n1;rate2=count2/n2;pai=(count1+count2)/(n1+n2);u=(rate1-rate2)/sqrt(pai*(1-pai)*(1/n1+1/n2)); p=1-probnorm(u);ods rtf file='d:\test\sas07-6.rtf';proc print;var n1 rate1 rate2 u p;run;quit;ods rtf close;data ex08_01;n=16;sm=172;std=14;pm=168;df=n-1;t=abs(sm-pm)/(std/sqrt(n));p=(1-probt(t,df));proc print;var t p;run;data ex08_02; input x1 x2 @@; d=x2-x1; cards;113 140 125 150 126 138 130 120 150 140 145 145 135 135 105 115 128 135 135 130 100 120 130 133 110 147 115 125 120 114 155 165 ;;;proc means t prt; var d;run;data ex08_03; input d @@; cards;0.170.190.090.200.25;;;proc means t prt; var d;run;data ex08_04; input x grp@@; cards;6.2 15.8 12.7 13.9 16.1 16.7 17.8 13.8 16.9 18.5 26.8 211.3 29.4 29.3 27.3 25.6 27.9 27.2 28.2 2;;;proc ttest; var x;class grp; run;data ex08_05; input x @@; cards;2.354.154.123.295.253.182.914.734.283.843.194.265.714.783.583.324.955.084.845.26 4.914.755.13 3.50 5.35 3.91 2.70 4.59 3.92 3.523.574.21 4.363.954.48 3.983.684.41 4.15 4.833.784.19 4.26 3.983.954.344.235.353.004.53 3.87 3.60 3.925.03 4.80 3.783.804.593.753.583.844.833.914.504.173.264.063.703.864.553.874.572.683.634.133.303.663.964.522.784.283.513.583.513.413.993.934.064.523.954.173.264.503.274.133.253.074.333.02;;;proc univariate data=ex08_05Normalplot;var x;run;data ex08_07;input x @@;if _n_<13 then c=1;else c=2;cards;3.23 3.504.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.955.10 2.78 3.23 4.20 4.87 5.126.217.188.05 8.569.60;proc ttest;var x;class c;run;data ex9_1;input x c @@;cards;4.20 13.30 13.70 14.30 14.10 13.30 14.50 24.40 23.50 24.20 24.60 24.20 25.60 33.60 34.50 35.10 34.90 34.70 3;proc anova;class c;model x=c;means c/snk; means c/hovtest; run;data ex9_2;input x a b @@; cards;64.00 1 1 53.00 1 2 71.00 1 3 41.00 1 4 50.00 1 5 42.00 1 6 65.00 2 1 54.00 2 2 68.00 2 3 46.00 2 4 58.00 2 5 40.00 2 6 73.00 3 1 59.00 3 2 79.00 3 3 38.00 3 4 65.00 3 5 46.00 3 6;proc anova;class a b; model x=a b; means a/dunnett; run;data ex9_3;input r c z $ x; cards;1 1 D 80 12 B 70 13 C 511 4 A 482 1 A 47 2 2 C 752 3 D 782 4 B 453 1 B 48 3 2 D 80 3 3 A 473 4 C 524 1 C 46 4 2 A 81 4 3 B 49 4 4 D 77 ;proc anova; class r c z; model x=r c z; means c/lsd; run;data ex9_1; input x c @@; cards;4.20 13.30 13.70 14.30 14.10 13.30 14.50 24.40 23.50 24.20 24.60 24.20 25.60 33.60 34.50 35.10 34.90 34.70 3;proc anova; class c; model x=c; means c/snk;means c/hovtest; run;data ex9_2;input x a b @@; cards;64.00 1 1 53.00 1 2 71.00 1 3 41.00 1 4 50.00 1 5 42.00 1 6 65.00 2 1 54.00 2 2 68.00 2 3 46.00 2 4 58.00 2 5 40.00 2 6 73.00 3 1 59.00 3 2 79.00 3 3 38.00 3 4 65.00 3 5 46.00 3 6;proc anova;class a b; model x=a b; means a/dunnett; run;data ex9_3;input r c z $ x; cards;1 1 D 80 12 B 70 13 C 511 4 A 482 1 A 47 2 2 C 75 23 D 78 24 B 453 1 B 48 3 2 D 80 3 3 A 473 4 C 524 1 C 46 4 2 A 81 4 3 B 49 4 4 D 77 ;proc anova;class r c z; model x=r c z; means c/lsd; run;data ex9_1;input x c @@; cards;4.20 13.30 13.70 14.30 14.10 13.30 14.50 24.40 23.50 24.20 24.60 24.20 25.60 33.60 34.50 35.10 34.90 34.70 3;proc anova;class c;model x=c; means c/dunnett; means c/hovtest; run;data ex10_01;input r c f @@;cards;1 1 681 2 62 1 522 2 11;;;proc freq data=ex10_01; weight f;tables r*c/chisq expected; run;data ex10_02;input r c f @@;cards;1 1 281 2 22 1 122 2 4;;;proc freq data=ex10_02; weight f;tables r*c/chisq expected; run;data ex10_03;input r c f @@;cards;1 1 301 2 102 1 172 2 25;;;proc freq data=ex10_03; weight f;tables r*c/chisq expected; run;data ex10_04;input b c;if b+c<40then chisq=(abs(b-c)-1)**2/(b+c);else chisq=abs(b-c)**2/(b+c); probchi=1-probchi(chisq,1); cards;2 11;;;proc print;run;data ex10_05;input r c f @@;cards;1 1 251 2 22 1 112 2 15;;;proc freq data=ex10_05;weight f;tables r*c/chisq expected;run;data ex10_06;input r c f @@;cards;1 1 801 2 182 1 202 2 203 1 243 2 38;;;proc freq data=ex10_06;weight f;tables r*c/chisq expected;run;data ex10_07;input r c f @@;cards;1 1 4421 2 4831 3 4161 4 1722 1 3692 2 3842 3 4872 4 115;;;proc freq data=ex10_07; weight f;tables r*c/chisq expected; run;data ex10_08;input r c f @@;cards;1 1 601 2 701 3 451 4 1002 1 432 2 322 3 192 4 313 1 193 2 233 3 223 4 20;;;proc freq data=ex10_08; weight f;tables r*c/chisq expected; run;data d10_09a;input r c f @@;cards;1 1 201 2 202 1 242 2 38;;;proc freq data=d10_09a; weight f;tables r*c/chisq expected; run;data d10_09b;input r c f @@;cards;1 1 801 2 182 1 202 2 20;;;proc freq data=d10_09b; weight f;tables r*c/chisq expected; run;data d10_09c;input r c f @@;cards;1 1 801 2 182 1 242 2 38;;;proc freq data=d10_09c; weight f;tables r*c/chisq expected; run;data ex10_12;input r c f @@;cards;1 1 21 2 142 1 32 2 8;;;proc freq data=ex10_12;weight f;tables r*c/chisq expected;run;data ex10_13;input r c f @@;cards;1 1 401 2 362 1 92 2 67;;;proc freq data=ex10_13;weight f;tables r*c/chisq expected;run;data ex10_14;input b c;if b+c<40then chisq=(abs(b-c)-1)**2/(b+c);else chisq=abs(b-c)**2/(b+c); probchi=1-probchi(chisq,1); cards;16 3;;;proc print;run;data ex11_1;input x1 x2 ;d=x1-x2;cards;14.00 15.2013.00 5.5015.00 14.0017.00 6.5013.00 5.5018.00 13.5017.50 10.0010.20 10.2010.00 10.0010.50 9.5013.80 6.803.03 3.4815.20 5.5016.50 9.00;proc univariate normal;var d;run;data ex11_2;input x1 @@;median=2.15;d=x1-median;cards;2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.993.19 3.374.57 ;proc univariate normal;var d;run;data ex11_3;input x c @@;cards;25 130 132 135 137 139 139 142 146 148 136 240 244 248 250 256 259 260 264 2195 2240 2;proc npar1way wilcoxon;var x;class c;run;DA TA ex11_4;DO c=1 TO 4;DO g=1 TO 2;INPUT n @@;Do i=1 to n;OUTPUT;END; END; END;CARDS;2 194 56 915 4;PROC NPAR1W A Y WILCOXON ; V AR c;CLASS g;RUN;data ex11_5;input x c @@;cards;46 1 52 2 47 356 1 53 2 32 357 1 54 2 58 359 1 55 2 49 361 1 60 2 44 364 1 62 2 24 365 1 62 2 18 365 1 62 2 37 365 1 63 2 45 367 1 69 2 37 367 1 70 2 37 367 1 71 2 25 367 1 71 2 19 368 1 71 2 37 371 1 72 2 45 371 1 88 2 37 371 1 90 271 1 92 274 1 95 275 176 177 194 198 1;proc npar1way wilcoxon;var x;class c;run;PROC FREQ DA TA=ex11-3;TABLES c*x/SCORES=RANK CMH2; RUN;PROC RANK;V AR x;RANKS rx; RUN;PROC anova ;CLASS c;MODEL rx=c;RUN;quit;DA TA ex11_6;DO c=1 TO 4;DO g=1 TO 3;INPUT n @@;Do i=1 to n;OUTPUT;END; END; END;CARDS;10 24 4817 41 6519 33 364 7 8;PROC NPAR1W A Y WILCOXON ;V AR c;CLASS g;RUN;DA TA ex11_8;DO b=1 TO 7;DO a=1 TO 4;INPUT x @@;OUTPUT;END;END;CARDS;190 94 77 928 10 12 970 92 81 9826 19 18 1922 23 24 2149 51 62 5845 44 41 42;PROC FREQ DA TA=ex11_8;TABLES b*a*x/SCORES=RANK CMH2; RUN;data ex12_01;input x y;cards;35 18537 18644 16747 14249 15047 14747 15342 16741 17040 16543 15843 16639 17337 18642 16548 13936 17939 18235 192;;;proc plot data=ex12_01; plot y*x;run;data ex12_01;input x y;cards;45 16435 18537 18644 16747 14249 15047 14747 15342 16741 17040 16543 15843 16639 17342 16548 13936 17939 18235 192;;;proc reg; model y=x; run;data ex13_1; input x y @@; cards;0.11 0.14 0.25 0.25 0.23 0.28 0.24 0.25 0.26 0.28 0.09 0.10 0.25 0.27 0.06 0.09 0.23 0.24 0.33 0.30 0.15 0.16 0.04 0.05 0.20 0.20 0.34 0.32 0.22 0.24;proc corr;var x y; run;data ex13_2; input x y; cards;10 4.0444 6.2115 4.8314 4.7112 4.4415 4.3811 3.7399 6.0011 4.3812 4.0011 4.36;proc corr spearman;var x y;run;data ex14_01;do group=1 to 3;do person=1 to 8;input x @@;output;end;end;cards;120 126 121 100 96 107 117 134 109 123 124 134 97 105 135 140 99 118 141 140 97 108 115 120 ;;;proc print;run;proc glm data=ex14_01;class group person;model x=group person;run;data ex17_1;input x a b @@;cards;0.554 1 10.550 1 10.578 1 10.706 1 10.686 1 10.651 1 11.015 1 21.005 1 21.071 1 21.106 1 21.155 1 21.145 1 20.337 2 10.276 2 10.313 2 10.387 2 10.431 2 10.362 2 10.503 2 20.612 2 20.593 2 20.604 2 20.640 2 20.560 2 2;proc anova;class a b;model x=a b a*b;run;data ex17_2;input group time tissue cons@@; datalines;1 1 1 0.11891 1 1 0.12361 1 1 0.13331 1 1 0.10311 1 1 0.0921 2 1 0.34981 2 1 0.32271 2 1 0.34881 2 1 0.31191 3 1 0.2404 1 3 1 0.2676 1 3 1 0.2505 1 3 1 0.26421 3 1 0.24342 1 1 0.3482 2 1 1 0.3646 2 1 1 0.378 2 1 1 0.3562 2 1 1 0.3596 2 2 1 0.6204 2 2 1 0.6544 2 2 1 0.6779 2 2 1 0.6312 2 2 1 0.6221 23 1 0.3968 2 3 1 0.3935 2 3 1 0.3942 2 3 1 0.377 2 3 1 0.3918 1 1 2 0.7787 1 1 2 0.7798 1 1 2 0.756 1 1 2 0.7745 1 1 2 0.7999 1 2 2 3.6153 1 2 2 3.4654 1 2 2 3.498 1 2 2 3.3174 1 2 2 3.3617 1 3 2 0.5643 1 3 2 0.5691 1 3 2 0.5799 1 3 2 0.58591 32 0.56282 1 2 0.1613 2 1 2 0.1663 2 1 2 0.1502 2 1 2 0.1124 2 1 2 0.1637 2 2 2 0.3774 2 2 2 0.3566 2 2 2 0.37482 2 2 0.39422 3 2 0.11942 3 2 0.09292 3 2 0.1052 3 2 0.09852 3 2 0.1196;proc glm data=ex17_2;class group time tissue;model cons=group time tissue group*time tissue*time group*tissue group*time*tissue/ss3; run;quit;your SAS dataset */%LET dataset = ex17_03 ;libname library '.' ;proc format library = library ;value GROUP /* 药物*/1 = '低分子肝素钙'2 = '速避凝' ;value STAGE /* 阶段*/1 = '第一阶段'2 = '第二阶段' ;quit;DA TA library.&dataset ;INFILE datafile LRECL=33;INPUTPSNO 1-2 GROUP 3 STAGE 4TT 5-8 STA TE $ 9-33 ;LABELPSNO = "病人编号"GROUP = "药物"STAGE = "阶段"TT = "凝血酶时间";FORMA TGROUP GROUP. STAGE STAGE. ;LENGTHPSNO 3 GROUP 3 STAGE 3 ;RUN ;data ex3;do group=1 to 2;do psno=1 to 20;input stage tt @@;output;end;end;cards;1 10.0 1 18.3 1 11.4 1 16.1 1 12.1 1 12.2 1 14.6 1 11.2 1 11.9 1 12.32 16.7 2 24.7 2 14.9 2 12.2 2 12.1 2 12.5 2 20.1 2 13.6 2 16.3 2 16.2 2 12.1 2 14.3 2 12.8 2 17.4 2 13.5 2 16.6 2 11.9 2 12.3 2 20.1 2 11.7 1 11.4 1 10.4 1 15.2 1 10.6 1 12.2 1 10.4 1 13.9 1 17.2 1 12.9 1 26.5 ;proc anova;class group psno stage;model tt=group psno stage;run;data ex4;input A 1 B 2 C 3 x;cards;112 131.3121 85.1123 148.7122 104.1133 38.1111 115.4131 86.8113 137.0132 29.8222 170.1213 147.3211 142.9232 22.4233 30.6212 178.3223 187.4221 151.4231 21.3311 180.8321 162.6332 29.6322 191.2323 191.4333 28.7313 214.7331 36.2312 183.0;proc anova;class A B C;model x= A B C A*B B*C A*C; RUN;libname a 'c:\';data a.ex19_1;input x y @@;d=x-y;cards;101 100131 136131 126150 143124 128137 126126 116105 9590 8767 5784 74109 101;ods rtf file='c:\Tab19-1.rtf'; proc print data=a.ex19_1; run;proc means t prt;var d;run;proc corr;var x y d;run;proc reg;model y=x;run;quit;ods rtf close;libname a'c:\';data a.Tab19_2;input id x1 x2;if _n_<13 then c=1;else c=2;d=x1-x2;cards;1 101 1002 131 1363 131 1264 150 1435 124 1286 137 1267 126 1168 105 959 90 8710 67 5711 84 7412 109 10113 100 10114 129 13115 127 12616 145 14017 137 13518 128 12619 115 11620 130 12621 87 9022 69 7023 85 8424 109 101;ods rtf file='c:\Tab19-2.rtf'; proc print data=a.Tab19_2; run;proc ttest;var d;class c;run;proc glm;class c;model x1 x2=c;repeated time 5contrast(1);run;quit;ods rtf close;libname a'c:\';data a.Tab19_10;input t0-t4 g @@;cards;9.73 54.61 55.91 46.81 47.56 1 5.50 50.87 79.90 62.37 55.03 1 7.96 23.43 64.10 56.00 45.15 1 2.37 18.63 73.10 76.05 60.80 1 2.37 55.24 93.35 65.47 62.37 1 6.50 32.08 73.45 76.27 60.23 1 8.34 132.1 102.0 97.83 92.83 1 1.80 5.40 82.8 73.95 60.14 1 14.66 29.0 48.88 52.24 31.65 2 0.84 25.00 53.80 44.25 32.38 2 0.68 17.34 64.56 61.60 55.80 2 2.14 14.10 69.77 66.65 54.43 2 2.30 53.40 73.83 62.00 57.31 2 6.17 25.85 45.80 53.25 47.95 2 2.45 53.30 58.80 57.80 71.10 2 1.58 44.00 30.30 70.20 67.06 2 ;ods rtf file='c:\Tab19-10.rtf'; proc print data=a.Tab19_10; run;proc glm;class g;model t0-t4=g;repeated time 5contrast(1);run;quit;ods rtf close;data ex20_01; input x1-x2 y @@; cards;5.7 1.1 7.56.6 0.97.07.1 1.3 6.87.0 2.3 7.26.8 2.37.76.1 2.07.88.9 2.7 7.38.7 1.3 7.08.5 1.5 7.28.8 2.6 7.35.0 2.56.85.6 1.6 7.46.9 2.67.64.5 1.7 7.24.4 1.9 7.08.5 1.3 7.96.8 2.07.84.8 2.7 7.44.8 1.4 6.18.1 1.6 6.94.5 0.9 6.25.2 1.76.57.7 2.1 8.07.7 1.9 7.67.7 1.8 6.46.2 2.57.64.7 1.05.17.8 2.6 6.86.7 2.77.76.2 1.7 6.85.3 1.26.97.9 2.3 7.54.1 1.8 6.07.2 1.6 7.64.0 2.7 6.95.8 2.46.24.5 2.4 7.44.1 1.9 6.48.1 2.6 7.24.2 2.8 6.8proc reg;model y=x1-x2; run;data ex20_02; input x1 y x2 @@; x1x2=x1*x2; cards;0.3 67 00.4 68 00.8 71 01.0 71 01.6 77 00.9 70 14.6 101 11.8 78 14.4 100 04.5 101 04.9 103 05.1 104 00.8 70 16.4 116 12.2 83 12.0 82 02.1 82 03.3 91 04.1 96 04.4 100 04.7 103 12.8 88 15.4 108 06.7 116 06.9 119 07.1 121 07.5 126 05.5 110 15.4 107 14.8 103 03.2 91 10.4 66 15.7 109 17.1 124 10.7 69 13.3 92 16.9 119 15.7 111 13.6 92 10.8 70 1;;;proc reg;model y=x1 x2 x1x2;run;data ex20_03;input x1-x5 y @@;cards;49 32.19 6 148 86 7.6 67 24.77 2.7 151 98 7.4 64 25.24 7 151 80 7.4 66 24.26 4.8 157 87 7.2 68 30.28 3.5 136 83 7.3 48 26.18 7.6 137 87 7.6 66 26.36 5.9 157 91 7.5 47 32.07 5.7 157 89 7.7 64 28.44 6.1 154 82 7.3 75 30.65 6.9 137 86 7.7 53 23.43 7.1 161 86 7.5 46 30.56 2.9 146 79 7.3 59 25.19 6 158 80 7.3 76 27.26 5.4 124 85 6.9 63 23.93 6.7 133 89 7.5 74 24.94 7.9 166 82 7.9 52 22.82 5.3 149 71 7.3 64 24.34 2.5 126 93 6.8 54 25.44 2.6 151 83 6.9 78 28.98 7.2 147 74 7.5 ;;;proc reg;model y=x1-x4/selection=stepwisesle=0.10sls=0.10;run;data ex21_0;input x y c; cards;184.9 4300 1 167.9 3850 1 171.0 4100 1 171.0 4300 1 188.0 4800 1 179.0 4000 1 177.0 5400 1 179.5 4000 1 187.0 4800 1 187.0 4800 1 169.0 4500 1 188.0 4780 1 176.7 3700 1 179.0 5250 1 183.0 4250 1 180.5 4800 1 179.0 5000 1 178.0 3700 1 164.0 3600 1 174.0 4050 1 168.7 3450 2 170.8 4100 2 165.0 3800 2 169.7 3300 2 171.5 3450 2 166.5 3250 2 165.0 3600 2 165.0 3200 2 173.0 3950 2 169.0 4000 2 173.8 4150 2 174.0 3450 2 170.5 3250 2 176.0 4100 2 169.5 3650 2 176.3 3950 2 163.0 3500 2 172.5 3900 2177.0 3450 2 173.0 3850 2 ;proc glm;class c;model y=x c; means c/snk; run;data ex21_1;input x y c; cards;42 39 144 66 136 70 113 44 119 35 122 26 128 30 123 55 134 63 142 69 113 20 11 22 129 70 119 51 124 31 19 30 122 33 1-2 25 115 46 133 43 226 33 233 48 221 43 231 38 233 48 231 63 234 41 211 48 29 40 27 50 219 62 2-2 27 231 73 212 39 212 44 2-5 34 216 43 215 45 231 63 3-3 39 325 43 325 64 324 43 33 26 326 47 328 51 332 67 34 43 316 24 321 52 31 28 39 62 33 48 322 47 37 36 325 67 35 49 312 33 3;proc glm;class c;model y=x c;means c/snk;run;DA TA EX12_1;INPUT x1-x11 y @@;DA TALINES;1 602 2 1 1 1 4.30 1.50 1.24 2.30 01 48 32 1 1 1 4.60 1.32 1.15 2.30 02 63 2 1 1 1 2 4.60 1.15 1.15 2.30 0 1 68 3 2 2 1 1 4.15 1.43 1.07 3.21 01 45 3 32 1 1 4.16 .96 .98 2.65 0 1 59 2 1 1 1 1 4.32 1.02 1.05 3.49 01 68 3 3 1 1 1 3.80 1.42 2.86 .85 02 63 2 2 1 1 1 3.87 1.55 2.44 .81 02 58 2 2 1 1 1 5.42 .87 4.46 3.14 01 442 2 2 1 2 4.35 1.01 5.13 2.20 01 46 3 1 12 1 3.42 1.26 1.40 .28 02 62 1 2 1 1 2 3.18 1.38 1.67 .48 02 65 1 2 1 1 1 3.30 .85 1.92 .69 02 58 2 1 1 1 2 4.41 1.05 2.97 1.79 01 22 5 1 2 2 2 5.10 1.63 3.24 .96 01 69 1 1 12 1 5.09 1.50 3.29 .75 02 55 2 1 1 1 2 3.98 1.41 .66 4.25 02 66 1 2 1 1 1 4.27 1.35 2.30 1.05 01 472 1 2 1 1 4.19 1.24 2.49 1.65 02 473 2 2 1 1 4.19 1.04 2.43 1.02 02 64 2 2 2 1 1 4.47 1.60 3.01 .95 02 63 1 2 1 1 1 4.23 1.50 4.04 1.14 01 64 1 1 12 1 4.16 1.44 1.63 1.95 01 702 2 1 2 1 4.77 1.08 1.79 2.69 01 48 12 1 1 1 3.78 1.00 1.19 2.63 02 64 2 1 1 1 1 5.20 1.56 1.21 1.28 01 472 2 2 1 2 4.25 1.06 3.34 .94 02 54 4 2 1 1 2 3.56 1.35 1.24 .88 02 57 1 2 1 1 1 4.80 1.26 3.19 .93 01 452 2 1 1 1 4.65 .92 2.99 .79 0 1 62 2 2 1 1 2 4.23 1.15 3.28 1.07 01 52 1 2 2 1 2 3.70 .85 2.55 2.97 02 50 2 2 1 1 1 4.11 1.23 2.54 1.67 02 50 23 2 2 1 3.85 1.35 2.34 1.09 01 58 3 1 1 1 1 3.01 1.08 1.86 1.14 01 54 32 1 2 1 3.02 1.23 1.55 .40 01 60 1 32 1 1 4.16 1.02 2.46 .80 02 60 2 1 1 1 2 5.12 1.31 3.50 1.11 02 63 3 1 1 1 1 4.30 1.40 2.80 .97 01 652 2 2 1 1 3.67 .72 2.29 .66 01 37 32 1 1 1 5.46 1.45 3.56 .94 02 52 2 2 1 1 2 4.35 1.13 3.86 1.11 02 46 13 1 1 1 3.60 .87 2.27 1.00 02 63 1 2 2 1 2 3.16 .68 2.30 1.23 02 63 2 2 2 1 2 3.82 1.36 1.98 1.18 02 603 2 2 1 1 4.63 1.28 2.46 .33 01 582 2 1 1 2 4.05 .85 2.60 .77 0。
医学统计学课后案例分析答案:第9章 关联性分析
第9章关联性分析案例辨析及参考答案案例9-1 有研究者以“正常血糖、糖耐量减低及2型糖尿病人群胰岛素抵抗与非酒精性脂肪肝的相关分析”为题,研究了非酒精性脂肪肝的患病率与糖尿病分级(即正常血糖、糖耐量减低和2型糖尿病三级)的关系。
以正常血糖者、糖耐量减低者和2型糖尿病患者为研究对象,年龄、性别可比,无大量饮酒史、肝炎史,脂肪肝的诊断以影像学结果为准。
指标以均数±标准差表示,统计分析采用两组独立样本比较的t检验。
结果发现,三组血糖、胰岛素、血脂水平等和脂肪肝患病率差别有统计学意义(数据及统计结果见教材表9-7),糖耐量减低组与正常血糖组比较P<0.05,2型糖尿病组与糖耐量减低组比较P<0.05。
结论,随着正常血糖向糖耐量减低及糖尿病发展,血糖、血脂、胰岛素抵抗指数及脂肪肝患病率等指标值皆升高并逐渐加重,差异有统计学意义,认为脂肪肝患病率与血糖水平、血胰岛素、血脂、胰岛素抵抗、糖耐量减低和2型糖尿病等成正相关。
教材表9-7 三种血糖水平人群的血生化及脂肪肝患病率组别例血糖/1Lmmol-⋅胰岛素/1Lmmol-⋅三酰甘油/1Lmmol-⋅总胆固醇/1Lmmol-⋅胰胰素抵抗指数/1Lmmol-⋅脂肪肝患病率/% 空腹餐后空腹餐后正常血糖87 5.0±0.55.6±1.07.4±1.824±8 0.9±0.3 3.0±0.9 0.6±0.5 48.3糖耐量减低62 6.5±0.58.2±1.311.4±2.7134±582.1±1.0 4.6±0.8 1.2±0.7 69.42型糖尿病68 8.3±2.612.5±3.416.8±3.2114±442.6±1.5 5.1±0.8 1.9±0.7 83.8经t检验,糖耐量减低组与正常血糖组比较,以及2型糖尿病与正常血糖组比较,各指标比较的P值均<0.01;而2型糖尿病与糖耐量减低组比较,餐后胰岛素两组比较P<0.05,脂肪肝患病率比较P<0.05,其余各指标比较的P值均<0.01。
医学统计学案例分析.
•
α=0.05
•
2)编秩:首先将两年的疗效按等级强度由小到大编秩
•
3)计算统计量
•
由spss系统得 Z=1.489 p=0.137 p> α, 在α=0.05的
•
水平上不拒绝H0,尚不能认为两年的疗效有差异。
对于住院日和费用的步骤如上述;由SPSS系统得住院日的数据 Z=2.775 P=0.006 P< α 在α=0.05的水平上拒绝H0,尚不能认为两年的住院日没有差 异。由SPSS系统得费用的数据 Z=2.589 P=0.010 P< α 在α=0.05的水平上 拒绝H0,尚不能认为两年的没有差异。
去氧胆酸喂养,经一段时间后,测肝脏脂类总量,数据见表,问两组 大鼠肝脏脂类总量有 8.95
正常饲养组+熊去氧胆 酸
8.91
8.85
8.82
8
8.89
某研究者对该资料做了两独立样本的T检验: t
X1 X 2 1.476
Sc2
1 n1
• 小结
• 卡方检验的用途: • (1)比较两个或多个独立样本频率或独立样本频率分布。
(2)比较配对设计两样本频率分布。 (3)单样本分布的拟合优度。、 注意事项:单项有序的行X列表,不宜用卡方检验比较两组效应,若做卡
方检验能证明各处理组的效应在构成比上有差异。即此种资料采用秩 和检验。
秩和检验的适用条件
•
拒绝H 0,可以认为两者检出率相同;前S1抗原与HBeAg:P>x,
•
不拒绝H0 ,可以认为两者检出率相同;前S1抗原与前S2抗原:
•
P<x,拒绝 H0 ,可以认为两者检出率有差别;
案例分析三
• 某研究者与研究熊去氧胆酸对脂肪肝的发生有无预防作用,将十只雄 性大鼠随机分为两组,一组有正常饲料喂养,另一组用正常饲料+熊
颜虹的医学统计学案例选
颜虹的医学统计学案例选引言在医学领域,统计学被广泛应用于增进医疗技术、患者治疗以及药物研制等方面。
而颜虹作为统计学大师,在医学研究领域上也留下了许多研究成果。
本文将介绍颜虹医学统计学案例,以期为科研工作者提供参考和借鉴。
一、颜虹与慢性疾病患者的生命质量颜虹曾经对慢性疾病的患者生活质量进行了研究分析,研究的对象为美国弗吉尼亚州的慢性疾病患者。
他们的研究表明,慢性疾病的患者在感知自身生命质量时会受到一系列因素的影响,例如患病类型、发展程度、患病持续时间以及患者个人特点等。
此外,研究结果还表明,患者基本的人口统计信息也会影响他们的生命质量体验。
这项研究结果对于了解患者的真实需要以及制定相应的医疗计划具有重要意义。
二、颜虹与乳腺癌药物治疗乳腺癌是女性中非常常见的恶性肿瘤疾病,目前多数乳腺癌伴随着激素受体阳性。
因此,避孕药在乳腺癌治疗中也有重要的应用价值。
而颜虹与其他统计学家合作,对有服用避孕药史的乳腺癌患者进行了药物治疗的研究分析。
结果表明,与未服用避孕药的患者相比,服用避孕药的患者在接收药物治疗时,生存期有所延长,治疗效果更加显著,具有一定的优势。
这一研究结果提供了一定的临床实践指导,尤其对于该疾病的治疗具有重要的指导意义。
三、颜虹与基因组学研究颜虹与其他学者还研究了基因组学在医学诊断和治疗中的应用。
这项研究运用了多项统计学方法,包括拟合模型、整合模型和模型选择等。
结果表明,基因组学分析可以帮助科研人员更好地理解基因间互动关系,从而为疾病的诊断和治疗提供更加准确的方法。
此外,该研究还表明,基因组学分析可以为疾病的预后评估和治疗方案的制定提供参考,具有很深远的意义。
四、颜虹与防止新病例发生颜虹与其他统计学家还研究了防止新病例发生的方法。
他们在对政府公共卫生部门的调研中发现,全面的健康教育和公共卫生宣传可以显著地降低新疾病的发生和流行程度。
比如,研究表明在SARS爆发期间,强制执行口罩佩戴和个人卫生习惯的教育宣传可以显著降低SARS的传播速度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学案例选第一章绪论部分案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。
简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。
你发现了什么问题,应如何修改?你的收获是什么?第二章实验设计部分案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(河南中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。
将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。
请讨论该分组方法是否随机?案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。
而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。
A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩张宫颈后吸宫。
作者认为该法“符合随机分配法则”。
请讨论对照组的设置是否合适?案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。
得出食管pH监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。
原文共收集骨质疏松症患者307例,其中试验组612例使用强骨胶囊,对照组93例使用骨松宝颗粒,其余开放组52例。
但对开放组患者的特征、所用药物、用药方法、观察方法、是否设盲等没有交代。
请讨论3组之间有无可比性?小结1、一项研究设计的内容包括:提出假说,确定研究类型,确定研究对象的范围和数量,计划的实施与质量控制,数据管理,统计分析,结果与讨论。
2、实验设计包括3个基本要素:处理因素、实验对象和实验效应。
3、实验设计必须遵循:对照、随机、重复的基本原则。
研究中所设立的对照组应尽可能达到对等、同步、专设的条件;随机包括3方面的内容,及随机抽样、随机分组和随机实验顺序;重复是指研究结果的重复、观察对象的重复和观察指标的重复。
思考与练习简答题1、研究设计的作用是什么?2、研究设计的基本内容是什么?3、实验设计应该遵循的基本原则是什么?4、实验设计为什么要设立对照?设立对照要注意些什么?5、随机化的含义是什么?目的是什么?6、区组化的目的是什么?第三章观察性研究设计概述案例3-1某地(100万人口)拟开展当地中老年人非胰岛素依赖型糖尿病的现况调查,目的是了解当地糖尿病的流行状况,以及与糖尿病患病相关的危险因素。
调查对象是当地居住超过5年、40岁以上的常住居民。
该研究采取分层、整群随机的抽样方法,将该地区15个镇按城镇或乡村,经济发展水平分成3个层,每层随机抽取2个镇或街道,再从被抽中的镇或街道中随机抽取两个村或居委。
被抽中村或居委的全部40岁以上居民包括原糖尿病患者均参加调查。
调查结果男女两性比例为0.94:1,并划分为5个年龄组,性别和各年龄组构成比与当地人口性别和年龄的分布情况相符。
调查内容包括:①问卷调查:被调查者的一般情况、糖尿病及其他病史、家族史、糖尿病临床表现、饮食调查、吸烟、饮酒情况及体力活动等;②体格检查:包括身高、体重、腰围、臀围及血压等;③血糖测定。
⑴该研究采用的是全面调查还是抽样调查?各有何优缺点?⑵该研究采用的抽样方法有何优点?是否有更好的抽样方法?⑶该研究的设计方案是否合理?请你设计一个研究的方案。
⑷该研究采用的调查表应该包括哪些项目?请你设计该调查表。
小结1、观察性研究是有目的地观察或测量自然接触不同因素人群的结果事件发生状况,通过对比分析发现事件的分布特点与差异,从而获得有关因果假设的启示,为进一步研究提供线索。
2、观察性研究包括描述性研究和分析性研究两大类。
3、横断面研究是按照事先制定的计划,调查特定人群特定时点某种疾病的患病情况,以及与患病有关的因素。
横断面研究的设计要考虑研究目的、对象、调查方法、调查表设计、样本量、组织计划、质量控制和分析计划等。
4、问卷是调查研究中用来收集资料的一种工具,它的形式是一份精心设计好的问题表格,它的用途在于测量人们的行为、态度和特征。
问卷设计的好坏是保证调查质量的关键,本章介绍问卷设计的基本原则和步骤。
5、随机抽样是抽样调查中样本具有代表性和能进行总体参数估计的保证,常用的抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。
简答题1、观察性研究与实验性研究有何异同?二者能否同时使用或结合使用?2、观察性研究主要有哪些方法?各有何优缺点?3、为什么大多数的观察性研究是抽样调查研究?4、根据对全国出生缺陷监测资料的统计分析,发现神经管缺陷的发生具有明显的季节性,表现为1~3月份出生的孩子的发生率比较高。
今欲调查其原因,应采取什么调查方法?请做出完整的调查设计并制定出调查表。
5、欲了解某市乙型病毒性肝炎患病情况及其影响因素,请做一个调查设计。
6、现拟在大学生中进行一项吸烟习惯调查,请你考虑调查问卷应包括哪些项目,并设计出调查问卷。
第四章统计描述案例4-1表4-24是某研究者在一项回顾性调查中收集的部分资料,其目的是研究抗生素的使用效果。
表4-24 某医院内、外科25例住院病人使用抗生素的情况病人编号性别年龄(岁) 入院体温(℃) 入院时白细胞计数(×103) 抗生素使用细菌培养所在科室住院时间1 2 30 37.2 8 2 2 1 52 2 73 36.7 5 2 1 1 103 2 40 37.2 12 2 2 2 64 2 47 36.8 4 2 2 2 115 2 25 36.9 11 2 2 2 56 1 82 36.0 6 1 2 2 147 1 60 37.5 8 1 1 1 308 2 56 37.0 7 2 2 1 119 2 43 36.7 7 2 2 1 1710 1 50 36.7 12 2 1 2 311 2 59 36.4 7 2 1 1 912 1 4 36.6 3 2 2 2 313 2 22 37.5 11 1 2 2 814 2 33 36.9 14 1 1 2 815 2 20 36.9 11 2 1 2 516 1 32 37.2 9 2 2 2 517 1 36 37.3 6 1 2 2 718 1 69 36.7 6 2 2 2 419 1 47 36.1 5 1 2 1 320 1 22 36.8 6 2 2 2 721 1 11 36.8 10 2 2 2 922 2 19 37.0 14 1 2 2 1123 2 67 36.4 4 2 2 1 1124 2 43 37.0 5 2 2 2 9注:性别:1=男,2=女;抗生素使用:1=是,2=否;细菌培养:1=是,2=否;所在科室:1=内科,2=外科。
试分析:⑴构造性别的频数分布表,并绘制性别的频数分布条图;⑵以20岁为组距,构造年龄的频数分布表,并绘制年龄的频数分布直方图;⑶以5天为组距,构造住院时间的频数分布表,并绘制住院时间的频数分布直方图,观察其分布特征;⑷计算住院时间的算术均数、几何均数、中位数;⑸计算住院时间的最大值、最小值、四分位数与四分位数间距;⑹计算住院时间的全距、方差、标准差和变异系数;⑺构造内、外科使用抗生素情况的统计表、条图和圆图;⑻构造内、外科采用细菌培养情况的统计表、条图和圆图;⑼构造内、外科使用抗生素和采用细菌培养情况的统计表、条图和圆图;⑽绘制箱图,比较用与不用抗生素的住院患者住院天数的差异;⑾以住院天数为纵坐标,以年龄为横坐标,绘制散点图;小结1、计量资料的统计描述,主要了解数据的分布范围、集中位置以及分布形态等特征。
大样本数据,需要编制频数分布表,通过频数分布表观察数据的分布特征。
2、频数分布表的主要作用是揭示资料的分布特征;描述其集中趋势和离散趋势,有助于发现数据中远离数据群体的离群值。
3、数据的分布形状分为对称分布与偏态分布。
偏态又分为右偏态和左偏态。
4、描述计量资料集中趋势的平均指标有:算术均数、几何均数、中位数等。
算术均数适合于对称分布资料,几何均数、中位数等。
算术均数适合于对称分布资料,几何均数适用于2右偏态和呈现比例递增的资料,中位数适合于任意分布的资料。
5、描述计量资料离散趋势的变异指标有:全距、方差、标准差和变异系数、四分位数间距等。
其中标准差是最常用的变异指标,适合于对称资料特别是正态分布资料;四分位数间距适合任意分布资料,尤其适合于大样本偏态分布资料。
变异系数主要用于比较几个量纲不同的变量之间的离散程度的差异,也可以用来比较量纲相同但均数相差悬殊的几个变量之间离散程度的差异。
6、描述计数资料基本特征的指标有:比、比例和率。
比可以是任意两个数值之比,包括比和比率。
当分子是分母的一部分时,称为比例;当比例与观察时限有关时,称为率。
比例又分为构成比和频率。
而率与时间单位有关,即率有速率和强度的含义,它表示单位时间某事件发生的可能性大小。
流行病学研究中常用的两个比是相对危险度和优势比(比数比)。
7、内部构成不同的两个率比较时,应计算标准化率。
8、动态数列用来描述一组按照时间顺序排列起来的统计指标,如绝对数、相对数、平均数等,在时间的变化和发展趋势。
9、医学常用统计指标有:人口统计指标、出生与死亡统计指标、生育统计指标、疾病统计指标、期望寿命等。
10、表达统计结果的数表称为统计表。
统计表由标题、标目、线条、数字4部分组成,必要时增加注释。
11、常用统计图有:条图、百分条图、园图、线图、半对数线图、箱图、散点图等,这些统计图所适用的数据类型,绘图目的和有关说明列在表4-25中。
第五章 概率分布案例5-1 一般人群先天性心脏病的发病率为8‰,某研究者为探讨母亲吸烟是否会增大其子女的先天性心脏病发病的危险,对一群20~35岁有吸烟嗜好的孕妇进行了生育考察,在 他们生育的320名子女中,经筛查有4人患先天性心脏病。
试讨论:⑴ 若以X 表示观察中患先天性心脏病的小孩数,X 的分布是什么分布?⑵ 若按人群先天性心脏病的发病率为8‰,计算320名子女中,至少有4名小孩患先天性心脏病的概率。