医学统计学定性统计描述思考与练习带答案
医药数理统计习题答案解析
第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
医学统计学李晓松主编第2版高等教育出版社附录第3章思考与练习答案.doc
第三章实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。
内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。
据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。
该结论是否正确?如果不正确,请说明理由。
三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复B. 随机化、对照、盲法C. 随机化、重复、盲法D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。
7天后观察两组幼猪的存活情况。
该研究采用的是A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照5. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。
医学统计学复习思考题及参考答案
预防医学第三篇复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述3种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
2.全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。
《医学统计学》教材后面的练习题及答案
《医学统计学》教材后面的练习题及答案《医学统计学》各章练习题与答案第一章医学统计中的基本概念一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《医学统计学》资料整理:医学统计学课程思考题及答案
医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。
医学统计学(第二版)思考与练习答案
【习题解析】
一、思考题
1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。
105.85
8.60
121.04
合计
5508(N)
5.11
264( )
4.86
286( )
男性HBsAg标准化阳性率:
女性HBsAg标准化阳性率:
可见,经标准化后女性HBsAg阳性率高于男性。
输出结果
注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。
2.同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
逐年
定基比
环比
定基比
环比
1998~
a0
160.5
—
—
—
—
—
—
1999~
a1
144.2
-16.3
-16.3
0.90
0.90
-0.10
-0.10
2000~
a2
130.0
-30.5
-14.2
0.81
定性资料的比较思考与练习参考答案
定性资料的⽐较思考与练习参考答案第8章定性资料的⽐较思考与练习参考答案⼀、最佳选择题1. 定性资料的统计推断常⽤( D )。
A.检验B. 正态检验C.检验D.检验E. t′检验2. 两组⼆分类资料发⽣率⽐较,样本总例数100,则检验⾃由度为(A)。
A. 1B. 4C. 95D. 99E. 1003. 四格表检验中, <,可以认为(B)。
A. 两总体率不同B. 不能认为两总体率不同C. 两样本率不同D. 不能认为两样本率不同E. 以上都不对4.等级资料⽐较宜采⽤(E)。
A.检验B.检验C.检验D. 正态检验E. 秩和检验5. 为⽐较治疗某病的新疗法与常规⽅法,试验者将100名患者按性别、年龄等情况配成对⼦,分别接受两疗法治疗。
观察得到有28对患者同时有效,5对患者同时⽆效,11对患者新药有效常规治疗⽆效。
欲⽐较两种疗法的有效率是否相同,应选择的统计分析⽅法为(D)。
A. 独⽴的两组⼆分类资料⽐较检验B. 独⽴的两组⼆分类资料⽐较校正检验C. 配对的两组⼆分类资料⽐较检验D.配对的两组⼆分类资料⽐较校正检验E. Fisher确切概率法1. 简述检验适⽤的数据类型。
答:提⽰:卡⽅检验是应⽤较⼴的⼀种定性资料的假设检验⽅法,常⽤于检验两个或多个样本率(或构成⽐)之间有⽆差别。
2. 两组⼆分类资料的设计类型有⼏类?其相应的检验⽅法是什么?答:提⽰:两组⼆分类资料的设计类型主要有2类,即完全随机设计和配对设计。
完全随机设计和配对设计资料在假设检验⽅法上均采⽤卡⽅检验。
完全随机设计资料应⽤公式(8-1)或(8-4),配对设计资料应⽤公式(8-7)或(8-8)。
3. 什么资料适合⽤秩和检验进⾏检验?简述秩和检验步骤。
答:提⽰:进⾏有序资料的⽐较时宜采⽤秩和检验。
秩和检验步骤为:①建⽴假设,并确定检验⽔准;②根据不同的设计类型对资料进⾏编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定值下结论。
医学统计学定性资料统计描述思考与练习带答案
第五章定性资料的统计描述【思考与练习】一、思考题1. 应用相对数时需要注意哪些问题?2. 为什么不能以构成比代替率?3. 标准化率计算的直接法和间接法的应用有何区别?4. 常用动态数列分析指标有哪几种?各有何用途?5. 率的标准化需要注意哪些问题?二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98 )、52.0%(51/98)和17.4%(17/98)。
该结论是否正确?为什么?三、最佳选择题1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为BA. 率B. 构成比C. 发病率D. 相对比E. 时点患病率2. 标准化死亡比SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D. 预期发病数/实际发病数E. 预期发病数/预期死亡数3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死13952 人,P i 腔83.18%,P21677413952 193691677483.08%,2333413952P313697600 101.86/10 万P416774122.46/10P52333413194142176.85/10万P6 P4 P5P713952 1936913697600 13194142123.91/10 万亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性女性19369人。
可计算出这样一些相对数:P 816774 2333413697600 13194142 149.15/10 万该地男性居民五种心血管疾病的死亡率为D A. P1B. P2C. P3D. P4E. P54. 根据第3题资料,该地居民五种心血管病的总死亡率为EA. P1B. P2C.p6D. P 7E. P 86. 某地区2000~2005年结核病的发病人数为a o ,a i , ,a 5,则该地区结核病在此期间的平均增长速度是Da 。
医学统计学习题答案
习题答案第一章思考题答案1.某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么a)A药组的疗效高于B药组。
(对,但不提倡这样说,原因是容易被误解)b)A药的疗效高于B药。
(不对,这是针对总体而言的)2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
(对)b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。
(不对,一次考试只是一次抽样的结果)c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。
(对)d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体A,B班所有学生的这次考试成绩构成了一个总体B。
(对)3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么a)如果变量取值中含有小数点,则该变量为连续型变量。
(不对,离散型变量取值也可以定义为取值含有小数点)b)如果资料为离散型变量的取值,则该资料一定为分类资料。
(不对,如白细胞计数,这是离散型的资料,但不具有分类性质)c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。
根据定义,应认为该资料为计量资料。
(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)第二章习题的答案1. 是非题(1) 不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
(错)(2) 少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
医药数理统计习题答案解析
第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
医学统计学课后习题答案
医学统计学课后习题答案医学统计学课后习题答案在医学领域中,统计学是一门非常重要的学科。
通过统计学的方法,我们可以对医学数据进行分析和解释,从而得出科学的结论和推断。
在医学统计学的学习过程中,课后习题是非常重要的一环。
通过解答习题,我们可以巩固所学的知识,并且更好地理解统计学的应用。
下面是一些医学统计学课后习题的答案,希望对大家的学习有所帮助。
1. 什么是样本均值和总体均值?它们之间有什么区别?样本均值是指从总体中抽取的一组样本数据的平均值。
总体均值是指整个总体中所有个体的平均值。
样本均值是对总体均值的估计。
区别:样本均值是通过抽样得到的估计值,而总体均值是真实的未知参数。
样本均值可以通过多次抽样得到不同的值,而总体均值是固定的。
2. 什么是标准差和方差?它们之间有什么关系?标准差是指一组数据的离散程度或者分散程度。
方差是标准差的平方。
关系:标准差是方差的平方根。
3. 什么是假设检验?在医学研究中有什么应用?假设检验是一种统计学方法,用于对两个或多个样本数据进行比较,从而判断它们之间是否存在显著差异。
在医学研究中,假设检验可以用于判断某种治疗方法是否有效,或者某种药物是否有副作用等。
4. 什么是P值?如何解释P值?P值是指在假设检验中,根据观察到的样本数据计算得到的一个概率值。
P值可以用来判断观察到的差异是否由随机因素引起。
解释P值:如果P值小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为观察到的差异是显著的。
如果P值大于显著性水平,则不能拒绝原假设,认为观察到的差异可能是由随机因素引起的。
5. 什么是置信区间?如何解释置信区间?置信区间是指对总体参数的一个估计范围。
置信区间由一个下限和一个上限组成。
解释置信区间:例如,对于一个置信水平为95%的置信区间,意味着在多次抽样中,有95%的置信区间会包含真实的总体参数值。
置信区间越窄,对总体参数的估计越准确。
6. 什么是卡方检验?在医学研究中有什么应用?卡方检验是一种用于比较两个或多个分类变量之间是否存在关联的统计方法。
《医学统计学》习题及答案
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
医学统计学练习及参考答案
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。
医学统计学课后习题答案
医学统计学课后习题答案在医学统计学课程中,课后习题是帮助学生巩固和应用课堂所学知识的重要环节。
以下是一些可能的课后习题及其答案,供学习参考。
习题1:某医院对100名患者进行了治疗效果的评估,其中70名患者病情有所改善。
请计算该治疗的有效率。
答案:有效率 = (改善的患者数 / 总患者数) × 100%有效率= (70 / 100) × 100% = 70%习题2:假设某研究中,有200名受试者,其中100名为实验组,接受新药治疗;另外100名为对照组,接受安慰剂。
研究结束时,实验组有30人出现副作用,对照组有10人出现副作用。
请计算两组的副作用发生率,并进行卡方检验,判断两组副作用发生率是否有显著差异。
答案:实验组副作用发生率= (30 / 100) × 100% = 30%对照组副作用发生率= (10 / 100) × 100% = 10%卡方检验计算:期望值 = (总人数× 总副作用数) / 总人数= (200 × 40) / 200 = 40实验组期望值= 40 × (100 / 200) = 20对照组期望值= 40 × (100 / 200) = 20卡方值 = [(30 - 20)^2 / 20] + [(10 - 20)^2 / 20] = 50自由度 = (组数 - 1) = 1卡方分布表中查得,自由度为1时,显著性水平为0.05的卡方临界值为3.841。
由于50 > 3.841,所以拒绝原假设,认为两组副作用发生率有显著差异。
习题3:某研究中,对50名高血压患者进行了血压测量,测量结果如下(单位:mmHg):- 收缩压:120, 130, 140, 150, 160, 170, 180, 190- 舒张压:80, 85, 90, 95, 100, 105, 110, 115请计算收缩压和舒张压的平均值和标准差。
医学统计学(李晓松主编第2版高等教育提高出版社)附录思考与理解练习95%答案解析
一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 ➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
医学统计学习题答案1
习题答案第一章思考题答案1.某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么?a)A药组的疗效高于B药组。
(对,但不提倡这样说,原因是容易被误解)b)A药的疗效高于B药。
(不对,这是针对总体而言的)2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么?a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
(对)b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。
(不对,一次考试只是一次抽样的结果)c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。
(对)d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体A,B班所有学生的这次考试成绩构成了一个总体B。
(对)3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么?a)如果变量取值中含有小数点,则该变量为连续型变量。
(不对,离散型变量取值也可以定义为取值含有小数点)b)如果资料为离散型变量的取值,则该资料一定为分类资料。
(不对,如白细胞计数,这是离散型的资料,但不具有分类性质)c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。
根据定义,应认为该资料为计量资料。
(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)第二章习题的答案1. 是非题(1) 不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
(错)(2) 少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习95%答案
一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 2.非参数检验➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章定性资料的统计描述【思考与练习】一、思考题1.应用相对数时需要注意哪些问题2. 为什么不能以构成比代替率3. 标准化率计算的直接法和间接法的应用有何区别4. 常用动态数列分析指标有哪几种各有何用途5. 率的标准化需要注意哪些问题二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为%(30/98)、%(51/98)和%(17/98)。
该结论是否正确为什么三、最佳选择题1. 某地2006年肝炎发病人数占当年传染病发病人数的%,该指标为BA. 率B. 构成比C. 发病率D. 相对比E. 时点患病率2. 标准化死亡比SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D. 预期发病数/实际发病数E. 预期发病数/预期死亡数3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。
可计算出这样一些相对数:11395283.18%16774p ==, 2139521936983.08%1677423334p +==+,313952101.86/1013697600p ==万, 416774122.46/1013697600p ==万,523334176.85/1013194142p ==万, 645p p p =+71395219369123.91/101369760013194142p +==+万81677423334149.15/101369760013194142p +==+万该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3pD. 4pE. 5p4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1pB. 2pC. 5pD. 6pE. 8p5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5p C. 6pD. 7pE. 8p6. 某地区2000~2005年结核病的发病人数为015,,,a a a ⋯,则该地区结核病在此期间的平均增长速度是D A .0156a a a ⋯+++B.C.D.1-E.7. 经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为10万,但经过标准化后甲地恶性肿瘤的死亡率为10万,而乙地为10万,发生此现象最有可能的原因是CA. 甲地的诊断技术水平更高B. 乙地的恶性肿瘤防治工作做得比甲地更好C. 甲地的老年人口在总人口中所占比例比乙地多D. 乙地的老年人口在总人口中所占比例比甲地多E. 甲地的男性人口在总人口中所占比例比乙地多8. 下列不属于相对比的指标是 CA. 相对危险度RRB. 比值比ORC. 病死率D. 变异系数CVE. 性别比9. 计算标准化率时,宜采用间接法的情况是BA.已知被标准化组的年龄别死亡率与年龄别人口数B.已知被标准化组的死亡总数与年龄别人口数C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大四、综合分析题1. 为研究经常吸烟与慢性阻塞性肺病(COPD)的关系,1998~2000年间,某医生收集了356例COPD患者的吸烟史,经常吸烟(日平均1支以上,30年)的COPD患者有231例;而同时期同年龄段的479名非COPD患者中,经常吸烟的有183例。
试计算两组患者的经常吸烟率,并分析经常吸烟对COPD的影响。
2. 某地居民1998~2004年某病的死亡率资料如表5-1所示,试作动态分析。
表5-1 某地居民1998~2004年某病死亡率(1/10万)年份1998~1999~2000~2001~2002~2003~2004~死亡率3.对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如表5-2所示,试比较该地男、女HBsAg阳性率。
表5-2 某地不同年龄、性别人群的HBsAg阳性率(%)年龄组(岁)男性女性检查数阳性数阳性率检查数阳性数阳性率0~521125601320~516149572640~710438365460~8386357049合计25851322923142【习题解析】一、思考题1.①计算相对数应有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。
2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
两者在实际应用时容易混淆,要注意区别。
3. 对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。
5. ①标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。
但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不相同。
因此标准化率是用于相互间的比较,实际水平应采用未标化率来反映。
②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意标准化方法的选用。
如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。
但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。
④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。
此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
二、案例辨析题该结论不正确。
因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题1. B2. A3. D4. E5. D6. D7. C8. C9. B四、综合分析题 1. 解:表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系分 组调查人数经常吸烟经常吸烟率(%)是否 COPD 患者 356 231 125 非COPD 患者479183296COPD 患者的经常吸烟率:231/356×100%=% 非COPD 患者经常吸烟率:183/479×100%=% COPD 患者的经常吸烟率比非COPD 患者高%231296=2.989125183OR 比值比()⨯=⨯还需进一步对OR 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
SPSS 操作 数据录入:打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,case 表示分组(0为非COPD 患者,1为COPD 患者),smok 表示吸烟情况 (0为非经常吸烟,1为经常吸烟),freq表示频数;再点击Data View标签,录入数据(见图5-1,图5-2)。
图5-1 Variable View窗口内定义要输入的变量case、smok和freq图5-2 Data View窗口内录入数据分析:Data→Weight Cases…Weight Cases by:Frequency 框:freqOKAnalyze→ Descriptive Statistics→CrosstabsRows框:caseColumns 框:smok Statistics : RiskContinue OK输出结果分组 * 吸烟情况 Cros s tabulationCount296183479125231356421414835非COPD 患者COPD 患者分组Total不吸烟吸烟吸烟情况TotalRis k Estimate2.989 2.2473.9761.760 1.503 2.061.589.513.675835Odds Ratio for 分组 (非COPD 患者 / COPD 患者)For cohor t 吸烟情况 = 非经常吸烟For cohor t 吸烟情况 = 经常吸烟N of Valid CasesValue Low er Upper 95% Confidence Interval2. 解:表5-4 某地居民1998~2004年某病死亡率(1/10万)动态变化年份 符号 死亡率绝对增长量发展速度 增长速度累计 逐年 定基环比 定基环比 1998~ a 0 ——————1999~ a 1 2000~ a 2 2001~ a 3 2002~a 42003~ a 5 -912004~a 6-122-31该病死亡率的平均发展速度0.79== 该病死亡率的平均增长速度=1=0.791=0.21---平均发展速度3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg 阳性率的影响,应先进行标准化再进行比较。
根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。
表5-5 直接法计算某地不同年龄、性别人群的HBsAg 标准化阳性率(%) 年龄组标准人口数i N男性女性原阳性率 i p预期阳性数i i N p原阳性率i p预期阳性数i i N p0~ 1081 20~ 1473 40~ 1546 60~ 1408合 计5508(N )264 (i i N p ∑)286(i i N p ∑)男性HBsAg 标准化阳性率:264100% 4.79%5508p '=⨯= 女性HBsAg 标准化阳性率:286100% 5.19%5508p '=⨯= 可见,经标准化后女性HBsAg 阳性率高于男性。