医学统计学定性资料统计描述思考与练习带答案

合集下载

医药数理统计习题答案解析

医药数理统计习题答案解析

第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。

二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。

三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。

证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。

四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。

医学研究生医学统计学定性资料的统计描述

医学研究生医学统计学定性资料的统计描述

百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
针刺合谷治疗胃痛的效果
疗效 治愈
例数 59
百分 比
(%)
60.82
有效
23
23.71
无效
15
合计
97
15.46
100.0 0
治愈 有效 无效
二、定性资料的描述指标 ——相对数(Relative number)
相对数:两个有联系的指标(数值)之比
相对比 A B
A和B可以是绝对数、平均数,也可以是相对数 A和B的量纲可以相同,也可以不同 A和B彼此分离,互不重叠或包含
如:人口出生性别比;每千人口的医生数、每千 人口的病床数、每医生的门诊工作量、变异系 数等。
人口出生性别比国际上一般以每出生100个女
性人口相对应出生的男性人口的数值来表示。 一般在102~107之间。
频率型指标
某 病 病 死 率 = 同 同 年 年 某 患 病 该 死 病 亡 总 人 数 数 100 %频率型指标
发病率(incidence rate,IR)表示一定时期 内,在可能发生某病的一定人群中新发生某病 的强度。
患病率(prevalence rate, PR)又称为现患 率,指某时点上受检人数中现患某种疾病的频 率,患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
医学研究生医学统计学定性资 料的统计描述
相关概念
定性资料是指将观察单位按照某种属性或类
别进行分组,然后计数各组的观察单位个数 所收集的资料。
根据变量类别之间是否有顺序、等级、大小 关系,分为无序分类变量资料和有序分类变 量资料。

医学统计学复习思考题及参考答案

医学统计学复习思考题及参考答案

预防医学第三篇复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。

总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。

例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。

从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。

抽取样本的目的是用样本的信息推论总体特征。

2.简述3种变量类型的特征。

(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。

第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

2.全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

《医学统计学》资料整理:医学统计学课程思考题及答案

《医学统计学》资料整理:医学统计学课程思考题及答案

医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。

样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。

2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。

3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。

4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。

A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。

A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。

因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。

u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。

校正χ2检验:1<T<5,n>=406、若对照组的样本含量为10,实验组的样本含量为20,观察指标为计量资料,则做两样本均数比较t检验时,其自由度为( C )。

医学统计学(第二版)思考与练习答案

医学统计学(第二版)思考与练习答案

第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。

不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2. 同一资料的标准差不一定小于均数。

均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。

标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。

若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。

不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。

曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。

医学统计学定性资料定量资料习题

医学统计学定性资料定量资料习题

第四章定量资料的统计描述1. 编制频数表时错误的做法是()。

A. 用最大值减去最小值求全距B. 组距常取等组距,一般分为10~15组C. 第一个组段须包括最小值D. 最后一个组段须包括最大值E. 写组段,如“~3,3~5,5~,…”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是()。

A. 中位数B. 几何均数C. 调和均数D. 算术均数E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用()。

A. 变异系数B. 全距C. 标准差D. 四分位数间距E. 百分位数与的间距4. 均数X和标准差S的关系是()。

…A. S越小,X对样本中其他个体的代表性越好B. S越大,X对样本中其他个体的代表性越好C. X越小,S越大D. X越大,S越小E. S必小于X5. 在正态分布条件下表示变量值变异情况的指标最常用的是()。

A. 标准差B. 标准误C. 变异系数D. 全距E. 百分位数6. 变异系数越大说明()。

A. 标准差越大B. 平均数越大C. 标准差、平均数都大D. 平均数小E. 以均数为准变异程度大7. 在服从正态分布),(2σμN条件下,样本标准差S的值()。

A. 与集中位置有关B. 与观察例数n无关C. 与平均数有关%D. 与平均数无关E. 与个体的变异程度有关8. 计算几何均数G时,用常用对数lgX和用自然对数lnX所得计算结果()。

A. 一样B. 不一样C. 有时一样,有时不一样D. 有时相差较大,只能用lgX9. 算术均数与中位数相比,()。

A. 抽样误差更大B. 不易受极端值的影响C. 更充分利用数据信息D. 更适用于分布不明及偏态分布资料10. 比较连续分布数据的离散度,()。

A. 单位相同时根本不能用CVB. 单位相同均数相差较大时根本不能用SC. S表示绝对离散度,CV表示相对离散度。

D. 只要单位相同,用S和用CV都是一样的11. 以中位数表示几种趋势,()资料。

04定性资料的统计描述(医学统计学)

04定性资料的统计描述(医学统计学)
3.正确计算合计率
对观察单位数不等的几个率,其合计率的计算不能将各 个率相加求其平均值,而应该用各率的分子之和除以分母 之和来计算。
4.注意资料的可比性
上例以各层例数的合计作为标准构成,计算得到甲 医院标准化后的总治愈率为
P
' 甲
4130 5000
100%
82.6%
乙医院标准化后的总治愈率为
P'乙
4000 5000
100%
80.0%
由上可见,甲医院标准化后的总治愈率高于乙医院
标准化后的总治愈率。
1. 标准化法的目的是为了消除混杂因素的影响,通过选 择同一参照标准,使算得的标准化率具有可比性。但标准 化率并不代表真实水平,选择的标准不同,计算出的标准 化率也不相同。因此标准化率仅适用于相互间的比较,实 际水平应采用未标化率来反映。
2. 样本的标准化率是样本指标值,亦存在抽样误差, 若要比较其代表的总体标准化率是否不同,需作假设检 验。
练习题
1.经调查得知甲乙两地的冠心病粗死亡率同为40/万,按 年龄构成标化后,甲地冠心病标化死亡率为45/万,乙 地为38/万,因此可认为 A.甲地年龄别人口构成较乙地年轻 B.乙地年龄别人口构成较甲地年轻 C.甲地年轻人患冠心病较乙地多 D.甲地冠心病的诊断较乙地准确 E.乙地冠心病的诊断较甲地准确
死亡率
某年死亡人口总数 同年年平均人口数
1000
同年平均人口为年初人口和年末人口的平均值。
2.年龄别死亡率(age-specific death rate ):表 示某地某年龄组每千人口中的死亡数,它消除了 人口年龄构成不同对死亡水平的影响,计算公式 为
年 龄 别 死 亡 率 某 年同某年地龄某别年平龄均组人死口人 亡数数10000 00

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。

2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。

统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。

统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。

4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。

5答系统误差、随机测量误差、抽样误差。

系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。

6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。

第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。

医学统计学课后习题答案解析

医学统计学课后习题答案解析

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。

要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。

医学统计学试题及答案

医学统计学试题及答案

医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。

答案:小2. 法定代表人同意书中要注明_________。

答案:被代表人的姓名3. 在统计学中,p值代表的是__________。

答案:假设检验的显著性水平4. 方差分析是用来比较__________。

答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。

答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。

请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。

答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。

请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。

答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。

医药数理统计习题答案解析

医药数理统计习题答案解析

第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。

二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。

三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。

证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。

四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。

《医学统计学》习题及答案

《医学统计学》习题及答案

一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学课后习题答案在医学统计学课程中,课后习题是帮助学生巩固和应用课堂所学知识的重要环节。

以下是一些可能的课后习题及其答案,供学习参考。

习题1:某医院对100名患者进行了治疗效果的评估,其中70名患者病情有所改善。

请计算该治疗的有效率。

答案:有效率 = (改善的患者数 / 总患者数) × 100%有效率= (70 / 100) × 100% = 70%习题2:假设某研究中,有200名受试者,其中100名为实验组,接受新药治疗;另外100名为对照组,接受安慰剂。

研究结束时,实验组有30人出现副作用,对照组有10人出现副作用。

请计算两组的副作用发生率,并进行卡方检验,判断两组副作用发生率是否有显著差异。

答案:实验组副作用发生率= (30 / 100) × 100% = 30%对照组副作用发生率= (10 / 100) × 100% = 10%卡方检验计算:期望值 = (总人数× 总副作用数) / 总人数= (200 × 40) / 200 = 40实验组期望值= 40 × (100 / 200) = 20对照组期望值= 40 × (100 / 200) = 20卡方值 = [(30 - 20)^2 / 20] + [(10 - 20)^2 / 20] = 50自由度 = (组数 - 1) = 1卡方分布表中查得,自由度为1时,显著性水平为0.05的卡方临界值为3.841。

由于50 > 3.841,所以拒绝原假设,认为两组副作用发生率有显著差异。

习题3:某研究中,对50名高血压患者进行了血压测量,测量结果如下(单位:mmHg):- 收缩压:120, 130, 140, 150, 160, 170, 180, 190- 舒张压:80, 85, 90, 95, 100, 105, 110, 115请计算收缩压和舒张压的平均值和标准差。

医学统计学课后习题答案解析

医学统计学课后习题答案解析

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。

要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。

医学统计学思考题

医学统计学思考题

医学统计学思考题第一章绪论1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。

总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。

但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。

例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。

随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能够根据样本估计。

显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

医学统计学课后案例分析答案:第8章 定性资料的比较

医学统计学课后案例分析答案:第8章  定性资料的比较

第8章 定性资料的比较 案例辨析及参考答案案例8-1 某单位调查了4类人员乙型肝炎表面抗体(HBsAb )的阳性率,想比较3种病人与健康人群的阳性率有无差别,数据见教材表8-14。

教材表8-14 4类人员乙型肝炎表面抗体(HBsAb )的阳性率 组别 阳性人数阴性人数合计 阳性率/%肝癌病人 肝炎病人 食管癌病人 健康人 17 18 5 3 159 160 142 151 176 178 147 154 9.66 10.11 3.40 1.95 合计436126556.56请大家对本案例讨论如下问题:(1)若看成一个4×2列联表资料进行1次2χ检验,是否能达到分析目的? (2)若将每一种病人与健康人群HBsAb 的检查结果分别组成四格表,进行3次四格表2χ检验,对否?(3)怎样达到分析目的? 案例辨析(1)因为分析目的是“想比较3种病人与健康人群的阳性率有无差别”,进行1次2χ检验,不能达到分析目的。

(2)独立地进行3次四格表2χ检验是不妥的,因为那样做会增大犯假阳性错误的概率。

正确做法(1)就本例而言,对于这个4组二分类资料,当小于5的理论频数的个数少于总格子数的 1/5 时,适合用一般2χ 检验进行总的分析。

其结果是 2χ= 14.148 9,P =0.002 7<0.05,4类人员HBsAb 阳性率之间的差别有统计学意义。

(2)接着作两两比较,原作者较关注3种病人与健康人的HBsAb 比较,其阳性率是否有差异,因此只需比较3次。

但每次比较,对应的检验水准应作调整(见后)。

(3)为了达到前述的统计分析目的,又使犯假阳性错误的概率不增加,应当对每个四格表资料进行假设检验时降低检验水准,即取300803)2(050./.=⨯='α。

于是,肝癌病人和健康人比较2χ=8.577 9,P =0.003 4<0.008 3;肝炎病人和健康人比较2χ= 9.288 3,P = 0.002 3<0.008 3; 食管癌病人和健康人比较校正2χ=0.180 7,P =0.670 7>0.008 3。

医学统计学4. 定性数据的统计描述

医学统计学4. 定性数据的统计描述
计算题
已知健康男童体重近似服从正态分布,某年某地 150名12岁健康男童体重的均数为35kg,标准差为 6kg,试估计
1)该地12岁健康男童体重在50kg以上者占该地12岁健康男 童总数的百分比;
2)该地12岁健康男童体重30-40公斤占该地12岁健康男童的 百分比;
3)该地80%的12岁健康男童集中在哪个范围;
应用相对数的注意事项
例如,某医师对口腔门诊不同年龄龋齿患病情况 (表5-3)进行了分析,得出40~49岁组患病率高, 0~9岁组和70岁及以上组患病率低的错误结论。
年龄组(岁)
0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计
表 5-3 口腔门诊龋齿患者年龄构成
患者人数
患者构成比(%)
一、统计学指标
绝对数:反应实际水平 相对数----两个数值的比,包括: 率 构成比 相对比
(一)率
率:
说明某现象或某事物在它可能发生的范围内实际发 生的频率或强度,又称频率指标或强度指标。
常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10万)等表示,计算公式为:

某时期内实际发生某现象的观察单位数 同时期可能发生某现象的观察单位总数
比例基数
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性
病的发生或流行情况,其计算公式为
某病患病率
某地某时点某病患病例数 该地同期内平均人口数
比例基数
以上比例基数可为100%、1000‰、10000/万、 100000/10万,实际中患病率的分母通常为调查 的总人数,分子为患病的人数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章定性资料的统计描述【思考与练习】一、思考题1.应用相对数时需要注意哪些问题?2. 为什么不能以构成比代替率?3. 标准化率计算的直接法和间接法的应用有何区别?4. 常用动态数列分析指标有哪几种?各有何用途?5. 率的标准化需要注意哪些问题?二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。

该结论是否正确?为什么?三、最佳选择题1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为BA. 率B. 构成比C. 发病率D. 相对比E. 时点患病率2. 标准化死亡比SMR是指AA. 实际死亡数/预期死亡数B. 预期死亡数/实际死亡数C. 实际发病数/预期发病数D. 预期发病数/实际发病数E. 预期发病数/预期死亡数3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。

可计算出这样一些相对数:11395283.18%16774p ==, 2139521936983.08%1677423334p +==+,313952101.86/1013697600p ==万, 416774122.46/1013697600p ==万,523334176.85/1013194142p ==万, 645p p p =+71395219369123.91/101369760013194142p +==+万81677423334149.15/101369760013194142p +==+万该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3pD. 4pE. 5p4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5pD. 6pE. 8p5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5pC. 6pD. 7pE. 8p6. 某地区2000~2005年结核病的发病人数为015,,,a a a ⋯,则该地区结核病在此期间的平均增长速度是DA .0156a a a ⋯+++B.C.D.1-E.7. 经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,发生此现象最有可能的原因是CA. 甲地的诊断技术水平更高B. 乙地的恶性肿瘤防治工作做得比甲地更好C. 甲地的老年人口在总人口中所占比例比乙地多D. 乙地的老年人口在总人口中所占比例比甲地多E. 甲地的男性人口在总人口中所占比例比乙地多 8. 下列不属于相对比的指标是 C A. 相对危险度RR B. 比值比ORC. 病死率D. 变异系数CVE. 性别比9. 计算标准化率时,宜采用间接法的情况是BA.已知被标准化组的年龄别死亡率与年龄别人口数B.已知被标准化组的死亡总数与年龄别人口数C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大四、综合分析题1. 为研究经常吸烟与慢性阻塞性肺病(COPD)的关系,1998~2000年间,某医生收集了356例COPD患者的吸烟史,经常吸烟(日平均1支以上,30年)的COPD 患者有231例;而同时期同年龄段的479名非COPD患者中,经常吸烟的有183例。

试计算两组患者的经常吸烟率,并分析经常吸烟对COPD的影响。

2. 某地居民1998~2004年某病的死亡率资料如表5-1所示,试作动态分析。

表5-1 某地居民1998~2004年某病死亡率(1/10万)年份1998~ 1999~ 2000~ 2001~ 2002~ 2003~ 2004~死亡率160.5 144.2 130.0 120.2 85.6 69.5 38.5 3.对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如表5-2所示,试比较该地男、女HBsAg阳性率。

表5-2某地不同年龄、性别人群的HBsAg阳性率(%)年龄组(岁)男性女性检查数阳性数阳性率检查数阳性数阳性率0~ 521 12 2.30560 13 2.3220~ 516 14 2.71957 26 2.7240~ 710 43 6.06836 54 6.4660~ 838 63 7.52570 49 8.60合计2585 132 5.112923 142 4.86【习题解析】一、思考题1.①计算相对数应有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。

2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。

构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。

两者在实际应用时容易混淆,要注意区别。

3. 对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。

4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。

5. ①标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。

但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不相同。

因此标准化率是用于相互间的比较,实际水平应采用未标化率来反映。

②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。

③注意标准化方法的选用。

如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。

但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。

④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。

此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。

二、案例辨析题该结论不正确。

因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。

三、最佳选择题1. B2. A3. D4. E5. D6. D7. C8. C9. B四、综合分析题1. 解:表5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系分组调查人数经常吸烟经常吸烟率(%) 是否COPD患者356 231 125 64.89 非COPD患者479 183 296 38.20 COPD患者的经常吸烟率:231/356×100%=64.89%非COPD患者经常吸烟率:183/479×100%=38.20%COPD 患者的经常吸烟率比非COPD 患者高26.69%231296=2.989125183OR 比值比()⨯=⨯还需进一步对OR 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。

SPSS 操作 数据录入:打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,case 表示分组(0为非COPD 患者,1为COPD 患者),smok 表示吸烟情况 (0为非经常吸烟,1为经常吸烟),freq 表示频数;再点击Data View 标签,录入数据(见图5-1,图5-2)。

图5-1 Variable View 窗口内定义要输入的变量case 、smok 和freq图5-2 Data View 窗口内录入数据分析:Data →Weight Cases…Weight Cases by : Frequency 框:freq OKAnalyze → Descriptive Statistics →Crosstabs Rows 框:case Columns 框:smok Statistics :RiskContinue OK输出结果分组 * 吸烟情况 Cros s tabulationCount296183479125231356421414835非COPD 患者COPD 患者分组Total不吸烟吸烟吸烟情况TotalRis k Estimate2.989 2.2473.9761.760 1.503 2.061.589.513.675835Odds Ratio for 分组 (非COPD 患者 / COPD 患者)For cohor t 吸烟情况 = 非经常吸烟For cohor t 吸烟情况 = 经常吸烟N of Valid CasesValue Low er Upper 95% Confidence Interval2. 解:表5-4 某地居民1998~2004年某病死亡率(1/10万)动态变化年份 符号 死亡率 绝对增长量发展速度增长速度累计 逐年 定基比 环比 定基比 环比 1998~ a 0 160.5 — ——— — — 1999~ a 1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.10 2000~ a 2 130.0 -30.5 -14.2 0.81 0.90 -0.19 -0.10 2001~a 3120.2-40.3-9.80.750.92-0.25-0.082002~ a 4 85.6 -74.9 -34.6 0.53 0.71 -0.47 -0.29 2003~ a 5 69.5 -91 -16.1 0.43 0.81 -0.57 -0.19 2004~a 638.5-122-310.240.55-0.76-0.45该病死亡率的平均发展速度0.79== 该病死亡率的平均增长速度=1=0.791=0.21---平均发展速度3. 解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg 阳性率的影响,应先进行标准化再进行比较。

相关文档
最新文档