医学统计学复习思考题及参考答案(精品)
医学统计学课后习题答案解析
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学复习题三及答案
医学统计学复习题三一、名词解释1.可信区间在参数估计时,按一定可信度估计所得的总体参数所在的范围2.统计推断随机事件是否发生虽然不确定的,但应用统计方法,通过对局部的观察可发现其有统计规律性3.参数估计用样本统计量来估计总体参数,包括点值估计和区间估计4.构成比又称构成指标。
它说明一事物内部各组成部分所占的比重或分布。
构成比=(某一组成部分的观察单位数/同一事物各组成的观察单位总数)×100% 5.率又称频率指标。
它说明某现象发生的频率或强度。
率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K6.抽样误差:由于抽样原因引起样本率与总体率的差别7.直线相关系数也称Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相关系数二、单项选择1.观察单位为研究中的( a)。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( d )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是( b )。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( e ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.抽样的目的是( b )。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征7.表示总体均数的符号是( b ) 。
A.σB.μC.XD.SE.M8.下述( c )种资料为计量资料。
医学统计学复习思考题及参考答案
预防医学第三篇复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述3种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述1.均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
2.全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。
《医学统计学》复习资料与习题答案
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《医学统计学》复习资料与习题答案《医学统计学》复习资料与习题答案教学提要(一)《医用统计学》基本概念 1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资1 / 9料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤 1、设计: 这是关键的一步。
(完整)医学统计学复习(练习及答案)
第1题:下列有关等级相关系数ts的描述中不正确的是A。
不服从双变量正态分布的资料宜计算rSB。
等级数据宜计算rsC。
rs值-1~+1之间D.查rs界值表时, rs值越大,所对应的概率P值也越大E。
当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A。
两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C。
两变量肯定不存在相关关系D.两变量间存在相关关系E。
就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。
A.95%的正常值在此范围B。
95%的样本率在此范围C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E。
样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。
A。
样本越大越好B.样本越小越好C。
保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。
A.r值的范围在—1~+1之间B.已知r来自ρ≠0的总体,则r〉0表示正相关, r<0表示负相关C。
已知Y和X相关,则必可计算其直线回归方程D。
回归描述两变量的依存关系,相关描述其相互关系E.r无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B。
受二个独立条件限制C。
受三个独立条件限制D。
受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。
A. tb≠trB. tb=trC. tb〉trD。
tbE。
视具体情况而定第8题:为了由样本推断总体,样本应该是。
A。
总体中任意的一部分B.总体中的典型部分C。
总体中有意义的一部分D。
总体中有价值的一部分E。
总体中有代表性的一部分第9题:以下检验方法属非参数法的是。
医学统计学习题答案
习题答案第一章思考题答案1.某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么a)A药组的疗效高于B药组。
(对,但不提倡这样说,原因是容易被误解)b)A药的疗效高于B药。
(不对,这是针对总体而言的)2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
(对)b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。
(不对,一次考试只是一次抽样的结果)c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。
(对)d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体A,B班所有学生的这次考试成绩构成了一个总体B。
(对)3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么a)如果变量取值中含有小数点,则该变量为连续型变量。
(不对,离散型变量取值也可以定义为取值含有小数点)b)如果资料为离散型变量的取值,则该资料一定为分类资料。
(不对,如白细胞计数,这是离散型的资料,但不具有分类性质)c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。
根据定义,应认为该资料为计量资料。
(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)第二章习题的答案1. 是非题(1) 不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
(错)(2) 少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
医学统计学第5章 假设检验思考与练习参考答案
第5章 假设检验思考与练习参考答案一、最佳选择题1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。
A.0.01α=B. 0.05α=C. 0.10α=D. 0.20α=E. 0.30α=2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t =3.24,t 0.05,v =2.086, t 0.01,v =2.845。
正确的结论是( E )。
A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是( A )。
A. 建立假设,选择和计算统计量,确定P 值和判断结果B. 建立无效假设,建立备择假设,确定检验水准C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误D. 计算统计量,确定P 值,作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。
A. 统计量t 越大,说明两总体均数差别越大B. 统计量t 越大,说明两总体均数差别越小C. 统计量t 越大,越有理由认为两总体均数不相等D. P 值就是αE. P 值不是α,且总是比α小5. 下列( E )不是检验功效的影响因素的是:A. 总体标准差σB. 容许误差δC. 样本含量nD. Ⅰ类错误αE. Ⅱ类错误β二、思考题1.试述假设检验中α与P 的联系与区别。
答:α值是决策者事先确定的一个小的概率值。
P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。
P ≤α时,拒绝0H 假设。
2. 试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
大学《医学统计学》课后习题汇总及答案解析
1. 0101. 医学统计学研究的对象是:A.医学中的小概率事件B.各种类型的数据C.疾病的预防与治疗D.有变异的医学现象2. 0102. 用样本推论总体,具有代表性的样本通常指的是:A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.依照随机原则抽取总体中的部分个体3. 0103.下列观测结果属于有序数据的是:A.收缩压测量值B.脉搏数C.住院天数D.病情程度4. 0104.随机误差指的是:A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差5. 0105.系统误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差6. 0106.抽样误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差7. 0107.收集资料不可避免的误差是:A.随机误差B.系统误差C.过失误差D.记录误差8. 0108.统计学中所谓的总体通常指的是:A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据9. 0109.统计学中所谓的样本通常指的是:A.可测量的生物样品B.统计量C.数据中有代表性的一部分D.总体中有代表性的部分观察单位10. 0111统计学的主要作用是:A. 使分析更为简单B. 避免计算出现错误C. 改善数据质量D.探测随机现象的规律11. 0112概率描述的是:A.总体具有的特征B.数据具有的特征C.随机事件发生的可能性D.随机现象的规律性12. 0114.统计描述结果的主要表达方式是:A.统计指标、统计表和统计图B.描述数据特征C.概率分布D.抽样误差13. 0201.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A中位数 B.几何均数 C.均数 D.P百分位数9514. 0202.算术均数与中位数相比,其特点是:A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料15. 0203.将一组定量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.能够更精确地检验D. 描述数据的分布特征16. 0205. 变异系数主要用:A.比较不同计量指标的变异程度 B衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度17. 0206.对于正态或近似正态分布的资料,描述其变异程度应选用的指标A.变异系数B. 离均差平方和C.极差D. 标准差18. 0207.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应用:A. 四分位数间距B.标准差C.变异系数D.方差19. 0208.一组原始数据的分布呈正偏态分布,其数据的特点是:A.数值离散度大B.数值离散度小C.数值偏向较大的方向D.数值偏向较小的方向20. 0210在衡量数据的变异度时,标准差与方差相比,其主要特点是:A.标准差小于方差 C.标准差更容易计算C.标准差更为准确D. 标准差的计量单位与原始数据相同21. 0213.比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是:A.标准差B.百分位数C.极差D. 变异系数22. 0214.中位数与算数均数相比,其特点是:A.容易计算B.计算出的结果更为可靠C.不易受异常值影响D.更适合对称分布的数据23. 0301.正态曲线拐点所对应的横坐标为:A.⎺X±SB. μ±σC. X±2SD. μ±1.96σ24. 0302.标准正态分布的形状参数和位置参数分别为:A 0,1B 1,0C μ,σD σ,μ25. 0303.正态分布N(μ,σ2),当μ恒定时,σ越大则:A.曲线沿横轴越向左移动B. 曲线形状和位置不变C.曲线越“瘦高”D.曲线越“矮胖”26. 0305.正态曲线下,横轴上从均数到+∞的面积为A.50%B.95%C.97.5%D.99%27. 0306. 若随机变量X服从N(μ,σ2 )的正态分布,则X的第97.5百分位数等于()A. μ+1.96σB.μ-1.64σC.μ-σD.μ+1.64σ28. 0308.某项指标95%医学参考值范围表示的是:A.在此范围“异常"的概率大于或等于95%B.在此范围“正常"的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围29. 0309.确定某项指标的医学参考值范围时,“正常人”指的是:A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人30. 0311.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是:A.用均数来评价 B 用参考值范围来评价C.用几何均数来评价D.用变异系数来评价31. 0401 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是( )A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少32. 0402.计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数33. 0403.计算标准化死亡率的目的是( )A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响34. 0406.相对危险度RR的计算方法是( )A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同条件下某疾病发生的概率之比35. 0407.比数比OR值表示的是( )A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同条件下某疾病发生的危险性程度36. 0408.计算患病率时的平均人口数的计算方法是( )A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末的人口数D.生活满一年的总人口数37. 0409.死因构成比反映的是( )A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性38. 0410.患病率与发病率的区别是( )A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.患病率与病程有关39. 0412.某地某年肝炎发病人数占同年传染病人数的10.1%,该指标属于( )A.相对比B.构成比C.发病率D.传染率40. 0413.某医师对其所在科室近5年某病住院患者进行了统计,结果发现该病患者农村人口200人,城镇人口50人,分别占80%与20%,则结论为( )A.农村人容易患该病B.城镇人容易患该病C农村城镇都易患该病 D.尚不能得出结论41. 0501统计表的主要作用是()A.便于形象描述和表达结果B.客表达验的原始数据C. 代替冗长的文字述和便于分析对比D.容易进行统计述和推断42. 0502.述某疾病患者年龄(岁)的分布,采用的统计图是()A.线图B.条图C.百分条图D.直方图43. 0503.高血压临床试验分为试验组和对照组分析考治疗0周、2周、4周6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数图B.线图C.条图D.直方图44. 0505.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图45. 0506.下列统计图适用于构成比关系的()A.直方图B.箱式图C.误差条图、条图D.圆图、圆百分条46. 0507.对有些资料构造统计表时下列可以省略的是()A.标题B.标目 C线条 D.备注47. 0509.描述某现象频数分布情况应选择的是( )A.圆图B.百分条图C.箱式图D.直方图48. 0601.样本均数的标准误越小说明A.观察个体的变异越小B.由样本均数估计总体均数的可靠性越大C.由样本均数估计总体均数的可靠性越小D.抽样误差越大49. 0602抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C资料不是正态分布 D.个体差异及抽样50. 0603.要减少抽样误差,通常的做法是A.减小系统误差B.将个体变异控制在一定范围内C减小标准差 D.适当增加样本含量51. 0604.对于正偏态分布的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布52. 0606.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109-9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C. 该区间包含总体均数的可能性为95%D.该区间包含样本均数的可能性为95%53. 0607.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L该地正常成年人血清胆固醇均数95%的可信区间是A.3.64±1.96×1.20B.3.64±1.20C.3.64±1.96×1.20/√200D.3.64±2.58×1.20/√20054. 0609.假设检验差别有统计学意义时,P越小,说明A.样本均数差别越大B.总体均数差别越大C认为样本之间有差别的统计学证据越充分 D.认为总体之间有差别的统计学证据越充分55. 0610.关于假设检验,正确的说法是A检验水准必须设为0.05 B必须根据样本大小选择检验水准C必须采用双侧检验 D.必须建立无效假设56. 0611假设检验水准a指的是A.检验的置信度B.控制Ⅱ类错误的概率C.控制1类错误的概率D.无效假设的概率57. 0613.假设检验中的P值的含义是A.总体间有差别时出现现有样本及极端情况的概率B.总体间无差别时出现现有样本及极端情况的概率C.总体间有差别时H成立的概率D.总体间无差别时H成立的概率58. 0701.两样本均数之差的标准误反映的是A.两样本数据集中趋势的差别B. 两样本数据的变异程度C. 两样本均数之差的变异程度D. 数据的分布特征59. 0702. 两样本均数比较,检验结果P>0.05说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论60. 0706.增加t检验的检验效能,应该使用的方法是A.减小I类错误B.减小测量的系统误差C.减小测量的随机误差D. 增加样本量61. 0707. 以下不能用配对t检验方法的是(C)A比较15名肝癌患者癌组织和癌旁组织中Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者癌组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后后糖化血红蛋白的变化62. 0709. 对于配对设计的t检验,其检验假设H0是A. 两样本均数相同B. 配对数据的差值总体均数为0C.两总体均数相同D.两总体均数不同63. 0801.方差分析的基本思想是A.组间均方大于组内均方B.组内均方大于组件均方C.不同来源的方差必须相等D.总变异及其自由度可按不同来源分解64. 0802.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差等于组间方差D.总方差等于各组方差之和65. 0803.完全随机设计方差分析中的组间均方反映的是A.某因素效应大小B.随机测量误差大小C.全部数据的离散度D.处理因素效应与随机误差综合结果66. 0806 完全随机设计的多个样本均数比较,经方差分析,若P<0.05,则结论为:A 各样本均数全相等B 各样本均数全不相等C 至少有两个样本均数不等D 至少有两个总体均数不等67. 0814 在完全随机设计资料的方差分析中,已知总样本量为60,分为4个不同的处理组,则组内变异的自由度为A 3B 56C 57D 5968. 0901. 两样本率比较,差别具有统计学意义时,P值越小说明A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同69. 0907当四个表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是A 增大B 减小C 不变D 不确定70. 0911. 卡方检验的基本思想是A. 对总变异进行分解计算X2值B.根据总体间差别的大小计算X2值C.根据样本配对的情况计算X2值D.根据实际频数和理论频数的差异计算X2值71. 0912. 对三行四列表资料作X2检验,自由度为A. 1B. 2C. 6D. 372. 1001.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息73. 1010 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次为A 0.2B 1.0C 5.0D 3.074. 1011. 两样本比较的秩和检验,其应用条件是A. 两样本服从正态分布B. 两总体服从正态分布C. 两样本方差齐同D. 不受任何条件限制75. 1013.配对资料的符号秩和检验的无效假设是A. 两组配对的差值中位数为零B.两总体均数相同C.两总体分布位置相同D.两组配对的差值均数为零76. 1101,两数值变量的相关关系越强,对应的是A 相关系数越大B 回归系数越大C 相关系数的绝对值越大D 回归系数的绝对值越大77. 1105,1~17岁儿童可以用年龄(岁)估计体重(市斤)回归方程为y ^=14+4x,若将体重换成国际单位kg,则此方程A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变78. 1106,对同一资料进行线性回归与相关分析时,下列正确的情形是A ρ=0时,r=0B ρ>0时,b>0C r>0时,b<0D r<0时,b<079. 1107下列双变量中,适用于进行线性相关分析的是A年龄与体重 B民族与血型C体重与体表面积D母亲文化水平与子女的智商80. 1108 若直线回归系数的假设检验结果p<0.05,则可认为两变量间A有密切的关系 B有一定的因果关系C相关关系密切D存在数量依存关系81. 1111用最小二乘法建立线性回归方程的原则是保证各实测点到回归直线的(B)A纵向距离的离均差最小B纵向距离的平方和最小C垂直距离相等 D垂直距离的平方和最小82. 1112,进行线性回归分析,合理的直观分析方法是A计算回归系数 B做回归直线C计算截距或常数项D绘制散点图83. 1501实验性研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.提高检验效能D.保持各组的非处理因素均衡一致84. 1502.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响85. 1503.在临床试验设计选择对照时,最高效的对照形式是(D)A.历史对照B.空白对照C.标准对照D.安慰剂对照86. 1504.实验没计的三大原则是A.随机、对照、自法B.随机、均衡、重复C.随机、对照、均衡D. 随机、对照、重复87. 1505.某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效,对照组采用阳性药物溶栓胶囊,这属于A.空白对照B.历史对照C.标准对照D.安慰剂对照88. 1509.临床试验需要在设计阶段确定主要指标的目的是A.便于试验实施B.减少测量的随机误差C.减少非处理因素的影响D.避免结果的任意性89. 1511.观察性研究与实验性研究的主要区别是A.是否设立对照组B.是否以人为研究对象C.是否是抽样研究D.是否主动施加干预措施90. 1514.诊断试验中的灵敏度指的是(B)A.检测仪器的敏感性B.对患病的人检出的概率C.对未患病人检出的概率D.阳性预测值。
医学统计学课后习题答案解析
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《医学统计学》资料整理:医学统计学课程思考题及答案
《医学统计学》资料整理:医学统计学课程思考题及答案医学统计学课程思考题及答案(注:红色字体表示已经改正,多余表示删除的内容)一.名词解释1.Population and Sample总体:根据研究目的确定的同质研究对象某观测值的集合。
样本:从总体中随机抽取的有代表性的部分研究对象其观测值的集合。
2.Cross-over design交叉设计:每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。
3.Variance方差:离均差平方和的均数,反映一组同质计量资料的离散趋势大小。
4.Power of test检验效能:常用1-β表示,其意义是当两个总体存在差异时,使用统计检验发现总体间差异的能力,一般在0.8左右5.Relative ration相对数、相对比:二.选择题1、分析母亲体重与婴儿的出生体重的关系,宜绘制( C )A. 直方图B. 圆图C. 散点图D. 直条图2、统计推断包括( D )A、统计描述B、参数估计C、估计抽样误差D、参数估计和假设检验3、两样本率比较,经χ2检验,差别无显著性时,P值越大小,说明(B C )A.两样本率差别越大B.两总体率相同的可能性越大C.越有理由认为两总体率不同D.越有理由认为两样本率不同4、调查某地1000人,记录每人的血压值,所得的资料是一份( B A)。
A、计量资料B、计数资料C、还不能决定是计量资料还是计数资料D、可看作计量资料,也可看作计数资料5、某医师用A药治疗25例病人,治愈20人;用B药治疗30例病人,治愈10人;比较两药疗效时,可选用的最适当的方法是( A )。
A、χ2检验B、 u检验C、校正χ2检验D、确切概率法χ2检验:推断两个或两个以上总体率(或构成比)之间有无差别及两分类变量间有无相关关系等。
因为T=25*25/55>=5,n>=40,所以采用四格表专用公式。
u检验:两完全随机设计两总体均数比较,样本量很大,且总体的方差已知。
医学统计学复习思考题
医学统计学复习思考题一、名词解释1.同质与变异:2.总体和样本3.参数和统计量4.过失误差5.抽样误差6.随机测量误差7.概率 8.计量资料 9.计数资料10.等级资料 11.平均数 12.标准差13.标准正态分布 14.参考值范围 15标准误16.相对数 17 率 18构成比19.相对比 20.标准化率法 21 X²检验22.参数统计 23.非参数统计 24.回归系数25相关系数二、问答题1.均数﹑几何均数和中位数的适用范围有何异同?2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系3.医学中参考值范围的含义是什么?确定的原则和方法是什么?4.标准差和标准误有何区别和联系?5.可信区间和参考值范围有何不同?6.假设检验和区间估计有何联系?7.t检验和方差分析的应用条件有何异同?8.检验假设中α和P的区别何在?9.常用的相对数指标有那些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。
10.X²检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?11.应用相对数时应注意哪些问题?12.什么情况下需要进行率的标准化?标准化的方法有那些?13.X2检验的基本思想是什么?14.四表格资料在何种情况下需要进行校正?为什么?15.行X列表X2检验的注意事项有哪些?16.非参数检验适用那些情况?17.相关系数与回归系数的区别与联系?18.应用直线回归和相关分析时应注意那些问题?19.列表的原则和基本要求是什么?20.常用的统计图有哪几种?他们的适用条件是什么?21.调查研究和实验研究的主要区别何在?22.调查中非抽样误差的来源有哪些?如何控制?如何评价调查质量?三.计算题1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.125.20 5.10 4.70 4.07 3.50 4.69 4.38 4.896.25 5.32 4.50 4.633.614.44 4.43 4.25 4.035.85 4.09 3.35 4.08 4.79 5.30 4.973.18 3.97 5.16 5.10 5.864.795.34 4.24 4.32 4.776.36 6.384.865.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.384.31 4.585.726.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 2.704.60 4.095.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.345.186.14 3.24 4.90 3.05(1)编制频数分布表并绘制直方图,简述其分布特征。
医学统计学(第二版)思考与练习答案
第四章 定量资料的统计描述【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。
不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。
2. 同一资料的标准差不一定小于均数。
均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。
标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。
若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。
不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。
曲线下区间( 2.58, 2.58)μσμσ-+内的面积为95.00%;区间( 2.58, 2.58)μσμσ-+内的面积为99.00%。
5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
医学统计学复习题一及答案
医学统计学复习题一一、名词解释1. 变异即同质的观察单位之间某项特征所存在的差异2. 等级资料 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
3. 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
固定的常数4. 统计量:样本的统计指标,如样本均数、标准差, 参数附近波动的随机变量5. 算术均数 简称均数,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x 表演示样本均数6. 中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值7. 百分位数 :将顺序排列的一组观察值分为一百等分,位于某百分位置上的数值,以Px 表示,它是一种位置指标,理论上有x%的观察值比它小,有(100-X)%的观察值比它大。
二、单项选择1.表示事物内部各个组成部分所占比重的相对数是( b )。
A.相对比B.率C.构成比D.率的标准误E.均数2.说明样本均数抽样误差大小的指标是( c )。
A.变异系数B.标准差C.标准误D.全距 E 四分位数间距3.正态分布曲线下中间面积为95% 的变量值范围为( a )。
A.μσ±196.B.μσ±258.C.μσ±1D.μσ±125.E.σ±μ24.在两样本均数假设检验中,P ≤α时,拒绝H 0,认为( b )。
A.两样本均数有差别B.两总体均数有差别C.两样本均数无差别D.两总体均数无差别E.两总体均数差别很大5.下述( c )种资料为计数资料。
A.血红蛋白(g/L)B.红细胞计数(×1012/L)C.抗体滴度D.血型E.身高(cm)6.某地某年肺癌死亡率城区为郊区的194.1%,本指标是( b )。
A.率B.构成比C.相对比D.中位数E.百分率7.用均数和标准差可全面描述( b )资料的特征。
A.正偏态分布B.正态分布和近似正态分布C.负偏态分布D.t 分布E.χ2分布8.四格表的自由度( b )。
医学统计学习题答案1[精品文档]
习题答案第一章思考题答案1.某医生收治200名患者,随机分成2组,每组100人。
一组用A药,另一组用B药。
经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么?a)A药组的疗效高于B药组。
(对,但不提倡这样说,原因是容易被误解)b)A药的疗效高于B药。
(不对,这是针对总体而言的)2.某校同一年级的A班和B班用同一试卷进行一次数学测验。
经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么?a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。
(对)b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。
(不对,一次考试只是一次抽样的结果)c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。
(对) d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体A,B班所有学生的这次考试成绩构成了一个总体B。
(对)3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么?a)如果变量取值中含有小数点,则该变量为连续型变量。
(不对,离散型变量取值也可以定义为取值含有小数点)b)如果资料为离散型变量的取值,则该资料一定为分类资料。
(不对,如白细胞计数,这是离散型的资料,但不具有分类性质)c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。
根据定义,应认为该资料为计量资料。
(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)第二章习题的答案1. 是非题(1) 不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
(错)(2) 少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
医学统计学课后习题答案解析
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学思考题
医学统计学思考题第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学复习思考题及参考答案(精品)预防医学第三篇复习思考题及参考答案第十三章医学统计学方法的基本概念和基本步骤 1.举例说明总体与样本的关系。
总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。
例如研究某地 2019 年正常成人白细胞数,观察对象是该地2019 年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2019 年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。
从上述的某地 2019 年正常成人中随机抽取 150 人,这 150 正常成人的白细胞数就是样本。
抽取样本的目的是用样本的信息推论总体特征。
2.简述 3 种变量类型的特征。
(1)数值变量的变量值是用定量方法测量的,表现为数值的大小,一般有计量单位;(2)无序分类变量的变量值是用定性方法得到的,表现为互不相容的类别或属性,但各类别间无程度上的差别,包括二项分类和多项分类;(3)有序分类变量的变量值也是用定性方法得到的,也表现为互不相容的类别或属性,但各类别之间有程度上的差别。
第十四章数值变量的统计描述 1.均数、几何均数和中位1 / 14数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
2.全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。
3.制定医学参考值范围的一般原则是什么?(1)抽取样本含量足够大的正常人。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 一般认为样本含量应在 100 例以上,并以取得一个比较稳定的样本分布为原则。
(2)对抽取的正常人进行准确而统一的测定,控制测量误差。
(3)判断是否需要分组制定参考值范围。
(4)决定参考值范围的单侧或双侧界值。
(5)选择适当的百分界值。
(6)根据资料的分布类型选用恰当的方法估计参考值范围。
第十五章数值变量的统计推断 1.标准差与标准误有何区别和联系? 标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别: ①概念不同;标准差是描述观察值(个体值) 之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随 n 的增大而减小,甚至趋于 0 。
联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
2.参考值范围与可信区间有何区别? (1) 意义不同: 参考值范围是指同质总体中包括一定数量(如 95%或 99%) 个体值的估计范围。
3 / 14可信区间是指按一定的可信度来估计总体参数所在范围。
(2) 计算方法不同 : 参考值范围用计算。
可信区间用或计算, 前者用标准差,后者用标准误。
3.何谓假设检验?其一般步骤是什么? 所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件, 从而对所提出的假设作出拒绝或不拒绝的结论的过程。
假设检验一般分为以下步骤: ① 建立假设:包括: H0,称无效假设; H1: 称备择假设;② 确定检验水准:检验水准用表示,一般取 0. 05;③ 计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定 P 值:通过统计量及相应的界值表来确定 P 值;⑤推断结论:如 P>,则接受 H0,差别无统计学意义;如 P ,则拒绝 H0,差别有统计学意义。
4.方差分析的基本思想是什么? 方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分解为两个或多个组成部分,其总自由度也分解为相应的几个部分。
例如完全随机设计的方差分析,可把总变异分解为组间变异和组内变异,即 SS 总=SS 组内+SS 组间,总的自由度也分解为相应的两部分,即总= 组内+组间。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 离均差平方和除以自由度得均方MS,组间均方(MS 组间) 与误差均方(MS 误差)之比为 F 值;如果各组处理的效应一样,则组间均方等于组内均方,即 F=1;但由于抽样误差, F 值不正好等于 1,而是接近 1;如果 F 值较大,远离 1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义,至于 F 值多大才能认为差别有意义,可查 F 界值表(方差分析用) 来确定。
5. t 检验、 u 检验和 F 检验的应用条件各是什么? t 检验的应用条件是:① 未知而且 n 较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两样本所属总体的方差相等。
u 检验的应用条件是:① 已知;② 未知但样本含量较大。
方差分析的应用条件是:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等。
第二十一章统计表和统计图 1.常用统计图的适用范围是什么?常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情5 / 14况。
④半对数线图,适用于连续性资料,反映事物发展速度(相对比) 。
⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。
⑥散点图: 适用于成对数据,反映散点分布的趋势。
2.普通线图和半对数线图在制作和应用中有何主要区别?普通线图绘制时,纵轴的尺度为算术尺度,并且一般应从0 开始;而半对数线图纵坐标的尺度为对数尺度,起点没有 0。
应用上,普通线图反映某事物随时间变动的趋势或某现象随另一现象变迁的情况;而半对数线图用来比较两种或两种以上事物物随时间变动的速度(相对比)。
复习思考题及其答案第十六章分类资料的统计描述 1. 应用相对数的注意事项应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。
2.简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。
例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。
如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。
第十七章分类资料的统计推断 1.描述率的 u 检验的适用条件。
进行率的比较时,在样本含量较大,且 p 和 1-p 不太小,即满足 np 和时,率的抽样分布接近正态分布,可按正态分布的原理处理资料,可进行 u 检验。
2.简述检验的的基本思想检验是检验理论频数与实际频数的吻合程度,从基本公式()可以看出,在检验假设成立的情况下, T(理论频数)与 A (实际频数)之差一般不会很大,此时值也较小;反之,值较大。
当值较大,且大于一定的界值时,就拒绝 H0,接受 H1,认为两样本率有统计学差异。
当值较小,且小于特定的界值时,就不拒绝 H0,认为两样本率差异无统计学意义。
3.简述当不满足行列的检验的条件时的处理办法。
7 / 14当不满足行列的检验的条件(RC 表中不宜有 1/5 的格子数小于 5,或有一个格子的理论频数小于 1 时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合理性。
(2)和(3)两种处理方法会丢失部分信息。
4.四格表的 u 检验和检验有何联系与区别?相同点:(1)四格表的 u 检验是根据正态分布近似原理(n50 且n,np5)凡是能使用 u 检验进行两个率比较的资料,都可以使用检验,同一资料二者是等价的即。
(2) u 检验和检验都存在连续性校正问题。
不同点:(1)由于正态分布可确定单、双侧检验界值,当满足正态近似条件时,可用 u 检验进行单侧检验。