(2020年编辑)【孙振球第三版】医学统计学复习题

合集下载

医学统计学考试试题及答案

医学统计学考试试题及答案l．统计中所说的总体是指:（） [单选题] *A根据研究目的确定的同质的研究对象的全体(正确答案)B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2．统计学的主要作用是 : （） [单选题] *A使分析更为简单B避免计算出现错误C改善数据质量D克服个体变异的影响E探测随机现象的规律(正确答案)3．关于随机抽样，以下哪一项说法是正确的:（） [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体，以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性，样本量应越大越好E选择符合研究者意愿的样本4．测量身高、体重等指标的原始资料叫:（） [单选题] *A计数资料B计量资料(正确答案)C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人，治疗结果如下:（）[单选题] *A计数资料B计量资料C无序分类资料D有序分类资料(正确答案)E数值变量资料6．正态分布曲线的位置参数是: （） [单选题] *AαBβC µ(正确答案)DσEχ7．医学统计学的基本内容是: （） [单选题] *A统计设计、数据整理与核查、统计描述、统计推断(正确答案) B收集资料、整理资料、设计、统计推断C统计设计、收集资料、统计推断、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断8．良好的实验设计，能减少人力、物力，提高实验效率;还有助于消除或减少: （） [单选题] *A抽样误差B系统误差(正确答案)C随机误差D责任事故E以上都不对9．以下何者不是实验设计应遵循的原则 : （） [单选题] *A对照的原则B随机原则C重复原则D交叉的原则(正确答案)E以上都不对10．对于配对设计的t检验，其检验假设H0是:（） [单选题] *A两样本均数相同B两样本均数不同C两总体均数相同D两样本均数不同E配对数据的差值总体均数为0(正确答案)11．某计量资料的分布性质未明，要计算集中趋势指标，宜选择 : （） [单选题] * A 算术均数B几何均数C 中位数(正确答案)D 标准差E 变异系数12．各观察值均加（或减）同一数后: （） [单选题] *A均数不变，标准差改变B均数改变，标准差不变C两者均不变(正确答案)D两者均改变E以上均不对13．比较某地1990~1997年肝炎发病率宜绘制 : （） [单选题] *A直条图B构成图C普通线图(正确答案)D直方图E统计地图14．某厂发生食物中毒，9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24以上(小时)，问该食物中毒的平均潜伏期为多少小时? （） [单选题] *A 5B 5．5C 6(正确答案)D l0E 1215．比较12岁男孩身高和体重的变异程度大小，宜采用的指标是: （） [单选题] *A全距B标准差C方差D变异系数(正确答案)E极差16．对于正态或近似正态分布的资料，描述其变异程度应选用的指标是 : （）[单选题] *A变异系数B离均差平方和C极差D 四分位间距E标准差(正确答案)17．以下不属于统计表的基本组成的是:（） [单选题] *A．标题B．标目C．线条D．时间(正确答案)E．数字18．某项指标95%医学参考值范围表示的是: （） [单选题] *A在此范围“异常”的概率大于或等于95%B 在此范围“正常”的概率大于或等于95%C 在“异常”总体中有95%的人在此范围之外D 在“正常”总体中有95%的人在此范围(正确答案)E 在人群中检测指标有5%的可能超出此范围19．20世纪50年代，发现某省部分地区的居民因长期饮用深井高碘水导致高碘性甲状腺肿，随机抽查得到该地区甲乙两村常住居民的高碘性甲状腺肿患病率，甲村为20.6%，乙村为25.3%，则甲乙两村该病的合计患病率为:（） [单选题] *A两村患病率的几何平均数得29.11%B 两村患病率相加得45.9%C 两村患病率相乘得5.21%D 两村患病率的平均数得22.95%E 甲乙两村调查人群中患该病总人数除以调查总人数(正确答案)20．药物A对于治疗普通肺炎的有效率为67.0%，药物B治疗普通肺炎的有效率为65 .7%，为了分析A药和B药对于普通肺炎的有效率是否不同，经过两独立样本的t检验计算t值，最后查表得到的P=0.035，那么该研究中最后应该下的研究结论应该是:（） [单选题] *A药物A与药物B治疗普通肺炎的有效率相同B 尚不能认为药物A与药物B治疗普通肺炎的有效率相同(正确答案)C 尚不能认为药物A与药物B治疗普通肺炎的有效率不同D 药物A治疗普通肺炎的有效率优于药物BE 无法下结论21．以下属于离散型变量指标的是:（） [单选题] *A身高B 体重C 住院病人数D 血液中血红蛋白含量(正确答案)E 某地年降水量22．小概率事件是指:（） [单选题] *A统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件(正确答案)B 统计学上一般把P≤0.5或P≤0. 1的事件称为小概率事件C 统计学上一般把P≤0.05或P>0.01的事件称为小概率事件D 统计学上一般把P≤0.25的事件称为小概率事件E 发生概率足够小的事件23．在绘制频数分布表的过程中，组限在每组中: （） [单选题] * A只包含下限而不包含上限(正确答案)B 只包含上限而不包含下限C 既包含下限又包含上限D 可自行选择包含上限或下限E 上限和下限均不包含24．以下几幅图中属于正偏态分布的是: ( A ) [单选题]A(正确答案)BC DE25．描述抗体滴度集中趋势适宜用:（） [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数26．算术均数与中位数相比，其特点是:（） [单选题] * A不易受极端值的影响B 能充分利用数据的信息(正确答案)C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明资料27．医学参考值范围的计算方法主要有:（） [单选题] *A百分位数法和估计值法B 百分位数法和正态分布法(正确答案)C 百分位数法和查表法D 正态分布法和查表法E 查表法和公式计算法28．比较两个不同人群的患病率、发病率、死亡率等资料时，为消除其内部构成（如年龄、性别、工龄、病程长短、病情轻重等）对率的影响，可以:（） [单选题] * A排除对结果有不良影响的个体B 增大样本量C 采用标准化率(正确答案)D 更改相关数据E 通过统计软件消除影响29．统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差，将后者称为均数的: （） [单选题] *A标准值B 标准差C 标准化率D 标准误(正确答案)E 标准方差30．以下变量适合用单侧检验进行分析的是:（） [单选题] *A血铅水平(正确答案)B 血压C 呼吸次数D 血红蛋白含量E 3岁男童正常身高3l．统计学中所谓的样本通常是指:（） [单选题] *A总体中有代表性的一部分观察单位(正确答案)B可测量的生物性样品C统计量D某一变量的测量值E数据中的一部分观测值32．医学统计学研究的对象是:（） [单选题] *A医学中的小概率事件B各种类型的数据C动物和人的本质D疾病的预防与治疗E医学中具有不确定性结果的事物(正确答案)33．关于随机抽样，以下哪一项说法是正确的:（） [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体，以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性，样本量应越大越好E选择符合研究者意愿的样本34,下列观测结果属于有序数据的是:（） [单选题] *A收缩压测量值B脉搏数C住院天数D病情程度(正确答案)E四种血型35．两样本均数比较，其差别有统计学意义是指 :（） [单选题] * A两样本均数的差别具有实际意义B两总体均数的差别具有实际意义C两样本和两总体均数的差别都具有实际意义D有理由认为两样本均数有差别E有理由认为两总体均数有差别(正确答案)36．不可完全消除的误差类型是:（） [单选题] *A系统误差B 随机误差(正确答案)C 抽样误差D 人为误差E 机械误差37．正态曲线下，横轴上从均数到+∞的面积是:（） [单选题] *A 50%(正确答案)B 95%C 97.5%D 99%E 不能确定（与标准差的大小有关）38．6人接种流感疫苗一个月后测定抗体滴度为1:20,1:40,1:80,1:160,1:320，求平均滴度应选用的指标是:（） [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数39．描述两端无确定数值数据的平均水平适宜用:（） [单选题] *A算术均数B 方差C 标准差D 几何均数E 中位数(正确答案)40．以下变量中，属于分类变量的是: （） [单选题] *A脉搏B血型(正确答案)C肺活量D红细胞计数E血压41．减少抽样误差的有效途径是:（） [单选题] *A避免系统误差B控制随机测量误差C增大样本含量(正确答案)D减少样本含量E以上都不对42．样本是总体的 : （） [单选题] *A有价值的部分B有意义的部分C有代表性的部分(正确答案)D任意一部分E典型部分43．将计量资料制作成频数表的过程，属于统计工作哪个基本步骤:（） [单选题] * A统计设计B收集资料C整理资料D分析资料(正确答案)E以上均不对44．统计工作的步骤正确的是:（） [单选题] *A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料(正确答案)D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断45．表示血清学滴度资料平均水平最常计算 :（） [单选题] *A算术均数B几何均数(正确答案)C中位数D全距E率46．一种新的治疗方法不能治愈病人，但能延长病人寿命，那么则会发生的情况是 :（） [单选题] *A 该病患病率增加(正确答案)B 该病发病率增加C 该病患病率下降D 该病发病率下降E 以上都不对47．计算标化死亡率的目的是:（） [单选题] *A 减少死亡率估计的抽样误差B 减少死亡率估计的系统误差C 便于进行不同地区的死亡率比较D 便于进行不同时间的死亡率比较E 消除不同人群内部构成不同的影响(正确答案)48．统计推断的目的是: （） [单选题] *A参数估计B假设检验C统计描述D用样本信息推断总体特征(正确答案)E以上均不对49．两样本均数比较时，其无效假设是:（） [单选题] * A．两个总体均数不同B．两个样本均数不同C．两个总体均数相同(正确答案)D．两个样本均数相同E．以上均不对50．实验设计的三个基本要素是: （） [单选题] *A化学因素、物理因素、研究对象B 研究者、受试对象、效果C 受试对象、背景因素、实验效应D 处理因素、实验效应、受试对象(正确答案)E 干扰因素、实验场所、处理因素。

(完整版),医学统计学第三版复习总结,推荐文档

方差由Y 及 b (x - x)的方差两部分构成个体Yi 值的范围预测
直线回归方程的应用
描述两变量的依存数量关系
利用回归方程进行预测
利用回归方程进行控制
第二直线相关 ( linear correlation )
;
()0.5,
()0.5, 对比组,
(RR)无单位，比值范围在0至∞之间。

表明暴露与疾病无联系；
表明存在负联系(提示暴露是保护因子)；
消除更多因素(如大于3个)的影响:
分层分析受到限制,因为很多层可能没有病例,这时通常可使用COX回归模型
期望人数？即根据两种疗法疗效相同的假设，由总死亡人数计算出的两种疗法在该日的期望死亡人数。

1.生存率分析的概念，特点（与其它统计分析比较），适用范围。

生存分析：是将事件的结果和出现这一结果所经历的时间，结合起来分析的一种统计分析方法，它不仅可以从事件结局的好坏，如疾病的治愈（成功）和死亡（失败），而且可以从事件的持续时间，如某病经治疗后存活的时间长短进行分析比较，因而能够更全面、更精确地反映该治疗的效果。

考试题医学统计学第三版

考试题医学统计学第三版1,统计设计的基本原则有哪些？（1）对照：以排除偶然的非处理因素的干扰，如成组对照、配对对照。

（2）随机：总体中每一个体都有同等的机会被抽中，其目的是使样品有代表性，如抽签、随机数字表等。

（3）均衡：处理组与对照组的内部构成一致，如性别一致、年龄一致等。

（4）重复（样本含量）：样本一般要求≧30例。

2. 怎样的数据资料属分类资料？数据不代表数值大小，只是一种编码，每个编码代表一种属性，这种资料叫分类资料，又称分类变量或定性资料。

其观察值是定性的，表现为互不相容的类别或属性。

有无序分类、有序分类两种情况。

3. 简述什么叫总体和样本，医学研究中的样本有什么要求？总体：是指根据研究目的确定的同质观察单位的全体，是同质的所有观察单位某中观察值（变量值）的集合。

样本：用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。

医学研究中的样本应按随机化原则获取，即总体中每一个观察单位都有同等的机会被选入到样本中来，以避免误差和偏倚对研究结果有所影响。

4. 统计描述的基本方法有哪些，各自有何特点？（1）频数表与频数图：由组段和频数两栏组成的整理表即频数表，将频数表数据在直角坐标系上绘制成图即频数图。

特点：①.较具体、直观的描述一组数据的特征；②便于发现可疑的异常值；③有助于正确选用统计指标和便于计算。

（2）描述性统计量可以用来定量的刻画统计分布的特征，常用的有三类：描述集中趋势的有算术均数，几何均数，中位数。

描述离散趋势的有极差，四分位数间距，方差，标准差，变异系数，描述分布类型的偏度系数峰度系数。

（3）百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。

5. 统计描述的意义是什么？试举例说明。

统计描述，是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述，其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。

例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据，无论多认真审视也无法说清这些男孩的身高情况，这就要用统计描述来解决这些问题，对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄男孩体重如下，其平均体重是30千克，由表面看这三组资料的均数相等，即集中趋势相同，但各组的数据参差不齐，也就是离散趋势不同，描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等6. 描述计量资料集中趋势（一般水平）的指标有哪些，各适用于什么情况？描述计量资料集中趋势的指标有：算术平均数、几何平均数、中位数。

医学统计学第3版,02计量重点学习资料统计描述试题

第二章计量资料的统计描绘一、教课大纲领求（一）掌握内容1.频数分布表与频数分布图（ 1）频数表的编制。

（ 2）频数分布的种类。

（ 3）频数分布表的用途。

2.描绘数据分布集中趋向的指标掌握其意义、用途及计算方法。

算术均数、几何均数、中位数。

3.描绘数据分布失散程度的指标掌握其意义、用途及计算方法。

极差、四分位数间距、方差、标准差、变异系数。

（二）熟习内容连续型变量的频数分布图：等距分组、不等距分组。

二、教课内容精要计量资料又称为丈量资料，它是丈量每个察看单位某项指标值的大小所得的资料，一般均有计量单位。

常用描绘定量资料分布规律的统计方法有两种：一类是用统计图表，主假如频数分布表（图）；另一类是采纳合适的统计指标。

（一）频数分布表的编制频数表（ frequency table）用来表示一批数据各察看值或在不一样取值区间的出现的频繁程度（频数）。

对于失散数据，每一个察看值即对应一个频数，如某医院某年度一日内死亡0， 1，2， 20 个病人的天数。

如描绘某学校学生性别分布状况，男、女生的人数即为各自的频数。

对于分布区间很大的失散数据和连续型数据，数据分布区间由若干组段构成，每个组段对应一个频数。

制作连续型数据频数表一般步骤以下：1. 求数据的极差（range）。

R X max X min （ 2-1 ）2. 依据极差选定合适“组段”数（往常8— 10 个）。

L≤χ<U 。

确立组段和组距。

每个组段都有下限L 和上限U，数据χ归组统必定为3.写出组段，逐个划记。

频数表可用于揭露资料的分布特点和分布种类，在文件中常用于陈说资料，它便于发现某些特大或特小的可疑值，也便于进一步计算指标和统计剖析办理。

（二）描绘频数分布中心地点的均匀指标描绘中心地点的均匀指标，但常因资料的不一样而选用不一样的指标进行描绘。

1. 算术均数（对称分布）算术均数（ arithmetic mean）简称均数，描绘一组数据在数目上的均匀水平。

《医学统计学》教材后面的练习题及答案

《医学统计学》教材后面的练习题及答案《医学统计学》各章练习题与答案第一章医学统计中的基本概念一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E．有变异的医学事件2. 用样本推论总体，具有代表性的样本指的是A．总体中最容易获得的部分个体 B．在总体中随意抽取任意个体C．挑选总体中的有代表性的部分个体 D．用配对方法抽取的部分个体E．依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A．收缩压测量值 B．脉搏数C．住院天数 D．病情程度E．四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E．仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么？应采取什么措施和方法加以控制？[参考答案]常见的三类误差是：（1）系统误差：在收集资料过程中，由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因，可造成观察结果倾向性的偏大或偏小，这叫系统误差。

要尽量查明其原因，必须克服。

（2）随机测量误差：在收集原始资料过程中，即使仪器初始状态及标准试剂已经校正，但是，由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如，实验操作员操作技术不稳定，不同实验操作员之间的操作差异，电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制，至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施，从而达到控制的目的。

（3）抽样误差：即使在消除了系统误差，并把随机测量误差控制在允许范围内，样本均数（或其它统计量）与总体均数（或其它参数）之间仍可能有差异。

《医学统计学》复习资料与习题答案

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《医学统计学》复习资料与习题答案《医学统计学》复习资料与习题答案教学提要（一）《医用统计学》基本概念 1、变异：宇宙中的事物，千差万别，各不相同。

即使是性质相同的事物，就同一观察指标来看，各观察指标（亦称个体）之间，也各有差异，称为变异。

同质观察单位之间的个体变异，是生物的重要特征，是偶然性的表现。

2、变量：由于生物的变异特性，使得观察单位某种指标的数值互相不等，所以个体值称为变量值或观察值。

3、总体：即根据研究目的确定的同质的研究对象的全体。

更确切地说，是性质相同的所有观察单位的某种变量值的集合。

4、样本：即从总体中抽取一部分作为观察单位进行观察，这部分观察单位称为样本。

为了使样本对总体有较好的代表性，抽样必须遵循随机化的原则，即总体中每一观察单位均有相同的机会被抽取到样本中去。

5、计量资料（数值变量资料）：对每个观察单位用定量方法测定某项指标量的大小，所得的资1 / 9料称为计量资料，一般有度量衡等单位。

6、计数资料（分类变量资料）：将观察单位按某种属性或类别分组，所得各组的观察单位数，称为计数资料。

可分为二项式或多项式分类变量。

7、等级资料：将观察单位按某种属性的不同程度分组，所得各组的观察单位数，称为等级资料。

这类资料与计数资料不同的是：属性的分组有程度的差别，各组按大小顺序排列；与计量资料不同的是：每个观察单位未确切定量，因而称为半定量资料。

8、抽样误差：由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。

(二)统计工作的基本步骤 1、设计: 这是关键的一步。

2020年-2021年医学统计学各章节试题(含答案)

第一章绪论习题一、选择题1．统计工作和统计研究的全过程可分为以下步骤:A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中，习惯上把（）的事件称为小概率事件。

A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3～8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。

该资料的类型是（）。

4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。

该资料的类型是（）。

5.空腹血糖测量值，属于（）资料。

6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。

该资料的类型是（）。

7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。

该资料的类型是（）。

8. 100名18岁男生的身高数据属于（）。

二、问答题1．举例说明总体与样本的概念 2．举例说明同质与变异的概念 3．简要阐述统计设计与统计分析的关系第一章绪论（答案）一、选择题1.D2.B3.A4. C5.C6.B7.D8.C二、问答题1．统计学家用总体这个术语表示大同小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。

实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。

例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。

医学统计学复习题

预防医学复习题（统计部分）复习重点（及简答题）1. 医学统计学的基本概念如：总体与样本的联系区别2. 资料的分类如：请列举资料的类型并举例说明3. 定量资料统计描述的指标（集中与离散趋势）如：定量统计描述指标有哪些？如：正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如：正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用（P值的含义）如：P值的含义是什么，对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中：A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指：A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是：A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤0.05或P≤0.01的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7．统计中所说的总体是指：A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8．概率P=0，则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9．总体应该由A．研究对象组成B．研究变量组成C．研究目的而定D．同质个体组成E．个体组成10. 在统计学中，参数的含义是A．变量B．参与研究的数目C．研究样本的统计指标D．总体的统计指标E．与统计研究有关的变量11．调查某单位科研人员论文发表的情况，统计每人每年的论文发表数应属于A．计数资料 B．计量资料 C．总体 D．个体 E．样本12．统计学中的小概率事件，下面说法正确的是：A．反复多次观察，绝对不发生的事件B．在一次观察中，可以认为不会发生的事件C．发生概率小于0.1的事件D．发生概率小于0.001的事件 E．发生概率小于0.1的事件13、统计上所说的样本是指：A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属（）资料。

医学统计学(孙振球)练习

例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇（mmol/L）的测量结果如下，试编制频数分布表。

2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.80 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.95 3.00 3.26例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。

例2-3 利用表2-1计算101名正常成年女子的血清总胆固醇均数。

例2-4 某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度倒数分别为10,20,40,40,160，求几何均数。

例2-5 69例类风湿关节炎（RA ）患者血清EBV-VCA-lgG 抗体滴度的分布见表2-5第(1)、(2)栏,求其平均抗体滴度。

表2-5 69例RA 患者血清EBV-VCA-lgG 抗体测定结果抗体滴度人数f 滴度倒数Xlg Xlg f X⑴ ⑵ ⑶ ⑷ ⑸ 1: 10 1: 20 1: 40 1: 80 1: 160 1: 320 1: 640 1: 1280 4 3 10 10 11 15 14 2 10 20 40 80 160 320 640 1280 1.0000 1.3010 1.6021 1.9031 2.2041 2.5051 2.8062 3.1072 4.0000 3.9030 16.0210 19.0310 24.2451 37.5765 39.2868 6.2144 合计69——150.2778例2-6 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天，求其中位数。

《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京：人民卫生出版社，2010第二章计量资料的统计描述计算分析题（P26）1. 根据某单位的体检资料，116名正常成年女子的血清甘油三酯测量结果如下，请据此资料：（1）描述集中趋势应选择何指标？并计算之。

（2）描述离散趋势应选择何指标？并计算之。

（3）求该地正常成年女子血清甘油三酯的95%参考值范围。

（4）试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比？表2-1某单位116名正常成年女子的血清甘油三酯（mmol/L）测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116（1）数据文件数值变量名：组段，频数；用Compute产生新变量“组中值”（也可直接输入组中值）。

（2）操作步骤Analyze èData èWeight Cases ；Weight Cases by 频数。

Analyze èDescriptives èDescriptives ；将“组中值”选入V ariable 框中；单击OK 。

（3）结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布，故选择均数描述集中趋势，选择标准差描述离散趋势。

某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16（mmol/L ），标准差为0.20（mmol/L ）；该地正常成年女子血清甘油三酯的95%参考值范围是（0.77，1.55）mmol/L 。

计算过程根据公式s x 96.1±，即1.16±1.96×0.20。

该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59％，1.5 mmol/L 以下者估计占总人数的95.54％。

医学统计学复习考试题库完整

第一部分复习练习题一.最讎择丿Y 表示一m 称分布的变量值的 ______________ a.平均水平 b.频数分布c.离散情况d.极差一组正态分布资料,理论上有 ____________ a. T>M b.X <M c ・商 A X^MngKM 反映一组血淸学滴度资料或效价资料平均水平采用 a. Y b. M c. G d R 在O 未知且n 较大时，估计u 95%町售区间可用_ a. X+1.96S b. T±2.58S c. X±2. 58Sx d. T±1.96S X 来自同一总体中的两个样本，其中—小的那个样本均数估计u 时更可靠。

a. Sx b. S c. S : d. CV在假设检验中，由于抽样的偶然性，拒绝了实际上成立的Ho 假设，贝IJ —0 a.犯第I 类错误 b.犯第II 类错误 c.推断正确 d. a, b 都有可能在假设检验中，由于抽样偶然性，接受了实际上不成立的比假设，贝9—o a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a, b 都有可能在假设检验中，接受了实际上成立的出假设，则 _________ 。

a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a,b 都有可能 a 二0・05, t>t a os. v,统计•上可认为 o a.两总体均数差别无显著意义b.两样本均数差别无显著意义 c.两总体均数差别有显著意义d.两样本均数差别有显著意义 10、在均数为方差为/的正态总体中随机抽样，每组样本含量n 相等，u=(X L u)/ox ；则u21. 96 的概率是 ______ 。

a. P>0.05 b. PW0.05 c. PM0.025 d. PW0.025 11、 ____________________________________________________________ 在均数为u,标准差为。

(完整版)孙振球第三版研究生医学统计学课后习题答案

医学统计学作业答案（二～四章）第二章三、计算分析题 1.（1）均数=1.156 （2）标准差=0.2044（3）)5566.1~7554.0(96.1=±s x（4）0.8mmol/L 以下者占4.09%； 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度：1:36.833. 08.15=x ；M=14；M 代表性好；95%的参考值范围：<(P 95) 36第三章1.（1）女性血红蛋白的变异程度（CV=0.087）> 红细胞的变异程度（CV=0.069）（2）男性血红蛋白的标准误=0.374；红细胞的标准误=0.0306 （3）健康成年女性红细胞均数95%C.I.为4.144～4.216 （4）成年男女血红蛋白含量不同，t=24.03, P =0.0001（5）男性两项指标均低于标准值，红细胞与标准值比较， t=5.89,P =0.0001 血红蛋白与标准值比较，t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41～104.59)3. t=1.1429， P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。

4. t=3.71, P =0.001，新药和标准药的疗效差别有统计学意义。

5. （1）对数转换；（2）方差齐性检验，F=3.69, P =0.038，转换后两总体方差仍不齐；（3）用welch 法校正t 检验：t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。

6.（1）两药平均退热天数之差的95% C.I.为：1.0～1.8天（2）t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义（3）上述两种方法中（1）因95%C.I.不包括H 0（μ1-μ2=0），也可以说明两药退热天数不同（α=0.05）；（2）的检验中可以看出两药退热天数不同，并说明其概率非常小。

【孙振球第三版】医学统计学复习题

【孙振球第三版】医学统计学复习题1、总体：根据研究目的确定的同质观察单位的全体。

2、有限总体：是指空间、时间范围限制的总体。

4、样本：从总体中随机抽取部分观察单位，其实测值的集合。

5、计量资料：描述指标，对每个观察单位用定量的方法测量某项指标量的大小所得的资料，有计量单位。

6、计数资料：相对数，将观察单位按性质或类别分类，然后清点各组观察单位的个数所得资料。

7、等级资料：又称半定量资料或有序分类变量资料，是将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。

8、随机误差（偶然误差）：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起，观察值不按方向性和系统性变化，在大量重复测量中，它可呈现或大或小，或正或负的规律性变化。

9、平均数：描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差：由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异，以及统一总体若干样本统计量之间的差异。

11、I型错误：拒绝了实际上成立的H0，这类“弃真”错误称为I 型错误。

检验水平，就是预先规定的允许犯I 型错误概率的最大值。

I 型错误概率大小也用α表示，α可取单尾亦可取双尾。

12、II型错误：“接受”了实际上不成立的H0，这类“取伪”的错误称为II型错误。

其概率大小用β表示，β只取单尾，β值的大小一般未知，须在知道两总体差值δ、α及n时，才能算出。

13、相对数：两个有联系的指标之比，是分类变量常用的描述性统计指标，常用两个分类的绝对数之比表示相对数的大小。

如率、构成比、比等。

14、率：强度相对数，说明某现象发生的频率或强度。

15、构成比：结构相对数字，表示事物内部某一部分的个体与该事物各个部分个体数的和之比。

用来说明各构成部分在总体所占的比重或分布。

16、相对比：简称比，是两个相关联指标之比，说明两指标间的比例关系。

两指标可以性质相同，也可以性质不同，通常以倍数或百分数表示。

医学统计学复习题

医学统计学复习题一、名词解释1．总体：根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体，反之为无限总体。

2•样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。

样本应具有代表性。

所谓有代表性的样本，是指用随机抽样方法获得的样本。

3.随机抽样：随机抽样（ran dom sampli ng ）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

4.变异：在自然状态下，个体间测量结果的差异称为变异（variation ）。

变异是生物医学研究领域普遍存在的现象。

严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。

5•计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。

计量资料亦称定量资料、测量资料。

.其变量值是定量的，表现为数值大小，一般有度量衡单位。

如某一患者的身高（cm）、体重（kg）、红细胞计数（1012/L）、脉搏（次/分）、血压（KPa）等。

6.计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（cou ntdata）。

计数资料亦称定性资料或分类资料。

其观察值是定性的，表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

7.等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。

等级资料又称有序资料。

如患者的治疗结果可分为治愈、好转、有效、无效、死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量。

医学统计学复习题

医学统计学复习题一、名词解释：1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。

2、正态分布有什么基本特征？有哪几个参数？3、医学正常值范围与可信区间有何区别？4、假设检验中应注意哪些问题？6、应用相对数时应注意的事项？8、非参数检验的适用条件、优缺点？三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。

2、不论数据呈什么分布，用算术均数和用中位数表示平均水平都一样合理。

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。

4、随机抽样就是指在抽样研究中不要主观挑选研究个体。

8、同一总体中随机抽样，样本含量越大，则样本标准差越小。

9、只要单位相同，用s和用CV来比较两套变量值的离散度，结论是完全一样的。

10、从同一总体随机抽取的两组数据中，平均数大的组标准差也大。

11、同一批计量数据的标准差不会比标准误大。

12、t检验是对两样本均数的差别作统计检验的方法之一。

13、当总体方差已知时，检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。

14、在配对t检验中，用药前数据减去用药后数据和用药后数据减去用药前数据，作t检验后的结论是相同的。

15、方差分析中均方就是方差。

16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。

17、4个均数作差别的统计检验，可以分别作两两比较的6次t检验以作详细分析。

18、回归系数越大，两变量的数量关系越密切。

19、双变量正态分布资料，样本回归系数小于零，可认为两变量呈负相关。

20、某事物内部某一部分所占的比重就是比例，患病率也是一种比例。

21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较，可以计算标准化死亡率后再作比较。

22、非参数统计方法不对特定分布的参数作统计推断，但仍要求数据服从正态分布。

医学统计学复习题解答(最佳选择题和简答题)

《医学统计学》习题解答（最佳选择题和简答题）孙振球主编.医学统计学习题解答. 第2版. 北京：人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章计量资料的统计描述（注：题号上有“方框” 的简答题为基本概念，下同）第三章总体均数的估计与假设检验简答题：第四章多个样本均数比较的方差分析简答题：第五章计数资料的统计描述简答题：第六章二项分布与Poisson分布简答题：第七章χ2检验简答题：1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同？3. 对于四格表资料，如何正确选用检验方法？4. 说明行×列表资料χ2检验应注意的事项？5. 说明R×C表的分类及其检验方法的选择。

第八章秩和检验简答题：5. 两独立样本比较的Wilcoxon秩和检验，当n1>10或n2-n1>10时用u检验，这时检验是属于参数检验还是非参数检验，为什么？6. 随机区组设计多个样本比较的Friedman M 检验，备择假设H1如何写？为什么？第九章回归与相关简答题：第十章统计表与统计图简答题：5. 统计表与统计图有何联系和区别？6. 茎叶图与频数分布图相比有何区别，有何优点？第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。

医学统计学三

医学统计学三医学统计学复习题三一、名词解释1.可信区间（1）按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围，该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidence level),常取95%或99%。

（2）置信区间是指由样本统计量所构造的总体参数的估计区间。

在统计学中，一个概率样本的置信区间（Confidence interval）是对这个样本的某个总体参数的区间估计。

置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。

置信区间给出的是被测量参数的测量值的可信程度，即前面所要求的“一定概率”。

这个概率被称为置信水平。

置信区间的两端被称为置信极限。

对一个给定情形的估计来说，置信水平越高，所对应的置信区间就会越大。

2.统计推断推断统计是研究如何利用样本数据来推断总体特征的统计方法。

其包含两个内容：参数估计，即利用样本信息推断总体特征；假设检验，即利用样本信息判断对总体的假设是否成立。

做法包括：1.假设检验：原假设和对立假设。

2.单边检验与双边检验。

3.抽样误差计算4.p-值决策5.效应量计算。

3.参数估计parameter estimation根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。

它是统计推断的一种基本形式，是数理统计学的一个重要分支，分为点估计和区间估计两部分。

点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。

通常它们是总体的某个特征值，如数学期望、方差和相关系数等。

区间估计是依据抽取的样本，根据一定的正确度与精确度的要求，构造出适当的区间，作为总体分布的未知参数或参数的函数的真值所在范围的估计。

估计量的评价标准：（1）无偏性，（2）一致性，（3）有效性，（4）充分性。

3.构成比构成比（constituent ratio)表示某事物内部各组成部分在整体中所占的比重，常以百分数表示，计算公式如下：构成比=（某一组成部分的观察单位数/同一事物各组成部分的观察单位总数）X100%4.率率，rate，频率指标或强度指标。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、名词解释：1、总体：根据研究目的确定的同质观察单位的全体。

是同质所有观察单位的某种变量值的集合。

2、有限总体：是指空间、时间范围限制的总体。

3、无限总体：是指没有空间、时间限制的总体。

4、样本：从总体中随机抽取部分观察单位，其实测值的集合。

5、计量资料：又称定量资料或数值变量资料。

为观测每个观察单位的某项指标的大小，而获得的资料。

其变量值是定量的，表现为数值大小，一般有度量衡单位。

根据其观测值取值是否连续，又可分为连续型或离散型两类。

6、计数资料：又称定性资料或者无序分类变量资料，亦称名义变量资料，是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。

其变量值是定性的，表现为互不相容的性或类别。

分两种情形：（1）二分类：两类间相互对立，互不相容。

（2）多分类：各类间互不相容。

其变量值具有半定量性质，表现为等级大小或属性程度。

9、平均数：描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差：由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异，以及统一总体若干样本统计量之间的差异。

11、I型错误：拒绝了实际上成立的H0，这类“弃真”错误称为I 型错误。

检验水平，就是预先规定的允许犯I型错误概率的最大值。

I型错误概率大小也用α表示，α可取单尾亦可取双尾。

12、II型错误：“接受”了实际上不成立的H0，这类“取伪”的错误称为II型错误。

其概率大小用β表示，β只取单尾，β值的大小一般未知，，须在知道两总体差值δ、α及n时，才能算出。

13、相对数：两个有联系的指标之比，是分类变量常用的描述性统计指标，常用两个分类的绝对数之比表示相对数学的大小。

如率、构成比、比等。

14、率：强度相对数，说明某现象发生的频率或强度。

15、构成比：结构相对数字，表示事物内部某一部分的个体与该事物各个部分个体数的和之比。

用来说明各构成部分在总体所占的比重或分布。

16、相对比：简称比，是两个相关联指标之比，说明两指标间的比例关系。

两指标可以性质相同，也可以性质不同，通常以倍数或百分数表示。

两指标可以是绝对数、相对数或平均数。

17、标准化：采用某影响因素的统一标准构成以消除内部构成不同对总率的影响，使通过标化后的标准率具有可比性。

18、动态数列：是一系列按时间顺序排列起来的统计指标，用以观察和比较该事物在时间上的变化和发展趋势。

常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

19、非参数检验：相对于参数检验而言，不依赖于总体分布类型，也不对总体参数进行统计推断的假设检验方法，称为参数检验。

20、相关系数：又称Pearson积差相关系数，以符号r来表示。

说明两正态变量间相关关系的密切程度和方向的指标。

无单位，其值为-1≤r≤1。

相关系数的检验假设常用t检验。

21、回归系数：即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。

在直线回归中对回归系数的t检验与F检验等价。

22、随机划原则：是指在实验分组时，每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。

23、分类变量资料：计数资料，又称定性资料或无序分类变量资料。

是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。

其变量值是定性的，表现为互不相容的性或类别。

分两种情形：（1）二分类：两类间相互对立，互不相容。

（2）多分类：各类间互不相容。

24、无序分类变量资料：计数资料，又称定性资料。

是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。

其变量值是定性的，表现为互不相容的性或类别。

分两种情形：（1）二分类：两类间相互对立，互不相容。

（2）多分类：各类间互不相容。

25、期望寿命：指同时出生的一代人活满x岁以后尚能生存的年数（即岁数）。

26、检验效能：表达式为1-β，以往称把握度。

其意义为当两总体确有差异，按规定检验水准所能发现该差异的能力。

27、观察单位：亦称个体，是统计研究中的基本单位。

它可以是一个人、一只动物，也可以是特指的一群人；可以是一个器官，甚至一个细胞。

28、样本含量：样本中包含观察单位数称为该样本的样本含量。

29、变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，成为变量。

30、变量值：对变量的观测值称为变量值或观察值。

31、误差：泛指实测值与真实值之差，按产生原因和性质可粗分为（1）随机误差；（2）非随机误差①系统误差②非系统误差。

32、系统误差：实验过程中产生的误差，它的值或恒不变，或遵循一定的变化规律，其产生的原因往往是可知的或可能掌握的。

应尽可能设法预见到各种系统误差的具体来源，力求通过周密的研究设计和严格的技术措施施加以消除或控制。

33、非系统误差：在实验过程中由于研究者偶然失误造成的误差。

这类误差应当通过认真检查核对予以清除，否则将影响研究结果的准确性。

34、频率：一个随机试验有几种可能，在结果重复进行试验时，个别结果看来是偶然发生，但当重复试验次数相当大时，总有规律出现。

在重复多次后，出现结果的比例称之为频率。

35、概率：概率是描述随机事件发生可能性大小的一个度量。

36、医学参考值：是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数，也称正常值。

由于存在个体差异，生物医学数据并非常数而是在一定范围内波动，故医学参考值范围作为判定正常和异常的参考标准。

37、正态分布：正态分布又称高斯分布，是一种很重要的连续型分布，应用很广。

若指标X的频率分布曲线对应于数学上的正态分布曲线，则称该指标服从正态分布。

38、偏态分布：指集中位置偏向一侧，频数分布不对称。

（1）正偏态分布：集中位置偏向数值小的一侧。

（2）负偏态分布：集中位置偏向数值大的一侧。

39抽样：在医学研究中，为节省人力、物力、财礼和时间，一般都采取从总体中抽取样本，根据样本信息来推断总体特征的方法，即抽样研究的方法来实现，这种从总体种随机抽取部分观察单位的过程称为抽样。

为保证样本的代表性，抽样时必须遵循随机化原则。

二、填空题1、医学统计工作的基本步骤：设计、搜集资料、整理资料、分析资料。

2、医学统计资料的主要来源的四个方面：统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。

3、正态分布的规律的应用：估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。

4、计量资料统计描述的方法：频数分布表、频数分布图、统计指标。

5、CV（变异系数）：常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。

6、统计推断是从总体中随机抽样本，由样本信息推断总体特征的过程，包括参数估计和假设检验两方面内容。

参数估计包括点估计和区间估计。

7、可信区见估计的优劣取决于两要素：（1）可信度1-α（准确度），即区间包含总体均数µ的理论概率大小，可信度愈接近1愈好。

（2）区间宽度β（精密度），即区间的长度，区间愈窄愈好。

8、变量变换的方法有：对数变换、平方跟变换、倒数变换、平方根反正弦变换。

9、常用的相对数：率、构成比、相对比。

10、动态数列常用指标有：绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。

11、二项式分布的参数是n和π。

n,n次独立重复实验数目；π，每次实验的“阳性”概率。

12、二项式分布在n很大，而π很小，且nπ=λ为常数时，二项式分布近似Poisson分布。

13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。

14、Poisson分布具备可加性。

15、当λ（总体率）增大时，Poisson分布渐近正态分布。

16、四格表中四格子基本数值为两对实测的实际频数和理论频数。

17、R*C表的卡方检验，若表格中有一个方向按多个等级分类时，则称之为单向有序行列表，当等级数大于3时，如检验各处理组各等级下的构成比有无差别时采用Χ2检验，如检验各处理组各等级下的程度上有无差别时采用非参数检验。

18、配对比较秩和检验，以正秩或负秩的和（T）为检验统计量，其中T越小则P的值小于相应的检验水平。

19、正态分布的两个参数µ和σ2，前者决定分布的位置，后者决定分布的形态（形状、变异度）。

20、四格表Χ2的校正条件为n≥40而且1＜T＜5。

21、R*C表资料Χ2检验，如果有T＜1，应该采取的措施有：（1）增加样本含量，使理论频数增大；（2）根据专业知识考虑能否删除理论频数太小的行或列，能否将理论频数太小的行或列与性质相近的行或列合并。

（3）改用双向无序R*C表资料的Fisher确切概率法。

22、Poisson分布中，总体的方差与均数的关系是λ=σ2，当均数较大时，Poisson分布趋近于正态分布。

23、要分析某个资料是否属于二项分布，可用频数分布的拟合优度的Χ2检验。

24、r是相关系数，表示具有直线关系的两变量间相关密切程度和相关方向。

25、变异系数的应用条件是均数相差较大、观察指标单位不同。

26、Χ2表示理论频数与实际频数的符合程度。

27、常用相对数的指标有强度相对数字（率）、结构相对数（构成比）、相对比（比）。

28、常用的描述构成比的统计图有圆图和百分比条图。

29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。

30、实验设计的基本原则随即机原则、对照原则、重复原则。

31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。

32、写出四种变量变换的方法：倒数变换、平方根变换、平方反正弦变换、对数变换。

33、在F检验中如有各比较组方差不齐时应用变量变换、近似t 检验、Wilcoxon秩和检验的方法。

34、四格表资料Χ2适用条件：（1）n≥40且T≥5时用Χ2检验的基本公式，当P≈α时，改用四格资料表的Fisher的确切概率法；（2）n≥40且1＜T＜5时用，用四格资料表Χ2检验的校正公式，或改用四格资料表的Fisher的确切概率法；（3）n＜40，或T＜1时，改用四格资料表的Fisher的确切概率法。

35、当总体率λ很小时，当n很大时，二项分布可用泊松分布来近似。

36、率的标准化的计算方法有直接标准化方法和间接标准化方法。

37、Χ2检验的用途：（1）推断两个总体率或构成比之间有无差别；（2）多个总体率或构成比之间有无差别；（3）两分类变量间有无关联性；（4）多个样本间的多重比较；（5）频数分布拟合优度的Χ2检验。