医学统计学问答题
医学统计学考试试题及答案
医学统计学考试试题及答案l.统计中所说的总体是指:() [单选题] *A根据研究目的确定的同质的研究对象的全体(正确答案)B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.统计学的主要作用是 : () [单选题] *A使分析更为简单B避免计算出现错误C改善数据质量D克服个体变异的影响E探测随机现象的规律(正确答案)3.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本4.测量身高、体重等指标的原始资料叫:() [单选题] *A计数资料B计量资料(正确答案)C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人,治疗结果如下:()[单选题] *A计数资料B计量资料C无序分类资料D有序分类资料(正确答案)E数值变量资料6.正态分布曲线的位置参数是: () [单选题] *AαBβC µ(正确答案)DσEχ7.医学统计学的基本内容是: () [单选题] *A统计设计、数据整理与核查、统计描述、统计推断(正确答案) B收集资料、整理资料、设计、统计推断C统计设计、收集资料、统计推断、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断8.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: () [单选题] *A抽样误差B系统误差(正确答案)C随机误差D责任事故E以上都不对9.以下何者不是实验设计应遵循的原则 : () [单选题] *A对照的原则B随机原则C重复原则D交叉的原则(正确答案)E以上都不对10.对于配对设计的t检验,其检验假设H0是:() [单选题] *A两样本均数相同B两样本均数不同C两总体均数相同D两样本均数不同E配对数据的差值总体均数为0(正确答案)11.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 : () [单选题] * A 算术均数B几何均数C 中位数(正确答案)D 标准差E 变异系数12.各观察值均加(或减)同一数后: () [单选题] *A均数不变,标准差改变B均数改变,标准差不变C两者均不变(正确答案)D两者均改变E以上均不对13.比较某地1990~1997年肝炎发病率宜绘制 : () [单选题] *A直条图B构成图C普通线图(正确答案)D直方图E统计地图14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24以上(小时),问该食物中毒的平均潜伏期为多少小时? () [单选题] *A 5B 5.5C 6(正确答案)D l0E 1215.比较12岁男孩身高和体重的变异程度大小,宜采用的指标是: () [单选题] *A全距B标准差C方差D变异系数(正确答案)E极差16.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是 : ()[单选题] *A变异系数B离均差平方和C极差D 四分位间距E标准差(正确答案)17.以下不属于统计表的基本组成的是:() [单选题] *A.标题B.标目C.线条D.时间(正确答案)E.数字18.某项指标95%医学参考值范围表示的是: () [单选题] *A在此范围“异常”的概率大于或等于95%B 在此范围“正常”的概率大于或等于95%C 在“异常”总体中有95%的人在此范围之外D 在“正常”总体中有95%的人在此范围(正确答案)E 在人群中检测指标有5%的可能超出此范围19.20世纪50年代,发现某省部分地区的居民因长期饮用深井高碘水导致高碘性甲状腺肿,随机抽查得到该地区甲乙两村常住居民的高碘性甲状腺肿患病率,甲村为20.6%,乙村为25.3%,则甲乙两村该病的合计患病率为:() [单选题] *A两村患病率的几何平均数得29.11%B 两村患病率相加得45.9%C 两村患病率相乘得5.21%D 两村患病率的平均数得22.95%E 甲乙两村调查人群中患该病总人数除以调查总人数(正确答案)20.药物A对于治疗普通肺炎的有效率为67.0%,药物B治疗普通肺炎的有效率为65 .7%,为了分析A药和B药对于普通肺炎的有效率是否不同,经过两独立样本的t检验计算t值,最后查表得到的P=0.035,那么该研究中最后应该下的研究结论应该是:() [单选题] *A药物A与药物B治疗普通肺炎的有效率相同B 尚不能认为药物A与药物B治疗普通肺炎的有效率相同(正确答案)C 尚不能认为药物A与药物B治疗普通肺炎的有效率不同D 药物A治疗普通肺炎的有效率优于药物BE 无法下结论21.以下属于离散型变量指标的是:() [单选题] *A身高B 体重C 住院病人数D 血液中血红蛋白含量(正确答案)E 某地年降水量22.小概率事件是指:() [单选题] *A统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件(正确答案)B 统计学上一般把P≤0.5或P≤0. 1的事件称为小概率事件C 统计学上一般把P≤0.05或P>0.01的事件称为小概率事件D 统计学上一般把P≤0.25的事件称为小概率事件E 发生概率足够小的事件23.在绘制频数分布表的过程中,组限在每组中: () [单选题] * A只包含下限而不包含上限(正确答案)B 只包含上限而不包含下限C 既包含下限又包含上限D 可自行选择包含上限或下限E 上限和下限均不包含24.以下几幅图中属于正偏态分布的是: ( A ) [单选题]A(正确答案)BC DE25.描述抗体滴度集中趋势适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数26.算术均数与中位数相比,其特点是:() [单选题] * A不易受极端值的影响B 能充分利用数据的信息(正确答案)C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明资料27.医学参考值范围的计算方法主要有:() [单选题] *A百分位数法和估计值法B 百分位数法和正态分布法(正确答案)C 百分位数法和查表法D 正态分布法和查表法E 查表法和公式计算法28.比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以:() [单选题] * A排除对结果有不良影响的个体B 增大样本量C 采用标准化率(正确答案)D 更改相关数据E 通过统计软件消除影响29.统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的: () [单选题] *A标准值B 标准差C 标准化率D 标准误(正确答案)E 标准方差30.以下变量适合用单侧检验进行分析的是:() [单选题] *A血铅水平(正确答案)B 血压C 呼吸次数D 血红蛋白含量E 3岁男童正常身高3l.统计学中所谓的样本通常是指:() [单选题] *A总体中有代表性的一部分观察单位(正确答案)B可测量的生物性样品C统计量D某一变量的测量值E数据中的一部分观测值32.医学统计学研究的对象是:() [单选题] *A医学中的小概率事件B各种类型的数据C动物和人的本质D疾病的预防与治疗E医学中具有不确定性结果的事物(正确答案)33.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本34,下列观测结果属于有序数据的是:() [单选题] *A收缩压测量值B脉搏数C住院天数D病情程度(正确答案)E四种血型35.两样本均数比较,其差别有统计学意义是指 :() [单选题] * A两样本均数的差别具有实际意义B两总体均数的差别具有实际意义C两样本和两总体均数的差别都具有实际意义D有理由认为两样本均数有差别E有理由认为两总体均数有差别(正确答案)36.不可完全消除的误差类型是:() [单选题] *A系统误差B 随机误差(正确答案)C 抽样误差D 人为误差E 机械误差37.正态曲线下,横轴上从均数到+∞的面积是:() [单选题] *A 50%(正确答案)B 95%C 97.5%D 99%E 不能确定(与标准差的大小有关)38.6人接种流感疫苗一个月后测定抗体滴度为1:20,1:40,1:80,1:160,1:320,求平均滴度应选用的指标是:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数39.描述两端无确定数值数据的平均水平适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数E 中位数(正确答案)40.以下变量中,属于分类变量的是: () [单选题] *A脉搏B血型(正确答案)C肺活量D红细胞计数E血压41.减少抽样误差的有效途径是:() [单选题] *A避免系统误差B控制随机测量误差C增大样本含量(正确答案)D减少样本含量E以上都不对42.样本是总体的 : () [单选题] *A有价值的部分B有意义的部分C有代表性的部分(正确答案)D任意一部分E典型部分43.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:() [单选题] * A统计设计B收集资料C整理资料D分析资料(正确答案)E以上均不对44.统计工作的步骤正确的是:() [单选题] *A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料(正确答案)D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断45.表示血清学滴度资料平均水平最常计算 :() [单选题] *A算术均数B几何均数(正确答案)C中位数D全距E率46.一种新的治疗方法不能治愈病人,但能延长病人寿命,那么则会发生的情况是 :() [单选题] *A 该病患病率增加(正确答案)B 该病发病率增加C 该病患病率下降D 该病发病率下降E 以上都不对47.计算标化死亡率的目的是:() [单选题] *A 减少死亡率估计的抽样误差B 减少死亡率估计的系统误差C 便于进行不同地区的死亡率比较D 便于进行不同时间的死亡率比较E 消除不同人群内部构成不同的影响(正确答案)48.统计推断的目的是: () [单选题] *A参数估计B假设检验C统计描述D用样本信息推断总体特征(正确答案)E以上均不对49.两样本均数比较时,其无效假设是:() [单选题] * A.两个总体均数不同B.两个样本均数不同C.两个总体均数相同(正确答案)D.两个样本均数相同E.以上均不对50.实验设计的三个基本要素是: () [单选题] *A化学因素、物理因素、研究对象B 研究者、受试对象、效果C 受试对象、背景因素、实验效应D 处理因素、实验效应、受试对象(正确答案)E 干扰因素、实验场所、处理因素。
医学统计学试题答案
医学统计学试题答案一、选择题1. 医学统计学中,用于描述数据分布集中趋势的指标是()。
A. 方差B. 标准差C. 均数D. 百分位数答案:C2. 下列哪项不是医学研究中的常见随机误差来源?()。
A. 测量误差B. 抽样误差C. 实验设计偏差D. 仪器误差答案:C3. 在医学统计分析中,卡方检验主要用于()。
A. 比较两组连续变量的均值B. 比较两组分类变量的分布C. 检验两组数据的一致性D. 评估变量间的相关性答案:B4. 回归分析的主要目的是()。
A. 确定变量间的因果关系B. 评估变量间的关系强度C. 预测未来数据的趋势D. 以上都是答案:D5. 灵敏度和特异度是评价()的重要指标。
A. 治疗效果B. 诊断试验C. 预防措施D. 病因关系答案:B二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________和________。
答案:方差,标准差2. 医学研究中,为了减少随机误差的影响,常采用的方法有________、________和________。
答案:重复测量,随机化,盲法3. 医学统计分析中,用于评估两组连续变量间差异的非参数检验包括________、________等。
答案:Mann-Whitney U检验,Wilcoxon符号秩检验4. 逻辑回归分析可以用来处理变量间的________和________关系。
答案:线性,非线性5. 医学研究中,为了评估治疗效果的一致性,常用的统计方法是________。
答案:Meta分析三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用十分广泛,它通过使用各种统计方法和技术来分析和解释临床数据,帮助研究者得出科学的结论。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者设计合理的研究方案,如随机对照试验,以减少偏倚和误差。
其次,在数据收集阶段,统计学原理可以指导如何进行有效的数据采集和处理缺失数据。
医学统计学名词解释问答题
医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
3、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布)4、总体均数的可信区间与参考值范围的区别概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围5、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
医学统计学名词解释及问答题
医学统计学名词解释及问答题1、总体(population ):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation ):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic ):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error ):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability ):某事件发生的可能性大小。
9、正态分布(normal distribution ):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical referenee range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(varianee ):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation ):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用b 表示。
15、标准误(standard error ):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean ):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing ):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学题库及答案
医学统计学题库及答案1. 描述统计1.1 以下哪个是描述统计的目的?A. 通过样本数据估计总体参数B. 通过总体数据估计样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:C1.2 描述统计法可以通过以下哪种途径进行?A. 经验法B. 理论法C. 实证法D. 推理法答案:C1.3 描述统计研究的内容主要包括以下哪些方面?A. 数据的整理和分类B. 数据的测量和统计描述C. 数据的分析和解释D. 数据的比较和推断答案:A、B、C、D1.4 描述统计法分为以下哪两类?A. 单变量描述统计B. 双变量描述统计C. 多变量描述统计D. 多重描述统计答案:A、B、C、D2. 分布统计2.1 以下哪种回答正确描述了正态分布?A. 均值等于0,标准差等于1B. 均值等于1,标准差等于0C. 均值等于0,标准差大于1D. 均值等于1,标准差大于0答案:A2.2 正态分布的特点包括以下哪些?A. 对称分布B. 峰态分布C. 均匀分布D. 尖峰分布答案:A、D2.3 正态分布的标准差决定了以下哪个特征?A. 数据的离散程度B. 数据的集中程度C. 数据的偏斜程度D. 数据的峰态程度答案:A2.4 正态分布的特征值z是根据以下哪个公式计算得出的?A. z = (x - μ) / σB. z = (x - σ) / μC. z = (μ - x) / σD. z = (σ - x) / μ答案:A3. 推断统计3.1 推断统计的目的是什么?A. 通过样本数据推断总体参数B. 通过总体数据推断样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:A3.2 推断统计的方法主要包括以下哪些?A. 参数估计B. 假设检验C. 方差分析D. 相关分析答案:A、B、C3.3 参数估计的目的是什么?A. 估计总体参数B. 估计样本参数C. 估计总体样本参数D. 估计样本总体参数答案:A3.4 假设检验的步骤包括以下哪些?A. 对原假设提出对立假设B. 利用样本数据计算统计量的值C. 比较统计量的值与临界值D. 根据比较结果得出结论答案:A、B、C、D4. 相关分析4.1 以下哪个参数可以反映两个变量之间的关系强度?A. 相关系数B. 偏度C. 标准差D. 峰度答案:A4.2 相关系数的取值范围是什么?A. [-1, 0]B. [0, 1]C. [-∞, +∞]D. [0, +∞]答案:A、B4.3 相关系数绝对值越大表示什么?A. 两个变量之间的关系越强B. 两个变量之间的关系越弱C. 两个变量之间没有关系D. 无法确定两个变量之间的关系强弱答案:A4.4 相关分析需要满足以下哪些前提?A. 两个变量之间存在线性关系B. 两个变量之间呈正态分布C. 样本容量充足D. 数据来自独立样本答案:A、B、D这是一个医学统计学题库及答案的文档,包含了描述统计、分布统计、推断统计和相关分析等方面的问题和答案。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学 问答题
1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
2020年-2021年医学统计学各章节试题(含答案)
第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把( )的事件称为小概率事件。
A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( )。
4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是( )。
5.空腹血糖测量值,属于( )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是( )。
7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是( )。
8. 100名18岁男生的身高数据属于( )。
二、问答题1.举例说明总体与样本的概念 2.举例说明同质与变异的概念 3.简要阐述统计设计与统计分析的关系第一章绪论(答案)一、选择题1.D2.B3.A4. C5.C6.B7.D8.C二、问答题1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
医学统计学试题及答案
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
医学统计学问答题考试必备
医学统计学问答题1.试述医学参考值范围的制定方法。
答:(1)选择足够数量的正常人作为参照样本。
所谓“正常人”指排除了影响所研究指标的疾病和有关因素的同质人群。
(2)对选定的正常人进行准确的测定。
要严格控制检测误差,同时必须对测量条件做出统一的规定和说明。
(3)决定取单侧还是双侧范围值。
根据研究目的和专业知识选择适当的方法,一般选用双侧。
(4)选择适当的百分范围。
最常用的百分界限是95%。
(5)估计参考值范围的界限。
最基本的有百分位数法和正态分布法。
2.相对数使用时应注意哪些问题?答:(1)分析时构成比和率不能混淆构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。
(2)使用相对数时,分母不易过小分母过小时结果不稳定。
观察单位数少时最好用绝时数表示。
(3)要注意资料的可比性用以比较的资料应是同质的,除了研究因素之外,其余的因素应相同或相近。
(4)要注意使用率的标准化对于内部构成不同的资料,应先进行标准化后再做比较。
(5)要考虑存在抽样误差,样本之间的差异应做统计学检验。
3.试述线性相关系数与线性回归系数的意义。
答:线形相关系数是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。
它没有测量单位,其数值为-1 < r <o+1-为正,表示正相关;r为负,表示负相关;r为0,表示零相关即无直线关系;r绝对值为1时,表示完全相关。
线形回归系数是表示两变量之间的依存关系的统计量,它的数值表示当自变量变化一个单位,因变量随之变化的单位数。
4.描述计量资料离散趋势的指标有哪些?试述各指标的应用条件。
描述计量资料离散趋势的指标有极差、四分位数间距、方差和标准差、变异系数。
(1)极差(全距):应用于粗略地说明变量的变动范围。
(2)四分位数间距:应用于偏态分布的资料、开口资料或分布不明的资料。
(3)方差和标准差:应用于正态分布的资料。
(4)变异系数:应用于均数相差较大或单位不同的几组观察值得变异程度的比较。
《医学统计学》习题及答案
病毒性肝炎患者2.36 2.15 2.52 2.28 2.31 2.53 2.19 2.34 2.31 2.41
A.两样本均数的u检验B.样本均数与总体均数的t检验
C.两样本均数的t检验D.配对设计t检验
E.增长速度=(发展速度一1)/100
32.SMR表示
A.标化组实际死亡数与预期死亡数之比
B.标化组预期死亡数与实际死亡数之比
C.被标化组实际死亡数与预期死亡数之比
D.被标化组预期死亡数与实际死亡数之比
E.标准组与被标化组预期死亡数之比
33.两个样本率差别的假设检验,其目的是
A.推断两个样本率有无差别
E.第二类错误概率小
42.等级资料比较宜用
A. t检验B. u检验C.秩和检验
D. 检验E. F检验
43.作两均数比较,已知 、 均小于30,总体方差不齐且分布呈极度偏态,宜用
A. t检验B. u检验C.秩和检验
D. F检验E. 检验
44.从文献中得到同类研究的两个率比较的四格表资料,其 检验结果为:甲文 ,乙文 ,可认为
A. A≥5 B. T≥5 C. A≥5且T≥5
D. A≥5且n≥40E. T≥5且n≥40
38.三个样本率比较得到 > ,可以为
A.三个总体率不同或不全相同B.三个总体率都不相同
C.三个样本率都不相同D.三个样本率不同或不全相同
E.三个总体率中有两个不同
39.四格表 检验的校正公式应用条件为
A. n>40且T>5 B. n<40且T>5
1 2.74 4.49
医学统计学重要试题1
医学统计学重要试题1一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P 越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.部构成不同B.部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C:二、二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
医学统计学试题及答案
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学部分精彩试题及问题详解
word 第一章绪论1.如下关于概率的说法,错误的答案是A. 通常用P表示B. 大小在0%与100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.如下有关个人根本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.如下有关个人根本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.如下关于总体和样本的说法,不正确的答案是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体和有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年某某市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有某某市居民C. 2007年所有某某市居民D. 2007年某某市居民中的糖尿病患者E. 2007年某某市居民中的非糖尿病患者[参考答案] C. 2007年所有某某市居民6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进展统计推断的重要根底。
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的答:研究人员通常需要了解和研究某一类个体,这个类就是总体。
医学统计学问答题(含答案解析)
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。
医学统计学 试题-含答案
医学统计学试题-含答案编号:姓名专业:成绩:一、单选题(共30 题,每题1 分,共30 分。
请将答案填在下表的()中1. 对正态分布资料,常用哪些指标进行统计描述?( )A. 均数与标准差B. 均数与四分位数间距C. 中位数与四分位数间距D. 中位数与标准差2. 纵轴尺度必须从0 开始的统计图为()。
A. 线图B.条图C.散点图D.箱式图3. 欲分析60 例类风湿关节炎患者血清EBV-VCA-lgG 抗体滴度的平均水平,宜采用( )A .均数B .几何均数C .中位数D .标准差4. 某地调查110 名30~49 岁健康成年男性的血清总胆固醇,得均数4.74(mmol/L)、标准差0.8816(mmol/L)和标准误0.0841(mmol/L)。
估计该地健康成年男性总血清胆固醇的95%参考值范围应根据()。
A. 4.74±1.96×0.8816B. 4.74±2.58×0.8816C. 4.74±1.96×0.0841D. 4.74±2.58×0.08415. 从偏态总体抽样,当n 足够大时(比如n > 60),样本均数的分布()。
A. 仍为偏态分布B. 近似对称分布C. 近似正态分布D. 近似对数正态分布6. 当n 较大,p 和1-p 均不太小,如np 和n( 1-p)均大于5 时,总体率95%可信区间的计算公式为()。
A. p±1.96s pB. p±2.58s pC. p±2.33s pD. p±1.64s p7. 理论上要求两个正态总体方差相等的假设检验方法是()。
A. Paired-samples t testB. Wilcoxon rank sum testC. One-samples t testD. Independent -samples t test8. 某医生随访收集了200 例食管癌术后病人的生存时间随访资料,欲分析多个预后因素对生存时间的影响,宜选用()。
医学统计学试题及答案
一、选择题(每题2分,共20分)1. 以下哪种类型的数据属于计数资料?A. 体温测量值B. 血压测量值C. 血红蛋白含量D. 血小板计数答案:D2. 以下哪种统计指标可以反映数据的集中趋势?A. 标准差B. 方差C. 离散系数D. 中位数答案:D3. 以下哪种方法可以用来估计总体参数?A. 参数估计B. 非参数估计C. 概率估计D. 样本估计答案:A4. 以下哪种方法可以用来检验两个总体均值是否相等?A. t检验B. F检验C. 卡方检验答案:A5. 以下哪种统计指标可以反映数据的离散程度?A. 平均数B. 标准差C. 中位数D. 四分位数间距答案:B6. 以下哪种误差是由于抽样过程中随机因素造成的?A. 系统误差B. 随机误差C. 系统偏差D. 随机偏差答案:B7. 以下哪种统计方法可以用来比较两个分类变量的比例差异?A. t检验B. F检验C. 卡方检验D. 秩和检验答案:C8. 以下哪种统计方法可以用来检验两个独立样本的均值差异是否具有统计学意义?A. t检验B. F检验D. 秩和检验答案:A9. 以下哪种统计指标可以反映数据的分布形状?A. 标准差B. 方差C. 中位数D. 离散系数答案:D10. 以下哪种统计方法可以用来检验一个样本的均值是否与总体均值相等?A. t检验B. F检验C. 卡方检验D. 秩和检验答案:A二、填空题(每空2分,共10分)1. 样本量越大,抽样误差越小,因此,增大样本量可以提高统计推断的可靠性。
2. 两种独立样本的方差不相等时,应使用t检验中的______方法。
3. 在进行卡方检验时,如果期望频数小于5,应使用______检验。
4. 在进行t检验时,若样本量较小,应使用______检验。
5. 当总体分布未知时,可以使用______方法进行参数估计。
三、简答题(每题5分,共15分)1. 简述医学统计学的基本任务。
答案:医学统计学的基本任务包括:①描述医学现象的数据特征;②推断医学现象的规律性;③分析医学现象之间的关联性;④为医学决策提供依据。
医学统计学题库第十六章 生存分析(答案)
第十六章 生存分析(答案)一、选择题1、D2、E3、C4、B5、D6、E 二、问答题1、 (1)在生存资料中,截尾值指尚未观察到研究对象出现反应时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存资料称为截尾值。
(2)出现截尾值的原因主要有以下3种情况:①失访;②退出;③终止。
2、Cox 回归模型中,偏回归系数i β的意义是,当其它协变量不变时,i X 每变化一个单位,相对危险度的自然对数变化i β个单位。
3、Cox 回归模型与logistic 回归模型具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。
但Cox 回归模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,而logistic 回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。
三、计算题:1、(1)Cox 回归模型参数估计和假设检验结果见下表表 cox 回归模型计算及检验结果 (621.332=χ, 000.0=P )变量 偏回归系数 偏回归系数标准误 Wald P 值 OR 值 OR 值95%可信区间 下限 上限 x1 0.001 0.002 0.360 0.548 1.001 0.997 1.005 x2 0.454 0.206 4.846 0.028 1.574 1.051 2.358 x3 -1.8860.37725.0500.0000.1520.072 0.317由上表可见,在05.0=α检验水准上,所建立的Cox 回归模型成立(621.332=χ,000.0=P );入院时白细胞数(1x )的偏回归系数无统计学意义,淋巴结浸润度(2x )和缓解出院后的巩固治疗(3x )的偏回归系数均有统计学意义。
Cox 回归模型为:[])886.1454.0001.0ex p()(),(3210x x x t h X t h i -+=。
以上结果可解释为:淋巴结浸润度(2x )和缓解出院后的巩固治疗(3x )均对急性淋巴细胞性白血病病人的生存时间产生影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为%,区间µ±σ的面积为%,区间µ±σ的面积为%。
6.试举例说明均数的标准差与标准误的区别与联系。
7.标准正态分布(u 分布)与t 分布有何不同?t 分布为抽样分布,标准正态分布(u 分布)为理论分布。
t 分布比正态分布的峰值低,且尾部翘得更高。
随着自由度的增大,t 分布逐渐趋近于标准正态分布。
即当自由度ν→∞时,t 分布→标准正态分布。
8.均数的可信区间与参考值范围有何不同?9.假设检验时,一般当P <时,则拒绝H 0,理论根据是什么?10.假设检验中和P 的区别何在?检验的应用条件是什么?型错误与II 型错误有何区别与联系?I 型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示。
II 型错误则是“接受”了实际上不成立的0H 所犯的“取伪”错误,其概率大小用β表示。
当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。
13.假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。
两者既互相联系,又有区别。
假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H 。
也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。
14.为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝0H 时,有可能犯I 型错误;“接受” 0H 时可能犯II 型错误。
无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。
15.方差分析的基本思想和应用条件是什么?方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分 解为两个或多个组成部分,其总自由度也分解为相应的几个部分。
例如完全随机设计的方差 分析,可把总变异分解为组间变异和组内变异,即SS 总=SS 组内+SS 组间,总的自由度也 分解为相应的两部分,即ν 总=ν 组内+ν 组间。
离均差平方和除以自由度得均方MS ,组间 均方(MS 组间)与误差均方(MS 误差)之比为 F 值;如果各组处理的效应一样,则组间均方等 于组内均方,即 F =1;但由于抽样误差,F 值不正好等于1,而是接近 1;如果F 值较大, 远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义, 至于F 值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。
方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。
16.在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?组间SS 表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;组内SS 表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。
17. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?区别点完全随机设计 随机区组设计 设计 采用完全随机化的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分别接受不同的处理。
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。
变异分解三种变异:总SS =组间SS +组内SS 四种变异:总SS =处理SS +区组SS +误差SS18.以实例说明为什么不能以构成比代替率?19.秩和检验的优缺点?20.简述直线回归与直线相关的区别与联系。
联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b 与r 正负号一致。
2相关系数与回归的假设检验等价,即对于同一样本,tb=tr3同一组数据的相关系数和回归系数可以互相换算:r=by ,x*Sx/Sy 4用回归解释相关:由于决定系数总回ss ss r /2 ,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明相关的效果越好。
二者的区别:(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。
(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y 如何依赖于X 而变化。
(3)意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。
(4)计算上:xy xx xy l l l r //=,xx xy l l b /=(5)取值范围:-1≤r ≤1,-∞<b<∞.2、 二项分布、Poission 分布的应用条件 二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传 病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立 的结果;(2) n 次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。
Poisson 分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合 Poisson 分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n 次试验 相互独立;(3) n 应很大, P 应很小。
3、极差、四分位数间距、标准差、变异系数的适用范围有何异同? 答:这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点 为: 极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变 异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来 比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的 离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程 度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
4.中位数、均数、几何均数的适用条件有何异同。
(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水 平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态 分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明 显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值 的数值变量资料的平均水平。
5.第一类错误与第二类错误的区别与联系。
当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α 表示。
当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β 表示。
当样本含量一定时,α 愈大,β 愈小,反之,α 愈小,β 愈大。
1-β 称为检验效能或 把握度,其意义是两总体确有差别,按α 水准能发现它们有差别的能力。
6.运用相对数时要注意哪些问题? 应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过 小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比 较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需 要进行率的标准化;(5)两样本率比较时应进行假设检验。
7.方差分析后进行两两比较能否用t 检验?为什么? t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给 出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在 单因素k 水平设计(k ≥3)和多因素设计的定量资料的均值检验场合。
方差分析 有十几种,不同的方差分析取决于不同的设计类型。
t 检验进行两两比较 其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平), 混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错 误用单因素多水平设计或仍采用多次t 检验进行两两比较。
误用这两种方法的后果是,不仅 无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出 错误的结论。
参数检验与非参数检验的区别何在?各有何优缺点? (1)区别: 参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。
(2)优缺点: 参数检验:优点是符合条件时,检验效能高。
缺点是对资料要求严格,如等级资料、分 布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相 等。