医学统计学问答题(含答案)
医学统计学考试试题及答案
医学统计学考试试题及答案l.统计中所说的总体是指:() [单选题] *A根据研究目的确定的同质的研究对象的全体(正确答案)B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.统计学的主要作用是 : () [单选题] *A使分析更为简单B避免计算出现错误C改善数据质量D克服个体变异的影响E探测随机现象的规律(正确答案)3.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本4.测量身高、体重等指标的原始资料叫:() [单选题] *A计数资料B计量资料(正确答案)C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人,治疗结果如下:()[单选题] *A计数资料B计量资料C无序分类资料D有序分类资料(正确答案)E数值变量资料6.正态分布曲线的位置参数是: () [单选题] *AαBβC µ(正确答案)DσEχ7.医学统计学的基本内容是: () [单选题] *A统计设计、数据整理与核查、统计描述、统计推断(正确答案) B收集资料、整理资料、设计、统计推断C统计设计、收集资料、统计推断、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断8.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: () [单选题] *A抽样误差B系统误差(正确答案)C随机误差D责任事故E以上都不对9.以下何者不是实验设计应遵循的原则 : () [单选题] *A对照的原则B随机原则C重复原则D交叉的原则(正确答案)E以上都不对10.对于配对设计的t检验,其检验假设H0是:() [单选题] *A两样本均数相同B两样本均数不同C两总体均数相同D两样本均数不同E配对数据的差值总体均数为0(正确答案)11.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 : () [单选题] * A 算术均数B几何均数C 中位数(正确答案)D 标准差E 变异系数12.各观察值均加(或减)同一数后: () [单选题] *A均数不变,标准差改变B均数改变,标准差不变C两者均不变(正确答案)D两者均改变E以上均不对13.比较某地1990~1997年肝炎发病率宜绘制 : () [单选题] *A直条图B构成图C普通线图(正确答案)D直方图E统计地图14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24以上(小时),问该食物中毒的平均潜伏期为多少小时? () [单选题] *A 5B 5.5C 6(正确答案)D l0E 1215.比较12岁男孩身高和体重的变异程度大小,宜采用的指标是: () [单选题] *A全距B标准差C方差D变异系数(正确答案)E极差16.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是 : ()[单选题] *A变异系数B离均差平方和C极差D 四分位间距E标准差(正确答案)17.以下不属于统计表的基本组成的是:() [单选题] *A.标题B.标目C.线条D.时间(正确答案)E.数字18.某项指标95%医学参考值范围表示的是: () [单选题] *A在此范围“异常”的概率大于或等于95%B 在此范围“正常”的概率大于或等于95%C 在“异常”总体中有95%的人在此范围之外D 在“正常”总体中有95%的人在此范围(正确答案)E 在人群中检测指标有5%的可能超出此范围19.20世纪50年代,发现某省部分地区的居民因长期饮用深井高碘水导致高碘性甲状腺肿,随机抽查得到该地区甲乙两村常住居民的高碘性甲状腺肿患病率,甲村为20.6%,乙村为25.3%,则甲乙两村该病的合计患病率为:() [单选题] *A两村患病率的几何平均数得29.11%B 两村患病率相加得45.9%C 两村患病率相乘得5.21%D 两村患病率的平均数得22.95%E 甲乙两村调查人群中患该病总人数除以调查总人数(正确答案)20.药物A对于治疗普通肺炎的有效率为67.0%,药物B治疗普通肺炎的有效率为65 .7%,为了分析A药和B药对于普通肺炎的有效率是否不同,经过两独立样本的t检验计算t值,最后查表得到的P=0.035,那么该研究中最后应该下的研究结论应该是:() [单选题] *A药物A与药物B治疗普通肺炎的有效率相同B 尚不能认为药物A与药物B治疗普通肺炎的有效率相同(正确答案)C 尚不能认为药物A与药物B治疗普通肺炎的有效率不同D 药物A治疗普通肺炎的有效率优于药物BE 无法下结论21.以下属于离散型变量指标的是:() [单选题] *A身高B 体重C 住院病人数D 血液中血红蛋白含量(正确答案)E 某地年降水量22.小概率事件是指:() [单选题] *A统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件(正确答案)B 统计学上一般把P≤0.5或P≤0. 1的事件称为小概率事件C 统计学上一般把P≤0.05或P>0.01的事件称为小概率事件D 统计学上一般把P≤0.25的事件称为小概率事件E 发生概率足够小的事件23.在绘制频数分布表的过程中,组限在每组中: () [单选题] * A只包含下限而不包含上限(正确答案)B 只包含上限而不包含下限C 既包含下限又包含上限D 可自行选择包含上限或下限E 上限和下限均不包含24.以下几幅图中属于正偏态分布的是: ( A ) [单选题]A(正确答案)BC DE25.描述抗体滴度集中趋势适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数26.算术均数与中位数相比,其特点是:() [单选题] * A不易受极端值的影响B 能充分利用数据的信息(正确答案)C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明资料27.医学参考值范围的计算方法主要有:() [单选题] *A百分位数法和估计值法B 百分位数法和正态分布法(正确答案)C 百分位数法和查表法D 正态分布法和查表法E 查表法和公式计算法28.比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以:() [单选题] * A排除对结果有不良影响的个体B 增大样本量C 采用标准化率(正确答案)D 更改相关数据E 通过统计软件消除影响29.统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的: () [单选题] *A标准值B 标准差C 标准化率D 标准误(正确答案)E 标准方差30.以下变量适合用单侧检验进行分析的是:() [单选题] *A血铅水平(正确答案)B 血压C 呼吸次数D 血红蛋白含量E 3岁男童正常身高3l.统计学中所谓的样本通常是指:() [单选题] *A总体中有代表性的一部分观察单位(正确答案)B可测量的生物性样品C统计量D某一变量的测量值E数据中的一部分观测值32.医学统计学研究的对象是:() [单选题] *A医学中的小概率事件B各种类型的数据C动物和人的本质D疾病的预防与治疗E医学中具有不确定性结果的事物(正确答案)33.关于随机抽样,以下哪一项说法是正确的:() [单选题] *A抽样时应使得总体中的每一个个体都有同等的机会被抽取(正确答案) B研究者在抽样时应精心挑选个体,以使样本更能代表总体C随机抽样即随意抽取个体D为确保样本具有更好的代表性,样本量应越大越好E选择符合研究者意愿的样本34,下列观测结果属于有序数据的是:() [单选题] *A收缩压测量值B脉搏数C住院天数D病情程度(正确答案)E四种血型35.两样本均数比较,其差别有统计学意义是指 :() [单选题] * A两样本均数的差别具有实际意义B两总体均数的差别具有实际意义C两样本和两总体均数的差别都具有实际意义D有理由认为两样本均数有差别E有理由认为两总体均数有差别(正确答案)36.不可完全消除的误差类型是:() [单选题] *A系统误差B 随机误差(正确答案)C 抽样误差D 人为误差E 机械误差37.正态曲线下,横轴上从均数到+∞的面积是:() [单选题] *A 50%(正确答案)B 95%C 97.5%D 99%E 不能确定(与标准差的大小有关)38.6人接种流感疫苗一个月后测定抗体滴度为1:20,1:40,1:80,1:160,1:320,求平均滴度应选用的指标是:() [单选题] *A算术均数B 方差C 标准差D 几何均数(正确答案)E 中位数39.描述两端无确定数值数据的平均水平适宜用:() [单选题] *A算术均数B 方差C 标准差D 几何均数E 中位数(正确答案)40.以下变量中,属于分类变量的是: () [单选题] *A脉搏B血型(正确答案)C肺活量D红细胞计数E血压41.减少抽样误差的有效途径是:() [单选题] *A避免系统误差B控制随机测量误差C增大样本含量(正确答案)D减少样本含量E以上都不对42.样本是总体的 : () [单选题] *A有价值的部分B有意义的部分C有代表性的部分(正确答案)D任意一部分E典型部分43.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:() [单选题] * A统计设计B收集资料C整理资料D分析资料(正确答案)E以上均不对44.统计工作的步骤正确的是:() [单选题] *A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料(正确答案)D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断45.表示血清学滴度资料平均水平最常计算 :() [单选题] *A算术均数B几何均数(正确答案)C中位数D全距E率46.一种新的治疗方法不能治愈病人,但能延长病人寿命,那么则会发生的情况是 :() [单选题] *A 该病患病率增加(正确答案)B 该病发病率增加C 该病患病率下降D 该病发病率下降E 以上都不对47.计算标化死亡率的目的是:() [单选题] *A 减少死亡率估计的抽样误差B 减少死亡率估计的系统误差C 便于进行不同地区的死亡率比较D 便于进行不同时间的死亡率比较E 消除不同人群内部构成不同的影响(正确答案)48.统计推断的目的是: () [单选题] *A参数估计B假设检验C统计描述D用样本信息推断总体特征(正确答案)E以上均不对49.两样本均数比较时,其无效假设是:() [单选题] * A.两个总体均数不同B.两个样本均数不同C.两个总体均数相同(正确答案)D.两个样本均数相同E.以上均不对50.实验设计的三个基本要素是: () [单选题] *A化学因素、物理因素、研究对象B 研究者、受试对象、效果C 受试对象、背景因素、实验效应D 处理因素、实验效应、受试对象(正确答案)E 干扰因素、实验场所、处理因素。
医学统计学试题答案
医学统计学试题答案一、选择题1. 医学统计学中,用于描述数据分布集中趋势的指标是()。
A. 方差B. 标准差C. 均数D. 百分位数答案:C2. 下列哪项不是医学研究中的常见随机误差来源?()。
A. 测量误差B. 抽样误差C. 实验设计偏差D. 仪器误差答案:C3. 在医学统计分析中,卡方检验主要用于()。
A. 比较两组连续变量的均值B. 比较两组分类变量的分布C. 检验两组数据的一致性D. 评估变量间的相关性答案:B4. 回归分析的主要目的是()。
A. 确定变量间的因果关系B. 评估变量间的关系强度C. 预测未来数据的趋势D. 以上都是答案:D5. 灵敏度和特异度是评价()的重要指标。
A. 治疗效果B. 诊断试验C. 预防措施D. 病因关系答案:B二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________和________。
答案:方差,标准差2. 医学研究中,为了减少随机误差的影响,常采用的方法有________、________和________。
答案:重复测量,随机化,盲法3. 医学统计分析中,用于评估两组连续变量间差异的非参数检验包括________、________等。
答案:Mann-Whitney U检验,Wilcoxon符号秩检验4. 逻辑回归分析可以用来处理变量间的________和________关系。
答案:线性,非线性5. 医学研究中,为了评估治疗效果的一致性,常用的统计方法是________。
答案:Meta分析三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用十分广泛,它通过使用各种统计方法和技术来分析和解释临床数据,帮助研究者得出科学的结论。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者设计合理的研究方案,如随机对照试验,以减少偏倚和误差。
其次,在数据收集阶段,统计学原理可以指导如何进行有效的数据采集和处理缺失数据。
医学统计学本科试题及答案
医学统计学本科试题及答案一、选择题(每题2分,共20分)1. 在医学统计学中,总体是指:A. 研究中的所有个体B. 研究中所观察到的个体C. 研究中所抽取的样本D. 研究中未观察到的个体答案:A2. 下列哪项不是医学统计学中常用的统计图表?A. 条形图B. 折线图C. 饼图D. 散点图E. 树状图答案:E3. 以下哪个指标用于描述分类变量的关联性?A. 均值B. 标准差C. 相关系数D. 卡方检验答案:D4. 医学统计学中的“误差”通常指:A. 测量误差B. 抽样误差C. 实验误差D. 所有上述情况答案:D5. 在进行两独立样本均值的比较时,应使用:A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:A6. 医学统计学中的“样本量”是指:A. 研究中观察到的个体数量B. 研究中抽取的个体数量C. 研究中所有可能的个体数量D. 研究中随机抽取的个体数量答案:B7. 以下哪个统计量用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 方差答案:D8. 相关系数的取值范围是:A. -1 到 1B. 0 到 1C. -∞ 到+∞D. 1 到+∞答案:A9. 在医学研究中,为了减少偏倚,研究者通常会采用:A. 随机化B. 匹配C. 盲法D. A和C答案:D10. 下列哪项是生存分析中常用的统计方法?A. Kaplan-Meier法B. Cox回归C. Logistic回归D. 所有上述情况答案:D二、简答题(每题10分,共30分)1. 简述医学统计学中的“随机误差”和“系统误差”的区别。
答案:随机误差是指在测量过程中由于偶然因素引起的误差,这种误差是不可预测的,但在多次测量中会呈现正态分布,可以通过增加样本量来减少其影响。
系统误差则是由于测量方法或仪器本身的缺陷引起的误差,它是可预测的,并且会持续影响测量结果,需要通过改进测量方法或校准仪器来消除。
2. 解释医学统计学中的“95%置信区间”的含义。
医学统计学题库及答案
医学统计学题库及答案1. 描述统计1.1 以下哪个是描述统计的目的?A. 通过样本数据估计总体参数B. 通过总体数据估计样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:C1.2 描述统计法可以通过以下哪种途径进行?A. 经验法B. 理论法C. 实证法D. 推理法答案:C1.3 描述统计研究的内容主要包括以下哪些方面?A. 数据的整理和分类B. 数据的测量和统计描述C. 数据的分析和解释D. 数据的比较和推断答案:A、B、C、D1.4 描述统计法分为以下哪两类?A. 单变量描述统计B. 双变量描述统计C. 多变量描述统计D. 多重描述统计答案:A、B、C、D2. 分布统计2.1 以下哪种回答正确描述了正态分布?A. 均值等于0,标准差等于1B. 均值等于1,标准差等于0C. 均值等于0,标准差大于1D. 均值等于1,标准差大于0答案:A2.2 正态分布的特点包括以下哪些?A. 对称分布B. 峰态分布C. 均匀分布D. 尖峰分布答案:A、D2.3 正态分布的标准差决定了以下哪个特征?A. 数据的离散程度B. 数据的集中程度C. 数据的偏斜程度D. 数据的峰态程度答案:A2.4 正态分布的特征值z是根据以下哪个公式计算得出的?A. z = (x - μ) / σB. z = (x - σ) / μC. z = (μ - x) / σD. z = (σ - x) / μ答案:A3. 推断统计3.1 推断统计的目的是什么?A. 通过样本数据推断总体参数B. 通过总体数据推断样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:A3.2 推断统计的方法主要包括以下哪些?A. 参数估计B. 假设检验C. 方差分析D. 相关分析答案:A、B、C3.3 参数估计的目的是什么?A. 估计总体参数B. 估计样本参数C. 估计总体样本参数D. 估计样本总体参数答案:A3.4 假设检验的步骤包括以下哪些?A. 对原假设提出对立假设B. 利用样本数据计算统计量的值C. 比较统计量的值与临界值D. 根据比较结果得出结论答案:A、B、C、D4. 相关分析4.1 以下哪个参数可以反映两个变量之间的关系强度?A. 相关系数B. 偏度C. 标准差D. 峰度答案:A4.2 相关系数的取值范围是什么?A. [-1, 0]B. [0, 1]C. [-∞, +∞]D. [0, +∞]答案:A、B4.3 相关系数绝对值越大表示什么?A. 两个变量之间的关系越强B. 两个变量之间的关系越弱C. 两个变量之间没有关系D. 无法确定两个变量之间的关系强弱答案:A4.4 相关分析需要满足以下哪些前提?A. 两个变量之间存在线性关系B. 两个变量之间呈正态分布C. 样本容量充足D. 数据来自独立样本答案:A、B、D这是一个医学统计学题库及答案的文档,包含了描述统计、分布统计、推断统计和相关分析等方面的问题和答案。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计100题
医学统计学试题及其答案l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学试题及答案
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
(完整版)医学统计学试题和答案
(一)单项选择题3.抽样的目的是( b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于 1B.一定小于 1C. 可大于1,也可小于 1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
医学统计学练习题及参考答案
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《医学统计学》习题及答案
病毒性肝炎患者2.36 2.15 2.52 2.28 2.31 2.53 2.19 2.34 2.31 2.41
A.两样本均数的u检验B.样本均数与总体均数的t检验
C.两样本均数的t检验D.配对设计t检验
E.增长速度=(发展速度一1)/100
32.SMR表示
A.标化组实际死亡数与预期死亡数之比
B.标化组预期死亡数与实际死亡数之比
C.被标化组实际死亡数与预期死亡数之比
D.被标化组预期死亡数与实际死亡数之比
E.标准组与被标化组预期死亡数之比
33.两个样本率差别的假设检验,其目的是
A.推断两个样本率有无差别
E.第二类错误概率小
42.等级资料比较宜用
A. t检验B. u检验C.秩和检验
D. 检验E. F检验
43.作两均数比较,已知 、 均小于30,总体方差不齐且分布呈极度偏态,宜用
A. t检验B. u检验C.秩和检验
D. F检验E. 检验
44.从文献中得到同类研究的两个率比较的四格表资料,其 检验结果为:甲文 ,乙文 ,可认为
A. A≥5 B. T≥5 C. A≥5且T≥5
D. A≥5且n≥40E. T≥5且n≥40
38.三个样本率比较得到 > ,可以为
A.三个总体率不同或不全相同B.三个总体率都不相同
C.三个样本率都不相同D.三个样本率不同或不全相同
E.三个总体率中有两个不同
39.四格表 检验的校正公式应用条件为
A. n>40且T>5 B. n<40且T>5
1 2.74 4.49
医学统计学重要试题1
医学统计学重要试题1一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P 越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.部构成不同B.部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C:二、二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
医学统计学试题及答案
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
(完整版)医学统计学试题和答案
(一)单项选择题3.抽样的目的是(b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
医学统计学问答题(含答案解析)
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。
临床医学院《医学统计学》考核试题与答案
临床医学院《医学统计学》考核一、A11、均数和标准差的关系是()[单选题] *A、标准差越小,均数越大B、标准差越大,均数越小C、标准差越大,均数对样本各观察值的代表性越好D、标准差越小,均数对样本各观察值的代表性越好√2、某农村地区一组9岁男孩身高均数为123.9cm,标准差为6.1cm;体重均数为24.7kg,标准差为3.1kg。
下面说法中正确的是()[单选题] *A、身高的标准差为6.1,体重的标准差为3.1,身高的变异比体重大B、身高的标准差为6.1cm,体重的标准差为3.1kg,身高的变异比体重大C、身高的标准差为6.1cm,体重的标准差为3.1kg,无法比较D、身高变异系数为4.9%,体重变异系数为12.6%,体重变异比身高大√3、当=1时,下列说法不正确的是()[单选题] *A、b=1√B、决定系数=1C、说明两变量之间关系密切D、说明两变量之间呈正相关关系4、最小二乘法确定直线回归方程的原则是()[单选题] *A、各观测点距直线的垂直距离相等B、各观测点距直线的垂直距离平方和最小C、各观测点距直线的纵向距离相等D、各观测点距直线的纵向距离平方和最小√5、如果两变量呈非线性的关系,在探索两变量的关联程度时()[单选题] *A、直接计算线性相关或回归系数B、先进行变量转换,使其呈现线性关系,然后进行线性相关或回归分析C、直接用原始数据拟合曲线D、B和C均正确√6、对于简单随机抽样,每个个体每次被抽到的机会都()[单选题] *A、相等√B、不相等C、无法确定D、不一定7、一项评价培美曲塞联合奈达铂治疗中晚期肺腺癌效果的临床试验,有310名患者参与,并被随机分为两组。
这310名患者是()[单选题] *A、目标总体B、研究总体C、1份样本D、310份样本√8、某县有25万人口,其中农村居民占70%,现欲作农村居民高血压患病情况及其影响因素的调查研究,所确定的“观察单位”应该是()[单选题] *A、该县的农村居民个体√B、该县的自然村C、该县的每个农村家庭D、该县的常驻居民9、正态分布的两个参数和,以下对应的正态曲线越趋于高耸的是()[单选题] *A、μ愈大B、μ愈小C、σ愈大D、σ愈小√10、一批产品,优质品占20%,进行重复抽样检查,共取5件产品进行检查,则恰有三件是优质品的概率等于()[单选题] *A、B、C、D、E、√11、某城市7岁男童平均身高为119.95cm,标准差为4.72cm。
医学统计学 试题-含答案
医学统计学试题-含答案编号:姓名专业:成绩:一、单选题(共30 题,每题1 分,共30 分。
请将答案填在下表的()中1. 对正态分布资料,常用哪些指标进行统计描述?( )A. 均数与标准差B. 均数与四分位数间距C. 中位数与四分位数间距D. 中位数与标准差2. 纵轴尺度必须从0 开始的统计图为()。
A. 线图B.条图C.散点图D.箱式图3. 欲分析60 例类风湿关节炎患者血清EBV-VCA-lgG 抗体滴度的平均水平,宜采用( )A .均数B .几何均数C .中位数D .标准差4. 某地调查110 名30~49 岁健康成年男性的血清总胆固醇,得均数4.74(mmol/L)、标准差0.8816(mmol/L)和标准误0.0841(mmol/L)。
估计该地健康成年男性总血清胆固醇的95%参考值范围应根据()。
A. 4.74±1.96×0.8816B. 4.74±2.58×0.8816C. 4.74±1.96×0.0841D. 4.74±2.58×0.08415. 从偏态总体抽样,当n 足够大时(比如n > 60),样本均数的分布()。
A. 仍为偏态分布B. 近似对称分布C. 近似正态分布D. 近似对数正态分布6. 当n 较大,p 和1-p 均不太小,如np 和n( 1-p)均大于5 时,总体率95%可信区间的计算公式为()。
A. p±1.96s pB. p±2.58s pC. p±2.33s pD. p±1.64s p7. 理论上要求两个正态总体方差相等的假设检验方法是()。
A. Paired-samples t testB. Wilcoxon rank sum testC. One-samples t testD. Independent -samples t test8. 某医生随访收集了200 例食管癌术后病人的生存时间随访资料,欲分析多个预后因素对生存时间的影响,宜选用()。
医学统计学--问答题
1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布 标准正态分布原始值X无需转换作u=(X-µ)/σ转换分布类型对称对称集中趋势µµ=0均数与中位数的关系µ=Mµ=M参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型2)描述频数分布的特征3)便于发现一些特大或特小的可疑值4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。
6.试举例说明均数的标准差与标准误的区别与联系。
7.标准正态分布(u分布)与t分布有何不同?t分布为抽样分布,标准正态分布(u分布)为理论分布。
t分布比正态分布的峰值低,且尾部翘得更高。
随着自由度的增大,t分布逐渐趋近于标准正态分布。
即当自由度ν→∞时,t分布→标准正态分布。
8.均数的可信区间与参考值范围有何不同?9.假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?10.假设检验中和P的区别何在?11.t检验的应用条件是什么?12.I型错误与II型错误有何区别与联系?H所犯的“弃真”错误,其概率大小用α表示。
I型错误是指拒绝了实际上成立的H所犯的“取伪”错误,其概率大小用βII型错误则是“接受”了实际上不成立的表示。
当样本含量n确定时,α愈小,β愈大;反之α愈大,β愈小。
13.假设检验和区间估计有何联系?假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。
两者既互相联系,又有区别。
假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了H,则按α水准,不拒绝0H;若不包含0H,则按α水准,拒绝0H,接受1H。
也就是0说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。
14.为什么假设检验的结论不能绝对化?因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。
拒绝H时,有可能犯I型错误;“接受”0H时可能犯II型错误。
无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。
15.方差分析的基本思想和应用条件是什么?方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分解为两个或多个组成部分,其总自由度也分解为相应的几个部分。
例如完全随机设计的方差分析,可把总变异分解为组间变异和组内变异,即SS 总=SS 组内+SS 组间,总的自由度也分解为相应的两部分,即ν总=ν组内+ν组间。
离均差平方和除以自由度得均方MS,组间均方(MS 组间)与误差均方(MS 误差)之比为F 值;如果各组处理的效应一样,则组间均方等于组内均方,即 F=1;但由于抽样误差,F 值不正好等于1,而是接近 1;如果F 值较大,远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义,至于F 值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。
方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。
16.在完全随机设计方差分析中SS组间、SS组内各表示什么含义?SS表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和组间SS表示组内变异,指各处理组内变量值大小不等,是由随机误随机误差造成的;组内差造成的。
17. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?区别点 完全随机设计 随机区组设计设计 采用完全随机化的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分别接受不同的处理。
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。
变异分解 三种变异:总SS =组间SS +组内SS四种变异:总SS =处理SS +区组SS +误差SS18.以实例说明为什么不能以构成比代替率?19.秩和检验的优缺点?20.简述直线回归与直线相关的区别与联系。
联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b 与r 正负号一致。
2相关系数与回归的假设检验等价,即对于同一样本,tb=tr3同一组数据的相关系数和回归系数可以互相换算:r=by ,x*Sx/Sy4用回归解释相关:由于决定系数总回ss ss r /2 ,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明相关的效果越好。
二者的区别:(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。
(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y 如何依赖于X 而变化。
(3)意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。
(4)计算上:xy xx xy l l l r //=,xx xy l l b /=(5)取值范围:-1≤r ≤1,-∞<b<∞.2、 二项分布、Poission 分布的应用条件 二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传 病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立 的结果;(2) n 次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。
Poisson 分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合 Poisson 分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n 次试验 相互独立;(3) n 应很大, P 应很小。
3、极差、四分位数间距、标准差、变异系数的适用范围有何异同? 答:这四个指标的相同点在于均用于描述计量资料的离散程度。
其不同点 为: 极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变 异程度,或用于初步了解资料的变异程度。
若样本含量相差较大,不宜用极差来 比较资料的离散程度。
四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的 离散程度。
标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。
变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。
4.中位数、均数、几何均数的适用条件有何异同。
(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。
5.第一类错误与第二类错误的区别与联系。
当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。
当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。
当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。
1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
6.运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。
7.方差分析后进行两两比较能否用t 检验?为什么? t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k 水平设计(k≥3)和多因素设计的定量资料的均值检验场合。
方差分析有十几种,不同的方差分析取决于不同的设计类型。
t 检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t 检验进行两两比较。
误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。
参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。
(2)优缺点:参数检验:优点是符合条件时,检验效能高。
缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。
非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。