医学统计学历年考题及答案
医学统计学知识考试试题及答案汇编
医学统计学知识考试试题及答案汇编
1. 单选题
1. 以下哪一项不是描述定量数据的统计指标?
- A. 均值
- B. 方差
- C. 中位数
- D. 众数
答案:D
2. 在医学研究中,如果一个疗法的p值小于0.05,通常表示什么?
- A. 结果具有显著统计意义
- B. 结果缺乏统计意义
- C. 结果需要进一步研究才能确定
- D. 结果无法得出结论
答案:A
3. 敏感性是指什么?
- A. 检测到真阳性的能力
- B. 检测到真阴性的能力
- C. 将阴性案例正确判断为阴性的能力
- D. 将阳性案例正确判断为阳性的能力
答案:A
2. 多选题
1. 常用的医学统计学假设检验方法包括:
- A. t检验
- B. 方差分析
- C. χ^2检验
- D. 相关分析
答案:A、B、C、D
2. 在随机对照试验中,以下哪些因素可能导致结果偏倚?
- A. 样本量过小
- B. 实验组和对照组的基线特征不平衡
- C. 实验过程中的操作失误
- D. 受试者的主观因素
答案:A、B、C、D
3. 判断题
1. 假设检验中,如果p值大于显著性水平,可以拒绝原假设。
- 正确 / 错误
答案:错误
2. 置信区间是指对总体参数的估计范围。
- 正确 / 错误
答案:正确
以上是医学统计学知识考试的一些试题及答案汇编,希望对您的学习有所帮助。
请注意,以上答案仅供参考,具体情况需要根据实际问题进行判断。
医学统计学试题答案
医学统计学试题答案一、选择题1. 医学统计学中,用于描述数据分布集中趋势的指标是()。
A. 方差B. 标准差C. 均数D. 百分位数答案:C2. 下列哪项不是医学研究中的常见随机误差来源?()。
A. 测量误差B. 抽样误差C. 实验设计偏差D. 仪器误差答案:C3. 在医学统计分析中,卡方检验主要用于()。
A. 比较两组连续变量的均值B. 比较两组分类变量的分布C. 检验两组数据的一致性D. 评估变量间的相关性答案:B4. 回归分析的主要目的是()。
A. 确定变量间的因果关系B. 评估变量间的关系强度C. 预测未来数据的趋势D. 以上都是答案:D5. 灵敏度和特异度是评价()的重要指标。
A. 治疗效果B. 诊断试验C. 预防措施D. 病因关系答案:B二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________和________。
答案:方差,标准差2. 医学研究中,为了减少随机误差的影响,常采用的方法有________、________和________。
答案:重复测量,随机化,盲法3. 医学统计分析中,用于评估两组连续变量间差异的非参数检验包括________、________等。
答案:Mann-Whitney U检验,Wilcoxon符号秩检验4. 逻辑回归分析可以用来处理变量间的________和________关系。
答案:线性,非线性5. 医学研究中,为了评估治疗效果的一致性,常用的统计方法是________。
答案:Meta分析三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用十分广泛,它通过使用各种统计方法和技术来分析和解释临床数据,帮助研究者得出科学的结论。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者设计合理的研究方案,如随机对照试验,以减少偏倚和误差。
其次,在数据收集阶段,统计学原理可以指导如何进行有效的数据采集和处理缺失数据。
医学统计学本科试题及答案
医学统计学本科试题及答案一、选择题(每题2分,共20分)1. 在医学统计学中,总体是指:A. 研究中的所有个体B. 研究中所观察到的个体C. 研究中所抽取的样本D. 研究中未观察到的个体答案:A2. 下列哪项不是医学统计学中常用的统计图表?A. 条形图B. 折线图C. 饼图D. 散点图E. 树状图答案:E3. 以下哪个指标用于描述分类变量的关联性?A. 均值B. 标准差C. 相关系数D. 卡方检验答案:D4. 医学统计学中的“误差”通常指:A. 测量误差B. 抽样误差C. 实验误差D. 所有上述情况答案:D5. 在进行两独立样本均值的比较时,应使用:A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:A6. 医学统计学中的“样本量”是指:A. 研究中观察到的个体数量B. 研究中抽取的个体数量C. 研究中所有可能的个体数量D. 研究中随机抽取的个体数量答案:B7. 以下哪个统计量用于描述数据的离散程度?A. 平均数B. 中位数C. 众数D. 方差答案:D8. 相关系数的取值范围是:A. -1 到 1B. 0 到 1C. -∞ 到+∞D. 1 到+∞答案:A9. 在医学研究中,为了减少偏倚,研究者通常会采用:A. 随机化B. 匹配C. 盲法D. A和C答案:D10. 下列哪项是生存分析中常用的统计方法?A. Kaplan-Meier法B. Cox回归C. Logistic回归D. 所有上述情况答案:D二、简答题(每题10分,共30分)1. 简述医学统计学中的“随机误差”和“系统误差”的区别。
答案:随机误差是指在测量过程中由于偶然因素引起的误差,这种误差是不可预测的,但在多次测量中会呈现正态分布,可以通过增加样本量来减少其影响。
系统误差则是由于测量方法或仪器本身的缺陷引起的误差,它是可预测的,并且会持续影响测量结果,需要通过改进测量方法或校准仪器来消除。
2. 解释医学统计学中的“95%置信区间”的含义。
《医学统计学》习题及答案
《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
医学统计学题库及答案
医学统计学题库及答案1. 描述统计1.1 以下哪个是描述统计的目的?A. 通过样本数据估计总体参数B. 通过总体数据估计样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:C1.2 描述统计法可以通过以下哪种途径进行?A. 经验法B. 理论法C. 实证法D. 推理法答案:C1.3 描述统计研究的内容主要包括以下哪些方面?A. 数据的整理和分类B. 数据的测量和统计描述C. 数据的分析和解释D. 数据的比较和推断答案:A、B、C、D1.4 描述统计法分为以下哪两类?A. 单变量描述统计B. 双变量描述统计C. 多变量描述统计D. 多重描述统计答案:A、B、C、D2. 分布统计2.1 以下哪种回答正确描述了正态分布?A. 均值等于0,标准差等于1B. 均值等于1,标准差等于0C. 均值等于0,标准差大于1D. 均值等于1,标准差大于0答案:A2.2 正态分布的特点包括以下哪些?A. 对称分布B. 峰态分布C. 均匀分布D. 尖峰分布答案:A、D2.3 正态分布的标准差决定了以下哪个特征?A. 数据的离散程度B. 数据的集中程度C. 数据的偏斜程度D. 数据的峰态程度答案:A2.4 正态分布的特征值z是根据以下哪个公式计算得出的?A. z = (x - μ) / σB. z = (x - σ) / μC. z = (μ - x) / σD. z = (σ - x) / μ答案:A3. 推断统计3.1 推断统计的目的是什么?A. 通过样本数据推断总体参数B. 通过总体数据推断样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:A3.2 推断统计的方法主要包括以下哪些?A. 参数估计B. 假设检验C. 方差分析D. 相关分析答案:A、B、C3.3 参数估计的目的是什么?A. 估计总体参数B. 估计样本参数C. 估计总体样本参数D. 估计样本总体参数答案:A3.4 假设检验的步骤包括以下哪些?A. 对原假设提出对立假设B. 利用样本数据计算统计量的值C. 比较统计量的值与临界值D. 根据比较结果得出结论答案:A、B、C、D4. 相关分析4.1 以下哪个参数可以反映两个变量之间的关系强度?A. 相关系数B. 偏度C. 标准差D. 峰度答案:A4.2 相关系数的取值范围是什么?A. [-1, 0]B. [0, 1]C. [-∞, +∞]D. [0, +∞]答案:A、B4.3 相关系数绝对值越大表示什么?A. 两个变量之间的关系越强B. 两个变量之间的关系越弱C. 两个变量之间没有关系D. 无法确定两个变量之间的关系强弱答案:A4.4 相关分析需要满足以下哪些前提?A. 两个变量之间存在线性关系B. 两个变量之间呈正态分布C. 样本容量充足D. 数据来自独立样本答案:A、B、D这是一个医学统计学题库及答案的文档,包含了描述统计、分布统计、推断统计和相关分析等方面的问题和答案。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学试题及答案
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 下列哪项是医学研究中最常用的推论统计方法?A. 描述统计学B. 推论统计学C. 非参数统计学D. 相关统计学答案:B. 推论统计学2. 在医学研究中,随机分组的目的是什么?A. 减少选择偏倚B. 增加样本数量C. 提高研究效率D. 保证研究结果的可靠性答案:A. 减少选择偏倚3. 下列哪个指标可以用来描述一个连续变量的集中趋势?A. 标准差B. 方差C. 中位数D. 百分位数答案:C. 中位数4. 当两个变量之间呈强相关关系时,它们的相关系数应该接近于多少?A. 0B. 1C. -1D. 无法确定答案:B. 15. 下列哪个统计检验适用于比较两个分类变量之间的关联性?A. Pearson相关系数B. 二项分布检验C. 卡方检验D. t检验答案:C. 卡方检验二、填空题1. 在医学统计中,P值小于0.05通常被认为是_____________。
答案:统计显著2. 如果一个研究中包含了100位受试者,其中60位接受了新药物治疗,40位接受了安慰剂治疗,那么该研究的总样本容量是____________。
答案:1003. 如果一个连续变量的标准差增加,表示该变量的____________变异性。
答案:增加4. 在医学研究中,被检验的原假设通常是_____________。
答案:无效的、无差异的或无关的5. 在双盲试验中,既不知道哪个组接受了治疗,也不知道哪个组接受了安慰剂的是_____________。
答案:受试者和研究者三、简答题1. 请解释什么是置信区间。
答:置信区间是用来描述统计结果的一个区间范围,该区间给出了研究结果的不确定性程度。
通常以一定的置信水平表示,例如95%的置信区间。
在医学研究中,研究者根据样本数据计算得出一个点估计,然后通过置信区间来估计这一点估计的可靠性范围。
2. 请解释相关系数的含义和作用。
答:相关系数用于描述两个变量之间的关联程度。
相关系数的取值范围在-1到1之间。
(完整版)医学统计学试题及答案
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学练习题及答案
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
(完整版)医学统计学试题及其答案
l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示 BA某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对3.抽签的方法属于 DA分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数 8 23 6 31该资料的类型是: DA计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 CA有价值的部分 B有意义的部分 C有代表性的部分D任意一部分 E典型部分7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:CA统计设计 B收集资料 C整理资料 D分析资料 E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对10.以下何者不是实验设计应遵循的原则 DA对照的原则 B随机原则 C重复原则D交叉的原则 E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数 B几何均数 C中位数 D全距 E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变 E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? CA 5B 5.5C 6D 10E 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是 BA观察个体之间变异越大 B观察个体之间变异越小C样本的抽样误差可能越大 D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是 BA从未患过病的人 B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是20.均数与标准差之间的关系是 EA标准差越大,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是 AA总体中个体之间存在变异 B抽样未遵循随机化原则C被抽取的个体不同质 D组成样本的个体较少 E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
《医学统计学》习题及答案
病毒性肝炎患者2.36 2.15 2.52 2.28 2.31 2.53 2.19 2.34 2.31 2.41
A.两样本均数的u检验B.样本均数与总体均数的t检验
C.两样本均数的t检验D.配对设计t检验
E.增长速度=(发展速度一1)/100
32.SMR表示
A.标化组实际死亡数与预期死亡数之比
B.标化组预期死亡数与实际死亡数之比
C.被标化组实际死亡数与预期死亡数之比
D.被标化组预期死亡数与实际死亡数之比
E.标准组与被标化组预期死亡数之比
33.两个样本率差别的假设检验,其目的是
A.推断两个样本率有无差别
E.第二类错误概率小
42.等级资料比较宜用
A. t检验B. u检验C.秩和检验
D. 检验E. F检验
43.作两均数比较,已知 、 均小于30,总体方差不齐且分布呈极度偏态,宜用
A. t检验B. u检验C.秩和检验
D. F检验E. 检验
44.从文献中得到同类研究的两个率比较的四格表资料,其 检验结果为:甲文 ,乙文 ,可认为
A. A≥5 B. T≥5 C. A≥5且T≥5
D. A≥5且n≥40E. T≥5且n≥40
38.三个样本率比较得到 > ,可以为
A.三个总体率不同或不全相同B.三个总体率都不相同
C.三个样本率都不相同D.三个样本率不同或不全相同
E.三个总体率中有两个不同
39.四格表 检验的校正公式应用条件为
A. n>40且T>5 B. n<40且T>5
1 2.74 4.49
(完整版)医学统计学试题及其答案
l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示 BA某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对3.抽签的方法属于 DA分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数 8 23 6 31该资料的类型是: DA计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 CA有价值的部分 B有意义的部分 C有代表性的部分D任意一部分 E典型部分7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:CA统计设计 B收集资料 C整理资料 D分析资料 E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对10.以下何者不是实验设计应遵循的原则 DA对照的原则 B随机原则 C重复原则D交叉的原则 E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数 B几何均数 C中位数 D全距 E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变 E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? CA 5B 5.5C 6D 10E 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是 BA观察个体之间变异越大 B观察个体之间变异越小C样本的抽样误差可能越大 D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是 BA从未患过病的人 B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是20.均数与标准差之间的关系是 EA标准差越大,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是 AA总体中个体之间存在变异 B抽样未遵循随机化原则C被抽取的个体不同质 D组成样本的个体较少 E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学练习题及答案
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学试题及答案
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学试题和答案
(一)单项选择题3.抽样的目的是(b )。
A.研究样本统计量B。
由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数B。
总体的统计指标C.样本的统计指标D。
样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6。
各观察值均加(或减)同一数后( b ).A.均数不变,标准差改变 B。
均数改变,标准差不变C。
两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数 B。
差C.极差D.标准差8。
以下指标中( d)可用来描述计量资料的离散程度。
A.算术均数 B。
几何均数C。
中位数 D.标准差9。
偏态分布宜用(c)描述其分布的集中趋势.A。
算术均数 B.标准差C。
中位数 D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B。
标准差C.几何均数D.中位数11。
( a )分布的资料,均数等于中位数。
A。
对称 B。
左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A。
正态 B.近似正态C。
左偏态 D.右偏态13。
最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B。
标准差C。
中位数 D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B。
标准差C。
标准误 D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c ).A。
算术平均数 B.中位数C。
几何均数D。
平均数16.变异系数CV的数值( c )。
A。
一定大于1 B。
一定小于1C。
可大于1,也可小于1 D。
一定比标准差小17。
数列8、—3、5、0、1、4、—1的中位数是( b )。
医学统计学试题及答案
第一套试卷及参考答案一、选择题? (40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(?? B??? )A 条图?????B 百分条图或圆图?????? C线图????? D直方图2、均数和标准差可全面描述? D??? 资料的特征A? 所有分布形式? B负偏态分布? C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )?? A 用该市五岁男孩的身高的95%或99%正常值范围来评价?? B 用身高差别的假设检验来评价?? C 用身高均数的95%或99%的可信区间来评价?? D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A?? )A???? 变异系数?????? B?????? 方差???? C 标准差???? D 四分位间距5、产生均数有抽样误差的根本原因是(?? A? )A.个体差异????B. 群体差异?????C. 样本均数不同????D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A?? )(A)相对比?? (B)构成比?? (C)定基比?? (D)率7、统计推断的内容为(? D?? )??A.用样本指标估计相应的总体指标????? ?B.检验统计上的“检验假设” C.? A和B均不是? ???????????????????D. A 和B均是8、两样本均数比较用t检验,其目的是检验(?? C )?A两样本均数是否不同??????????? B两总体均数是否不同C两个总体均数是否相同????????? D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D? )(A)?????? n1+ n2????? (B)?????? n1+ n2–1? (C)?????? n1+ n2 +1??? (D)?????? n1+ n2 -2?10、标准误反映(A )A 抽样误差的大小?????? ???B总体参数的波动大小 C 重复实验准确度的高低? ??D 数据的离散程度11、最小二乘法是指各实测点到回归直线的? (C)A垂直距离的平方和最小????? B垂直距离最小C纵向距离的平方和最小????? D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
医学统计学试题及答案
医学统计学一、选择题1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图 C线图 D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为( A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同 B两总体均数是否不同C两个总体均数是否相同 D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A) n1+ n2(B) n1+ n2 –1(C) n1+ n2 +1(D) n1+ n2 -210、标准误反映( A )A 抽样误差的大小B总体参数的波动大小C 重复实验准确度的高低D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C)A tr>tbB tr<tbC tr= tb D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
(完整版)医学统计学试题和答案
(一)单项选择题3.抽样的目的是( b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于 1B.一定小于 1C. 可大于1,也可小于 1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计简答1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么?3 假设检验的基本思想和原则4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。
问你合不合理,为什么?你的设计是什么?6一型错误和二型错误的区别和联系7什么是抽样误差?举例说明分类资料和数量资料的抽样误差计算1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值(1)比较白天晚上血压有无差别(配对t检验计算)(2)白天和晚上血压有无相关(相关分析)(3)如何用白天血压估计晚上血压(回归分析)2 多个平均值进行总体假设检验。
类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)3 样本率与总体率的比较(u检验)(也有人说:配伍组方差分析)20081. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式3. 数值资料的统计描述指标?公式?4. 多元回归模型的基本形式?参数含义?回归效果的评价?5. 什么叫截尾值?产生原因?举例说明6. 一同学两样本率的比较用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?7. 一个三因素的2X2X2的析因设计的实验设计及分析思路8. 给了一个数值资料:小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值(1)对体重增加量资料进行统计描述(2)求饮食量和体重增加量的关系(3)由体重增加量的样本估计其代表总体均数的可信区间(4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间(5)(3)和(4)中的可信区间有什么差别?20061直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中P.a,B以及1-B的意义4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路5有一个两样本的秩和检验的应用题,写思路,不要求计算6生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?7给了一个实验,测量抗体.样本序列 抗体滴度 效应 是否有效 1 1:40 + 是 2 1:160 ++ 是. . ..就是几个表格,让你给每个列个表,并且应该用哪些指标来描述. 8正态分布,二项分布,poisson 分布的可信区间9有两个变量,让你说出分析它们相关的统计分析思路10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.2005(研究生)1. 举例说明变量及变量类型。
(10分)答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。
如身高、体重、疗效等 变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。
如身高(cm )、体重(kg )、心律(次/min )、血压(mmHg )等。
(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A 、B 、O 、AB )等。
b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。
如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。
2. 在假设检验过程中,若设定a 为0.05,算得统计量后,得p 值为0.015,按a=0.05的检验水准拒绝无效假设。
请对这一结论做出适当的评论,并为此写例假设检验中p 值的含义,以及p 与a 的关系。
(10分)答案:P 值为0.015小于检验水准a (0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H 0,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等。
P 值的含义是指从H 0所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于)现有样本统计量的概率。
若p>a ,按a 检验水准不拒绝H 0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。
若p<=a ,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。
3. 写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。
(15分)答案:(1)统计描述:描述资料的类型:数值变量资料 频数表 资料的分布:正态性检验 服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距(2)统计推断:资料的设计类型:完全随机设计的多个样本比较 分布:正态性检验和方差齐性检验:(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。
4. 写出两变量之间相关关系的分析思路。
(15分) 答案:(1)绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。
如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman 等级相关分析。
或者进行曲线拟合。
(2)计算直线相关系数r 或者Spearman 秩相关系数r s 。
()()()()yyxx xy l l l y y x x y y x x r =----=∑∑∑22(3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R 值也不一定等于零,应对样本相关系数做假设检验。
根据检验目的,检验假设为: H0:P=0;H1=/0.常用t 检验,212--==n r r sr t rv=n-2,拒绝H0认为两变量间存在直线相关。
(4)总体相关系数的可信区间估计,先对相关系数做Z 变换,估计Z 的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a )%可信区间(3,3/-+--n u z n u z a a ),再对Z 的可信区间上下限按r=tanh z 进行逆变换。
5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。
要求写出随机分配方案。
(10分)随机数字表(部分数据)编号 1-10 11-20 21-30 31-40 41-501 22 17 68 65 81 68 95 23 92 35 87 02 22 57 51 61 09 43 95 06 58 24 82 03 47 2 19 36 27 59 46 13 79 93 37 55 39 77 32 77 09 85 52 05 30 62 47 83 51 62 74 3 16 77 23 02 77 09 61 87 25 21 28 06 24 25 93 16 71 13 59 78 23 05 47 47 25 4 78 43 76 71 61 20 44 90 32 64 97 67 63 99 61 46 38 03 93 22 69 81 21 99 21 5 03 28 28 26 08 73 37 32 04 05 69 30 16 09 05 88 69 58 28 99 35 07 44 75 47答案:先把十五只动物按体重从小到大分别编号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15;在随机数字表任意指定某行某列,如取第三行的1列开始,向下录入不重复的二位随机数字:16 77 23 02 09 61 87 25 21 28 06 24 93 71 13;对应于十五只动物的编号,对随机数字有小到大编秩得出序号R 如下:5 13 7 1 3 11 14 9 6 10 2 8 15 12 4;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 11 15;乙组动物为:3 8 9 10 12 ;丙组动物有:2 6 7 13 14。
6. 某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对K 562细胞进行抑制。
此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)?(10分)答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。
设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。
b2表示乙药物,b3表示丙药物。
先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。
分析两因素之间有无交互作用及其交互作用的性质。
同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。
样本含量:2X3X4=247. 某研究者随机测定了某地100例健康成人血清NSE 酶(ug/l )含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。
(20分) 答案:(1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。