医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

合集下载

医学统计学试题及答案

医学统计学试题及答案

医学统计学试题及答案医学统计学》课程考试试题(A卷)评卷总分:100分,考试时间:120分钟,考核方式:闭卷一、选择题(每题1分,共62分,只选一个正确答案)1、医学科研设计包括哪些方面?(D)A.物力和财力设计B.数据与方法设计C.理论和资料设计D.专业与统计设计2、医学统计资料的分析包括哪些方面?(D)A.数据分析与结果分析B.资料分析与统计分析C.变量分析与变量值分析D.统计描述与统计推断3、医学资料的同质性指的是什么?(D)A.个体之间没有差异B.对比组间没有差异C.变量值之间没有差异D.研究事物存在的共性4、离散型定量变量的测量值指的是什么?(D)A.可取某区间内的任何值B、可取某区间内的个别值C.测量值只取小数的情况D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是什么?(A)A.无序二分类变量B、定量变量C.等级变量D.无序多分类变量6、计量资料编制频数表时,组距的选择与什么有关?(D)A.越大越好B.越小越好C.与变量值的个数无关D.与变量值的个数有关7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选什么?(D)A.极差B.方差C.标准差D.变异系数8、若要用方差描述一组资料的离散趋势,对资料的要求是什么?(D)A.未知分布类型的资料B.等级资料C.呈倍数关系的资料D.正态分布资料9、频数分布两端没有超限值时,描述其集中趋势的指标也可用什么?(D)A.标准差B.几何均数C.相关系数D.中位数10、医学统计工作的步骤是什么?(A)A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验11、下列关于变异系数的说法,哪个是正确的?(A)A.没有度量衡单位的系数B.描述多组资料的离散趋势C.其度量衡单位与变量值的度量衡单位一致D、其度量衡单位与方差的度量衡单位一致12、10名食物中毒的病人潜伏时间(小时)分别为3.4,5,3,2,5.5,2.5,6,6.5.7,其中位数是多少?(B)A.4B.4.5C.3D.213、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描述这组资料离散趋势的指标最好为什么?(C)A.全距B.四分位数间距C.标准差D.方差14、当在正态分布曲线下,均值不变,而标准差变大时,曲线的形态会变得更加矮胖,但中心位置不会改变。

《医学统计学》考试试题及答案大全(二)

《医学统计学》考试试题及答案大全(二)

《医学统计学》考试试题及答案(一)单项选择题3.抽样的目的是(b )。

A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。

A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。

A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。

A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。

A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。

A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。

A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。

A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。

A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。

A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。

A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。

A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。

A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。

A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。

医学统计学与流行病学(2021-2022-1)学习通章节答案期末考试题库2023年

医学统计学与流行病学(2021-2022-1)学习通章节答案期末考试题库2023年

医学统计学与流行病学(2021-2022-1)学习通超星课后章节答案期末考试题库2023年1.标化后的患病率,反映答案:相对水平2.随机选取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为:答案:18.3%3.计算标化率的目的是:答案:消除资料内部构成不同的影响,使率具有可比性4.某制药厂有男职工570 人,女职工 460 人,(460/570)×100%为答案:相对比5.肺癌患者术后进行随访所得到的资料进行生存分析时,不属于截尾资料的是答案:随访期内死于肺癌者6.下列关于生存概率和生存率叙述,正确的是答案:生存率是生存概率的累积7.某医生随访了220例肺癌术后病人的生存时间随访资料,欲分析多个预后因素对生存时间的影响,宜选用答案:Cox比例风险回归模型8.在疾病发生危险因素的研究中,采用多重线性回归分析的主要目的是答案:减少混杂因素的影响9.下列哪一组指标可以通用:答案:发病率###罹患率10.研究职业与疾病的关系时应考虑哪些因素答案:暴露机会###劳动条件###劳动强度###精神紧张强度11.某项吸烟与肺癌关系的病例对照研究结果中,对照组平均年龄高于病例组,P<0.05, OR=3(P<0.05),下列结论正确的是( )答案:两组均衡性不好12.在一项病例对照研究中,某研究因素OR值的95%可信区间为0.3~0.75,那么该研究因素可能为( )答案:无关因素13.以人群为基础的病例对照研究,下列哪个分析指标是不恰当的 ( )答案:OR14.下列哪项不是病例对照研究样本含量大小的取决因素?( )答案:欲研究因素所致的发病率P115.比值比主要应用于( )答案:病例对照研究16.OR值是( )种流行病学研究方法的评价暴露与疾病关系的指标答案:病例对照研究17.直线相关分析中,若总体相关系数,则从该总体中抽取的样本相关系数答案:可能大于0也可能小于018.下列关于小概率事件的含义,叙述错误的是答案:认为在一次研究或观察中肯定不会发生19.在回归直线方程y = a+bx, 若a>0,下述正确的是答案:a的符号和b无关20.对20名大学男生身高和体重的数据进行直线相关分析,对算出的r1进行假设检验得P < 0.05;对他们100米跑成绩和200米跑成绩也进行相关分析,将算出的r2进行假设检验得P < 0.01。

医学统计学试题及答案

医学统计学试题及答案

医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。

答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。

它通常包括零假设(H0)和备择假设(H1)。

通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。

2. 解释什么是“置信区间”。

答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。

它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。

(完整版)医学统计学题库

(完整版)医学统计学题库

For personal use only in study and research; not for commercial use第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。

A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。

该资料的类型是( A )。

4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。

该资料的类型是(C )。

5.空腹血糖测量值,属于( C )资料。

6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。

该资料的类型是(B )。

7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。

该资料的类型是(D )。

8. 100名18岁男生的身高数据属于(C )。

二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。

实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。

例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。

医学统计学试题试卷答案真题

医学统计学试题试卷答案真题

医学统计学试卷一、最佳选择题 (每题1分,共20分)1.关于膀胱癌化疗的随访资料做生存分析,可当作截尾值处理的是()。

A.死于膀胱癌B.死于意外死亡C.死于其它肿瘤D.死于意外死亡和死于其它肿瘤2.总体可分为有限总体和无限总体,其中有限总体是指( )。

A.无法确定数量的总体B.观察单位有限的总体C.在有限时间内确定的总体D.方便研究的总体E.其它选项都不是3.习惯上,下列属于小概率事件的为( )。

A.P=0.99B.P=0.10C.P=0.15D.P=0.03E.其它选项都不是4.当自由度不变时,关于χ2值与P值的关系,下列哪一项是正确的?( )A.χ2值越大,P值越大B.χ2值越大,P值越小C.χ2值变化时,P值不变D.χ2值变化时,P值变大或变小E.χ2值变化时,P值可能变化也可能不变5.方差分析中( )。

A.F值可能是负数B.F值不可能是负数C.组间离均差不会等于组内离均差D.组间离均差不会小于组内离均差E.组间离均差不会大于组内离均差6.为初步了解吸光度与溶液浓度之间的关系,宜选用( )。

A.直方图B.圆图C.条图D.半对数线图E.散点图7.若上海市健康女工744人血红蛋白含量的均数为12.239g%,标准差为0.998g%,则下列哪个最有理由认为是正常范围?()A.11.24-11.3237B.9.654-14.814C.10.283-14.195D.10.592-13.886E.10.952-13.5168.两变量(x和y)作相关分析时,算得r=0.38,可以说( )。

A.x和y无关,因r值较小B.x和y相关不很密切,因r值不到1C.不能确定x和y的相关密切程度,因不知n的大小D.虽然x和y相关,但不能认为x和y有因果关系E.可以认为x和y存在直线相关关系9.直线回归中X与Y的标准差相等时,以下叙述( )正确。

A.b=aB.b=rC.b=1D.r=1E.其它选项都不正确10.各年龄的死亡水平发生改变都会影响平均寿命的大小,其中哪个年龄别的影响最大?( )A.65岁到70岁以前组B.30岁到35岁以前组C.零岁到1岁以前组D.25岁到30岁以前组11.甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得,则理论上( )。

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

五、其它30分(3~5道题目,每题6~10分)随访资料的生存分析:【06真题】九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。

记录的资料如下:(5分)1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。

【05真题、04真题、03真题】四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。

资料如下表:(8分)16例某种癌症病人随访资料病人号治疗组分组日期终止日期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?【答案】jszb0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。

医学统计学部分试题及答案

医学统计学部分试题及答案

第一章绪论1.下列关于概率的说法,错误的是A. 通常用P表示B. 大小在0%与100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.下列有关个人基本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.下列关于总体和样本的说法,不正确的是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体和有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有成都市居民C. 2007年所有成都市居民D. 2007年成都市居民中的糖尿病患者E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。

答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。

7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。

根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。

统计量是研究人员能够知道的,而参数是他们想知道的。

一般情况下,这些参数是难以测定的,仅能根据样本估计。

自考医学统计学试题及答案

自考医学统计学试题及答案

自考医学统计学试题及答案一、选择题(每题2分,共20分)1. 在医学统计学中,总体是指:A. 所有可能的个体B. 研究中实际测量到的个体C. 研究中感兴趣的个体集合D. 研究中随机抽取的一部分个体答案:C2. 下列哪项不是医学统计学中常用的统计图表?A. 条形图B. 饼图C. 线图D. 树状图答案:D3. 医学统计中的样本容量应该根据以下哪个因素确定?A. 研究目的B. 总体大小C. 预期效应大小D. 所有上述因素答案:D4. 以下哪个统计量用于描述偏态分布的数据集中趋势?A. 均值B. 中位数C. 众数D. 方差答案:C5. 医学研究中,P值是用来表示:A. 结果的可信程度B. 研究的样本容量C. 总体中观察到当前结果的概率D. 实验组与对照组之间的差异大小答案:A6. 两独立样本t检验适用于:A. 比较两个独立样本均值的差异B. 比较两个相关样本均值的差异C. 比较三个或以上样本均值的差异D. 比较比例的差异答案:A7. 相关系数是用来衡量:A. 变量之间的线性关系强度B. 变量之间的因果关系C. 变量之间的非线性关系D. 变量的分布形态答案:A8. 在医学统计学中,灵敏度是指:A. 真正率B. 假正率C. 漏诊率D. 误诊率答案:A9. 以下哪项是生存分析中常用的统计方法?A. Kaplan-Meier方法B. 方差分析C. 多元回归分析D. 相关性分析答案:A10. 医学统计学中的混杂因素是指:A. 与研究疾病无关的因素B. 与研究疾病有关的非研究因素C. 与研究疾病和研究因素都有关的外部因素D. 研究设计中未能控制的因素答案:C二、填空题(每题2分,共20分)11. 医学统计学中的误差分为随机误差和______误差。

答案:系统12. 在统计学中,95%置信区间意味着如果我们多次进行实验,95%的结果会落在这个区间内。

13. 医学统计学中,样本均数的标准误差是总体标准差除以样本容量的______。

医学统计学试题及答案

医学统计学试题及答案

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为(A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

硕士研究生医学统计学练习题与答案

硕士研究生医学统计学练习题与答案

B. 甲县的肿瘤防治工作比乙县好
4
C. 甲县的老年人口在总人口中所占比例比乙县小
D. 甲县的老年人口在总人口中所占比例比乙县大
52.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人
口女多于男,而乙乡男多于女,适当的比较方法是( )。
A. 分别进行比较
B. 两个率比较的χ2 检验
的界值( )。
A.大
B.小
C.相等
D.不一定
44.方差分析中变量变换的目的是( )。
A.方差齐性化 B.曲线直线化 C.变量正态化 D.以上都对
45.下面说法中不正确的是( )。
A.方差分析可以用于两个样本均数的比较
B.完全随机设计更适合实验对象变异不太大的资料
C.在随机区组设计中,每一个区组内的例数都等于处理数
6.各观察值均加(或减)同一数后( )。
A.均数不变,标准差改变
B.均数改变,标准差不变
C.两者均不变
D.两者均改变
7.比较身高和体重两组数据变异度大小宜采用( )。
A.变异系数
B.方差
C.极差
D.标准差
8.以下指标中( )可用来描述计量资料的离散程度。
A.算术均数
B.几何均数
C.中位数
D.标准差
9.偏态分布宜用( )描述其分布的集中趋势。
范围内狮子的数量,若进行 100 次这样的抽查,其中的 95 次所得数据应在以下范围内( )。
A.5~195
B.80.4~119.6
C.95~105
D.74.2~125.8
63. 关于样本率 p 的分布正确的说法是:
A. 服从正态分布
B. 服从 χ 2 分布

《医学统计学》习题及答案

《医学统计学》习题及答案

一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

医学统计学试题及答案

医学统计学试题及答案

《医学统计学》课程考试试题(A卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷)一、选择题(每题1分,共62分,只选一个正确答案)1、医学科研设计包括( D )A.物力和财力设计 B.数据与方法设计C.理论和资料设计 D.专业与统计设计2、医学统计资料的分析包括( D )A.数据分析与结果分析 B.资料分析与统计分析C.变量分析与变量值分析 D.统计描述与统计推断3、医学资料的同质性指的是( D )A.个体之间没有差异 B.对比组间没有差异C.变量值之间没有差异 D.研究事物存在的共性4、离散型定量变量的测量值指的是( D )A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A )A.无序二分类变量 B、定量变量.C.等级变量 D.无序多分类变量6、计量资料编制频数表时,组距的选择( D )A.越大越好 B.越小越好C.与变量值的个数无关 D.与变量值的个数有关7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料C.呈倍数关系的资料 D.正态分布资料9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数10、医学统计工作的步骤是( A )A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验11、下列关于变异系数的说法,其正确的是( A )A.没有度量衡单位的系数B.描述多组资料的离散趋势C.其度量衡单位与变量值的度量衡单位一致D、其度量衡单位与方差的度量衡单位一致12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B )A.4 B.4.5 C.3 D.213、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描述这组资料离散趋势的指标最好为( C )A.全距 B.四分位数间距 C.标准差 D.方差14、正态分布曲线下,当μ不变,σ变大时,( D )A.曲线形态不变,中心位置向左移 B.曲线形态不变,中心位置向右移C.曲线形态变的瘦高,中心位置不变 D.曲线形态变的矮胖,中心位置不变15、用于描述一组对称分布资料全部观察值变异程度大小的指标是( A )A.S B.R C. D.CV16、下列指标中,不属于集中趋势指标的是( A )A.变异系数 B.中位数 C.算术均数 D.几何均数17、总体是由( A )组成A.同质个体的所有变量值 B.全部个体 C.相同的观察指标D.部分个体18、随着样本例数的增大,样本均数( A )A、与总体均数更加接近. B.减小 C.不变 D.增大19、抽样误差产生的原因是( A )A.个体变异 B.工作人员责任心不强 C.仪器测量不准确D.观察对象不纯20、观察单位为研究中的( A )A.个体 B.全部对象 C.样本 D.观察指标21、变异系数CV是( B )A.整数 B.百分数 C.小数 D.率22、各观察值同加上一个不等于0的常数后,( B )不变A、算术均数B、标准差C、几何均数D、变异系数23、下列资料( B )为等级资料A、体重B、病人的病情分级C、某病发病率D、血型24、标准正态分布曲线下,0到2.58的面积为( B )A.90% B.49.5% C.95% D.50%25、测定一组人群的听力,已知听力过低为异常,若制定其医学参考值范围,应选择( B )A.单侧上限 B.单侧下限 C.双侧 D.单侧26、关于医学参考值范围的制定,下列说法正确的是( A )A.样本例数不能太少 B.只能选95%的百分界限C.不受资料分布类型的限制 D.选择单侧和双侧的结果是一样的27、正常成年男子收缩压的医学参考值范围一般指( B )A、所有正常成年男子收缩压的最小值到最大值范围B、绝大多数正常成年男子收缩压的波动范围C、所有正常成年男子收缩压的波动范围D、少部分正常成年男子收缩压的波动范围28、有关样本均数的标准误,下列说法正确的是( B )A.与样本例数的大小无关 B.表示样本均数离散趋势的大小C.表示样本变量值差异的大小 D.与样本所代表的总体变量值的离散趋势无关29、下列哪项不是样本均数标准误的用途( C )A.可用来计算总体均数的可信区间 B.可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D. 可用于均数假设检验的计算.30.t分布曲线随自由度的增大( D )A.曲线下的总面积变小 B.曲线的中心位置向左移C.曲线的高峰变低,尾部翘得较高 D.曲线的高峰变高,尾部翘得较低31.自由度一定的t分布曲线,当t值增大时,其尾部面积( A )A.变小 B.变大 C.不变 D.不清楚32、总体均数95%的可信区间主要是用于( A )A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C.95%的样本均数在此范围内 D.确定医学参考值范围33、要提高总体均数可信区间的把握度与精确度,最好的方法是( B )A.改变计算公式 B.增加样本例数C.减小样本例数 D.样本例数保持不变34、假设检验中,同一资料,作单侧检验与双侧检验( D )A.结论一致 B.结论不清楚C.作单侧检验更容易接受无效假设 D、作单侧检验更容易接受备择假设35、假设检验中,同一资料,作单侧检验与双侧检验( C )A.结论一致 B.结论不清楚C.作双侧检验更容易接受无效假设 D、作双侧检验更容易接受备择假设36.单样本t检验的目的是( B )A.推断未知总体均数是否小于零B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等D.推断未知总体均数是否为负数37、配对设计的目的是( A )A.提高组间可比性 B.计算简便 C.易于理解 D.为了结论更可靠38、配对设计t检验的目的是( A )A.推断差数的总体均数是否等于零B.推断差数的样本均数是否等于零C.推断差数的总体均数是否大于1D.推断差数的样本均数是否大于139、两样本均数t检验的目的是( A )A.推断两总体均数是否相等.B.推断两样本均数是否相等.C.推断两总体方差是否相等.D.推断两样本方差是否相等.40、甲乙两人分别从同一总体中各抽得30个与50个变量值作为两个样本,求得、S12,、S22,则有( D )A、做两样本t检验,必然得差别无统计学意义的结论B、做两样本t检验,必然得差别有统计学意义的结论C、分别有甲、乙两样本求出的总体均数的95%的可信区间,必然有重叠D、分别有甲、乙两样本求出的总体均数的95%的可信区间,很可能有重叠41、两样本均数的t检验,若两样本例数分别为n1和n2,自由度为( D )A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-242、若同时减少第一类错误与第二类错误,最佳的方法为( A )A.增加样本例数 B.减少样本例数 C.样本例数不变 D.改变检验水准43、拒绝无效假设,只可能犯( A )A、第一类错误. B.第二类错误C.推断结论不可靠的错误 D.检验水准不一致的错误44、反映事物内部某一组成部分所占的比重宜采用( A )A.构成比 B.标准化率 C.相对比 D.率45、某地某年乙脑的发病人数占同年传染病病人数的20%,该指标为( A )A.构成比 B.率 C.相对比 D.发病率46、甲乙两地进行冠心病发病率的比较,需要进行率的标准化的情况有( A )A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大47、甲、乙两组资料进行率的标准化时,选择标准人口数或选择该标准人口数换算成相应的标准人口构成比,两方法得出的结论( A )A.相同 B.甲组标化率大于乙组标化率C.不同 D.甲组标化率小于乙组标化率48、某医师给某地全部的麻疹易感儿童进行免疫接种,共有2000人,一个月后,从中随机抽取400人进行抗体水平的测定,其中阳性人数是300人,若计算该疫苗接种的阳性率,其数值为( B )A.10% B.75% C.50% D.60%49、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为( D )A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2) / (n1+n2)50、有关样本率的标准误,下例错误的是( D )A.表示样本率围绕总体率的离散趋势B.表示样本率相互之间的离散趋势C.表示样本率抽样误差的大小D.表示样本阳性率与样本阴性率之间的差异51、总体率估计的最佳方法是( B )A.点值估计 B.区间估计 C.概率估计 D.频率估计52、值是反映实际频数与理论频数( B )A.相差多少的指标 B.吻合程度的指标C.是否相等的指标 D.以上均不对53、四格表检验时,不需要进行连续性校正的条件是( A )A.n≥40, T≥5 B.n<40,1≤T<5C.n≥40,T<1 D.n≥40,1≤T<554、四格表资料的检验,理论频数T的计算是根据( A )A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π255、用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用( B )A.行X列表资料的检验 B.配对设计四格表检验C.t检验 D.两样本率比较的四格表检验56、3个样本率作比较,< 0.05,2,则在α=0.05检验水准下,可认为( B )A.各总体率不等或不全相等 B.各总体率均相等C.各样本率均相等 D.各样本率不全相等57、相关系数是表示两变量x与y之间( D )A .有无数量关系的指标 B.那个变量较大的指标C.有无依存关系的指标 D.相关关系的密切程度与相关方向的指标58、相关系数假设检验的无效假设是( B )A .ρ≠0 B.ρ=0 C.β≠0 D.β=059、相关系数假设检验的自由度为( B )A.n - 1 B.n - 2 C.n D.n + 1 60.最小二乘法原理是( C )A.各实测点距所求直线的纵向距离最小B.各实测点距所求直线的纵向距离相等C.各实测点距所求直线的纵向距离平方和最小D.各实测点距所求直线的垂直距离平方和最小61、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是( C )A.相关系数越小,回归系数也越小 B.相关系数与回归系数无关系C.回归系数有单位,相关系数没有单位 D.样本相关系数为0时,样本回归系数也为062、关于回归系数b,下列说法错误的是( B )A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共10分)63、绘制定量资料的频数表时,各组段的组距一定要相等。

《医学统计学》考试试题及答案(二)

《医学统计学》考试试题及答案(二)

1第一套试卷及参考答案一、选择题 (40 分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C 线图 D 直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式 B负偏态分布 C 正偏态分布 D 正态分布和近似正态分布 3、要评价某市一名 5 岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的 95%或 99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的 95%或 99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的 10 倍,该指标为( A )(A )相对比 (B ) 构成比 (C )定基比 (D )率 7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A 和 B 均不是D. A 和 B 均是8、两样本均数比较用 t 检验,其目的是检验( C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为 n 1 和 n 2,在进行成组设计资料的 t 检验时,自 由度是( D ) (A ) n 1+ n 2 (B ) n 1+ n 2– (C ) n 1+ n 2 +1 (D ) n 1+ n 2 -210、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小 B垂直距离最小 C纵向距离的平方和最小 D 纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

华中科技大学卫生统计学试题3

华中科技大学卫生统计学试题3

卫生统计学》考试题库华中科技大学同济医学院公共卫生学院流行病与卫生统计学系《卫生统计学》考试题库目录第一章第二章第三章第四章第五章第六章第七章第八章第九章第十章第十一章第十二章第十三章第十四章第十五章第十六章绪论定量资料的统计描述正态分布总体均数的估计和假设检验方差分析分类资料的统计描述二项分布与Poisson分布及其应用χ2检验秩和检验回归与相关常用统计图表实验设计调查设计医学人口统计与疾病统计常用指标寿命表随访资料的生存分析附录:单项选择题参考答案第一章绪论2. 统计量(statistic) 5. 同质(homogeneity) 8. 抽样误差(sampling error)返回3. 总体(population) 6. 变异(variation)一,名词解释1. 参数(parameter) 4. 样本(sample) 7. 概率(probability) 二,单选题1.在实际工作中,同质是指: A.被研究指标的影响因素相同C.被研究指标的主要影响因素相同2. 变异是指: A.各观察单位之间的差异C.各观察单位某测定值差异较大3.统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部C.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指: A.从总体中随意抽取一部分C.依照研究者的要求选取有意义的一部分E.以上都不是5.按随机方法抽取的样本特点是: A.能消除系统误差D.能减少样本偏性A.均不可避免C.测量误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是: A.设计,调查,审核,整理资料C.设计,搜集,整理,分析资料E.以上都不对8.统计工作的关键步骤是: A.调查或实验设计是: A.这300 名高血压患者C.所有的高血压患者B.这300 名高血压患者的血压值D.所有的高血压患者的血压值2B.研究对象的有关情况一样D.研究对象的个体差异很小B.同质基础上,各观察单位之间的差异D.各观察单位有关情况不同E.以上都对E.以上都对B.根据地区划分的研究对象的全体D.随意想象的研究对象的全体B.有意识地选择总体中的典型部分D.从总体中随机抽取有代表性的一部分B.能消除随机测量误差E.以上都对C.能消除抽样误差6.统计学上的系统误差,测量误差,抽样误差在实际工作中: B.系统误差和测量误差不可避免D.系统误差和抽样误差不可避免B.收集,审核,整理,分析资料D.调查,审核,整理,分析资料B.整理分组C.收集资料D.审核资料E.分析资料9. 欲研究某种药物对高血压病的疗效,临床观察300 名病人的血压情况,确切地说,研究总体E.这种药物10.抽样误差是由: A.计算引起D.采样结果不准引起11.抽样误差指的是: A.个体值和总体参数值之差C.样本统计量值和总体参数值之差12.习惯上,下列属于小概率事件的为: A.P=0.09 A. 计量资料14.概率P 的范围: A. -1≤P≤1 三,简答题1, 统计学的基本步骤有哪些2, 总体与样本的区别与关系3, 抽样误差产生的原因有哪些可以避免抽样误差吗4, 何为概率及小概率事件B. 0<P第二章第三章一,名词解释1. 正态分布(normal distribution)定量资料的统计描述返回2. 中位数(median) 4. 方差(variance)正态分布3. 四分位数间距(quartile interval) 5. 正偏态分布(positively skewed distribution) 6. 负偏态分布(negatively skewed distribution)7. 对数正态分布(logarithmic normal distribution ) 8. 医学参考值范围(medical reference range) 二,单选题1. μ确定后,δ越大, 则正态曲线: A.越陡峭A.统计资料B. 形状不变B.等级资料C. 越平缓C.计数资料D.向左移动D.计量资料E.向右移动E.调查资料 2. 平均数可用于分析下列哪种资料: 3. 常用的平均数指标有: A.样本均数,总体均数,中位数C.算术均数,几何均数,中位数B.算术均数,总体均数,几何均数D.中位数,样本均数,几何均数3E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用: A.算术均数5. 用x = A.加权法均数, 则应: A.减一个组距D.加半个组距A.几何均数B.加一个组距E.以上均不对B.中位数C.平均数D.均数E.算术均数C.减半个组距B.几何均数B.简捷法C.中位数C.目测法D.平均数D.平均法 E.以上均是E.直接法∑ x /n 公式计算均数的方法称为:6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标: 8. 用频数表法计算均数时,组中值应为: A.(本组段下限值+本组段上限值)/2 C.(本组下限值+下组上限值)/2 E.本组段的下限值9. 原始数据加上一个不为0 的常数后: A. x 不变,CV 变D. x 变,CV 不变A.均数比中位数大B. x 变或CV 变E. x ,CV 均改变B.均数比中位数小C.均数等于中位数E.以上说法均不准确D.全距E.标准差C. x 不变,CV 不变B.(本组下限值+下组下限值)/2 D.本组段的上限值10. 对于对称分布的资料来说: D.均数与中位数无法确定孰大孰小A.均数B.中位数C.几何均数B.不要求组距相等11. 血清学滴度资料最常计算_______以表示其平均水平. 12. 利用频数表及公式M=L+i/fn (n/2- fL )计算中位数时: A.要求组距相等C.要求数据呈对称分布E.要求数据呈对数正态分布B.几何均数小于算术均数D.几何均数可以大于算术均数,也可以小于算术均数D.要求变量值都比较接近A.几何均数大于算术均数C.几何均数等于算术均数E.以上说法都不对14. 原始数据同时乘以一个既不等于零也不等于1 的常数后: A. x 不变,M 变(M 为中位数)D. x 与M 都变A.四分位数间距所得的值为: A.方差B.全距C.四分位数间距D.变异系数E.标准差B.全距B. x 与M 都不变E.以上都不对 C.标准差D.变异系数E.方差C. x 变,M 不变13. 对于同一份正偏态的资料, 求得的几何均数与算术均数:15. 表示变量值变异情况的指标最常用的是: 16. 一组计量资料中,每个变量值与均数之差的平方和, 除以变量值的个数-1,再开平方417. 标准差一定: A.不比均数大A.一定小于1 B.不比均数小B.一定大于1 C.取决于均数D.比标准误小E.以上都不对18. 变异系数CV 的数值_________ C.可大于1;也可小于1D.一定不会等于零A.全距E.一定比S 小C.方差D.变异系数E.标准差19. 比较身高和体重两组数据变异度大小宜采用: B.四分位数间距20. 描述一组偏态分布资料的变异度,以______指标较好. A. R B. S2 C. Q D. S E. CV 21. 当两组(或几组)资料均数相近,度量单位相同时,标准差大的那组资料: A.均数的代表性最差C.无法据此判断出均数的代表性E.以上都不对22. 一组数据呈正态分布,其中小于x +2.58S 的变量值有: A. 5% B. 95% C. 97.5% D. 92.5% E. 99.5% 23. 若正常人血铅含量近似对数正态分布,拟用300 名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: B. lg-1 ( x lgx +2.58slgx ) C. x±2.58S -1 D. P99 =L+i/f99 (300×99/100- fL ) E. lg ( x lgx +2.33Slgx ) 24. 某市120 名12 岁男孩平均身高x =143.10cm,S=5.67cm,则身高在128.24-157.96cm A. x +2.58S 范围内的理论频数最接近下列哪个值A. 114 B. 119 C. 64 D. 72 E. 96 25. 若上海市健康女工744 人血红蛋白含量的均数为12.239g%,标准差为0.998g%,则下列哪个最有理由认为是正常范围: A.11.24-11.3237 D. 10.592-13.886 三, 简答题1. 2. 3. 描述数值变量资料集中趋势的指标有哪些其适用范围有何异同描述数值变量资料离散趋势的指标有哪些其适用范围有何异同医学中参考值范围的涵义是什么确定的步骤和方法是什么B. 9.654-14.814 E.10.952-13.516 C. 10.283-14.195 B.均数的代表性最好D.均数也最大四,计算分析题1.某市100 名7 岁男童的坐高(cm)如下: 63.8 68.0 67.5 64.9 64.5 66.7 68.1 66.1 66.8 67.4 69.7 67.3 66.5 68.6 62.5 66.8 66.3 66.8 64.3 65.0 68.3 66.9 66.3 65.7 67.2 63.2 66.6 68.4 68.0 61.1 67.8 67.6 67.9 65.0 65.9 69.5 69.7 65.0 67.9 67.5 63.2 66.4 65.9 62.4 64.6 69.1 69.8 62.6 64.8 66.8 71.1 66.5 66.2 66.4 70.1 67.2564.5 68.0 68.0 67.465.7 68.2 66.7 68.567.0 63.2 65.665.1 64.6 66.870.0 64.2 67.969.6 64.5 67.664.7 65.9 70.465.8 66.6 68.464.2 69.2 64.367.3 71.2 66.065.0 68.3 67.365.0 70.8 65.667.2 65.3 66.070.2 64.2 66.9⑴编制其频数分布表并绘制直方图,简述其分布特征; ⑵计算中位数, 均数, 几何均数, 并说明用其中哪一种来表示这组数据的集中趋势为好⑶计算极差,四分位数间距,标准差,并说明用其中哪一种来表示这组数据的离散趋势为好(4)计算坐高在64.0cm 到68.0cm 范围内的7 岁男童比例. (5)计算100 名7 岁男童中坐高在64.0cm 到68.0cm 范围内的人数. 2. 用玫瑰花结形成试验检查13 名流行性出血热患者的抗体滴度,结果如下,求平均滴度. 1:20 1:160 尿铅含量例数⑴求中位数; 1:20 1:160 0~18 1:80 1:80 4~26 1:80 1:80 8~39 1:320 1:40 12~28 16~25 1:320 1:40 20~6 24~1 28~2 1:3203. 调查某地145 名正常人尿铅含量(mg/L)如下:⑵求正常人尿铅含量95%的正常值范围.第四章总体均数的估计和假设检验第五章方差分析返回一,名词解释1 标准误(standard error) 3 假设检验(hypothesis testing) 5 Ⅰ型错误(type I error) 7 检验效能(power of test) 2 可信区间(confidence interval) 4 统计推断(statistical inference) 6 Ⅱ型错误(type II error) 8 变量变换(variable transformation)二,单选题1 2 ________小,表示用该样本均数估计总体均数的可靠性大. A. CV B. S C. σ X D. R E. 四分位数间距统计推断的内容是__________. A. 用样本指标估计相应总体指标C. A,B 均不是3 4 A. 0.01 D. A,B 均是C. α=0.10 B. 检验统计上的"假设" E. 估计参考值范围D. α=0.20 E. α=0.25两样本均数比较时,分别取以下检验水准,以________所对应的第二类错误最小. B. α=0.05 方差分析中,当P<0.05 时,结果________. A. 可认为各样本均数都不相等6B. 可认为各总体均数不等或不全等C. 可认为总体均数都不相等E. 以上都不对5 变量变换的目的是_______. A. 方差齐性化D. A,B,C 均对6 B. 曲线直线化D) 证明总体均数不等或不全相等C.变量正态化E. A,B,C 均不对甲乙两人分别从随机数字表抽得30 个(各取两位数字)随机数字作为两个样本,求得2 X 1 , S12 , X 2 , S 2 ,则理论上_________.A.2 X 1 = X 2 , S12 = S 2B. 作两样本均数的t 检验,必然得出无差别的结论C. 作两方差齐性的F 检验,必然方差齐D. 分别由甲,乙两样本求出的总体均数的95%可信区间,很可能有重叠E. 以上均不是7. 在相同自由度(ν 1 ,ν 2 )及F 值时,方差齐性检验与方差分析所得的P 值_______. A. 前者大D. 前者是后者的两倍 B. 前者小E. 后者是前者的两倍C. 两者相等8. 正态性检验中,按α=0.10 水准,认为总体服从正态分布,此时若推断有错,此错误的概率为___________. A. 大于0.10 E. 1-β,而β未知9. 在正态总体中随机抽样, X μ ≥ ____ 的概率为5%. A. 1.96σ E. t 0.05 S X 10. 成组设计的方差分析中,必然有_____________. A. SS 组内< SS 组间C. MS 总= MS 组内+ MS 组间E. 以上均不对11. 配伍组设计的方差分析中,ν 配伍等于__________. A. D. B. MS 组内< MS 组间D. SS 总= SS 组内+ SS 组间B. 1.96 σ X C. 2.58 D. t 0.05 S B. 小于0.10 C. 等于0.10 D.β,而β未知ν 总ν 误差ν 总ν 处理+ ν误差大B. 小B. E.ν 总ν 处理ν 总ν 处理ν 误差C.ν 处理ν 误差12. 在相同自由度(ν 1 ,ν 2 )及α水准时,方差分析的界值比方差齐性检验的界值________. A.A. C. 相等C. SB. 增大样本均数D. 前者是后者的两倍D. CV E. 不一定13. 下面可用来说明均数抽样误差大小的是________________.σB. σ XE. 四分位数间距14. 对于一组样本来说,若标准差固定不变,可通过_______________来减少抽样误差. A. 增大样本含量C. 减小变异系数7D. 减小几何均数E. 以上都不对15. 以下关于抽样误差,正确的是____________. 抽样误差仅是由个体变异产生的,抽样造成的样本统计量与总体参数的差异A. 抽样研究中,抽样误差是可以避免的B. 对于同一总体的若干样本统计量间,也存在抽样误差C. 抽样误差的大小可用标准差来说明D. 以上均不对16. 以下关于t 分布不正确的是________. A. 在相同自由度时,|t|值越大,概率P 越小 B. 在相同t 值时,双尾概率P 为单尾概率P 的两倍C. t 分布曲线是一条曲线D. t 分布的极限分布是标准正态分布E. 标准正态分布可看作是t 分布的特例17. 以下关于可信区间,正确的是_________. A. 可信区间是包含未知总体参数的一个范围B. 可信区间包含可信区间上下限两个值C. 可信区间的确切含义是指有(1-α)的可能认为计算出的可信区间包含了总体参数D. 可信区间的确切含义也可理解是总体参数落在该范围的可能性为1-α E. 以上说法均不对18. 为了解某地 1 岁婴儿的血红蛋白浓度,从该地随机抽取了 1 岁婴儿n(<50)人,测得其血红蛋白的平均数为x ,标准差为S,则该地 1 岁婴儿血红蛋白的平均浓度的95%可信区间为__________. (总体标准差σ未知) A. C. E. 19 20 A.当两总体确有差异,按规定的检验水准α所能发现该差异的能力的是____________. α B. β C. 1-α D. 1-β E. 以上都不对设α为Ⅰ型错误的概率,β为Ⅱ型错误的概率,当两总体均数确定且抽取的样本含量不变时,有_____________. A. α增大,β减小C. α减小,β减小E. 以上均不对B. α增大,β增大D. α的改变不影响β的大小S ( X tα 2 , ∞) Sn ( X ± tα 2 ) σ n ( X ± uα 2 ) nB. D.S (∞, X + tα 2 )) S n ( X ± uα 2 ) n21在两个样本均数的假设检验中,若要同时减小Ⅰ型错误和Ⅱ型错误,则必须_____________.A. 增加样本含量D. A 和CB. 减小容许误差E. 以上都不对C. 减小总体标准差22关于假设检验,以下不对的是_______________. A. 根据样本统计量作出的推断结论具有概率性,因此其结论有可能出现判断错误8B. 当根据样本作出的结论是拒绝H0时,只可能犯Ⅰ型错误,不可能犯Ⅱ型错误C. 当根据样本作出的结论是接受H0时,只可能犯Ⅱ型错误,不可能犯Ⅰ型错误D. 当两总体确有差异时,按规定的检验水准所发现该差异的能力是βE. 以上均不对23. 关于可信区间和假设检验,不正确的是_____________. A. 可信区间可回答假设检验的问题B. 可信区间用于说明量的大小,假设检验用于推断质的不同C. 可信区间比假设检验可提供更多的信息D. 可信区间亦可回答假设检验的问题,但可信区间不可完全代替假设检验E. 以上结论均不对24. 方差分析中对数据的要求是________. A. 任何两个观察值之间均不相关B. 每一水平下的观察值分别服从总体均数为μ i 的正态分布C. 各总体的方差齐性D. A,B 和C 均对 E. B 和C 对25. 若假设检验结果为|t|≥ t 0.05(ν ) ,则说明_________________. A. 差异由抽样误差所致的概率等于或小于0.05 B. 差异由抽样误差所致的概率大于0.05 C. 差异由抽样误差所致的概率等于或大于0.05 D. 差异是由于本质上有所不同所致的概率等于或小于0.05 E. 差异是由于本质上有所不同所致的概率等于0.052 26. 要比较的两组数值型资料呈明显偏态分布, n1 , n 2 均小于30,且经统计检验σ 12 ≠ σ2 ,此时宜采用哪种检验方法A. t 检验B. u 检验 C. t′检验B. MS 组间SS 组间,则____________. A. MS 组间> SS 组内D. F≠1 A. α C. MS 组间= SS 组内28. 统计推断中,可信度是指_____________. 29. 两样本均数的比较,可用____________. A. 方差分析D. A,B,C 均可A. 用u 检验B. t 检验E. 仅A,B 都可B. 用t 检验 C. E. 用秩和检验以上均不对30. 两小样本数值变量资料比较的假设检验,首先应考虑___________ . D. 资料符合秩和检验还是t 检验的条件A. 两总体均数差别越大31. 两样本均数比较,经t 检验,差别有显著性时,P 越小,说明__________ . B. 两总体均数差别越小9C. 越有理由认为两总体均数不同E. 以上均不对32D. 越有理由认为两样本均数不同对15 名4~6 月贫血儿童用拘橼酸铁铵+维生素C 治疗前后侧的血色素含量(g%)见下表. 血色素含量治疗前1 2 … 14 15 11.5 10.7 … 9.5 10.0 B. 单因素方差分析治疗1 月10.4 11.0 … 10.1 10.5 C. t 检验E. 秩和检验治疗2 月12.0 12.0 … 12.1 11.3 治疗3 月12.0 13.0 … 13.5 12.5假定资料满足各种参数检验所要求的前提条件,那么,适合分析该资料的方法是A.χ 2 检验D. 配伍组设计方差分析三, 简答题1 2 3 4 5 6 7 8 假设检验的基本原理和步骤. 标准差和标准误的异同.参考值范围和置信区间有何区别t 检验和方差分析的基本思想各是什么二者的区别是什么t 检验和方差分析的应用条件有何异同以随机区组设计的两因素方差分析为例,简述方差分析的基本原理. 可信区间和假设检验的区别和联系. 配对t 检验与两样本t 检验的基本原理有何不同.四,计算分析题1. 将20 名某病患者随机分为两组,分别用甲,乙两药治疗,测得治疗前与治疗后一个月的血沉( mm/ 小时)如下表.试问: (1)甲,乙两药是否均有效(2)甲,乙两药的疗效是否有无差别甲,乙两药治疗前后的血沉(mm/ 小时) 病人号甲药乙药无变化101 20 16 1 19 162 23 19 2 20 133 16 13 3 19 154 21 20 4 23 135 20 20 5 18 136 17 14 6 16 157 18 12 7 20 188 18 15 8 21 129 15 13 9 20 1710 19 13 10 20 14治疗前治疗后病人号治疗前治疗后2. 胃溃疡患者12 人在施行胃次全切除术的前后,测定体重(kg)如下,问手术前后体重有患者术前术后152.5 72.5248 51.5339 40446 52.5558.5 49647.5 55749 52858 52951 50.51043 501113 411250 543. 某医师研究血清转铁蛋白测定对病毒性肝炎诊断的临床意义,测得11 名正常人和13 名病毒性肝炎患者血清转铁蛋白的含量(U/L) ,结果如下,问患者和健康人转铁蛋白含量是否有差异正常人n1=11) 260.5 271.6 ( 281.7 268.6 病毒性肝炎患者(n2 = 13) 224.4 221.7 218.8 233.8 230.9 240.7 256.9 253.0 260.7 215.4 251.8 224.7 228.3 264.1 273.2 270.8 284.6 291.3 254.8 275.94. 某地区1999 年测定了30 岁以上正常人与冠心病病人的血清总胆固醇含量, 资料如下表. 试检验正常人与冠心病病人血清总胆固醇含量的差别有无显著性. 正常人与冠心病病人血清总胆固醇(mmol/L)含量组别测定人数56 142 均数4.675.78 标准差0.88 1.18 标准误0.12 0.10正常人病人5. 为试验三种镇咳药,先以NH4OH 0.2ml对小白鼠喷雾,测定其发生咳嗽的时间,然后分别用药灌胃,在同样条件下再测定发生咳嗽的时间,并以"用药前时间减去用药后时间"为指标,计算延迟发生咳嗽的时间(秒) ,数据如下.试比较三种药的镇咳作用. 可待因60 复方 2 号50 复方1 号40 30 20 10 100 45 35 85 55 25 20 55 45 30 105 20 15 80 10 75 20 15 35 15 30 10 25 60 45 40 30 70 65 45 506. 经产科大量调查得知,某市婴儿出生体重均数为3.32kg,标准差为0.38kg,今随机测得36 名难产儿的平均体重为 3.43kg,问该市难产儿出生体重的均数是否比一般婴儿出生体重均数高7. 已知某地120 名正常成人脉搏均数为73.2 次/分, 标准差为8.1 次/分, 试估计该地正常成人脉搏总体均数的95%可信区间. 8. 请根据所给基本数据完成下列方差分析表. 分组A B C D n 8 6 5 8XS 3.543 5.329 5.431 7.46324.375 32.00 22.00 21.00方差分析表变异来源SS ν MS F11组间变异组内变异总变异第六章分类资料的统计描述返回一,名词解释1.率(rate)2.构成比(constituent ratio)3.相对比(relative ratio) 5.标化发病比(standardized incidence ratio)4.标准化率(standardized rate)6.标化死亡比(standardized mortality ratio) 二,单选题1.某医院的资料,计算了各种疾病所占的比例,该指标为: A.发病率A.相对比B.构成比B.流行率C.相对比C.构成比D.标化发病率D.罹患率E.标化发病比 E.标化流行率2.男性吸烟率是女性的10 倍,该指标为: 3.对两地的高血压患病率进行标准化,仅有两地各年龄组人口数和总患病率资料, 可采用的标准化方法为: A.直接法A.直接法A.某病病死率A.直接法7.SMR 为: A.实际死亡数/预期死亡数C.实际发病数/预期发病数E.以上都不是8.SIR 为: A.实际死亡数/预期死亡数C.实际发病数/预期发病数E.以上都不是9.间接标准化法计算标化死亡率是: A. SIR×标准人口死亡率C. SMR×标准人口死亡率B. SIR×标准人口总数D. SMR×标准人口总数B.预期死亡数/实际死亡数D.预期发病数/实际发病数B.预期死亡数/实际死亡数D.预期发病数/实际发病数B.间接法B.间接法C.倒求法C.倒求法D.等比法D.等比法指标. D.某病构成比E.以上都不是E.以上都不是方法计算标化死亡率. D.等比法C.某病死亡率E.以上都不是E.以上都不是4.只有各年龄组的发病率资料,用方法计算标化发病率.5.欲反映某种疾病对人群的威胁程度,计算B.某病患病率B.间接法C.倒求法6.各年龄组人口数和死亡率资料均有,最好用12E. 以上都不是10.间接标准化法计算标化发病率是: A. SIR×标准人口发病率C. SMR×标准人口死亡率E. 以上都不是11.对甲乙两县的死亡率进行标准化,若两县均有各年龄组死亡率,最好选择标准进行标化. A.两县各年龄组人口数合并C.乙县的人口构成资料 E.以上都不是12. 观察何种疾病死因是造成当地居民死亡的主要死因,用A. 死亡率D. 某病病死率A.发病率B.罹患率B.死因构成比E.生存率C.患病率D.二代罹患率E.感染率C.疾病别死亡率B.甲县的人口构成资料D.全国或省人口普查所得的人口构成为B. SIR×标准人口总数D. SMR×标准人口总数13. 衡量爆发性疾病发病的频度用14. 某厂男职工370 人,女职工456 人,慢性苯中毒人数男女分别为8 和10 人, (456/370)×100%为A.率三,简答题1.某地1956 年婴儿死亡人数中死于肺炎者占总死亡数的16%,1976 年则占18%,某医师认为该地20 年来对婴儿肺炎的防治效果不明显.你同意他的观点吗为什么2.已知甲乙两矿总职工数分别为20856 人和3911 人,甲矿工龄0.05E. Fisher 精确检验C. P=0.01 D. P0.0522.在四格表χ 检验中,若χ 值为6.86,则B. P0.4.当随机样本含量n=10,阳性18数X=6 时,为作统计推断应将概率p=________与检验水准α比较. A. p(X=6) B. p(X=6)十p(X=7)十…十p(X=10) C. p (X=7)十p(X=8)十…十p (X=10) D. p(X=6)十p(X=5)十…十p(X=0) E. p(X=5)十p(X=4)十…十p(X=0) 37.在样本率p与总体率π0比较时,用近似正态u 检验的条件是________. A. 样本含量n较大,总体率π0接近0.5 B. 样本含量n较大,总体率π0接近1 C. 样本含量n 较大,样本率p 接近0.5 D. 样本含量n 较大,样本率p 接近1 E. 样本率p 不太小38.从甲,乙两文中,查到同类研究的两个率比较的四格表资料,其χ 检验甲文χ >χ 0.01(1), 乙文χ >χ 0.05(1),可认为________. A. 两文结果有矛盾D. 甲文结果不可信B. 两文结果基本一致E. 甲文说明总体的差别大2 2 2 2 2 2 2C. 甲文结果更可信39.四个样本率作比较,χ >χ 0.01(3),可认为________. A. 各总体率不等或不全相等C. 各样本率均不相等40.四格表的自由度________. A. 不一定等于1 D. 等于样本含量减 12B. 各总体率均不相等D. 各样本率不等或不全相等E.两个总体率相等B. 一定等于1 E. 以上都不对B. χ ≤12 2C. 等于行数×列数41.χ 值的取值范围为________. A.一∞<χ <十∞2 2 2 2 2 2 2C. 0≤χ ≤十∞2D.χ ≥12E. —∞≤χ ≤0242. 当自由度不变时,关于χ 值与P值的关系,下列哪一项是正确的A. χ 值越大,P值越大. B. χ 值越大,P值越小. C. χ 值变化时,P值不变. D. χ 值变化时,P值变大或变小. E. χ 值变化时,P 值可能变化也可能不变. 43.在χ 检验中,自由度的计算为A. R×C B. n2C. n-1 B. b+c<40D.(R-1)×(C-1) C. T<1 或n5 且n>40E. 正态性检验E. b+c>4044.作四格表χ 检验时,需进行连续性矫正的条件是A. 1二,分析计算题191.试就下表资料分析比较甲,乙两医院乳腺癌手术后的5 年生存率(%). 甲,乙两医院乳腺癌手术后的5 年生存率(%) 腋下淋巴结转移无有合计病例数45 710 755 甲医院生存数35 450 485 生存率77.77 68.38 64.24 病例数300 83 383 乙医院生存数215 42 257 生存率71.67 50.60 67.102.已知某药的治愈率为60%.现欲研究在用此药的同时加用维生素C 是否有增效作用,某医生抽取10 名病人试用此药加用维生素C,结果8 人治愈,请作统计推断. 3.欲了解A,B 两地妇女的乳腺癌患病率是否相同,分别从两地抽样调查 1 万妇女,结果A 地患病人数为80 人,B 地102 人.请作统计分析.若A 地调查2 万名妇女,160 人患病,B 地调查1 万名妇女,102 人患病,则统计结论是什么. 4.按国家规定平均每毫升饮用水中的细菌数不得超过100 个, 现从某饮用水随机抽取2 毫升水测得细菌215 个,问该水源是否符合饮用水的国家卫生标准. 5.按国家规定平均每升饮用水中的大肠菌数不得超过 3 个, 现从某饮用水随机抽取1 升水测得大肠菌4 个,问该饮用水是否符合饮用水的国家卫生标准. 6.根据下表数据,试比较使用含氟牙膏与使用一般牙膏者的患龋率有无不同使用含氟牙膏与使用一般牙膏者的患龋率牙膏类型含氟牙膏—般牙膏合计调查人数200 100 300 患龋齿人数7050 120 患龋率(%) 35 50 407.某卫生防疫站在中小学观察三种矫正治疗近视眼措施的效果, 近期疗效数据见下表. 结论为"近期疗效以"夏天无"眼药水为最好,眼保健操次之,新医疗法最差" .试对此说法作出分析评价. 三种措施的近期有效率(%) 矫正方法"夏天无"眼药水新医疗法眼保健操存在一定的关系冠心病诊断结果与眼底动脉硬化级别的关系眼底动脉硬化级别0 ⅠⅡ正常340 73 1820观察例数135 32 18近期有效率(%) 37.78 18.75 27.788.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系, 资料整理如下. 问两者之间是否冠心病诊断结果可疑11 13 18 冠心病6 6 133合计357 92Ⅲ合计2 5131 446 31 5889.用两种方法检查已确诊的乳腺癌患者120 名.甲法的检出率为60%,乙法的检出率为50 %,甲,乙两法一致的检出率为35%,试问两种方法何者更优10.在某克山病区作中小学生心肌受损情况检查,277 名男生中检出率为48.74%, 147 名女生中检出率为57.10%,问男女生心肌受损率是否不同11.用某种化学物质进行诱发肿瘤试验,实验组15 只小白鼠中 4 只发生癌变,对照组10 只无一只发生癌变,问两组发癌率有无差别三,简答题 1. 二项分布,Poisson 分布与正态分布间有何关系 2. χ 检验的应用条件有哪些3. χ 检验用于解决哪些问题4. 四格表的u检验与χ 检验有何异同5. 请列举R×C表χ 检验的注意事项. 6. R×C 行列表与R×C双向有序分类列联表χ 检验的区别是什么7.某医生观察某新药预防流感的效果,并用四格表专用公式计算出χ =6.63,P=0.01.问: (1)此表的四个基本数字a,b,c,d 各等于多少(2)你对此有何看法某新药预防流感的效果分组服药组未服药组观察人数180 230 未发病130 190 有效率(%) 72.2 82.62 2 2 2 2 2第十章一,名词解释1,自变量(independent variable) 2,因变量(dependent variable)回归与相关返回3,简单相关分析(simple correlation analysis) 4,简单线性回归分析(simple linear regression analysis) 5,偏相关分析(partial correlation analysis) 6,多元线性回归分析(multivariate linear regression analysis ) 7,最小二乘法(least square method) 8,Pearson 相关分析(Pearson correlation analysis) 9,Spearman 相关分析(Spearman correlation analysis) 10,确定系数(determinant coefficient)21二,单选题1,相关系数检验的无效假设H1是.__________ A. ρ>0, B. ρ=0, C. ρ=1, D. ρ≠0 2,由样本计算两个随机变量x 和y 之间的简单相关系数r 的值近似等于零,经统计检验得到p=0.90.作结论时,正确的表述应该是__________.. A. x 与y 之间呈直线关系C. x 与y 之间没有直线关系A. SS 剩=SS 回C SS 总=SS 回A. r>0,b0,b>0 A. b=1 C. SS 剩=0 A. n C. n-2 A. 配对比较的t 检验C. 相关分析或回归分析A. 样本斜率B. 总体斜率B. x 与y 之间呈曲线关系D x 与y 之间毫无关系B. SS 总> SS 剩D. SS 剩< SS 回B. r0 D. r=b。

(完整版)医学统计学试题及答案

(完整版)医学统计学试题及答案

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

医学统计学题库第十六章 生存分析(答案)

医学统计学题库第十六章  生存分析(答案)

第十六章 生存分析(答案)一、选择题1、D2、E3、C4、B5、D6、E 二、问答题1、 (1)在生存资料中,截尾值指尚未观察到研究对象出现反应时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存资料称为截尾值。

(2)出现截尾值的原因主要有以下3种情况:①失访;②退出;③终止。

2、Cox 回归模型中,偏回归系数i β的意义是,当其它协变量不变时,i X 每变化一个单位,相对危险度的自然对数变化i β个单位。

3、Cox 回归模型与logistic 回归模型具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。

但Cox 回归模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,而logistic 回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。

三、计算题:1、(1)Cox 回归模型参数估计和假设检验结果见下表表 cox 回归模型计算及检验结果 (621.332=χ, 000.0=P )变量 偏回归系数 偏回归系数标准误 Wald P 值 OR 值 OR 值95%可信区间 下限 上限 x1 0.001 0.002 0.360 0.548 1.001 0.997 1.005 x2 0.454 0.206 4.846 0.028 1.574 1.051 2.358 x3 -1.8860.37725.0500.0000.1520.072 0.317由上表可见,在05.0=α检验水准上,所建立的Cox 回归模型成立(621.332=χ,000.0=P );入院时白细胞数(1x )的偏回归系数无统计学意义,淋巴结浸润度(2x )和缓解出院后的巩固治疗(3x )的偏回归系数均有统计学意义。

Cox 回归模型为:[])886.1454.0001.0ex p()(),(3210x x x t h X t h i -+=。

以上结果可解释为:淋巴结浸润度(2x )和缓解出院后的巩固治疗(3x )均对急性淋巴细胞性白血病病人的生存时间产生影响。

《医学统计学》单项选择题及答案

《医学统计学》单项选择题及答案

《医学统计学》单项选择题及答案第一章绪论1.医学统计学研究的对象是()A.医学中的小概率事件B.各种类型的数据C.动物和人的本质D.有变异的医学事物E.疾病的预防与治疗2.用样本推论总体,具有代表性的样本通常指的是()A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3.下列观测结果属于有序数据的是()A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4.随机误差指的是()A.由某些固定因素引起的误差B.由不可预知的偶然因素引起的误差C.选择样本不当引起的误差D.选择总体不当引起的误差E.由操作失误引起的误差5.系统误差指的是()A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差E.由不可预知的偶然因素引起的误差6.抽样误差指的是()A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差E.由不可预知的偶然因素引起的误差7.收集资料不可避免的误差是()A.随机误差B.系统误差C.过失误差D.记录误差E.仪器故障误差8.统计学中所谓的总体通常指的是()A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的生物样品B.统计量C.某一变量的测量值D.数据中有代表性的一部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B.检测出现错误C.统计设计不够合理D.生物个体的变异E.样本量不够答案:1.D2.E3.D4.B5.A6.D7.A8.C9.E10.D第二章定量数据的统计描述1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A.中位数B.几何均数C.均数D.P95百分位数E.频数分布2.算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.将一组计量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.提供原始数据D.为了能够更精确地检验E.描述数据的分布特征4.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B.几何均数C.中位数D.百分位数E.倒数的均数5.变异系数主要用于()A.比较不同计量指标的变异程度B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽样误差的大小6.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是()A.变异系数B.离均差平方和C.极差D.四分位数间距E.标准差7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用()A.全距B.标准差C.变异系数D.方差E.四分位数间距8.一组原始数据呈正偏态分布,其数据的特点是A.数值离散度较小B.数值离散度较大C.数值分布偏向较大一侧D.数值分布偏向较小一侧E.数值分布不均匀9.对于正偏态分布总体,其均数与中位数的关系是()A.均数与中位数相同B.均数大于中位数C.均数小于中位数D.两者有一定的数量关系E.两者数量关系不定10.在衡量数据的变异度时,标准差与方差相比,其主要特点是()A.标准差小于方差B.标准差大于方差C.标准差更容易计算D.标准差更为准确E.标准差的计量单位与原始数据相同答案1.A2.B3.E4.B5.A6.E7.E8.D9.B10.E 第三章正态分布与医学参考值范围1.正态曲线下,横轴上从均数到+∞的面积为()A.50%B.95%C.97.5%D.99%E.不能确定(与标准差的大小有关)2.标准正态分布的形态参数和位置参数分别为()A.0,1B.1,0C.μ,σD.σ,μE.S,X3.正态分布的均数、中位数和几何均数之间的关系为()A.均数与几何均数相等B.均数与中位数相等C.中位数与几何均数相等D.均数、中位数、几何均数均不相等E.均数、中位数、几何均数均相等4.正常成年男子的红细胞计数近似服从正态分布,已知X=4.78×1012/L,S=0.38×1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ(z)=1-Φ(-2.05)=0.9798,则理论上红细胞计数为()A.高于4.78×1012/L的成年男子占97.98%B.低于4.78×1012/L的成年男子占97.98%C.高于4.00×1012/L的成年男子占97.98%D.低于4.00×1012/L的成年男子占97.98%E.在4.00×1012/L至4.78×1012/L的成年男子占97.98%5.某项指标95%医学参考值范围表示的是()A.在此范围“异常”的概率大于或等于95%B.在此范围“正常”的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围E.在人群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人E.健康状况良好的人7.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人E.健康状况良好的人8.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是()A.用均数来评价B.用中位数来评价C.用几何均数来评价D.用变异系数来评价E.用参考值范围来评价9.应用百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大10.某市1974年238名居民的发汞含量(μmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(μmol/kg)15~35~55~75~95~115~135~155~175~195~215人数2066 604818166103A.B.>P5C.(P2.5,P97.5)D.S X96.1±E.S X96.1±答案1.A2.B3.B4.C5.D6.D7.C8.E9.B10.A 第四章定性数据的统计描述1.如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是()A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少E.该疾病的死因构成比增加2.计算乙肝疫苗接种后血清学检查的阳转率,分母为()A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数E.乙肝疫苗接种后的阳转人数3.计算标准化死亡率的目的是A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响E.便于进行不同时间死亡率的比较4.已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女性居民多,而乙乡男性居多,适当的比较方法是()A.两个率直接比较B.两个率间接比较C.直接对感染人数进行比较D.计算标准化率比较E.不具备可比性5.甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是()A.甲县的诊断水平高B.甲县的肿瘤防治工作比乙县好C.甲县的人口健康水平高D.甲县的老年人口在总人口中所占比例更小E.甲县的老年人口在总人口中所占比例更大6.相对危险度RR的计算方法是()A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同疾病的发病率之比E.两种不同条件下某疾病发生的概率之比7.比数比OR值表示的是()A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同疾病的严重程度E.两种不同条件下某疾病发生的危险性程度8.计算患病率时的平均人口数的计算方法是()A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末人口数D.生活满一年的总人口数E.生活至少在半年以上的总人口数9.死因构成比反映的是()A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性E.各种疾病的死亡风险大小10.患病率与发病率的区别是()A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.发病率更容易获得E.患病率与病程有关答案1.A2.C3.D4.D5.E6.E7.E8.A9.D10.E 第五章统计表与统计图1.统计表的主要作用是()A.便于形象描述和表达结果B.客观表达实验的原始数据C.减少论文篇幅D.容易进行统计描述和推断E.代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A.复式条图B.复式线图C.散点图D.直方图E.箱式图5.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图E.直条图6.下列统计图适用于表示构成比关系的是()A.直方图B.箱式图C.误差条图、条图D.散点图、线图E.圆图、百分条图7.有些资料构成统计表时,下列哪一项可以省略()A.标题B.标目C.线条D.数字E.备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B.百分条图C.线图D.半对数线图E.直方图9.描述某现象频数分布情况可选择()A.圆图B.百分条图C.箱式图D.误差条图E.直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A.圆图B.百分条图C.箱式图D.复式条图E.直方图答案1.E2.D3.B4.E5.D6.E7.E8.E9.E10.D 第六章参数估计与假设检验1.样本均数的标准误越小说明()A.观察个体的变异越小B.观察个体的变异越大C.抽样误差越大D.由样本均数估计总体均数的可靠性越小E.由样本均数估计总体均数的可靠性越大2.抽样误差产生的原因是()A.样本不是随机抽取B.测量不准确C.资料不是正态分布D.个体差异E.统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B.将个体变异控制在一定范围内C.减小标准差D.控制偏倚E.适当增加样本含量4.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为()A.正偏态分布B.负偏态分布C.正态分布D.t分布E.标准正态分布5.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%7.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,则该地正常成年人血清胆固醇均数的95%可信区间是()A.3.64±1.96×1.20B.3.64±1.20C.200/20.196.164.3×±D.200/20.158.264.3×±E.3.64±2.58×1.208.假设检验的目的是A.检验参数估计的准确度B.检验样本统计量是否不同C.检验样本统计量与总体参数是否不同D.检验总体参数是否不同E.检验样本的P值是否为小概率9.假设检验差别有统计学意义时,P值越小,说明()A.样本均数差别越大B.总体均数差别越大C.认为样本之间有差别的统计学证据越充分D.认为总体之间有差别的统计学证据越充分E.认为总体之间有差别的统计学证据越不充分10.关于假设检验,正确的说法()A.检验水准必须设为0.05B.必须采用双侧检验C.必须根据样本大小选择检验水准D.必须建立无效假设E.要说明无效假设正确,必须计算P值答案1.E2.D3.E4.C5.B6.E7.C8.D9.D10.D 第七章t检验1.两样本均数之差的标准误反映的是()A.两样本数据集中趋势的差别B.两样本数据的变异程度C.t分布的不同形状D.数据的分布特征E.两样本均数之差的变异程度2.两样本均数比较,检验结果05.0>P说明()A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别3.由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数比较,差别具有统计学意义时,P值越小说明()A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同E.越有理由认为两样本均数相同5.假设检验中的Ⅱ类错误指的是()A.可能出现的误判错误B.可能出现的假阳性错误C.可能出现的假阴性错误D.可能出现的无效假设错误E.可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使用的方法是()A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值E.增加样本含量7.以下不能用配对检验方法的是()A.比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E.比较15名受试者针刺檀中穴前后的痛阈值8.两独立样本均数t检验,其前提条件是()A.两总体均数相等B.两总体均数不等C.两总体方差相等D.两总体方差不等E.两总体均数和两总体方差都相等9.若将配对设计的数据进行两独立样本均数t检验,容易出现的问题是()A.增加出现I类错误的概率B.增加出现II类错误的概率C.检验结果的P值不准D.方差齐性检验的结果不准E.不满足t检验的应用条件10.两组定量资料比较,当方差不齐时,应该使用的检验方法是()A.配对t检验B.Satterthwaite t′检验C.两独立样本均数t检验D.方差齐性检验E.z检验答案1.E2.D3.E4.D5.C6.E7.C8.C9.B10.B 第八章方差分析1.方差分析的基本思想是()A.组间均方大于组内均方B.组内均方大于组间均方C.不同来源的方差必须相等D.两方差之比服从F分布E.总变异及其自由度可按不同来源分解2.方差分析的应用条件之一是方差齐性,它是指()A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差=组间方差D.总方差=各组方差之和E.总方差=组内方差+组间方差3.完全随机设计方差分析中的组间均方反映的是()A.随机测量误差大小B.某因素效应大小C.处理因素效应与随机误差综合结果D.全部数据的离散度E.各组方差的平均水平4.对于两组资料的比较,方差分析与t检验的关系是()A.t检验结果更准确B.方差分析结果更准确C.t检验对数据的要求更为严格D.近似等价E.完全等价5.多组均数比较的方差分析,如果0.05P<,则应该进一步做的是()A.两均数的t检验B.区组方差分析C.方差齐性检验D.SNK-q检验E.确定单独效应6.完全随机设计的多个样本均数比较,经方差分析,如果0.05P <,则结论为()A.各样本均数全相等B.各样本均数全不相等C.至少有两个样本均数不等D.至少有两个总体均数不等E.各总体均数全相等7.完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F值在理论上应接近于()A.()21,FνναB.误差处理SS SS/C.0D.1E.任意值8.对于多个方差的齐性检验,若P<α,可认为()A.多个样本方差全不相等B.多个总体方差全不相等C.多个样本方差不全相等D.多个总体方差不全相等E.多个总体方差相等9.析因设计的方差分析中,两因素X与Y具有交互作用指的是()A.X和Y的主效应相互影响B.X与Y对观察指标的影响相差较大C.X与Y有叠加作用D.X对观察指标的作用受Y水平的影响E.X与Y的联合作用较大10.多组均数比较的方差分析,如果0.05P<,则应该进一步做的是()A.两均数的t检验B.区组方差分析C.方差齐性检验D.SNK-q检验E.确定单独效应答案:1.E2.B3.C4.E5.D6.D7.D8.D9.D10.C 第八章χ2检验1.两样本率比较,差别有统计学意义时,P值越小说明()A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同E.越有理由认为两样本率相同2.欲比较两组阳性反应率,在样本量非常小的情况下(如1210,10n n<<),应采用的假设检验方法是()A.四格表χ2检验B.校正四格表χ2检验C.Fisher确切概率法D.配对χ2检验E.校正配对χ2检验3.进行四组样本率比较的χ2检验,如220.01,3χχ>,可认为()A.四组样本率均不相同B.四组总体率均不相同C.四组样本率相差较大D.至少有两组样本率不相同E.至少有两组总体率不相同4.从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为()A.两文结果有矛盾B.两文结果完全相同C.甲文结果更为可信D.乙文结果更为可信E.甲文说明总体的差异较大5.两组有效率比较的检验功效相关因素是()A.检验水准和样本率B.总体率差别和样本含量C.样本含量和样本率D.总体率差别和理论频数E.容许误差和检验水准6.通常分析四格表需用连续性校正χ2检验的情况是()A.T<5B.T<1或n<40C.T<5且n<40D.1≤T<5且n>40E.T<5或n<407.当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是()A.增大B.减小C.不变D.不确定E.随该格实际频数的增加而增减8.对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni方法校正后的检验水准应该是()A.0.017B.0.008C.0.025D.0.005E.0.0139.对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni方法校正后的检验水准应该是()A.0.050B.0.010C.0.025D.0.005E.0.01710.利用χ2检验公式不适合解决的实际问题是()A.比较两种药物的有效率B.检验某种疾病与基因多态性的关系C.两组有序试验结果的药物疗效D.药物三种不同剂量显效率有无差别E.两组病情“轻、中、重”的构成比例答案:1.D2.C3.E4.C5.B6.D7.C8.B9.E10.C 第九章非参数检验1.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是()A.适用范围广B.检验效能高C.检验结果更准确 D.充分利用资料信息E.不易出现假阴性错误2.对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A.增加Ⅰ类错误B.增加Ⅱ类错误C.减少Ⅰ类错误D.减少Ⅱ类错误E.两类错误都增加3.两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A.两总体的差别越大B.两总体的差别越小C.两样本的差别可能越大D.越有理由说明两总体有差别E.越有理由说明两总体无差别4.多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A.方差分析B.Wilcoxon T检验C.Kruskal-Wallis H检验D.u检验E.列联表χ2检验5.两组数据的秩和检验和t检验相比,其优点是()A.计算简便B.检验假设合理C.检验效能高D.抽样误差更小E.对数据分布不做限制6.两样本比较的秩和检验,其检验统计量T是()A.例数较小的秩和B.例数较大的秩和C.较小的秩和D.较大的秩和E.任意一组数据的秩和7.两样本比较的秩和检验,其无效假设是()A.两样本有相同的秩和B.两总体有相同的秩和C.两样本分布相同D.两总体分布相同E.两总体分布的位置相同8.两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A.比较两样本的秩和大小B.P值大小C.检验统计量T值大小D.两样本秩和的差别大小E.比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是×列联表χ2检验A.Wilcoxon秩和检验B.24C.四格表χ2检验D.Fisher确切概率法E.计算标准化率10.两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次是()A.0.2B.1.0C.5.0D.2.5E.3.0答案1.A2.B3.D4.C5.E6.A7.E8.E9.A10.E 第十章线性相关与回归1.两数值变量相关关系越强,对应的是()A.相关系数越大B.相关系数的绝对值越大B.回归系数越大C.回归系数的绝对值越大E.相关系数检验统计量的t值越大2.回归分析的决定系数2R越接近于1,说明()A.相关系数越大B.回归方程的显著程度越高C.应变量的变异越大D.应变量的变异越小E.自变量对应变量的影响越大3.对两变量X和Y作简单线性相关分析,要求的条件是()A.X和Y服从双变量正态分布B.X服从正态分布C.Y服从正态分布D.X和Y有回归关系E.X和Y至少有一个服从正态分布4.两组资料作回归分析,直线回归系数b较大的一组,表示()A.相关系数r也较大较大B.假设检验的P值较小C.决定系数R2较大D.决定系数R2较小E.Y随X变化其数量关系有更大的变化5.1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为?144YX=+,若将体重换成国际单位kg,则此方程()A.常数项改变B.回归系数改变C.常数项和回归系数都改变D.常数项和回归系数都不改变E.决定系数改变6.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.ρ=0时,r=0B.ρ>0时,r>0C.r>0时,b<0D.r<0时,b<0E.ρ<0时,r>07.下列双变量中,适用于进行线性相关分析的是()A.年龄与体重B.民族与血型C.体重与体表面积D.母亲文化水平与子女智商E.工龄与患病率8.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.有密切的关系B.有一定的因果关系C.相关关系密切D.存在数量依存关系E.有较强的回归关系9.作线性相关分析时,当n=12,r=0.767,查r界值表823.010,2/001.0=r,795.010,2/002.0=r,750.010,2/005.0=r,则P值范围为()A.0.001<p<0.002<p="">B.P<0.001C.P<0.002D.P>0.005E.0.002<p<0.005<p="">10.通过线性回归分析(n=48),得决定系数R2=0.49,则下列说法中错误的是()A.两个变量具有回归关系B.一定有相关系数r=0.70或r=-0.70C.假设检验的自由度ν=46D.回归平方和大于剩余平方和E.Y的总变异有49%可以由X的变化解释答案1.B2.E3.A4.E5.C6.D7.C8.D9.E10.D 第十一章多元线性回归1.在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是()A.节省样本B.提高分析效率C.克服共线影响D.减少异常值的影响E.减少混杂的影响2.多元线性回归分析中,反映回归平方和在应变量Y的总离均差平方和中所占比重的统计量是()A.简单相关系数B.复相关系数C.偏回归系数D.回归均方E.决定系数R23.对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是()A.决定系数 B.相关系数C.偏回归平方和D.校正决定系数E.复相关系数4.多元线性回归分析中,反映自变量对应变量作用大小的是()A.决定系数 B.标准化偏回归系数C.偏回归平方和。

医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

医学统计学考题(按章节)第6题【05分】__随访资料的⽣存分析五、其它30分(3~5道题⽬,每题6~10分)随访资料的⽣存分析:【06真题】九、某医⽣从 2002年 1⽉ 1⽇起对某医院收治的 6名急性⼼肌梗塞病⼈进⾏跟踪观察,2002年 3⽉ 25⽇结束观察,共 12周。

记录的资料如下:(5分)1、上述资料随访时间单位以(⽇)、(⽉)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。

【05真题、04真题、03真题】四、16例某癌症病⼈在不同时期经随机化分配到A、B两治疗组,并继续进⾏随访⾄1974年5⽉ 31⽇结束。

资料如下表:(8分) 16例某种癌症病⼈随访资料病⼈号治疗组分组⽇期终⽌⽇期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(⽇)、(⽉)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要⽐较A、B疗法对该种癌症病⼈的疗效,宜选⽤何种统计检验⽅法?4.A、B治疗组随访资料⽣存时间的特征量(代表值)⼀般⽤何指标表⽰?【答案】jszb0、本资料中,第7号观察对象数据,终⽌⽇期竟然早于分组⽇期,是典型的错误数据,应该排除。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

五、其它30分(3~5道题目,每题6~10分)随访资料的生存分析:【06真题】九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。

记录的资料如下:(5分)1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。

【05真题、04真题、03真题】四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。

资料如下表:(8分)16例某种癌症病人随访资料病人号治疗组分组日期终止日期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?【答案】jszb0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。

1、本资料并未按时间分组,实际上是A、B两个治疗组的未分组资料。

一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。

但研究目的不同,时间单位不同,使用恰当的时间单位。

本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小,因此,本资料随访时间单位以月较合适?2、产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。

因此,编号4、6、8、14、15观察对象属截尾值。

3、两样本生存曲线比较,宜选用对数秩检验(log-rank test)。

4、A、B治疗组随访资料生存时间的特征量(代表值)一般用中位生存时间median survival time表示。

【知识点解析】Jszba.生存分析是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,所以它的应变量有两个,即生存时间和结局。

b.随访资料做生存分析的条件为有一定的死亡数。

一、随访资料的生存分析(Survival analysis)(一)定义是将事件的结局和出现这一结局所经历的时间结合起来分析的统计分析方法。

临床科研中,评价某种药物的疗效或者某种疾病的愈后,不仅可以对某各时点治愈率(或生存率)进行评价,还可以考察生存时间。

利用生存分析的原理和方法,把“出生”、“死”的涵义稍加变通,在医学研究中可以有广泛的应用。

【意义】1、分析放置的心脏起搏器有效持续时间。

2、研究抛弃性隐形眼镜使用寿命。

3、比较某因素暴露组与非暴露组人群某种疾病发生或死亡的威胁性。

一般而言,能够明确划分起止点的现象均可以用生存分析的原理和方法来进行研究。

(二)特点能同时分析有结局的完全数据和没有结局的截尾数据,充分利用信息。

完全数据(complete data):是确切的生存时间。

若以死亡为结局事件,则完全数据是指从研究起点至死亡所经历的时间。

截尾数据(censored data):由于某种原因,在研究结束时未能观察到病人的明确结局,所以不知道该病人的确切生存时间。

是从起点至研究结束所经历的时间。

产生截尾数据的原因:1. 中途失访2.在研究结束时仍然存活3.死于与研究疾病无关的原因生存分析常有两个效应变量:结局,生存时间1)“死亡”:即处理失败,终止随访时间为“死亡”时间。

2)中途失访:如失去联系、中途退出等,终止随访时间为最后一次访问时间为准。

3)死于其它与研究疾病无关的原因,终止随访时间为死亡时间。

4)随访截止:随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。

【基本术语】1、“死亡”事件或称失败事件(failure event)2、截尾值(censored value)3、生存时间(survival time)4、生存率(survival rate)1、“死亡”事件或称失败事件(failure event)反映处理因素失败或失效的特征。

如乳腺癌病人手术后复发、肾移植病人肾功能衰竭、白血病患者化疗后的复发等。

2、截尾值(censored value)有的观察对象终止随访不是由于失败事件发生,而是由于中途失访、死于其它原因、随访截止。

由于不知道这些观察对象发生失败事件的时间,他们的资料不能提供完全的信息,这些对象的观察值称为截尾值,常用符号“+”表示。

3、生存时间(survival time)即随访观察持续的实足时间,按天、周、月、年等时间单位记录,常用符号t表示。

一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。

但对非住院病人常难以知道准确的死亡或失访时间。

生存分析中最基本的问题就是计算生存时间,它有三个要素:时间的起点、终点、时间的测度单位(时、日、月、年)3、生存时间(survival time)如某病人1990年2月1日进入随访,1992年4月间发生失败事件,他的生存时间为t=26月;又如某白血病患者化疗3月后失去联系,他的随访结果为一截尾值,生存时间记为t=3月;安放心脏起搏器患者术后2年因意外事故死亡,他的随访结果也为一截尾值,生存时间记为t=2+年。

4、生存率(survival rate)指某个观察对象活过t 时刻的概率,常用P(X>t)表示。

如P(X>10)表示某对象活过10天(或10月、10年)的概率。

根据不同随访资料的失败事件,生存率可以是缓解率、有效率等。

1.死亡概率:q【对于未分组资料】某时刻的死亡概率=某时刻的死亡人数/ 该时刻以前的期初观察人数未分组资料生存率的估计主要是用乘积极限法(product-limit estimates);又称Kaplan-Meier 法,主要适用于观察例数不多时,是一种非参数方法。

【对于 分组资料】某年死亡概率=某年内死亡数/ 某年年初观察人数若有截尾,则分母用校正的年初观察人数(年初观察人数-1/2截尾人数)2.生存概率: p =1-q3.生存率:S(ti)S(ti)=ti 时刻仍存活的例数/ 观察总例数如果含有截尾数据,分母需要校正。

生存率为累积生存概率,是各时段上的生存概率乘积。

S(ti) =p1*p2* ... *pi4.生存率的标准误5.生存曲线以时间t 为横轴,生存率S(ti)为纵轴,表达了生存率随时间的变化趋势。

常为阶梯形。

(四)生存分析研究的内容1.描述生存过程。

估计生存率及平均生存时间,绘制生存曲线。

未分组资料,采用Kaplan -Meier 法(简称K -M 法)。

分组资料,采用寿命表法(Life table )。

2.比较组间生存曲线是否有差别。

对于未分组资料,采用对数秩检验(log -rank test )。

3.影响生存时间的因素分析。

COX 模型。

【总体生存率可信区间的估计】用正态近似原理估计某时点总体生存率的可信区间。

00p n n s u p α±如本例3个月时生存率的95%可信区间为:3620.00457.096.12724.0 1828.00457.096.12724.0 :=⨯+=⨯-上限:下限(一)K-M 法描述生存过程:(二)比较组间生存曲线是否有差别:【五、两样本生存率曲线的比较】1、两时点生存率的比较对于大样本资料,根据正态近似原理,可用u检验。

①该法是正态近似法,当样本的生存率很小或很大,如小于0.05,或大于0.99,或各组死亡人数、生存人数少于5时,该方法误差较大;②由于该法只检验某时点两样本生存率的差别有无统计学意义,而不能对整个生存期作出评价。

2、两样本生存曲线比较——对数秩检验(log-rank test)其基本思想是如果无效假设成立,即两总体生存曲线无差别时,则两种处理在各个时期的实际死亡数与理论死亡数不会相差太大,否则应认为无效假设不可能成立,两条生存率曲线差异有统计学意义。

⏹Log-rank检验:时序检验,属于非参数方法,比较整个生存时间的分布◆大样本卡方检验◆2条或多条生存曲线比较对数秩检验(log-rank test)公式:1)(22-=-∑=组数νTT A x 当有 T <5 时,用校正公式。

H 0:单放疗组与放化疗组的生存率曲线分布相同H 1:单放疗组与放化疗组的生存率曲线分布不同α = 0.05计算检验统计量:X 2 = 4.65, 得 P=0.03按α = 0.05水准,拒绝H 0 ,接受H 1 ,故认为单放疗组与放化疗组的生存率曲线分布不同。

【生存率比较注意事项】当比较不同治疗方案的治疗效果时,仅比较某个时点的生存率,有时可能出现不正确的结论。

事实上,每一种防治措施的效果都是一条时间效应曲线,所以评价该措施的效果应对这条时间效应曲线进行全面评价,而不是仅对某个时点的生存率进行评价。

1.生存分析:生存分析(survival analysis )是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。

2.生存时间:生存时间(survival time )指观察到的存活时间。

3.完全数据:完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间。

4.截尾数据:由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。

从起点至截尾所经历的时间,称为截尾数据(censored data )。

5.死亡率:某年内死亡例数与年中观察例数之比称为死亡率(mortality rate )。

6.死亡概率:死亡概率(mortality probability )是指某年内死亡例数与年初观察例数之比,若年内有截尾,分母用校正人口数。

相关文档
最新文档