医学统计学分析计算题-答案
《医学统计学》考试试题及答案(三)
《医学统计学》考试试题及答案(一)单项选择题3.抽样的目的是(b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
医学统计学试题及答案
《医学统计学》课程考试试题(A卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷)一、选择题(每题1分,共62分,只选一个正确答案)1、医学科研设计包括( D )A.物力和财力设计 B.数据与方法设计C.理论和资料设计 D.专业与统计设计2、医学统计资料的分析包括( D )A.数据分析与结果分析 B.资料分析与统计分析C.变量分析与变量值分析 D.统计描述与统计推断3、医学资料的同质性指的是( D )A.个体之间没有差异 B.对比组间没有差异C.变量值之间没有差异 D.研究事物存在的共性4、离散型定量变量的测量值指的是( D )A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A )A.无序二分类变量 B、定量变量.C.等级变量 D.无序多分类变量6、计量资料编制频数表时,组距的选择( D )A.越大越好 B.越小越好C.与变量值的个数无关 D.与变量值的个数有关7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料C.呈倍数关系的资料 D.正态分布资料9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数10、医学统计工作的步骤是( A )A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验11、下列关于变异系数的说法,其正确的是( A )A.没有度量衡单位的系数B.描述多组资料的离散趋势C.其度量衡单位与变量值的度量衡单位一致D、其度量衡单位与方差的度量衡单位一致12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B )A.4 B.4.5 C.3 D.213、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描述这组资料离散趋势的指标最好为( C )A.全距 B.四分位数间距 C.标准差 D.方差14、正态分布曲线下,当μ不变,σ变大时,( D )A.曲线形态不变,中心位置向左移 B.曲线形态不变,中心位置向右移C.曲线形态变的瘦高,中心位置不变 D.曲线形态变的矮胖,中心位置不变15、用于描述一组对称分布资料全部观察值变异程度大小的指标是( A )A.S B.R C. D.CV16、下列指标中,不属于集中趋势指标的是( A )A.变异系数 B.中位数 C.算术均数 D.几何均数17、总体是由( A )组成A.同质个体的所有变量值 B.全部个体 C.相同的观察指标D.部分个体18、随着样本例数的增大,样本均数( A )A、与总体均数更加接近. B.减小 C.不变 D.增大19、抽样误差产生的原因是( A )A.个体变异 B.工作人员责任心不强 C.仪器测量不准确D.观察对象不纯20、观察单位为研究中的( A )A.个体 B.全部对象 C.样本 D.观察指标21、变异系数CV是( B )A.整数 B.百分数 C.小数 D.率22、各观察值同加上一个不等于0的常数后,( B )不变A、算术均数B、标准差C、几何均数D、变异系数23、下列资料( B )为等级资料A、体重B、病人的病情分级C、某病发病率D、血型24、标准正态分布曲线下,0到2.58的面积为( B )A.90% B.49.5% C.95% D.50%25、测定一组人群的听力,已知听力过低为异常,若制定其医学参考值范围,应选择( B )A.单侧上限 B.单侧下限 C.双侧 D.单侧26、关于医学参考值范围的制定,下列说法正确的是( A )A.样本例数不能太少 B.只能选95%的百分界限C.不受资料分布类型的限制 D.选择单侧和双侧的结果是一样的27、正常成年男子收缩压的医学参考值范围一般指( B )A、所有正常成年男子收缩压的最小值到最大值范围B、绝大多数正常成年男子收缩压的波动范围C、所有正常成年男子收缩压的波动范围D、少部分正常成年男子收缩压的波动范围28、有关样本均数的标准误,下列说法正确的是( B )A.与样本例数的大小无关 B.表示样本均数离散趋势的大小C.表示样本变量值差异的大小 D.与样本所代表的总体变量值的离散趋势无关29、下列哪项不是样本均数标准误的用途( C )A.可用来计算总体均数的可信区间 B.可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D. 可用于均数假设检验的计算.30.t分布曲线随自由度的增大( D )A.曲线下的总面积变小 B.曲线的中心位置向左移C.曲线的高峰变低,尾部翘得较高 D.曲线的高峰变高,尾部翘得较低31.自由度一定的t分布曲线,当t值增大时,其尾部面积( A )A.变小 B.变大 C.不变 D.不清楚32、总体均数95%的可信区间主要是用于( A )A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C.95%的样本均数在此范围内 D.确定医学参考值范围33、要提高总体均数可信区间的把握度与精确度,最好的方法是( B )A.改变计算公式 B.增加样本例数C.减小样本例数 D.样本例数保持不变34、假设检验中,同一资料,作单侧检验与双侧检验( D )A.结论一致 B.结论不清楚C.作单侧检验更容易接受无效假设 D、作单侧检验更容易接受备择假设35、假设检验中,同一资料,作单侧检验与双侧检验( C )A.结论一致 B.结论不清楚C.作双侧检验更容易接受无效假设 D、作双侧检验更容易接受备择假设36.单样本t检验的目的是( B )A.推断未知总体均数是否小于零B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等D.推断未知总体均数是否为负数37、配对设计的目的是( A )A.提高组间可比性 B.计算简便 C.易于理解 D.为了结论更可靠38、配对设计t检验的目的是( A )A.推断差数的总体均数是否等于零B.推断差数的样本均数是否等于零C.推断差数的总体均数是否大于1D.推断差数的样本均数是否大于139、两样本均数t检验的目的是( A )A.推断两总体均数是否相等.B.推断两样本均数是否相等.C.推断两总体方差是否相等.D.推断两样本方差是否相等.40、甲乙两人分别从同一总体中各抽得30个与50个变量值作为两个样本,求得、S12,、S22,则有( D )A、做两样本t检验,必然得差别无统计学意义的结论B、做两样本t检验,必然得差别有统计学意义的结论C、分别有甲、乙两样本求出的总体均数的95%的可信区间,必然有重叠D、分别有甲、乙两样本求出的总体均数的95%的可信区间,很可能有重叠41、两样本均数的t检验,若两样本例数分别为n1和n2,自由度为( D )A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-242、若同时减少第一类错误与第二类错误,最佳的方法为( A )A.增加样本例数 B.减少样本例数 C.样本例数不变 D.改变检验水准43、拒绝无效假设,只可能犯( A )A、第一类错误. B.第二类错误C.推断结论不可靠的错误 D.检验水准不一致的错误44、反映事物内部某一组成部分所占的比重宜采用( A )A.构成比 B.标准化率 C.相对比 D.率45、某地某年乙脑的发病人数占同年传染病病人数的20%,该指标为( A )A.构成比 B.率 C.相对比 D.发病率46、甲乙两地进行冠心病发病率的比较,需要进行率的标准化的情况有( A )A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大47、甲、乙两组资料进行率的标准化时,选择标准人口数或选择该标准人口数换算成相应的标准人口构成比,两方法得出的结论( A )A.相同 B.甲组标化率大于乙组标化率C.不同 D.甲组标化率小于乙组标化率48、某医师给某地全部的麻疹易感儿童进行免疫接种,共有2000人,一个月后,从中随机抽取400人进行抗体水平的测定,其中阳性人数是300人,若计算该疫苗接种的阳性率,其数值为( B )A.10% B.75% C.50% D.60%49、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为( D )A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2) / (n1+n2)50、有关样本率的标准误,下例错误的是( D )A.表示样本率围绕总体率的离散趋势B.表示样本率相互之间的离散趋势C.表示样本率抽样误差的大小D.表示样本阳性率与样本阴性率之间的差异51、总体率估计的最佳方法是( B )A.点值估计 B.区间估计 C.概率估计 D.频率估计52、值是反映实际频数与理论频数( B )A.相差多少的指标 B.吻合程度的指标C.是否相等的指标 D.以上均不对53、四格表检验时,不需要进行连续性校正的条件是( A )A.n≥40, T≥5 B.n<40,1≤T<5C.n≥40,T<1 D.n≥40,1≤T<554、四格表资料的检验,理论频数T的计算是根据( A )A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π255、用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用( B )A.行X列表资料的检验 B.配对设计四格表检验C.t检验 D.两样本率比较的四格表检验56、3个样本率作比较,< 0.05,2,则在α=0.05检验水准下,可认为( B )A.各总体率不等或不全相等 B.各总体率均相等C.各样本率均相等 D.各样本率不全相等57、相关系数是表示两变量x与y之间( D )A .有无数量关系的指标 B.那个变量较大的指标C.有无依存关系的指标 D.相关关系的密切程度与相关方向的指标58、相关系数假设检验的无效假设是( B )A .ρ≠0 B.ρ=0 C.β≠0 D.β=059、相关系数假设检验的自由度为( B )A.n - 1 B.n - 2 C.n D.n + 1 60.最小二乘法原理是( C )A.各实测点距所求直线的纵向距离最小B.各实测点距所求直线的纵向距离相等C.各实测点距所求直线的纵向距离平方和最小D.各实测点距所求直线的垂直距离平方和最小61、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是( C )A.相关系数越小,回归系数也越小 B.相关系数与回归系数无关系C.回归系数有单位,相关系数没有单位 D.样本相关系数为0时,样本回归系数也为062、关于回归系数b,下列说法错误的是( B )A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共10分)63、绘制定量资料的频数表时,各组段的组距一定要相等。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学分析计算题-答案(1)
第二单元 计量资料的统计推断分析计算题某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数标准差 标准值*红细胞数/1012·L -1 男 360女 255 血红蛋白/g ·L -1 男 360女255请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大 (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同) 解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
该地男性红细胞数总体均数的95%可信区间为:-× , +×,即 , 1210/L 。
该地女性红细胞数总体均数的95%可信区间为:-× , +×,即 , 1210/L 。
医学统计学分析计算题-答案
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别例 数 均 数 标准差 标准值* 红细胞数/1012·L -1男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L )男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
该地男性红细胞数总体均数的95%可信区间为:(4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。
医学统计学分析计算题-答案 (1)
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
医学统计学试题及答案
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
《医学统计学》计算题答案
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
医学统计学 统计题及参考答案(六部分)
第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
(完整版)孙振球第三版研究生医学统计学课后习题答案
医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1) 均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069) (2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较, t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038, 转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义 (3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
医学统计学试题及参考答案 1、2、3套
医学统计学试题及答案1、2、3套第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B)A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A)A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A)A.个体差异B.群体差异C.样本均数不同D.总体均数不同6.男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D)A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C.A和B均不是D.A和B均是8、两样本均数比较用t检验,其目的是检验(C)A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D)(A)n1+n2(B)n1+n2–1(C)n1+n2+1(D)n1+n2-210、标准误反映(A)A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)Atr >tbBtr<tbCtr=tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D)A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为(A)A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
(完整版)医学统计学试题及其答案
l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示 BA某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对3.抽签的方法属于 DA分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数 8 23 6 31该资料的类型是: DA计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 CA有价值的部分 B有意义的部分 C有代表性的部分D任意一部分 E典型部分7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:CA统计设计 B收集资料 C整理资料 D分析资料 E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对10.以下何者不是实验设计应遵循的原则 DA对照的原则 B随机原则 C重复原则D交叉的原则 E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数 B几何均数 C中位数 D全距 E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变 E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? CA 5B 5.5C 6D 10E 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是 BA观察个体之间变异越大 B观察个体之间变异越小C样本的抽样误差可能越大 D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是 BA从未患过病的人 B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是20.均数与标准差之间的关系是 EA标准差越大,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是 AA总体中个体之间存在变异 B抽样未遵循随机化原则C被抽取的个体不同质 D组成样本的个体较少 E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学分析计算题-答案 (1)
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L )男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
医学专业医学统计学试题(答案见标注)
医学专业医学统计学试题(答案见标注)姓名学号得分一.名词解释(请各举一例进行说明)(4分×4)1、概率2、抽样误差3、标准误4、可信区间二、单项选择题(2分×10)1.在对两个变量x与y进行直线相关分析后发现:相关系数r的值近似为0,经检验,得p>0.9。
下专业结论时,正确的表述应该是()A、x与y之间呈直线关系B、x与y之间呈曲线关系C、x与y之间没有直线关系D、x与y之间毫无关系2.为了直观地比较化疗后相同时间点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观察值的变异程度的大小可选用的变异指标是()A、标准差B、标准误C、变异系数D、算术平均数3.各观察值均加(或减)同一数后,()A、均数不变,标准差改变B、均数改变,标准差不变C、两者均改变D、两者均不变4.为了解两种治疗方法对原发性肝癌的疗效,随机把病人分成两组,一组用5-氟尿嘧啶+辅助治疗,另一组用安慰剂+辅助治疗。
治疗结果按缓解、死亡划分。
第一组12人,7人缓解、5人死亡;第二组11人,4人缓解、7人死亡,要分析两种疗法的治疗效果之间的差别有无显著性意义,应选用的统计方法是:()A x2检验B Fisher的精确概率C t 检验D 秩和检验5.正态分布曲线下,横轴上,从均数u到u+1.96σ的面积为:()A、47.5%B、95%C、45%D、97.5%6.两样本均数的t检验,按0.05的检验水准拒绝H0,若此时推断有误,其错误的概率为()(A)0.05 (B)>0.05 (C)<0.05 (D)不一定7.下列分布中,均数与方差相等的分布是()A、Poisson分布B、正态分布C、t分布D、二项分布8.计算麻疹疫苗接种后血清检查的阳转率,分母为()A、麻疹易感儿数B、麻疹患儿人数C、麻疹疫苗接种人数D、麻疹疫苗接种后的阳转人数9 .四个样本率作比较,2)3(05.02χχ>,可认为______。
医学统计学试题(卷)与答案解析
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图 C线图 D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为( A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同 D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D) n1+ n2 -210、标准误反映( A )A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医学统计学试题1-3含答案
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为( A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1(C)n1+ n2 +1(D)n1+ n2 -210、标准误反映( A )A 抽样误差的大小 B总体参数的波动大小C 重复实验准确度的高低D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验( D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》习题与答案
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D. 212211n n p n p n ++ E. 2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A.发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A.计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D.2χ检验E.F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D.F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
医学统计学计算与分析题题库
第一章医学统计中的基本概念二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
2.抽样中要求每一个样本应该具有哪三性?[参考答案]从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3. 什么是两个样本之间的可比性? [参考答案]可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
该地男性红细胞数总体均数的95%可信区间为:(4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。
该地女性红细胞数总体均数的95%可信区间为:(4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。
(4) 两成组大样本均数的比较,用u 检验。
1) 建立检验假设,确定检验水准H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别0.05α=2) 计算检验统计量22.829X X u ===3) 确定P 值,作出统计推断查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。
(5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。
1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准H 0:0μμ=,即该地男性红细胞数的均数等于标准值H 1:0μμ<,即该地男性红细胞数的均数低于标准值 单侧0.05α= ② 计算检验统计量0 4.66 4.845.8060.031X X t S μ--===- ③ 确定P 值,作出统计推断查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地男性红细胞数的均数低于标准值。
2) 男性血红蛋白含量与标准值的比较 ① 建立检验假设,确定检验水准H 0:0μμ=,即该地男性血红蛋白含量的均数等于标准值 H 1:0μμ<,即该地男性血红蛋白含量的均数低于标准值 单侧0.05α= ② 计算检验统计量0134.5140.215.2410.374X X t S μ--===- ③ 确定P 值,作出统计推断查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地男性血红蛋白含量的均数低于标准值。
3) 女性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准H 0:0μμ=,即该地女性红细胞数的均数等于标准值 H 1:0μμ<,即该地女性红细胞数的均数低于标准值 单侧0.05α= ② 计算检验统计量0 4.18 4.338.3330.018X X t S μ--===-③ 确定P 值,作出统计推断查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地女性红细胞数的均数低于标准值。
4) 女性血红蛋白含量与标准值的比较 ① 建立检验假设,确定检验水准H 0:0μμ=,即该地女性血红蛋白含量的均数等于标准值 H 1:0μμ<,即该地女性血红蛋白含量的均数低于标准值 单侧0.05α= ② 计算检验统计量0117.6124.711.1110.639X X t S μ--===- ③ 确定P 值,作出统计推断查t 界值表(ν=∞时)得P <0.0005,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地女性血红蛋白含量的均数低于标准值。
2.2 为了解某高寒地区小学生血红蛋白含量的平均水平,某人于1993年6月随机抽取了该地小学生708名,算得其血红蛋白均数为103.5g/L ,标准差为1.59g/L 。
试求该地小学生血红蛋白均数的95%可信区间。
2.2解:σ未知,n 足够大时,总体均数的区间估计可用(/2/2X X X u S X u S αα-+ , )。
该地小学生血红蛋白含量均数的95%可信区间为:(103.5 1.96103.5 1.96-+, ),即(103.38 , 103.62)g/L 。
2.3 一药厂为了解其生产的某药物(同一批次)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg ,标准差为2.22mg 。
试估计该批药剂有效成分的平均含量。
2.3解:该批药剂有效成分的平均含量的点值估计为103.0 mg 。
σ未知且n 很小时,总体均数的区间估计可用()/2,/2,X X X t S X t S αναν-+ , 估计。
查t 界值表得t 0.05/2,9=2.262,该批药剂有效成分的平均含量的95%可信区间为:(103.0 2.262103.0 2.262-+, ,即(101.41 , 104.59)mg 。
2.4 152例麻疹患儿病后血清抗体滴度倒数的分布如表5,试作总体几何均数的点值估计和95%区间估计。
表5 152例麻疹患儿病后血清抗体滴度倒数的分布滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计 人 数171031334224311522.4解:将原始数据取常用对数后记为X ,则152 1.85970.44250.0359X n X S S ====,,,,用(/2/2X X X u S X u S αα-+,)估计,则滴度倒数对数值的总体均数的95%可信区间为:(1.8597 1.960.0359 1.8597 1.960.0359-⨯+⨯ , ),即(1.7893 , 1.9301)。
所以滴度倒数的总体几何均数的点估计值为: 1.8597101072.39X ==,滴度倒数的总体几何均数的95%区间估计为( 1.7893 1.93011010, ),即(61.56 , 85.13)。
SPSS 操作 数据录入:打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量x 和f ;再点击Data View 标签,录入数据(见图2.4.1,图2.4.2)。
图2..4.1 Variable View窗口内定义要输入的变量x和f图2.4.2 Data View窗口内录入数据分析:Transform Compute…Target Variable:键入logxNumeric Expression:LG10(x) 将原始数据取对数值OKData Weight Cases…Weight cases by Frequency Variable:f 权重为fOKAnalyze Descriptive Statistics Explore… 探索性分析Dependent list:logx 分析变量logx Display:StatisticsS tatistics…:Descriptives 统计描述注:最后得到结果是原始数据对数值的均数及其95%可信区间。
2.5 某口腔医生欲比较“个别取模器龈下取模技术”与“传统硅橡胶取模方法”两种取模技术精度的差异,在12名病人口中分别用两种方法制取印模,在体视显微镜下测量标志点到龈沟底的距离,结果如表6,问两种取模方法结果有无差异?表6 12个病人口腔某测量标志点到龈沟底的距离/cm病例号个别取模器龈下取模技术传统硅橡胶取模方法1 0.626 0.6142 0.627 0.6263 0.670 0.6544 0.548 0.5495 0.590 0.5746 0.603 0.5877 0.605 0.6028 0.347 0.3389 0.768 0.75910 0.576 0.57211 0.330 0.31812 0.233 0.2192.5解:本题为配对设计的两样本均数的比较,采用配对t检验。
表2.5.1 12个病人口腔某测量标志点到龈沟底的距离/cm(1) 建立检验假设,确定检验水准H 0:0d μ=,即两种取模方法结果无差异 H 1:0d μ≠,即两种取模方法结果有差异0.05α=(2) 计算检验统计量两种取模方法结果的差值d 的计算见表2.5.1。
120.00930.00610.0018d d n d S S ====, ,, 00.00935.1670.0018d d t S -=== 112111n ν=-=-=(3) 确定P 值,作出统计推断查t 界值表得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为两种取模方法结果有差异,个别取模器龈下取模法标志点到龈沟底的距离略高于传统硅胶取模法。
病例号 个别取模器龈下取模1d传统硅橡胶取模法2d12d d d =-1 0.626 0.614 0.012 2 0.627 0.626 0.0013 0.670 0.654 0.016 4 0.548 0.549 -0.0015 0.590 0.574 0.016 6 0.603 0.587 0.016 7 0.605 0.602 0.0038 0.347 0.338 0.009 9 0.768 0.759 0.009 10 0.576 0.572 0.004 11 0.330 0.318 0.012 120.2330.2190.014SPSS操作数据录入:打开SPSS Data Editor窗口,点击Variable View标签,定义要输入的变量x1和x2;再点击Data View标签,录入数据(见图2.5.1,图2.5.2)。