医用统计学-总体均数的估计与假设检验练习题
医学统计学练习
1.假设检验在设计时应确定的是A.总体参数B.检验统计量C.检验水准D.P值E.以上均不是2.如果t≥t0.05/2,υ,,可以认为在检验水准α=0.05处。
A.两个总体均数不同B.两个总体均数相同C.两个样本均数不同D.两个样本均数相同E.样本均数与总体均数相同3.计量资料配对t检验的无效假设(双侧检验)可写为。
A.μd=0 B.μd≠0 C.μ1=μ2D.μ1≠μ2E.μ=μ04.两样本均数比较的t检验的适用条件是。
A.数值变量资料B.资料服从正态分布C.两总体方差相等D.以上ABC都不对E.以上ABC都对5.在比较两组资料的均数时,需要进行t/检验的情况是:A.两总体均数不等B.两总体均数相等C.两总体方差不等D.两总体方差相等E.以上都不是6.有两个独立的随机样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度为。
A.n1+n2 B.n1+n2-1 C.n1+n2+1D.n1+n2-2 E.n1+n2+27.已知某地正常人某定量指标的总体均值μ0=5,今随机测得该地特殊人群中的30人该指标的数值。
若用t检验推断该特殊人群该指标的总体均值μ与μ0之间是否有差别,则自由度为。
A.5 B.28 C.29D.4 E.308. 两大样本均数比较,推断μ1=μ2是否成立,可用。
A.t检验B.u检验C.方差分析D.ABC均可以E.χ2检验9.关于假设检验,下列说法中正确的是A.单侧检验优于双侧检验B.采用配对t检验还是成组t检验由实验设计方法决定C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小D.用Z检验进行两样本总体均数比较时,要求方差齐性E.由于配对t检验的效率高于成组t检验,因此最好都用配对t检验10.为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,则统计检验方法应用。
A.成组设计t检验B.成组设计u检验C.配对设计t检验D.配对设计u检验E.配对设计χ2检验11. 阅读文献时,当P=0.001,按α=0.05水准作出拒绝H0,接受H1的结论时,下列说法正确的是。
统计学教案习题04总体均数的估计和假设检验
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
公卫执业医师-综合笔试-卫生统计学-第三单元总体均数的估计和假设检验
公卫执业医师-综合笔试-卫生统计学-第三单元总体均数的估计和假设检验[单选题]1.两个样本均数比较作t检验,其他条件不变,犯第Ⅱ类错误的概率最小的是A.α=0.05B.α=0.(江南博哥)01C.α=0.1D.α=0.2E.该问题提法不对正确答案:D参考解析:一类错误α和二类错误β有一定的关系,α越大,β越小。
所以本题答案选择D。
掌握“Ⅰ型错误与Ⅱ型错误”知识点。
[单选题]5.下列关于均数的标准误的叙述,错误的是A.是样本均数的标准差B.反映样本均数抽样误差大小C.与总体标准差成正比,与根号n成反比D.增加样本含量可以减少标准误E.其值越大,用样本均数估计总体均数的可靠性越好正确答案:E参考解析:样本均数的标准差称为均数的标准误,是描述样本均数抽样误差大小的指标,其大小与总体标准差成正比,与根号n成反比。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越好。
故选项E叙述错误,本题选E。
掌握“标准误及可信区间★”知识点。
[单选题]6.关于可信区间,正确的说法是A.可信区间是总体中大多数个体值的估计范围B.95%可信区间比99%可信区间更好C.不管资料呈什么分布,总体均数的95%的可信区间计算公式是一致的D.可信区间也可用于回答假设检验的问题E.可信区间仅有双侧估计正确答案:D参考解析:按一定的概率估计总体参数的可能范围,该范围称为可信区间,可以用来估计总体均数的可能所在范围,常按95%可信度估计总体参数的可能范围。
掌握“标准误及可信区间★”知识点。
[单选题]7.同类定量资料下列指标,反映样本均数对总体均数代表性的是A.四分位数间距B.标准误C.变异系数D.百分位数E.中位数正确答案:B参考解析:样本均数的标准差即均数的标准误,简称标准误。
可用来描述样本均数的抽样误差,标准误越小,则说明样本均数的抽样误差越小,样本均数对总体均数的代表性越好。
掌握“标准误及可信区间★”知识点。
[单选题]8.比较两药疗效时,下列可作单侧检验的是A.己知A药与B药均有效B.不知A药好还是B药好C.己知A药与B药差不多好D.己知A药不会优于B药E.不知A药与B药是否有效正确答案:D参考解析:已知A药不会优于B药,只有低于B药的一种可能,所以可作单侧检验。
医用统计学-总体均数的估计与假设检验练习题
医用统计学-总体均数的估计与假设检验练习题一、名词解释1.抽样误差2.标准误3.置信区间4.第一类错误5.第二类错误二、是非题1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。
()2.同一批计量资料的标准差不会比标准误大。
()3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01<P<0.05,就表明前者两样本均数差别大,后者两样本均数差别小。
()4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。
()5.t检验可用于同一批对象的身高与体重均数差别的统计检验。
()三、最佳选择题1、()小,表示用该样本均数估计总体均数的可靠性大。
D、RE、四分位间距A、CVB、SC、x2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。
A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同E、越有理由认为两总体均数不同3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,X2和S22,则理论上()。
A、X1=X 2B、S12= S22C、作两样本均数的t检验,必然得出无差别的结论D、作两方差齐性的F检验,必然方差齐E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,∣X-μ∣≥()的概率为5%。
A、1.96σB、1.96C、2.58D、t0.05,v SE、t0.05,vsx5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围()。
A、74±4×4B、74±1.96×4C、74±2.58×4D、74±2.58×4÷10E、74±1.96×4÷106、关于以0为中心的t 分布,错误的是( )。
统计学习题及答案(完整)
第一部分 计量资料的统计描述、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。
A 、全距B 、标准差C 、变异系数D 、四分位数间距E 、方差2.用均数和标准差可以全面描述( )资料的特征。
A .正偏态分布B .负偏态分布C .正态分布D .对称分布E .对数正态分布3.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变9.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A .均数B .标准差C .中位数D .四分位数间距E .几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A .算术平均数B .中位数C .几何均数D .变异系数E .标准差二、简答题1、对于一组近似正态分布的资料,除样本含量 n 外,还可计算 ,S 和 ,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的 联系和区别。
3、说明频数分布表的用途。
4、变异系数的用途是什么?5、试述正态分布的面积分布规律。
三、计算分析题1、根据 1999 年某地某单位的体检资料, 116 名正常 成年女子的血清甘油三酯( mmol/L )测量结果如右表, 请据此资料: (1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
( 3)求该地正常成年女子血清甘油三酯的 95%参考值范围。
( 4)试估计该地正常成年女子血清甘油三酯在 0.8mmol/L 以下者及 1.5mmol/L 以下者各占正常女子总人数的百分比。
2、某些微丝蚴血症者 42 例治疗后 7 年用间接荧火抗体试验得抗体滴度如下。
求平均抗体滴度。
C .两者均不变D .两者均改变4.比较身高和体重两组数据变异度大小宜采用(A .变异系数B 5.偏态分布宜用( A .算术均数 B.方差 C .极差 D )描述其分布的集中趋势。
.标准差 C .中位数0 的常数后,(B .标准差C .几何均数 )分布的资料,均数等于中位数。
医学统计学最佳选择题
医学统计学最佳选择题一、绪论1.下面的变量中,属于分类变量的是A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于数值变量的是A.性别B.体重C.血型D.职业E.民族3.下列有关个人基本信息的指标,其中属于有序分类变量的是A.学历B.民族C.职业D.血型E.身高4.若要通过样本作统计推断,样本应是A.总体中典型的一部分B.总体中任意部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分5. 统计量是指A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的量E.是由样本数据计算出来的统计指标6.下列关于概率的说法,错误的是A.通常用P表示B.大小在0~1之间C.某事件发生的频率即概率D.在实际工作中,概率是难以获得的E.某事件发生的概率P≤时,称为小概率事件。
7.减少抽样误差的有效途径是A.避免系统误差B.控制随机测量误差C.增大样本含量D.减少样本含量E.以上都不对二、定量资料的统计描述1.用均数和标准差能用于全面描述下列哪种资料的特征A.正偏态分布B.负偏态分布C.正态分布D.对数正态分布E.任意分布2.当各观察值呈倍数变化(等比关系)时,平均数宜用A.均数B.几何均数C.中位数D.相对数E.四分位数间距3.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. MB. GC. XD. P95E. CV4. 对于正态分布的资料,理论上A. 均数比中位数大B. 均数比中位数小C. 均数等于中位数D. 均数与中位数无法确定孰大孰小E. 以上说法均不准确5.当资料两端含有不确定值时,描述其变异度宜采用A. RB. CVC. S2D. SE. Q6.关于标准差,哪项是错误的A.反映全部观察值的离散程度B.度量了一组数据偏离均数的大小C.反映了均数代表性的好坏D.一定大于或等于零E.不会小于算术均数7.各观察值均加(或减)同一非0常数后A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对8.比较身高和体重两组数据变异度大小宜采用A.方差B.标准差C.极差D.变异系数E.四分位数间距9. 横轴上,正态曲线下从σμ6-到μ的面积为.91三、定性资料的统计描述1.某病患者200人,其中男性180人,女性20人,分别占90%与10%,则结论为A 男性易患该病B 女性易患该病C 男、女性患该病概率相等D根据该资料可以计算出男、女性的患病率E 尚不能得出结论2.一种新的治疗方法不能治愈病人,但能使病人寿命延长,则会发生的情况是A该病患病率增加B该病患病率减少C该病发病率增加D该病发病率减少E该病患病率和发病率均不变。
统计学习题及答案(完整)-2
第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好.A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征.A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用( )。
A.变异系数B.方差C.极差D.标准差E.四分位数间距5.偏态分布宜用( )描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变.A.算术均数B.标准差C.几何均数D.中位数E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么? 组段频数5、试述正态分布的面积分布规律. 0。
6~ 10.7~ 3三、计算分析题0.8~91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19请据此资料:1。
医学统计学总体均数的估计与假设检验
一、 均数的抽样误差与标准误( )
例4.1某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm,资料,求标准误?
第三章 总体均数的估计与假设检验
添加副标题
汇报人姓名
均数的抽样误差与标准误
t分布
总体均数的估计
假设检验的一般步骤
t检验
u 检验
两均数的等效检验
正态性检验
两样本方差齐性检验
假设检验时应注意的问题
利用总体均数的可信区间进行假设检验
课堂讨论
第三章 总体均数的估计与假设检验
一、 均数的抽样误差与标准误( )
等效检验的假设
七、两均数的等效检验
H0: | 1- 2| H1: | 1- 2|< 为等效界值,若两总体均数差值在范围内为等效,超过则为不等效。 是推断两种处理效果是否相近或相等的统计方法。 为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?
检验水准、自由度及结果判断同t检验。
=n- 1=25 -1=24 查t界值表(P804),得单侧 t0.05,24 = 1.711 因: t =1.833> t0.05,24 所以:P < 0.05
结论:按照 = 0.05水准,拒绝H0 ,故可认为该山区健康成年男子脉搏高于一般人群。
1
上例如用双侧检验,查表得双侧 t0.05,24 = 2.064
样本含量一定时,增大,则减少,减少则增大,所以, 的确定并不是越小越好,一般取0.05较合理。
结论时,尽可能明确相结合。
02
医学统计学第5章 假设检验思考与练习参考答案
第5章 假设检验思考与练习参考答案一、最佳选择题1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。
A.0.01α=B. 0.05α=C. 0.10α=D. 0.20α=E. 0.30α=2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t =3.24,t 0.05,v =2.086, t 0.01,v =2.845。
正确的结论是( E )。
A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是( A )。
A. 建立假设,选择和计算统计量,确定P 值和判断结果B. 建立无效假设,建立备择假设,确定检验水准C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误D. 计算统计量,确定P 值,作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。
A. 统计量t 越大,说明两总体均数差别越大B. 统计量t 越大,说明两总体均数差别越小C. 统计量t 越大,越有理由认为两总体均数不相等D. P 值就是αE. P 值不是α,且总是比α小5. 下列( E )不是检验功效的影响因素的是:A. 总体标准差σB. 容许误差δC. 样本含量nD. Ⅰ类错误αE. Ⅱ类错误β二、思考题1.试述假设检验中α与P 的联系与区别。
答:α值是决策者事先确定的一个小的概率值。
P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。
P ≤α时,拒绝0H 假设。
2. 试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
总体均数的估计与假设检验(练习题)
练 习 题一、最佳选择题1.( C )小,表示用该样本均数估计总体均数的可靠性大。
A. CV B. S C. σXD. RE.四分位数间距2.两样本均数比较的t 检验,差别有统计意义时,P 越小,说明( C )。
A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同3.甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( E )。
A.12X X =B.2212S S =C.作两样本均数的t 检验,必然得出无差别的结论D.作两方差齐性的F 检验,必然方差齐E.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 4.在参数未知的正态总体中随机抽样,X μ-≥( A )的概率为5%。
A. 1.96σ B. 1.96 C. 2.58 D.0.05, t S ν E.0.05, X t S ν 5.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的平均数为74g/L ,标准差为4g/L ,则其95%的参考值范围(B )。
A.74±4⨯4B.74±1.96×4C.74±2.58⨯4D.74±2.58⨯4÷10E. 74±1.96⨯4÷10 6.关于以0为中心的t 分布,错误的是( E )。
A. t 分布是一簇曲线B. t 分布是单峰分布C.当ν→∝时,t →uD. t 分布以0为中心,左右对称E.相同ν时,|t|越大,P 越大7.在两样本均数比较的t 检验中,无效假设是( D )。
A.两样本均数不等 B.两样本均数相等 C.两总体均数不等D.两总体均数相等E.样本均数等于总体均数8.两样本均数比较时,分别取以下检验水准,以( E )所取第二类错误最小。
总体均数的估计和假设检验
(一) 单项选择题1. 标准误的英文缩写为:A .SB .SEC .X SD .SD2. 通常可采用以下那种方法来减小抽样误差:A .减小样本标准差B .减小样本含量C .扩大样本含量D .以上都不对 3. 配对设计的目的:A .提高测量精度B .操作方便C .为了可以使用t 检验D .提高组间可比性 4. 以下关于参数估计的说法不正确的是:A . 区间估计优于点估计B . 样本含量越大,参数估计准确的可能性越大C . 样本含量越大,参数估计越精确D .对于一个参数只能有一个估计值5. 关于假设检验,下列那一项说法是正确的A .单侧检验优于双侧检验B .采用配对t 检验还是成组t 检验是由实验设计方法决定的C .检验结果若P 值大于0.05,则接受H 0犯错误的可能性很小D .用u 检验进行两样本总体均数比较时,要求方差齐性6. 两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小A .α=0.05B .α=0.01C .α=0.10D .α=0.20 7. 统计推断的内容是A .用样本指标推断总体指标B .检验统计上的“假设”C .A 、B 均不是D .A 、B 均是8.当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较 A .t 检验 B .t ’ 检验 C .u 检验(假设是大样本时) D .F 检验9.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X ,21S ,2X ,22S ,则理论上A .1X =2X ,21S =22SB .作两样本t 检验,必然得出无差别的结论C .作两方差齐性的F 检验,必然方差齐D .分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠(二) 名词解释1. 统计推断 2. 抽样误差3. 标准误及X σ 4. 可信区间 5. 参数估计6. 假设检验中P 的含义7.I型和II型错误8.检验效能9.检验水准(三)是非题1.若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。
医药数理统计第六章习题(检验假设和t检验)
第四章抽样误差与假设检验练习题一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布4. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。
[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
101.4X=, 1.5S=,450n=,0.07S===95%可信区间为下限:/2.101.4 1.960.07101.26 XX u Sα=-⨯=-(g/L)上限:/2.101.4 1.960.07101.54 XX u Sα+=+⨯=(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
医学统计学练习题及答案
一、单向选择题1。
医学统计学研究的对象是 E。
有变异的医学事件2。
用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是 D.病情程度4。
随机误差指的是 E。
由偶然因素引起的误差5. 收集资料不可避免的误差是 A。
随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A。
中位数2。
算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4。
将一组计量资料整理成频数表的主要目的是E。
提供数据和描述数据的分布特征1. 变异系数主要用于 A.比较不同计量指标的变异程度2。
对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3。
某项指标95%医学参考值范围表示的是D。
在“正常”总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E.四分位数间距1。
样本均数的标准误越小说明 E。
由样本均数估计总体均数的可靠性越大2。
抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C。
正态分布4。
假设检验的目的是 D.检验总体参数是否不同5。
根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9。
1×109/L,其含义是 E。
该区间包含总体均数的可能性为95%1。
两样本均数比较,检验结果说明 D。
不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指E。
有理由认为两总体均数有差别3。
两样本均数比较,差别具有统计学意义时,P值越小说明 D。
越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E。
第6章思考与练习-总体均数的估计(卫生统计学)
第六章 总体均数的估计【思考与练习】一、思考题1.什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些? 2.样本均数的抽样分布有何特点? 3.阐述标准差与标准误的区别与联系。
4.如何运用抽样分布规律估计总体均数?5.阐述总体均数的置信区间与医学参考值范围的区别。
二、案例辨析题2005年随机抽取某市400名7岁男孩作为研究对象, 计算得其平均身高为122.5 cm, 标准差为5.0 cm 。
请估计该市7岁男孩身高的总体均数。
某学生的回答如下:“该市2005年7岁男孩平均身高的点估计值为122.5 cm ,按公式),(2/2/S Z X S Z X αα+-计算得到其总体均数的95%置信区间为(112.7, 132.3) cm ”。
请指出学生回答中的不恰当之处。
三、最佳选择题1.表示均数抽样误差大小的统计指标是 A .R B .S C .X SD .CVE .四分位数间距2.关于t 分布,下列叙述错误的是A .t 分布是以0为中心,左右对称的一簇单峰曲线B .自由度越小,曲线越低平C .当自由度为∞时,t 分布就是标准正态分布D .自由度相同时,||t 越大,概率P 值越小E .自由度越大,相同概率的t 界值越大3.从同一总体中随机抽取多个样本,分别估计总体均数的95%置信区间,则精确度高的是 A .均数大的样本 B .均数小的样本 C .标准差小的样本 D .标准误大的样本 E .标准误小的样本4.关于置信区间,下列叙述中错误的是 A .99%置信区间优于95%置信区间 B .置信区间的精确度反映在区间的长度C .当样本含量确定时,准确度与精确度是矛盾的D .置信区间的准确度反映在置信度(1)α-的大小上E .当置信度(1)α-确定时,增加样本含量可提高精确度 5.总体均数的95%置信区间的含义是 A .总体95%的个体值在该区间内 B .样本95%的个体值在该区间内C .平均每100个总体均数,有95个在该区间内D .平均每100个样本(样本含量相同)均数,有95个在该区间内E .平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数 6.假设某地35岁以上正常成年男性的收缩压的总体均数120.2mmHg ,标准差为11.2 mmHg ,后者反映的是 A .个体变异的大小 B .抽样误差的大小 C .系统误差的大小 D .总体的平均水平 E .样本的平均水平7.上述第6题中,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8 mmHg ,又从该地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5mmHg ,标准差为10.4 mmHg ,则下列说法正确的是 A .112.8mmHg 与120.2mmHg 不同是由于系统误差B .112.8mmHg 与120.2mmHg 不同是由于两总体均数不同C .90.5mmHg 与112.8mmHg 不同是由于抽样误差D .90.5mmHg 与120.2mmHg 不同是由于抽样误差E .90.5mmHg 与112.8mmHg 不同是因为两总体均数不同8.上述第7题中,7岁正常男孩收缩压的总体均数的95%置信区间为 A .90.5 1.9610.4±⨯B .0.05/2,990.5t ±⨯C .120.2 1.9610.4±⨯D .0.05/2,9120.210.4t ±⨯E .0.05/2,9120.2t ±⨯四、综合分析题1.从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h)的均数为9.15,标准差为 2.13。
医学统计学--第三章 总体均数的估计与假设检验
32
本例 n=10,按公式(3-2)算得样本均数的标准误为
S1=101=9,双尾 =0.05,
查附表 2 的 t 界值表得 t0.05 2,9 2.262 。 按公式(3-5) (166.95 2.262 1.1511) 即(164.35, 169.55)cm 故该地 18 岁男生身高均数的 95%可信区间 为(164.35, 169.55)cm。
X
2 X
、
) ,则 通
过同样方式的 u 变换( X
2
)也 可 将 其 转 换 为
标 准 正 态 分 布 N (0 , 1 ), 即 u 分 布 。
17
3.实际工作中,由于 X 未知,用S X 代替,
则(X
) / SX
不再服从标准正态分布,而
服从t 分布。
t X SX X S n , n 1
2
第一节 均数的抽样误差与标准误
3
统计推断:由样本信息推断总体特征。
样本统计指标 (统计量)
总体统计指标 (参数)
2
正态(分布)总体:N 说明!
~ ( , )
推断 !
为说明抽样误差规律,先用一个实例,后 引出理论。
4
例 3-1 若某市 1999 年 18 岁男生身高服从均 数μ =167.7cm、标准差 =5.3cm 的正态分布。对 该总体进行随机抽样,每次抽 10 人, n =10) ( , 共抽得 100 个样本( g =100) ,计算得每个样本均 数 X 及标准差 S 如图 3-1 和表 3-1 所示。
1 2 3 4 5 6 7 8 9 10 21 22 23 24 25
单侧 双侧
4 总体均数的估计和假设检验
1.58
1.62 1.38 1.56 … 1.40 1.52
3 4
5 … 99 100 均数
标准差 0.515
n=10
8 8 7 样本均数 样本均数 7
n=30
6
6
5
5
4
抽样次数
4
抽样次数
n=50
8 8 7 样本均数 样本均数 7
n=100
6
6
5
5
4
抽样次数
4
抽样次数
不同抽样例数100次抽样中样本均数和总体均数之间的关系
0.050 0.100
6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 … 1.645
0.010 0.020
31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 … 2.326
样本统计量和总体参数间的关系
• 样本统计量总是围绕着总体参数上下波动,不会离开总体 参数太远 – 样本统计量是个变量 – 总体参数和样本统计量之间总是存在一定差异 • 当样本量n时,样本统计量无限的逼近于总体参数
抽样误差(sampling error)
• 由于个体变异引起的,在抽样过程中发生的,总体参数与 样本统计量之间的差异 – 产生原因:个体变异 – 产生条件:抽样研究 – 表现形式:总体参数与样本统计量之间的差异 – 度量指标:标准误
1 2 3 4 5 6 7 8 9 10 … ∞
单侧 双侧
0.250 0.500
1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 … 0.674
总体均数的估计与假设检验(练习题)
练 习 题一、最佳选择题1.( C )小,表示用该样本均数估计总体均数的可靠性大。
A. CV B. S C. σXD. RE.四分位数间距2.两样本均数比较的t 检验,差别有统计意义时,P 越小,说明( C )。
A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同3.甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( E )。
A.12X X =B.2212S S =C.作两样本均数的t 检验,必然得出无差别的结论D.作两方差齐性的F 检验,必然方差齐E.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 4.在参数未知的正态总体中随机抽样,X μ-≥( A )的概率为5%。
A. 1.96σ B. 1.96 C. 2.58 D.0.05, t S ν E.0.05, X t S ν 5.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的平均数为74g/L ,标准差为4g/L ,则其95%的参考值范围(B )。
A.74±4⨯4B.74±1.96×4C.74±2.58⨯4D.74±2.58⨯4÷10E. 74±1.96⨯4÷10 6.关于以0为中心的t 分布,错误的是( E )。
A. t 分布是一簇曲线B. t 分布是单峰分布C.当ν→∝时,t →uD. t 分布以0为中心,左右对称E.相同ν时,|t|越大,P 越大7.在两样本均数比较的t 检验中,无效假设是( D )。
A.两样本均数不等 B.两样本均数相等 C.两总体均数不等D.两总体均数相等E.样本均数等于总体均数8.两样本均数比较时,分别取以下检验水准,以( E )所取第二类错误最小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医用统计学-总体均数的估计与假设检验练习题二、是非题1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。
()3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01<P<0.05,就表明前者两样本均数差别大,后者两样本均数差别小。
()4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。
()三、最佳选择题2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。
A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同E、越有理由认为两总体均数不同3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,X2和S22,则理论上()。
A、X1=X 2B、S12= S22C、作两样本均数的t检验,必然得出无差别的结论D、作两方差齐性的F检验,必然方差齐E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,∣X-μ∣≥()的概率为5%。
A、1.96σB、1.96C、2.58D、t0.05,v SE、t0.05,vsx5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围()。
A、74±4×4B、74±1.96×4C、74±2.58×4D、74±2.58×4÷10E、74±1.96×4÷106、关于以0为中心的t分布,错误的是()。
A、t分布是一簇曲线B、t分布是单峰分布C、当ν∝时,t uD、t分布以0为中心,左右对称E、相同ν时,∣t∣越大,P越大7、在两样本均数比较的t检验中,无效假设是()A、两样本均数不等B、两样本均数相等C、两总体均数不等D、两总体均数相等E、两样本均数等于总体均数8、两样本均数比较时,分别取以下检验水准,以()所取第二类错误最小。
A、α= 0.01B、α= 0.05C、α= 0.10D、α= 0.20E、α= 0.309、正态性检验,按α= 0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率()。
A、大于0.10B、小于0.10C、等于0.10D、等于β,而β未知E、等于1-β,而β未知10、关于假设检验,下面哪一项说法是正确的()。
A、单侧检验优于双侧检验B、若P>α,则接受H0犯错误的可能性很小C、采用配对t检验还是两样本是由试验设计方案所决定的D 、检验水准α只能取0.05E 、用两样本u 检验时,要求两总体方差齐性 11、第1类错误的概念是( )A.是对的,统计检验结果未拒绝H 0 B. H 0是对的,统计检验结果拒绝H 0 C. H 0是不对的,统计检验结果未拒绝H 0 D .是不对的, 统计检验结果拒绝H 0 E. 以上都不对12、进行两样本均数差别的u 检验时,不要求( )A.两样本含量要足够大B.两样本必须来自正态分布总体C.两样本所属总体的方差必须相等D.两组数据均数相近E.两组数据单位相同13、在研究两种药物治疗高血压效果的配对t 检验中,要求( )A.两组样本的方差相等B.数据呈双变量正态分布C.差数d 服从正态分布D.差数d 的方差为0E.n 比较小14、由两样本均数的判别来推断两总体均数的差别,所谓差别有显著性是指:A.两样本均数差别有显著性B.两总体均数差别有显著性C.两样本均数和总体均数的差别都有显著性D.其中有一个样本均数和总体均数的差别有显著性E.两样本均数和一个总体均数的差别有显著性 15、统计推断的内容是( )A.计算样本率B.检验统计上的“假设”C.计算样本均值D.计算标准化率E.估计参考值范围 16、在同一总体随机抽样,其他条件不变,样本含量越大,则______。
A.样本标准差s 越大 B.样本标准差s 越小C.总体均数的95%可信区间越窄D.总体均数的95%可信区间越宽E. 样本标准差s 越小,总体均数的95%可信区间越窄17、在同一总体随机抽样,样本含量n 固定时,α越小,总体均数可信区间x x u ασ±_______。
A.越宽 B.越窄 C.宽窄不变D.宽窄还与β有关E.以上说法都不对18、在随机抽样中,其他条件不变时,“增大样本含量能平均起来使_______”是错误的。
A .u α变小 B.x s 变小 C.可信区间变窄 D.x σ变小E.都是错误的19、在同一总体随机抽样,样本含量n 固定时,α越小,用区间x x u ασ±估计总体均属μ,估计_____ A 、错的概率越大 B 、错的概率越小 C 、错的概率不变 D 、其精度越差 E 、以上说法都不对20、在参数未知的正态总体中随机抽样,X μ-≥______的概率为5%。
A.1.96σB.1.96C.2.58D.t0.05SE.0.05Xt S四、简答题1、试举例说明均数的标准差与标准误的区别与联系。
2、标准正态分布(u分布)与t分布有何不同?3、均数的可信区间与参考值范围有何不同?4、假设检验时,一般当P<0。
05时,则拒绝H0,理论根据是什么?5、假设检验中α和P的区别何在?6、怎样正确选用单侧检验和双侧检验?7、t检验的应用条件是什么?8、Ⅰ型错误与Ⅱ型错误有何区别与联系?了解这两类错误有何实际意义?9、假设检验和区间估计有何联系?10、为什么假设检验的结论不能绝对化?五、计算分析题1、某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表:请就下表资料:(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?(2)计算男性两项指标的抽样误差。
(3)试估计该地健康成年女性红细胞数的均数。
(4)该地健康成年男、女血红蛋白是否不同?(5)该地男性两项血液指标是否均低于上表的标准值(若测定方法相同)?某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值红细胞(1012/L)男360 4.66 0.58 4.84 女255 4.18 0.29 4.33血红蛋白(g/L)男360 134.5 7.1 140.2 女255 117.6 10.2 124.7*《实用内科学》(1976年)所载均数(转为法定单位)2、一药厂为了了解其生产的某药物(同一批次)之有效成份含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg,标准差为2.22mg。
试估计该批药剂有效成份的平均含量。
3、通过以往大量资料得知某地20岁男子平均身高为1.68米,今随机测量当地16名20岁男子,得其平均身高为1.72米,标准差为0.14米。
问当地现在20岁男子是否比以往高?4、为了解某一新降血压药物的效果,将28名高血压病患者随机分为试验组和对照组,试验组采用新降压药,对照组则用标准药物治疗,测得治疗前后的舒张压(mmHg)如下表。
问:(1)新药是否有效?(2)要比较新药和标准药的疗效是否不同,请用下述两种不同方式进行检验:Ⅰ仅考虑治疗后的舒张压;Ⅱ考虑治疗前后舒张压之差。
您认为两种方法各有何优缺点?何种方法更好?两种药物治疗前后的舒张压(mmHg)新药病人号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 治疗前102 100 92 98 118 100 102 116 109 116 92 108 102 100 治疗后90 90 85 90 114 95 86 84 98 103 88 100 88 86标病人号 1 2 3 4 5 6 7 8 9 10 11 12 13 14准药治疗前98 103 110 110 110 94 104 92 108 110 112 92 104 90 治疗后100 94 100 105 110 96 94 100 104 109 100 95 100 855、将钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价是否不同?钩端螺旋体患者血清作凝溶试验测得的稀释倍数标准株(11人)100 200 400 400 400 400 800 1600 1600 1600 3200 水生株(9人)100 100 100 200 200 200 200 400 4006、某医师观察某新药治疗肺炎的疗效,将肺炎病人随机分为新药组和旧药组,得两组的退热天数如下表。
(1)计算两药平均退热天数之差的95%CI。
(2)对两药平均退热天数是否不同进行假设检验。
(3)上述两种方法有何联系?新旧两药的退热天数分组例数平均退热天数退热天数的标准差新药35 3.8 0.8旧药37 5.2 0.97、为比较治疗组和对照组的肺表面活性物质PaO2在治疗新生儿呼吸窘迫综合征患儿过程中的作用是否不同,某医生在治疗30名患儿后48小时得到如下表资料,问治疗后48小时,两组的PaO2是否不同?两组患儿PaO2(kPa)比较分组例数均数标准差治疗组15 12.55 0.33对照组15 9.72 2.038、随机抽查上海地区男孩出生体重,得到如下数据:出生体重2.0~2.2~2.4~2.6~2.8~3.0~3.2~3.4~3.6~3.8~4.0~4.2~4.4~4.6请分析计算:(1)理论上99%男孩的出生体重在什么范围?(2)估计全市男孩出生体重均数在什么范围?(3)某男孩出生体重均数为4.51kg,怎么评价?(4)郊区随机抽查男孩100人,得出出生体重均数为3.23 kg,标准差为0.47 kg,问市区和郊区男孩出生体重均数是否相同?(5)以前上海市区男孩出生体重均数为3.0 kg,问现在男孩出生体重均数是否更大了?练习题答案二、最佳选择题1、C2、C3、E4、E5、B6、E7、D8、E9、D 10、C11、B 12.、E 13、D 14、B 15、B 16、C 17、A 18、A 19、A 20、E四、计算分析题解答1、解:(1)女性两项指标的CV:CV RBC = 6.94%CV Hb = 8.67%(2) 男性两项指标的抽样误差:红细胞数:s=0.031 (1012/L)x血红蛋白:s=0.374 (g/L)x(3) (4.14,4.22) (1012/L)(4) u =22.83(5) 红细胞数u = - 5.888血红蛋白u = - 15.2322、解:s= 0.702x104.41~104.59 (mg)3、解:t = 1.1434、解:(1)t = 5.941(2)要比较新药和标准药的疗效是否不同,若仅考虑治疗后的舒张压是否不同,不考虑治疗前两组舒张压的基线水平是否不同,这明显不妥当。