考试题医学统计学第三版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考试题医学统计学第三版
1,统计设计的基本原则有哪些?
(1)对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
(2)随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。
(3)均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
(4)重复(样本含量):样本一般要求≧30例。
2. 怎样的数据资料属分类资料?
数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫分类资料,又称分类变量或定性资料。
其观察值是定性的,表现为互不相容的类别或属性。
有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?
总体:是指根据研究目的确定的同质观察单位的全体,是同质的所有观察单位某中观察值(变量值)的集合。
样本:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。
医学研究中的样本应按随机化原则获取,即总体中每一个观察单位都有同等的机会被选入到样本中来,以避免误差和偏倚对研究结果有所影响。
4. 统计描述的基本方法有哪些,各自有何特点?
(1)频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即频数图。
特点:①.较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便于计算。
(2)描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何均数,中位数。
描述离散
趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数峰度系数。
(3)百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。
例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征
如有三组同龄男孩体重如下,其平均体重是30千克,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等
6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?
描述计量资料集中趋势的指标有:算术平均数、几何平均数、中位数。
(1)算术均数描述一组同质计量资料的平均水平,适用于对称分布,特别是正态分布近似正态分布的数值变量数据。
(2)几何均数,适用于呈正偏态分布,但数据经对数变换后成正态分布的资料。
(3)中位数是将一组观察值按大小顺序排列后位次居中的观察值,适用于各种分布的资料。
7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?
描述计量资料离散程度的指标有:极差、四分位间距、方差、标准差、变异系数。
(1)极差是全部观察值中最大值与最小值之差,一般用于描述偏态小样本数据的变异程度。
(2)四分位数间距是去除两端各四分之一数据后中间一半观察值的变动范围,适用于偏态分布特别是末端没有具体数据的资料。
(3)方差、标准差适用于正态分布、近似正态分布对称分布的数据资料。
(4)变异系数是标准差与均数之比,常用于比较度量单位不同或均数相差悬殊的两组资料的变异度。
8. 怎样正确描述一组计量资料?
首先,制作频数表和频数图,以考察数据分布的形状和对称性等,再根据数据分布的类型选择合适的指标,以反映数据分布的平均水平。
正态分布资料选用均数与标准差。
如儿童身高,可计算均数。
均数即观察值的总和除以n,它反映正态分布资料的平均水平。
对数正态分布资料选用几何均数。
如血清抗体滴度,可计算几何均数。
几何均数即观察值的乘积开n次方,它反映对数正态分布的平均水平。
偏态分布资料选用中位数与四分位数间距。
如潜伏期天数,可计算中位数。
将观察值从小到大排队,位于正中位置的观察值称为中位数,它反映偏态分布的平均水平。
9. 举例说明抽样误差指什么?
由抽样引起的,样本指标与总体指数之间的差别称为抽样误差。
例如从广州市随机抽取60名5岁男孩,测量其身高,这60名男孩的平均身高通常不会恰好等于全广州市5岁男孩的平均身高,两者的差别称为抽样误差。
10. 简述假设检验的基本步骤。
答:0.05时拒绝H0,接受H1,反之不拒绝H0,当接受H1时,必须说明其实际意义。
(1)建立假设检验,确定检验水准(2)选定检验方法,计算检验统计量(3)确定P值,作出统计推断结论。
或者:(1).建立无效假设,其意义为在“无效假设”下,将误差视为随机误差,服从某种分布(2).根据变量的分布选择和计算统计量,如两组5岁男孩
平均身高的比较可作t检验(3).确定P值并作出推论
11. 假设检验中的第一类错误(a)和第二类错误(b)各指什么?
第一类错误(α):假设检验时,根据样本统计量作出的推断结论(拒绝Ho或不拒绝Ho)并不是百分之百的正确,拒绝了实际上成立的Ho,这类“弃真”的错误称为第一类错误。
第二类错误(β):假设检验时,根据样本统计量作出的推断结论(拒绝Ho或不拒绝Ho)并不是百分之百的正确,不拒绝实际上不成立的Ho,这类“存伪”的错误为第二类错误。
客观实际拒绝Ho 不拒绝Ho
Ho成立I型错误(α)推断正确(1-α)
Ho不成立推断正确(1-β)II型错误(β)
或:答Ⅰ型错误又称第一类错误(type Ⅰerror):拒绝了实际上成立的,为“弃真”的错误,其概率通常用α表示。
可取单尾也可取双尾,假设检验时研究者可以根据需要确定α值大小,一般规定α=0.05或α=0.01,其意义为:假设检验中如果拒绝时,发生Ⅰ型错误的概率为5%或1%,即100次拒绝的结论中,平均有5次或1次是错误的。
Ⅱ型错误又称第二类错误(type Ⅱerror):不拒绝实际上不成立的,为“存伪”的错误,其概率通常用β表示。
只取单尾,假设检验时β值一般不知道,在一定情况下可以测算出,如已知两总体的差值、样本含量和检验水准。
12. 假设检验的功效指什么,影响功效的因素及其作用有哪些?
假设检验的功效是指假设检验中真实差异不被错判为无差别的概率,即某项假设检验发现真实差异的能力大小。
其公式为:Power=1-?
影响因素:①客观差异越大,功效越大。
②个体标准差越小,功效越大。
③样本量越大,功
效越大。
④检验标准ɑ值越大,功效越大。
13. 举例说明多个样本均数比较方差分析的统计逻辑是什么?
以染尘后三个时期的大鼠全肺湿重数据为例,比较三个时期的大鼠全肺湿重有无差别。
(1)作假设检验Ho:三个不同时期全肺湿重
的总体均数相等,即u1=u2=u3;H1:三个总体均数不等或不全相等。
a=0.05
(2)计算统计量F ①总变异分解及自由度分解:
总变异=组间变异+组内变异;总自由度=组间自由度+组内自由度
②计算方差:组间方差=组间变异/组间自由度(处理作用+随机误差)
组内方差=组内变异/组内自由度(随机误差)③F=组间方差/组内方差
(3)确定P值和作出统计结论:若无处理作用则F=1,F﹥1表明有处理作用,当F值大过“F界值”时便拒绝Ho,认为三个时期的全肺湿重不同。
14. 方差分析中,组内误差MSW是来源于那些方面的误差?
来源于个体变异引起的抽样误差
15. 简述配对秩和检验的编秩方法。
(1)依据差值的绝对值从小到大排队编秩;
(2)根据差值的正负号给秩次冠以正负号;
(3)差值为0者舍去不计;
(4)遇有差值绝对值相等,但有正负号不同时,则取平均秩次。
16. 简述两组比较秩和检验的编秩方法。
(1)将两组数据混合从小到大排队统一编秩;
(2)遇有数值相等,且不在同一组时,要取平均秩次;
(3)同一组的相同数据可不必取平均秩次。
17. 为了解孕妇与新生儿的促甲状腺素水平(TSH),随机抽样测定了10名孕妇及其新生儿的血样。
结果如下表所示,请您对此资料作系统的全面的统计分析。
(提示:不必计算,公式可省略。
但要求(1)写出统计分析的方法与步骤,指标及其意义。
(2)假定结果有统计学意义,简要论述其医学上的应用价值)
母亲血样(TSH) 1.21 1.30 1.39 1.42 1.47 1.66 1.68 1.72 1.98 2.10
新生儿血(TSH) 3.90 4.50 4.20 4.83 4.16 4.93. 4.32 4.99 4.70 5.20
1.统计分析的方法与步骤:
(1)根据资料(两变量均为服从正态分布的数值变量)可以进行直线相关及回归分析;(2)作散点图;
(3)计算r;
(4)母亲为X,新生儿为Y;计算b,a,(得到回归方程(Y=a+bX);
(5)t检验:建立假设,计算tr或tb值,确定P值及下结论。
(6)实际推论:两变量是否存在直线相关及回归关系。
2.意义
母亲的促甲状腺素水平水平跟新生儿的水平相关,可以根据母亲的促甲状腺素水平预测新生儿的促甲状腺素水平水平。
18. 每个空气样品同时用甲、乙两种方法测定CS 的含量(mg/m ,非正态)如下,其目的为研究甲方法能否替代乙方法。
问应进行哪些方面的统计分析?(不必计算,要求分析、方法、步骤的系统完整)编号 1 2 3 4 5 6 7 8
9 10
甲方法40.7 4.4 38.8 45.2 0.3 20.5 2.8 4.4 5.6 1.0
乙方法50.0 4.4 40.0 42.2 2.3 22.5 4.8 4.4 5.0 4.0
从该组数据可以知道它是一个计量资料,然后题目中提示是非正态分布,然后根据计量资料的描述分析可以知道它是一个集中趋势,所以用秩和检验.
1)统计描述(差值的中位数)
2)分析一致性用秩相关(求同)
3)比较差异性用配对(配对秩和检验,求异)
拒绝或不拒绝H。
都不能说明乙法是否可以代替甲法
19、举例论述如何正确选用计量资料的统计描述指标。
首先制作频数表和频数图,以考察数据分布的形状和对称性等,再根据数据分布的类型选择合适的平均数,以反映数据分布的平均水
平.选择平均数类型的原则:?若数据服从或近似正态分布,如儿童身高,可计算均数.均数即观察值的总和除以n,它反应正态分布的平均水平.?若数据服从或近似对数正态分布,如抗体滴度,可计算几何均数.即观察值的乘积开n次方,反映对数正态分布的平均水平.?若数据呈偏态分布(不包括对数正态),如潜伏期天书,可计算中位数.将观察值从小到大排列,位于正中位置的观察值为中位数,它反映偏态分布的平均水平。