医学统计学课后习题答案
医学统计学课后习题答案16949
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A。
医学中的小概率事件 B. 各种类型的数据C。
动物和人的本质 D. 疾病的预防与治疗E.有变异的医学事件2。
用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A。
测量不准引起的误差B。
由操作失误引起的误差C. 选择样本不当引起的误差D。
选择总体不当引起的误差E. 由偶然因素引起的误差5。
收集资料不可避免的误差是A. 随机误差B。
系统误差C。
过失误差 D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差.要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学课后习题答案.
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学课后习题答案(第2版高等教育出版社)
医学统计学课后习题答案(第2版高等教育出版社)第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
医学统计学课后答案
第二章1.答:在统计学顶用来描绘集中趋势的指标系统是均匀数,包含算术均数,几何均数,中位数。
均数反应了一组察看值的均匀水平,合用于单峰对称或近似单峰对称散布资料的均匀水平的描绘。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数散布呈明显偏态,各察看值之间呈倍数变化 (等比关系 ),此时不宜用算术均数描绘其集中地点,而应当使用几何均数( geometric mean)。
几何均数一般用 G 表示,合用于各变量值之间成倍数关系,散布呈偏态,但经过对数变换后成单峰对称散布的资料。
中位数和百分位数:中位数( median)就是将一组察看值按升序或降序摆列,位次居中的数,常用M表示。
理论上数据集中有一多半比中位数小,另一半比中位数大。
中位数既合用于资料呈偏态散布或不规则散布时集中地点的描绘,也合用于张口资料的描绘。
所谓“张口”资料,是指数据的一端或许两头有不确立值。
百分位数( percentile)是一种地点指标,以P X表示,一个百分位数P X将所有察看值分为两个部分,理论上有X%的察看值比P X小,有( 100-X)%察看值比P X大。
故百分位数是一个界值,也是散布数列的一百等份切割值。
明显,中位数即是P50分位数。
即中位数是一特定的百分位数。
常用于拟订偏态散布资料的正常值范围。
2.答:常用来描绘数据失散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的失散程度大。
用极差反应失散程度的大小,简单了然,故获取宽泛采纳,如用以说明传得病、食品中毒等的最短、最长潜藏期等。
其弊端是: 1.不敏捷; 2.不稳固。
四分位数间距( inter-quartile range)就是上四分位数与下四分位数之差,即: Q= Q U- Q L ,此间包含了所有察看值的一半。
所以四分位数间距又可当作中间一半察看值的极差。
医学统计学课后习题答案
医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
医学统计学课后答案
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1. 举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007 年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007 年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000 人,分别测的其红细胞数,组成样本,其样本含量为2000 人。
2. 简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差得的实际观测随机误差是使重复观测获值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3. 举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学 课后答案
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的就是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的就是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验➢优点:资料信息利用充分;检验效能较高➢缺点:对资料的要求高;适用范围有限2.非参数检验➢优点:适用范围广,可适用于任何类型的资料➢缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1、举例说明总体与样本的概念。
研究人员通常需要了解与研究某一类个体,这个类就就是总体。
总体就是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体与有限总体之分,前者指总体中的个体就是无限的,如研究药物疗效,某病患者就就是无限总体,后者指总体中的个体就是有限的,它就是指特定时间、空间中有限个研究个体。
但就是,研究整个总体一般并不实际,通常能研究的只就是它的一部分,这个部分就就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2、简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差与非随机误差。
随机误差就是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,就是使实际观测值系统的偏离真实值的误差。
3、举例说明参数与统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
医学统计学课后答案
1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料参数检验优点:资料信息利用充分;检验效能较高缺点:对资料的要求高;适用范围有限2.非参数检验优点:适用范围广,可适用于任何类型的资料缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
(完整版)孙振球第三版研究生医学统计学课后习题答案
(完整版)孙振球第三版研究生医学统计学课后习题答案医学统计学作业答案(二~四章)第二章三、计算分析题 1.(1)均数=1.156 (2)标准差=0.2044(3))5566.1~7554.0(96.1=±s x(4)0.8mmol/L 以下者占4.09%; 1.5 mmol/L 以下者占95.35%2. 平均抗体滴度:1:36.833. 08.15=x ;M=14;M 代表性好;95%的参考值范围:<(P 95) 36第三章1.(1)女性血红蛋白的变异程度(CV=0.087)> 红细胞的变异程度(CV=0.069)(2)男性血红蛋白的标准误=0.374;红细胞的标准误=0.0306 (3)健康成年女性红细胞均数95%C.I.为4.144~4.216 (4)成年男女血红蛋白含量不同,t=24.03, P =0.0001(5)男性两项指标均低于标准值,红细胞与标准值比较,t=5.89,P =0.0001 血红蛋白与标准值比较,t=15.23, P =0.00012. 该批药有效成分平均含量为95%C.I.=(101.41~104.59)3. t=1.1429, P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。
4. t=3.71, P =0.001,新药和标准药的疗效差别有统计学意义。
5. (1)对数转换;(2)方差齐性检验,F=3.69, P =0.038,转换后两总体方差仍不齐;(3)用welch 法校正t 检验:t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。
6.(1)两药平均退热天数之差的95% C.I.为:1.0~1.8天(2)t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义(3)上述两种方法中(1)因95%C.I.不包括H 0(μ1-μ2=0),也可以说明两药退热天数不同(α=0.05);(2)的检验中可以看出两药退热天数不同,并说明其概率非常小。
大学《医学统计学》课后习题汇总及答案解析
1. 0101. 医学统计学研究的对象是:A.医学中的小概率事件B.各种类型的数据C.疾病的预防与治疗D.有变异的医学现象2. 0102. 用样本推论总体,具有代表性的样本通常指的是:A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.依照随机原则抽取总体中的部分个体3. 0103.下列观测结果属于有序数据的是:A.收缩压测量值B.脉搏数C.住院天数D.病情程度4. 0104.随机误差指的是:A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差5. 0105.系统误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差6. 0106.抽样误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差7. 0107.收集资料不可避免的误差是:A.随机误差B.系统误差C.过失误差D.记录误差8. 0108.统计学中所谓的总体通常指的是:A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据9. 0109.统计学中所谓的样本通常指的是:A.可测量的生物样品B.统计量C.数据中有代表性的一部分D.总体中有代表性的部分观察单位10. 0111统计学的主要作用是:A. 使分析更为简单B. 避免计算出现错误C. 改善数据质量D.探测随机现象的规律11. 0112概率描述的是:A.总体具有的特征B.数据具有的特征C.随机事件发生的可能性D.随机现象的规律性12. 0114.统计描述结果的主要表达方式是:A.统计指标、统计表和统计图B.描述数据特征C.概率分布D.抽样误差13. 0201.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A中位数 B.几何均数 C.均数 D.P百分位数9514. 0202.算术均数与中位数相比,其特点是:A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料15. 0203.将一组定量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.能够更精确地检验D. 描述数据的分布特征16. 0205. 变异系数主要用:A.比较不同计量指标的变异程度 B衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度17. 0206.对于正态或近似正态分布的资料,描述其变异程度应选用的指标A.变异系数B. 离均差平方和C.极差D. 标准差18. 0207.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应用:A. 四分位数间距B.标准差C.变异系数D.方差19. 0208.一组原始数据的分布呈正偏态分布,其数据的特点是:A.数值离散度大B.数值离散度小C.数值偏向较大的方向D.数值偏向较小的方向20. 0210在衡量数据的变异度时,标准差与方差相比,其主要特点是:A.标准差小于方差 C.标准差更容易计算C.标准差更为准确D. 标准差的计量单位与原始数据相同21. 0213.比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是:A.标准差B.百分位数C.极差D. 变异系数22. 0214.中位数与算数均数相比,其特点是:A.容易计算B.计算出的结果更为可靠C.不易受异常值影响D.更适合对称分布的数据23. 0301.正态曲线拐点所对应的横坐标为:A.⎺X±SB. μ±σC. X±2SD. μ±1.96σ24. 0302.标准正态分布的形状参数和位置参数分别为:A 0,1B 1,0C μ,σD σ,μ25. 0303.正态分布N(μ,σ2),当μ恒定时,σ越大则:A.曲线沿横轴越向左移动B. 曲线形状和位置不变C.曲线越“瘦高”D.曲线越“矮胖”26. 0305.正态曲线下,横轴上从均数到+∞的面积为A.50%B.95%C.97.5%D.99%27. 0306. 若随机变量X服从N(μ,σ2 )的正态分布,则X的第97.5百分位数等于()A. μ+1.96σB.μ-1.64σC.μ-σD.μ+1.64σ28. 0308.某项指标95%医学参考值范围表示的是:A.在此范围“异常"的概率大于或等于95%B.在此范围“正常"的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围29. 0309.确定某项指标的医学参考值范围时,“正常人”指的是:A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人30. 0311.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是:A.用均数来评价 B 用参考值范围来评价C.用几何均数来评价D.用变异系数来评价31. 0401 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是( )A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少32. 0402.计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数33. 0403.计算标准化死亡率的目的是( )A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响34. 0406.相对危险度RR的计算方法是( )A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同条件下某疾病发生的概率之比35. 0407.比数比OR值表示的是( )A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同条件下某疾病发生的危险性程度36. 0408.计算患病率时的平均人口数的计算方法是( )A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末的人口数D.生活满一年的总人口数37. 0409.死因构成比反映的是( )A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性38. 0410.患病率与发病率的区别是( )A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.患病率与病程有关39. 0412.某地某年肝炎发病人数占同年传染病人数的10.1%,该指标属于( )A.相对比B.构成比C.发病率D.传染率40. 0413.某医师对其所在科室近5年某病住院患者进行了统计,结果发现该病患者农村人口200人,城镇人口50人,分别占80%与20%,则结论为( )A.农村人容易患该病B.城镇人容易患该病C农村城镇都易患该病 D.尚不能得出结论41. 0501统计表的主要作用是()A.便于形象描述和表达结果B.客表达验的原始数据C. 代替冗长的文字述和便于分析对比D.容易进行统计述和推断42. 0502.述某疾病患者年龄(岁)的分布,采用的统计图是()A.线图B.条图C.百分条图D.直方图43. 0503.高血压临床试验分为试验组和对照组分析考治疗0周、2周、4周6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数图B.线图C.条图D.直方图44. 0505.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图45. 0506.下列统计图适用于构成比关系的()A.直方图B.箱式图C.误差条图、条图D.圆图、圆百分条46. 0507.对有些资料构造统计表时下列可以省略的是()A.标题B.标目 C线条 D.备注47. 0509.描述某现象频数分布情况应选择的是( )A.圆图B.百分条图C.箱式图D.直方图48. 0601.样本均数的标准误越小说明A.观察个体的变异越小B.由样本均数估计总体均数的可靠性越大C.由样本均数估计总体均数的可靠性越小D.抽样误差越大49. 0602抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C资料不是正态分布 D.个体差异及抽样50. 0603.要减少抽样误差,通常的做法是A.减小系统误差B.将个体变异控制在一定范围内C减小标准差 D.适当增加样本含量51. 0604.对于正偏态分布的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布52. 0606.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109-9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C. 该区间包含总体均数的可能性为95%D.该区间包含样本均数的可能性为95%53. 0607.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L该地正常成年人血清胆固醇均数95%的可信区间是A.3.64±1.96×1.20B.3.64±1.20C.3.64±1.96×1.20/√200D.3.64±2.58×1.20/√20054. 0609.假设检验差别有统计学意义时,P越小,说明A.样本均数差别越大B.总体均数差别越大C认为样本之间有差别的统计学证据越充分 D.认为总体之间有差别的统计学证据越充分55. 0610.关于假设检验,正确的说法是A检验水准必须设为0.05 B必须根据样本大小选择检验水准C必须采用双侧检验 D.必须建立无效假设56. 0611假设检验水准a指的是A.检验的置信度B.控制Ⅱ类错误的概率C.控制1类错误的概率D.无效假设的概率57. 0613.假设检验中的P值的含义是A.总体间有差别时出现现有样本及极端情况的概率B.总体间无差别时出现现有样本及极端情况的概率C.总体间有差别时H成立的概率D.总体间无差别时H成立的概率58. 0701.两样本均数之差的标准误反映的是A.两样本数据集中趋势的差别B. 两样本数据的变异程度C. 两样本均数之差的变异程度D. 数据的分布特征59. 0702. 两样本均数比较,检验结果P>0.05说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论60. 0706.增加t检验的检验效能,应该使用的方法是A.减小I类错误B.减小测量的系统误差C.减小测量的随机误差D. 增加样本量61. 0707. 以下不能用配对t检验方法的是(C)A比较15名肝癌患者癌组织和癌旁组织中Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者癌组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后后糖化血红蛋白的变化62. 0709. 对于配对设计的t检验,其检验假设H0是A. 两样本均数相同B. 配对数据的差值总体均数为0C.两总体均数相同D.两总体均数不同63. 0801.方差分析的基本思想是A.组间均方大于组内均方B.组内均方大于组件均方C.不同来源的方差必须相等D.总变异及其自由度可按不同来源分解64. 0802.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差等于组间方差D.总方差等于各组方差之和65. 0803.完全随机设计方差分析中的组间均方反映的是A.某因素效应大小B.随机测量误差大小C.全部数据的离散度D.处理因素效应与随机误差综合结果66. 0806 完全随机设计的多个样本均数比较,经方差分析,若P<0.05,则结论为:A 各样本均数全相等B 各样本均数全不相等C 至少有两个样本均数不等D 至少有两个总体均数不等67. 0814 在完全随机设计资料的方差分析中,已知总样本量为60,分为4个不同的处理组,则组内变异的自由度为A 3B 56C 57D 5968. 0901. 两样本率比较,差别具有统计学意义时,P值越小说明A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同69. 0907当四个表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是A 增大B 减小C 不变D 不确定70. 0911. 卡方检验的基本思想是A. 对总变异进行分解计算X2值B.根据总体间差别的大小计算X2值C.根据样本配对的情况计算X2值D.根据实际频数和理论频数的差异计算X2值71. 0912. 对三行四列表资料作X2检验,自由度为A. 1B. 2C. 6D. 372. 1001.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息73. 1010 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次为A 0.2B 1.0C 5.0D 3.074. 1011. 两样本比较的秩和检验,其应用条件是A. 两样本服从正态分布B. 两总体服从正态分布C. 两样本方差齐同D. 不受任何条件限制75. 1013.配对资料的符号秩和检验的无效假设是A. 两组配对的差值中位数为零B.两总体均数相同C.两总体分布位置相同D.两组配对的差值均数为零76. 1101,两数值变量的相关关系越强,对应的是A 相关系数越大B 回归系数越大C 相关系数的绝对值越大D 回归系数的绝对值越大77. 1105,1~17岁儿童可以用年龄(岁)估计体重(市斤)回归方程为y ^=14+4x,若将体重换成国际单位kg,则此方程A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变78. 1106,对同一资料进行线性回归与相关分析时,下列正确的情形是A ρ=0时,r=0B ρ>0时,b>0C r>0时,b<0D r<0时,b<079. 1107下列双变量中,适用于进行线性相关分析的是A年龄与体重 B民族与血型C体重与体表面积D母亲文化水平与子女的智商80. 1108 若直线回归系数的假设检验结果p<0.05,则可认为两变量间A有密切的关系 B有一定的因果关系C相关关系密切D存在数量依存关系81. 1111用最小二乘法建立线性回归方程的原则是保证各实测点到回归直线的(B)A纵向距离的离均差最小B纵向距离的平方和最小C垂直距离相等 D垂直距离的平方和最小82. 1112,进行线性回归分析,合理的直观分析方法是A计算回归系数 B做回归直线C计算截距或常数项D绘制散点图83. 1501实验性研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.提高检验效能D.保持各组的非处理因素均衡一致84. 1502.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响85. 1503.在临床试验设计选择对照时,最高效的对照形式是(D)A.历史对照B.空白对照C.标准对照D.安慰剂对照86. 1504.实验没计的三大原则是A.随机、对照、自法B.随机、均衡、重复C.随机、对照、均衡D. 随机、对照、重复87. 1505.某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效,对照组采用阳性药物溶栓胶囊,这属于A.空白对照B.历史对照C.标准对照D.安慰剂对照88. 1509.临床试验需要在设计阶段确定主要指标的目的是A.便于试验实施B.减少测量的随机误差C.减少非处理因素的影响D.避免结果的任意性89. 1511.观察性研究与实验性研究的主要区别是A.是否设立对照组B.是否以人为研究对象C.是否是抽样研究D.是否主动施加干预措施90. 1514.诊断试验中的灵敏度指的是(B)A.检测仪器的敏感性B.对患病的人检出的概率C.对未患病人检出的概率D.阳性预测值。
医学统计学课后答案
第二章1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。
几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。
中位数和百分位数:中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。
理论上数据集中有一半数比中位数小,另一半比中位数大。
中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。
所谓“开口”资料,是指数据的一端或者两端有不确定值。
百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。
故百分位数是一个界值,也是分布数列的一百等份分割值。
显然,中位数即是P 50分位数。
即中位数是一特定的百分位数。
常用于制定偏态分布资料的正常值范围。
2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。
极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。
极差大,说明资料的离散程度大。
用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。
其缺点是:1.不灵敏; 2.不稳定。
四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。
所以四分位数间距又可看成中间一半观察值的极差。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学课后习题答案
医学统计学课后习题答案在医学统计学课程中,课后习题是帮助学生巩固和应用课堂所学知识的重要环节。
以下是一些可能的课后习题及其答案,供学习参考。
习题1:某医院对100名患者进行了治疗效果的评估,其中70名患者病情有所改善。
请计算该治疗的有效率。
答案:有效率 = (改善的患者数 / 总患者数) × 100%有效率= (70 / 100) × 100% = 70%习题2:假设某研究中,有200名受试者,其中100名为实验组,接受新药治疗;另外100名为对照组,接受安慰剂。
研究结束时,实验组有30人出现副作用,对照组有10人出现副作用。
请计算两组的副作用发生率,并进行卡方检验,判断两组副作用发生率是否有显著差异。
答案:实验组副作用发生率= (30 / 100) × 100% = 30%对照组副作用发生率= (10 / 100) × 100% = 10%卡方检验计算:期望值 = (总人数× 总副作用数) / 总人数= (200 × 40) / 200 = 40实验组期望值= 40 × (100 / 200) = 20对照组期望值= 40 × (100 / 200) = 20卡方值 = [(30 - 20)^2 / 20] + [(10 - 20)^2 / 20] = 50自由度 = (组数 - 1) = 1卡方分布表中查得,自由度为1时,显著性水平为0.05的卡方临界值为3.841。
由于50 > 3.841,所以拒绝原假设,认为两组副作用发生率有显著差异。
习题3:某研究中,对50名高血压患者进行了血压测量,测量结果如下(单位:mmHg):- 收缩压:120, 130, 140, 150, 160, 170, 180, 190- 舒张压:80, 85, 90, 95, 100, 105, 110, 115请计算收缩压和舒张压的平均值和标准差。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学课后习题答案16949
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B。
各种类型的数据C。
动物和人的本质 D. 疾病的预防与治疗E.有变异的医学事件2。
用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4。
随机误差指的是A。
测量不准引起的误差B。
由操作失误引起的误差C。
选择样本不当引起的误差 D. 选择总体不当引起的误差E. 由偶然因素引起的误差5。
收集资料不可避免的误差是A。
随机误差 B. 系统误差C. 过失误差D。
记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差.要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的.(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.表2-5 均数,几何均数和中位数的相异点平 均 数 意 义 应用场合均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增减倍数 ①等比资料;②对数正态分布资料中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两察值水平 端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。
百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P 50即中位数。
多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
(2)计算:中位数和百分位数均可用同一公式计算,即Px=L+(i/f x )(n ·x%-Σf L )可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。
中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。
百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差是否一定小于均数?答:不一定。
同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?(1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。
其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。
②相异点:表示方法不同,正态分布用N (µ,σ2)表示,标准正态分布用N (0,1)表示,对数正态分布N (μlgX ,σ2lgX )表示。
(2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。
②相异点:标准正态分布是标准正态变量u 的分布,标准正态曲线下的面积唯一的由u 决定,给应用带来极大方便。
对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。
正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。
正态分布是很多统计方法的理论基础。
6.医学中参考值范围的含义是什么?确定的原则和方法是什么?含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。
(2)原则:① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。
一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。
② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。
③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。
④ 决定取双侧范围值还是单侧范围值。
⑤ 选择适当的百分范围⑥ 确定可疑范围⑦ 估计界值(3)方法:① 百分位数法:P x =L+(i/f x )(n ·x%-Σf L )② 正态分布法(对数正态分布): ()X lg X lg 1S u X lg Su X α-α±±双侧百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。
7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?答:不一定。
均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。
计算题:1. 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4074 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.86 4.79 5.34 4.24 4.32 4.776.36 6.384.865.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.04 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.903.05(1)编制频数分布表,简述其分布特征。
①找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)③分组段,划记(表1-1)表2-6 某地101例30~49岁健康男子血清总胆固醇值划记表组段(mmol/L) 划记频数2.5~ 13.0~ 83.5~ 94.0~ 234.5~ 255.0~ 175.5~ 96.0~ 66.5~ 27.0~7.5 1合计 101由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。
表2-7 某地101例30~49岁健康男子血清总胆固醇值(mmol/L )X 、s 计算表血清总胆 组中值 频数 fX fX 2累计 累计频数固醇值 X f 频数 (实际)2.5~ 2.75 1 2.75 7.563 1 0.00993.0~ 3.25 8 26.00 84.500 9 0.08913.5~ 3.75 9 33.75 126.563 18 0.17824.0~ 4.25 23 97.75 415.438 41 0.40594.5~ 4.75 25 118.75 564.063 66 0.65355.0~ 5.25 17 89.25 468.563 83 0.82185.5~ 5.75 9 51.75 297.563 92 0.91096.0~ 6.25 6 37.50 234.375 98 0.97036.5~ 6.75 2 13.50 91.125 100 0.99017.0~7.5 7.25 1 7.25 52.563 101 1.0000 478.25 2242.315注:Xu 为组段上限值 (2)计算均数X 、标准s 、变异系数CV 。
由上计算表1-2可见:=∑∑=f fX X /478.25/101=4.735(mmol/L )1f f/)fX (fX s 22-∑∑∑-∑=1101101/)25.478(313.23422--==0.882(mmol/L ) CV=x s /⨯100%=0.882/4.735⨯100%=18.627%(3)计算中位数M ,并与均数X 比较,利用前表计算中位数MM = L+(i/f 50)(n ⨯50%-Σf L )=4.5+(0.5/25)(101⨯50%-41)=4.69(mmol/L )本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是资料服从正态分布的特征之一。