临床医学统计学名词解释问答题
【缩印整理版】医学统计学名词解释及问答题
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
医学统计学填空,名词解释。简答
1、常用的统计学资料类型分计量、计数和等级2、正态分布的两个参数是位置参数和形态参数3、统计推断包括两个重要方面是参数估计和假设检验5、方差分析的应用条件是,1样本来自正态整体2方差极性3独立样本资料15、欲比较两组均数相差较大的资料的离散程度宜用变异系数15、统计学将p《0.05或平《0.01定为小概率事件16、概率是以符号p表示,其取值波动于0~1之间20、估计医学正常值的方法有正态法和百分位数法,它们分别用于正态分布资料和偏态分布资料25、常用的相对数率、构成比、相对比40、x2值是反映实际频数和理论频数的吻合程度50、根据资料的内容和性质选用合适的统计图53、实验设计的基本原则是对照原则、均衡原则、随机原则和重复原则64、& 是指样本均数对u的离散程度&x-是指均数的均数对u的离散程度名词解释1.总体:population总体指根据研究目的所确定的同质观察单位的全体,更确切的说,是同质的所有观察单位某项观察值的集合2.样本:sample从总体中随机抽取部分观察单位其某项观察值的集合称为样本。
3.变异:即个体间的差异,是生物医学数据最显著地特征。
4.变异系数:coefficient of variation用CV表示,即标准差与算术均数之比,描述了观察值的变异相对于其平均水平的大小。
5.相对数:relative number是两个有关联的数值或指标之比称为相对数。
是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。
6、四分位数间距quartile range、用Q表示,就是上四分位数与下四分位数之差,即P75-P25。
间距越大,说明资料的离散程度越大。
7、均方:将各部分离均差平方和除以相应自由度,其比值称为均方差简称均方。
8、标准误:standard error统计学把样本均数的标准差称为均数的标准误。
标准误是描述均数的抽样误差大小的统计指标,标准误越大,抽样误差越大。
医学统计学 问答题
1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
医学统计学名词解释及问答题
医学统计学名词解释及问答题统计学(Statistics):运⽤概率论、数理统计的原理与⽅法,研究数据的搜集;分析;解释;表达的科学。
总体(population):⼤同⼩异的研究对象全体。
更确切的说,总体是指根据研究⽬的确定的、同质的全部研究单位的观测值。
样本(sample):来⾃总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利⽤样本信息可以对总体特征进⾏推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性⽽出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可⽤标准误描述其⼤⼩。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的⼤⼩。
样本均数的标准差称为均数的标准误。
均数标准误⼤⼩与标准差呈正⽐,与样本例数的平⽅根呈反⽐,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定⼀个具有较⼤置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),⼜称可信区间。
参考值范围描述绝⼤多数正常⼈的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围⽤于判断某项指标是否正常置信区间揭⽰的是按⼀定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、⼆项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)⾮参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对⽐较数据(x)的分布进⾏统计检验的⽅法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,⽽相关系数⽆单位β为回归直线的斜率(slope)参数,⼜称回归系数(regression coefficient)。
医学统计学课后习题答案
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学复习资料(2)
医学统计学复习资料(2)i ed医学统计学复习资料一、名词解释题1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
医学统计学名词解释、简答、问答
名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学问答题考试必备
医学统计学问答题1.试述医学参考值范围的制定方法。
答:(1)选择足够数量的正常人作为参照样本。
所谓“正常人”指排除了影响所研究指标的疾病和有关因素的同质人群。
(2)对选定的正常人进行准确的测定。
要严格控制检测误差,同时必须对测量条件做出统一的规定和说明。
(3)决定取单侧还是双侧范围值。
根据研究目的和专业知识选择适当的方法,一般选用双侧。
(4)选择适当的百分范围。
最常用的百分界限是95%。
(5)估计参考值范围的界限。
最基本的有百分位数法和正态分布法。
2.相对数使用时应注意哪些问题?答:(1)分析时构成比和率不能混淆构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。
(2)使用相对数时,分母不易过小分母过小时结果不稳定。
观察单位数少时最好用绝时数表示。
(3)要注意资料的可比性用以比较的资料应是同质的,除了研究因素之外,其余的因素应相同或相近。
(4)要注意使用率的标准化对于内部构成不同的资料,应先进行标准化后再做比较。
(5)要考虑存在抽样误差,样本之间的差异应做统计学检验。
3.试述线性相关系数与线性回归系数的意义。
答:线形相关系数是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。
它没有测量单位,其数值为-1 < r <o+1-为正,表示正相关;r为负,表示负相关;r为0,表示零相关即无直线关系;r绝对值为1时,表示完全相关。
线形回归系数是表示两变量之间的依存关系的统计量,它的数值表示当自变量变化一个单位,因变量随之变化的单位数。
4.描述计量资料离散趋势的指标有哪些?试述各指标的应用条件。
描述计量资料离散趋势的指标有极差、四分位数间距、方差和标准差、变异系数。
(1)极差(全距):应用于粗略地说明变量的变动范围。
(2)四分位数间距:应用于偏态分布的资料、开口资料或分布不明的资料。
(3)方差和标准差:应用于正态分布的资料。
(4)变异系数:应用于均数相差较大或单位不同的几组观察值得变异程度的比较。
医学统计学课后习题答案71532
医学统计学课后习题答案71532医学统计学第⼀章绪论答案名词解释:(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2)总体和样本:总体是根据研究⽬的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5)概率:是描述随机事件发⽣的可能性⼤⼩的数值,⽤p 表⽰(6)计量资料:由⼀群个体的变量值构成的资料称为计量资料。
(7)计数资料:由⼀群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8)等级资料:由⼀群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是⾮题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第⼆章计量资料统计描述及正态分布答案名词解释:1. 平均数是描述数据分布集中趋势(中⼼位置)和平均⽔平的指标2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布以µ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围参考值范围也称正常值范围,医学上常把把绝⼤多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σµχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、⽅差、标准差、变异系数8. σµ96.1± σµ58.2±9. 全距 R10. 检验⽔准、显著性⽔准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,µ,σ,规律性17. 标准差18. 单位不同,均数相差较⼤是⾮题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑⼏何均数和中位数的适⽤范围有何异同?答:相同点,均表⽰计量资料集中趋势的指标。
医学统计学复习思考题
医学统计学复习思考题医学统计学复习思考题⼀、名词解释1.同质与变异:2.总体和样本3.参数和统计量4.过失误差5.抽样误差6.随机测量误差7.概率 8.计量资料 9.计数资料10.等级资料 11.平均数 12.标准差13.标准正态分布 14.参考值范围 15标准误16.相对数 17 率 18构成⽐19.相对⽐ 20.标准化率法 21 X2检验22.参数统计 23.⾮参数统计 24.回归系数25相关系数⼆、问答题1.均数﹑⼏何均数和中位数的适⽤范围有何异同?2.中位数与百分位数在意义上﹑计算和应⽤上有何区别与联系3.医学中参考值范围的含义是什么?确定的原则和⽅法是什么?4.标准差和标准误有何区别和联系?5.可信区间和参考值范围有何不同?6.假设检验和区间估计有何联系?7.t检验和⽅差分析的应⽤条件有何异同?8.检验假设中α和P的区别何在?9.常⽤的相对数指标有那些?它们的意义和计算上有何不同?为什么不能以⽐代率?请联系实际加以说明。
10.X2检验适⽤于解决那些问题?对资料的设计类型和应⽤条件有何不同要求?11.应⽤相对数时应注意哪些问题?12.什么情况下需要进⾏率的标准化?标准化的⽅法有那些?13.X2检验的基本思想是什么?14.四表格资料在何种情况下需要进⾏校正?为什么?15.⾏X列表X2检验的注意事项有哪些?16.⾮参数检验适⽤那些情况?17.相关系数与回归系数的区别与联系?18.应⽤直线回归和相关分析时应注意那些问题?19.列表的原则和基本要求是什么?20.常⽤的统计图有哪⼏种?他们的适⽤条件是什么?21.调查研究和实验研究的主要区别何在?22.调查中⾮抽样误差的来源有哪些?如何控制?如何评价调查质量?三.计算题1.某地101例30~49岁健康男⼦⾎清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.125.20 5.10 4.70 4.07 3.50 4.69 4.38 4.896.25 5.32 4.50 4.633.614.44 4.43 4.25 4.035.85 4.09 3.35 4.08 4.79 5.30 4.973.18 3.97 5.16 5.10 5.864.795.34 4.24 4.32 4.776.36 6.384.865.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.726.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 2.704.60 4.095.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.345.186.14 3.24 4.90 3.05(1)编制频数分布表并绘制直⽅图,简述其分布特征。
卫生统计学名词解释和简答题
卫生统计学一、名词解释1、总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
2、样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
3、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
4、计量资料定量资料(quantitative data ):亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如上例中的身高(cm)、体重(kg)资料等均为定量资料。
5、定性资料:定性资料(qualitative data ):亦称分类资料(categorical data ),其观察值是定性的,表现为互不相容的类别或属性,一般无度量衡单位。
可进一步细分为以下两种资料。
6、变异系数:变异系数是一种相对变异指标,常用于比较度量单位不同或单位相同但均数相差悬殊的两组或多组对称分布特别是正态分布资料的变异程度。
7、回归系数:b称为回归系数(coefficient of regression),含义为当x每变化1个单位,因变量γ平均变化b个单位。
8、决定系数:也称判定系数或者拟合优度。
它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。
9、率:说明某现象发生的频率或强度的指标。
10、构成比:说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
11、粗出生率:指某年某地平均每千人口的活产数,是反映一个国家或地区的人口自然变动的基本指标。
12、粗死亡率:指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
二、简答题1.简述方差分析的基本思想和应用条件。
方差分析的基本思想:将全部观察值之间的变异按照设计的要求和分析的需要分解成两个或多个部分,然后再作分析。
方差分析的应用条件为:1、各样本是相互独立的随机样本;2、各样本均来自正态分布总体;3、各样本的总体方差相等,即方差齐。
医学统计学课后习题答案
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学考试重点
医学统计学考试重点简答 4-5个讨论分析1-2题计算 1-2题考试题型:名词解释10个选择20个填空题 20个绪论2选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体结果?0.05被认为是有统计学意义代表性的犯错概率。
一般小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表 12现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
医学统计学问答题(含答案)
医学统计学问答题(含答案)简答题0、算术均数、⼏何均数与中位数各有什么适⽤条件?答:(1)算术均数:适⽤对称分布,特别就是正态或近似正态分布得数值变量资料。
(2)⼏何均数:适⽤于频数分布呈正偏态得资料,或者经对数变换后服从正态分布(对数正态分布)得资料,以及等⽐数列资料。
(3)中位数:适⽤各种类型得资料,尤其以下情况:A 资料分布呈明显偏态;B 资料⼀端或两端存在不确定数值(开⼝资料或⽆界资料);C 资料分布不明。
1、对于⼀组近似正态分布得资料,除样本含量n 外,还可计算S X ,与S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料得集中趋势(2)S 为标准差,说明正态分布或近似正态分布得离散趋势(3)S X 96.1±可估计正态指标得95%得医学参考值范围,即此范围在理论上应包含95%得个体值。
2、试述正态分布、标准正态分布得联系与区别。
正态分布标准正态分布原始值X ⽆需转换作u=(X-µ)/σ转换分布类型对称对称集中趋势 µµ=0 均数与中位数得关系µ=M µ=M 参考:标准正态分布得均数为0,标准差为1;正态分布得均数则为µ,标准差为σ(µ为任意数,⽽σ为⼤于0得任意数)。
标准正态分布得曲线只有⼀条,⽽正态分布曲线就是⼀簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布就是正态分布得特例。
3、说明频数分布表得⽤途。
1)描述频数分布得类型 2)描述频数分布得特征 3)便于发现⼀些特⼤或特⼩得可疑值 4)便于进⼀步做统计分析与处理4、变异系数得⽤途就是什么?多⽤于观察指标单位不同时,如⾝⾼与体重得变异程度得⽐较;或均数相差较⼤时,如⼉童⾝⾼与成⼈⾝⾼变异程度得⽐较。
5、试述正态分布得⾯积分布规律。
(1)X 轴与正态曲线所夹得⾯积恒等于1或100%;(2)区间µ±σ得⾯积为68、27%,区间µ±1、96σ得⾯积为95、00%,区间µ±2、58σ得⾯积为99、00%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床医学统计学--名词解释+问答题————————————————————————————————作者:————————————————————————————————日期:医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
3、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布)4、总体均数的可信区间与参考值范围的区别概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围5、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数。
6、假设检验的步骤①建立假设与确定检验水准(α)(反证法思想)H0:μ1=μ2 无效假设H1:μ1≠μ2 备择假设检验水准:α=0.05(双侧或单侧)②选定方法和计算检验统计量:根据资料的性质(变量类型、设计类型、资料组数、样本含量等)和分析目的选择检验统计量。
所有检验统计量均在无效假设成立的前提下,可以证明其分布。
③确定P值,作出判断(利用小概率原理)P值是指在H0成立的前提下,获得现有检验统计量值以及比该统计量值更极端情况下的概率。
P≤α(0.05) ,拒绝H0,接受H1,认为差别有统计学意义,可以认为......不同或不等;P >α(0.05) ,接受H0,拒绝H1,认为差别无统计学意义,还不能认为......不同或不等。
④结合专业知识下结论。
7、假设检验时应注意的问题①样本具有代表性且可比;②正确选用假设检验方法;③差别的统计学意义不等于实际意义;④判断结论时不能绝对化;⑤单侧检验与双侧检验的选择;⑥报告结果应注明样本含量、统计量值、P值,单侧检验也应注明;95%CI既能说明差别的大小,也具有检验的作用,建议使用。
8、方差分析的基本思想、基本条件基本思想:①首先将总变异分解为组间变异和误差(组内)变异,然后比较两者的均方,即计算F值。
②若F值大于某个临界值,表示处理组间的效应不同;若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅由随机原因所致)。
③对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。
④不同之处在于变异分解的项目因设计不同而异。
基本条件:①资料无偏性,各样本是相互独立的随机样本(独立性);②各样本来自正态分布总体(正态性);③各样本组的总体方差相等(方差齐性)。
9、R×C表χ2检验的应用注意事项1. 采用专用公式计算χ2值,无须计算理论频数,但也必须求出最小理论频数。
2. 对R×C表,若T<5的个数超过所有理论频数个数的1/5或有T<1的格子出现,则易犯第一类错误。
此时应:①增大样本含量②根据专业知识将相邻的行或列进行合理合并,一般仅对有序分类合并③精确概率法④似然比χ2检验⑤删去T过小的行或列,但会丢失相应信息3. 多组样本率或构成比比较时,若效应有强弱的等级时,χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。
4. 当结果变量为无序分类时,可采用χ2检验;当结果变量为有序分类时,可考虑趋势检验或等级相关分析。
10、简述直线相关与回归的区别与联系区别:资料:相关分析要求X、Y服从双变量正态分布回归分析要求应变量Y服从正态分布,x无特定要求应用:相关分析用于说明两变量间的相关关系,描述两变量X、Y之间呈线性关系的密切程度和方向回归分析用于说明两变量间的依存关系,可以用一个变量的数值推算另一个变量的数值联系:正负符号:对同一资料中,r与b的符号相同假设检验:对同一资料中,r与b的假设检验是等价的,二者的t值相等,t b=t rr与b可相互转换回归可解释相关:相关系数r的平方称决定系数,表示Y的变异中可由X解释的部分占总变异的比例11、应用直线相关与回归的注意事项①作相关与回归分析要有实际意义。
②对相关关系的作用要正确理解。
③作相关与回归分析前必须先作散点图。
④积差法计算相关系数r适用于正态资料;资料明显偏态或原始资料只能用等级划分或难以判定资料属何种分布时,才宜按等级相关处理。
⑤相关、回归若无统计学意义,不等于无任何关系。
⑥回归方程的适用范围仅适用于自变量X的实测范围内。
12、相关系数的意义、应用直线相关的注意事项相关系数是用以说明在两个变量之间存在线性相关关系以及相关关系的密切程度与方向的统计指标。
样本相关系数用r表示,总体相关系数用ρ表示。
相关系数没有单位,其值为-1≦r≦1。
r值为正表示正相关,r值为负表示负相关,r值为0表示X与Y无线性关系。
r的绝对值越大表示相关越密切。
①线性相关表示两变量之间的关系是双向的分析变量之间的关系;须首先绘制散点图,散点图呈直线趋势时再做分析;②r表示服从双变量正态分布的两变量间的相关关系,描述两变量之间呈线性关系的密切程度和方向;r=0只能说明X与Y之间无线性关系,并不表示X与Y之间无任何相关;③计算出相关系数是样本相关系数,是总体相关系数的估计值,因此判断总体相关时需做假设检验;④相关关系不一定是因果关系。
**13、频数表的编制步骤①找出观察值中的最大值和最小值,并求出极差②按极差大小决定组段数、组段和组距③列出组段④划记计数**14、统计图的制图通则①据资料的性质和分析目的选择合适的图形②确切的标题与编号(在图的下方正中央位置)③纵、横轴之比为5:7,必要时注明度量单位④必要时辅以图例**15、t 分布有如下性质:①单峰分布,曲线在t=0 处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。
**16、非参数统计的优缺点优点:①适用范围广,是对有序分类资料最有效的统计方法②对不满足参数统计的资料,非参数统计的效率高③搜集资料方便缺点:对适用参数统计的资料,应用非参数统计的效率低,即犯第II类错误的概率比参数统计大1、医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性质、影响条件或背景相同或相近。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、样本:是从总体中随机抽取的一部分观察单位所组成的集合。
10、随机变量:是指取值不能事先确定的观察结果。
11、统计量:是样本的统计指标,采用拉丁字母表示,是参数附近波动的随机变量。
12、参数:是总体的统计指标,采用小写的希腊字母,为固定的常数。
13、随机抽样:为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
14、抽样误差:是由于个体差异导致在抽样研究中产生的样本统计量与相应的总体参数之间的差异以及统计量间的差异。
15、确定性现象:在一定条件下,一定会发生或一定不会发生的现象。
16、随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。
其表现结果称为随机事件。
17、频率:样本的实际发生率称为~,0≦f≦1。
18、概率:随机事件发生的可能性大小,0≦P≦1。
19、小概率事件:概率小于等于0.05或0.01的事件称为小概率事件,习惯上以0.05为标准,统计学上认为小概率事件在一次实验中是不大可能发生的。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。