医学统计学 名词解释+问答题-1
医学统计学复习资料
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学名词解释及问答题
医学统计学名词解释及问答题统计学(Statistics):运⽤概率论、数理统计的原理与⽅法,研究数据的搜集;分析;解释;表达的科学。
总体(population):⼤同⼩异的研究对象全体。
更确切的说,总体是指根据研究⽬的确定的、同质的全部研究单位的观测值。
样本(sample):来⾃总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利⽤样本信息可以对总体特征进⾏推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性⽽出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可⽤标准误描述其⼤⼩。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的⼤⼩。
样本均数的标准差称为均数的标准误。
均数标准误⼤⼩与标准差呈正⽐,与样本例数的平⽅根呈反⽐,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定⼀个具有较⼤置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),⼜称可信区间。
参考值范围描述绝⼤多数正常⼈的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围⽤于判断某项指标是否正常置信区间揭⽰的是按⼀定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、⼆项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)⾮参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对⽐较数据(x)的分布进⾏统计检验的⽅法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,⽽相关系数⽆单位β为回归直线的斜率(slope)参数,⼜称回归系数(regression coefficient)。
医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学复习题(名词解释和简答)
医学统计学复习题(名词解释和简答)一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学名词解释、简答、问答
名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
医学统计学名词解释
统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
16.方差(variance):又称均方差,反映一组数据的平均离散水平。
医学统计学名词与简答题
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学名词与简答题医学统计学重点第一章医学统计学基础 1 随机现象是指在一定条件下并不总是出现相同结果的现象。
2 概率 probability 即随机事件发生的可能性大小。
3 小概率事件 P0. 05 或0. 01 的事件。
4 总体 population:是根据研究目的所确定的同质观察单位的全体。
5 参数 parameter:描述总体特征的统计指标,一般用希腊字母表示。
6 样本 sample:从总体中抽出的供研究的观察单位。
7 统计量:根据样本观察值计算出的描述样本的特征值。
8 误差 error:使之研究结果与真实情况之间的差别。
根据原因分为:随机测量误差、系统误差和抽样误差。
系统误差对研究结果的影响较大,是可以控制和避免的。
9 抽样误差 sampling error:由于抽样所导致的样本均数与总体均数之差(在抽样研究中,即使没有随机测量误差和系统误差,在样本指标和总体指标间仍可能存在误差这种误差是由于抽样所致)。
1 / 1010 数值变量资料又称计量资料,是对某种随机变量进行定量测量所得的资料。
11 统计工作一般包括研究设计、资料收集、数据整理和统计分析四个基本步骤。
统计分析包括统计描述和统计推断。
12 同质:影响研究指标的主要因素易控制的因素基本上相同。
13 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
第二章数据变量资料的统计描述 1 频数表的编制步骤:找全距(极差),定组距,写组段,划记,列频数表。
(重点具体看书) 2 集中趋势的描述有:算数均数,几何均数,中位数。
医学统计学名解和简答
医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。
2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。
3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。
4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。
5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。
如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。
6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。
7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。
8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。
9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。
10.方差:将离均差平方和再取平均其结果。
11.标准差:总体观察值中个体值的变异强度。
12.正态分布:标准差与均数结合能够完整地概括一个正态分布。
13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。
14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。
15.标准误:标本均数的标准差6-,又称(简写SE)。
16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。
17标准差:是一组观察值变异程度的指标。
18总变异=组间变异+组内变异。
19. 率:是表示某种现象发生的频率和强度。
20.构成比:表示事物内部各个组成部分所占整体的比重。
21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。
23. 确定组距:将全距除以组数可得到组距的近似值。
24.确定组限:实际组限在每组中只包含下限而不包含上限。
25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。
卫生统计学名词解释和简答题
卫生统计学一、名词解释1、总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
2、样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
3、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
4、计量资料定量资料(quantitative data ):亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如上例中的身高(cm)、体重(kg)资料等均为定量资料。
5、定性资料:定性资料(qualitative data ):亦称分类资料(categorical data ),其观察值是定性的,表现为互不相容的类别或属性,一般无度量衡单位。
可进一步细分为以下两种资料。
6、变异系数:变异系数是一种相对变异指标,常用于比较度量单位不同或单位相同但均数相差悬殊的两组或多组对称分布特别是正态分布资料的变异程度。
7、回归系数:b称为回归系数(coefficient of regression),含义为当x每变化1个单位,因变量γ平均变化b个单位。
8、决定系数:也称判定系数或者拟合优度。
它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。
9、率:说明某现象发生的频率或强度的指标。
10、构成比:说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
11、粗出生率:指某年某地平均每千人口的活产数,是反映一个国家或地区的人口自然变动的基本指标。
12、粗死亡率:指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
二、简答题1.简述方差分析的基本思想和应用条件。
方差分析的基本思想:将全部观察值之间的变异按照设计的要求和分析的需要分解成两个或多个部分,然后再作分析。
方差分析的应用条件为:1、各样本是相互独立的随机样本;2、各样本均来自正态分布总体;3、各样本的总体方差相等,即方差齐。
医学统计学考试重点
医学统计学考试重点简答 4-5个讨论分析1-2题计算 1-2题考试题型:名词解释10个选择20个填空题 20个绪论2选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体结果?0.05被认为是有统计学意义代表性的犯错概率。
一般小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表 12现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
医学统计学复习题(名词解释和简答)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料.。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1。
平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3。
标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围.填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47。
5%6。
均数、标准差7。
全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0。
医学统计学名词解释+问答题-1
医学统计学名词解释+问答题-1医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
3、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布)4、总体均数的可信区间与参考值范围的区别概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围5、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
医学统计学课后习题答案
浙江大学远程教育学院复习题《医学统计学》一、名词解释1、总体与样本总体:根据研究目的确定的同质观察单位的全体。
更确切地说,它是根据研究目的确定的同质观察单位某种变量值的集合。
样本:由总体中随机抽取部分观察单位的变量值组成。
样本是总体中有代表性的一部分。
1.同质与变异:具有相同性质的一类事物为同质,而在同质条件下,就同一观察指标来说,各观察单位表现出来的数量间存在着差异,这种客观存在的差异性称为变异。
2.参数与统计量:统计学中把总体的指标统称为参数。
而由样本算得的相应的总体指标称为统计量。
3.变异系数:变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。
4.频数分布:在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为频数分布。
又称分布数列。
5.统计推断:根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
6.全距:全距是用来表示统计资料中的变异量数(measuresofvariation),其最大值与最小值之间的差距;即最大值减最小值后所得之数据。
7.抽样误差:抽样误差是指样本指标值与被推断的总体指标值之差。
8.标准差:也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
9.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。
二、简述题1.什么是误差?.答:误差是一个量的观测值或计算值与其真值之差;特指统计误差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量。
2.简述在医学统计中最常用的三种平均数指标答:三种平均数指标:1、均数;2、几何均数;3、中位数3. t检验的前提条件是什么?答:1、正态分布;2、方差齐性;4. 简述常用的相对数指标答:1、率;2、构成比;3、相对比;5. 简述四格表资料卡方检验的条件答:1.所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
3、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布)4、总体均数的可信区间与参考值范围的区别概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围5、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数。
6、假设检验的步骤①建立假设与确定检验水准(α)(反证法思想)H0:μ1=μ2 无效假设H1:μ1≠μ2 备择假设检验水准:α=0.05(双侧或单侧)②选定方法和计算检验统计量:根据资料的性质(变量类型、设计类型、资料组数、样本含量等)和分析目的选择检验统计量。
所有检验统计量均在无效假设成立的前提下,可以证明其分布。
③确定P值,作出判断(利用小概率原理)P值是指在H0成立的前提下,获得现有检验统计量值以及比该统计量值更极端情况下的概率。
P≤α(0.05) ,拒绝H0,接受H1,认为差别有统计学意义,可以认为......不同或不等;P >α(0.05) ,接受H0,拒绝H1,认为差别无统计学意义,还不能认为......不同或不等。
④结合专业知识下结论。
7、假设检验时应注意的问题①样本具有代表性且可比;②正确选用假设检验方法;③差别的统计学意义不等于实际意义;④判断结论时不能绝对化;⑤单侧检验与双侧检验的选择;⑥报告结果应注明样本含量、统计量值、P值,单侧检验也应注明;95%CI既能说明差别的大小,也具有检验的作用,建议使用。
8、方差分析的基本思想、基本条件基本思想:①首先将总变异分解为组间变异和误差(组内)变异,然后比较两者的均方,即计算F值。
②若F值大于某个临界值,表示处理组间的效应不同;若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅由随机原因所致)。
③对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。
④不同之处在于变异分解的项目因设计不同而异。
基本条件:①资料无偏性,各样本是相互独立的随机样本(独立性);②各样本来自正态分布总体(正态性);③各样本组的总体方差相等(方差齐性)。
9、R×C表χ2检验的应用注意事项1. 采用专用公式计算χ2值,无须计算理论频数,但也必须求出最小理论频数。
2. 对R×C表,若T<5的个数超过所有理论频数个数的1/5或有T<1的格子出现,则易犯第一类错误。
此时应:①增大样本含量②根据专业知识将相邻的行或列进行合理合并,一般仅对有序分类合并③精确概率法④似然比χ2检验⑤删去T过小的行或列,但会丢失相应信息3. 多组样本率或构成比比较时,若效应有强弱的等级时,χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。
4. 当结果变量为无序分类时,可采用χ2检验;当结果变量为有序分类时,可考虑趋势检验或等级相关分析。
10、简述直线相关与回归的区别与联系区别:资料:相关分析要求X、Y服从双变量正态分布回归分析要求应变量Y服从正态分布,x无特定要求应用:相关分析用于说明两变量间的相关关系,描述两变量X、Y之间呈线性关系的密切程度和方向回归分析用于说明两变量间的依存关系,可以用一个变量的数值推算另一个变量的数值联系:正负符号:对同一资料中,r与b的符号相同假设检验:对同一资料中,r与b的假设检验是等价的,二者的t值相等,t b=t rr与b可相互转换回归可解释相关:相关系数r的平方称决定系数,表示Y的变异中可由X解释的部分占总变异的比例11、应用直线相关与回归的注意事项①作相关与回归分析要有实际意义。
②对相关关系的作用要正确理解。
③作相关与回归分析前必须先作散点图。
④积差法计算相关系数r适用于正态资料;资料明显偏态或原始资料只能用等级划分或难以判定资料属何种分布时,才宜按等级相关处理。
⑤相关、回归若无统计学意义,不等于无任何关系。
⑥回归方程的适用范围仅适用于自变量X的实测范围内。
12、相关系数的意义、应用直线相关的注意事项相关系数是用以说明在两个变量之间存在线性相关关系以及相关关系的密切程度与方向的统计指标。
样本相关系数用r表示,总体相关系数用ρ表示。
相关系数没有单位,其值为-1≦r≦1。
r值为正表示正相关,r值为负表示负相关,r值为0表示X与Y无线性关系。
r的绝对值越大表示相关越密切。
①线性相关表示两变量之间的关系是双向的分析变量之间的关系;须首先绘制散点图,散点图呈直线趋势时再做分析;②r表示服从双变量正态分布的两变量间的相关关系,描述两变量之间呈线性关系的密切程度和方向;r=0只能说明X与Y之间无线性关系,并不表示X与Y之间无任何相关;③计算出相关系数是样本相关系数,是总体相关系数的估计值,因此判断总体相关时需做假设检验;④相关关系不一定是因果关系。
**13、频数表的编制步骤①找出观察值中的最大值和最小值,并求出极差②按极差大小决定组段数、组段和组距③列出组段④划记计数**14、统计图的制图通则①据资料的性质和分析目的选择合适的图形②确切的标题与编号(在图的下方正中央位置)③纵、横轴之比为5:7,必要时注明度量单位④必要时辅以图例**15、t 分布有如下性质:①单峰分布,曲线在t=0 处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。
**16、非参数统计的优缺点优点:①适用范围广,是对有序分类资料最有效的统计方法②对不满足参数统计的资料,非参数统计的效率高③搜集资料方便缺点:对适用参数统计的资料,应用非参数统计的效率低,即犯第II类错误的概率比参数统计大1、医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性质、影响条件或背景相同或相近。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、样本:是从总体中随机抽取的一部分观察单位所组成的集合。
10、随机变量:是指取值不能事先确定的观察结果。
11、统计量:是样本的统计指标,采用拉丁字母表示,是参数附近波动的随机变量。
12、参数:是总体的统计指标,采用小写的希腊字母,为固定的常数。
13、随机抽样:为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
14、抽样误差:是由于个体差异导致在抽样研究中产生的样本统计量与相应的总体参数之间的差异以及统计量间的差异。
15、确定性现象:在一定条件下,一定会发生或一定不会发生的现象。
16、随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。
其表现结果称为随机事件。
17、频率:样本的实际发生率称为~,0≦f≦1。
18、概率:随机事件发生的可能性大小,0≦P≦1。
19、小概率事件:概率小于等于0.05或0.01的事件称为小概率事件,习惯上以0.05为标准,统计学上认为小概率事件在一次实验中是不大可能发生的。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
23、标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。