最新医学统计学名词解释及问答题
医学统计学名解
医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。
5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。
变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。
6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。
从总体中随机抽取的部分研究对象称为样本。
7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。
由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。
8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。
而通过样本资料计算出来的相应指标称为统计量。
9.概率:随机事件发生可能性大小的数值度量。
10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。
计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
一般具有度量衡单位,如身高(cm)、体重(kg)等。
11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。
一般无度量衡单位,如性别、职业、血型等。
12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。
各属性之间有程度的差别,互不相容。
14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。
【缩印整理版】医学统计学名词解释及问答题
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
医学统计学复习资料
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学习题二
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学名词解释简答
●【抽样误差】由抽样引起的样本统计量与总体参数间的差别。
原因:个体变异+抽样 表现:样本统计量与总体参数间的差别、不同样本统计量间的差别。
抽样误差是有规律的 ●【可信区间CI 】区间估计是按一定的概率或者可信度1-α,用一个区间估计总体参数所在的范围CI ,这个范围成为可信度为1-α的可信区间,置信区间。
影响:可信度、个体差异、样本含量 两要素:可信度1-α、可靠性;精确性可信度为95%的CI 涵义:每100个样本计算95%的CI ,平均有95%的CI 包含了总体参数。
95%,指方法本身,而非某个区间。
该区间包含总体参数,可信度为95%●【总体和样本】根据研究目的确定的同质的所有观察单位的某种变量值的集合。
样本是指在研究总体中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集 ●【参数和统计量】描述总体特征的指标,不变的,固定的,未知的统计量:描述样本特征的指标,变化的,已知的,有误差的●【概率和小概率原理】描述某随机事件发生可能性大小的度量,记做P ,取值0<P <1 小概率原理:P ≤0.05,该事件发生的可能性很小,进而认为在一次抽样中不可能发生 ●【随机】机会均等、随机抽样、随机分组、实验顺序随机●【变异系数CV 】离散系数,标准差S 、均数之比。
用来衡量单位不同的多组资料的变异度、比较均数相差悬殊的多组资料的变异度●【相关系数】两个有直线关系的变量间相关关系的密切程度与相关方向的指标,记做r ,-1≤r ≤1,正、负相关,其绝对值越大表示关系越密切,越接近于0相关越不密切 ●【回归系数】b 回归直线的斜率,自变量增加一个单位,应变量的平均改变量●【标准误】样本统计量的标准差,衡量抽样误差的大小 ●【偏倚】实验中某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应 ●【一类错误、二类错误】【检验效能】1-β 就是对真实的H 1作出肯定结论之概率●【假设检验中的P 值】从 H0 总体中随机获得等于或大于现有统计量值的概率。
医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学名词解释及问答题
察单位都有同等的机会被选入到样本中),从总1、总体(population):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学复习题(名词解释和简答)
医学统计学复习题(名词解释和简答)一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学期末考试 名词解释
10、测定某地107名正常人尿铅含量(μmol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。
12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。
13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。
16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。
19、正态分布是以μ为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。
25、正态分布的形态由σ决定,t分布的形态由自由度决定。
20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。
22、计算正态分布资料95%正常值范围的公式是X±1.96S ;估计总体均数95%可信区间的公式是X±1.96Sx 。
26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于μ,Sx趋向于 0 ,t(0.05,v)趋向于1.96 。
①选有代表性的、较稳定的、数量较大的人群做标准;②将相互比较的各组数据合并作标准;③选择相互比较的各组中的一组作为标准。
一、名词解释1、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。
根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。
2、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。
各类别属性没有程度或顺序上的差别,如男女,血型。
3、等级资料:又称有序分类资料,是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料称为等级资料。
各类别属性有程度或顺序上的差别,如显效、有效、无效等。
4、总体:是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
医学统计学 名词解释
29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。
30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。
31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料 称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。
24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。
25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
【临床】医学统计学--名词解释+问答题
【临床】医学统计学--名词解释+问答题医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
2024 医学统计学形考作业1-4(含答案)
医学统计学专题测验一1.名词解释总体:是指根据研究目的确定的研究对象的全体。
误差:测量值与事实真相之间的差值。
抽样研究:是指以样本特征推论总体特征的研究。
极差:又称全距,是所有观察值中最大值和最小值之差。
变异系数:是标准差与均数的比值。
2.下面有关抽样误差的叙述,正确的是( D )。
A.严格设计和严格实施的研究可以避免抽样误差B.样本量越大,抽样误差越大C.抽样误差是由于测量人员测量技术不合格导致的误差D.抽样误差与研究特征的个体差异有关3.“是否吸烟”的变量类型是( D )。
A.数值型变量资料B.多分类变量资料C.等级资料D.二分类变量资料4.下面关于样本量的陈述,正确的是( D )。
A.样本量与总体规模有关B.抽样误差与样本量无关C.样本量与应答率水平无关D.样本量需要专门的公式估计5.下面关于研究对象的陈述,错误的是( C )。
A.研究对象与研究目的有关B.研究对象可以是人,也可以是动物C.研究对象不需要来自研究总体D.研究对象是研究设计的内容6.下面有关总体的叙述,正确的是( A )。
A.总体是由根据研究目的所确定的全部研究对象B.总体与研究目的无关C.总体由样本量决定D.总体由统计分析方法决定7.下列选项中,属于数值变量的是( B )。
A.民族B.体重C.血型D.性别8.数据录入时,部分数据录入有误,误差的类型属于( B )。
A.样本与总体之差B.系统误差C.随机测量误差D.抽样误差9.统计量是( C )。
A.统计总体数据得到的量B.反映总体特征的的量C.使用样本数据计算出来的统计指标D.使用参数估计出来的10.某病房记录了50名病人的护理等级,其中特级护理1名,一级护理3名,二级护理12名,三级护理34名,此资料属于( C )。
A.分类变量资料B.二分类资料C.有序分类变量资料D.数值变量资料11.下面有关误差的叙述,错误的是(D )。
A.随机误差不可以避免B.系统误差一定要避免发生C.抽样误差包含个体差异D.因为样本含量越大,抽样误差越小,所样本含量越大越好12.某药物临床试验数据的两端均没有确定数值,描述其中心位置适用的最佳指标是( A )。
医学统计学名词与简答题
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学名词与简答题医学统计学重点第一章医学统计学基础 1 随机现象是指在一定条件下并不总是出现相同结果的现象。
2 概率 probability 即随机事件发生的可能性大小。
3 小概率事件 P0. 05 或0. 01 的事件。
4 总体 population:是根据研究目的所确定的同质观察单位的全体。
5 参数 parameter:描述总体特征的统计指标,一般用希腊字母表示。
6 样本 sample:从总体中抽出的供研究的观察单位。
7 统计量:根据样本观察值计算出的描述样本的特征值。
8 误差 error:使之研究结果与真实情况之间的差别。
根据原因分为:随机测量误差、系统误差和抽样误差。
系统误差对研究结果的影响较大,是可以控制和避免的。
9 抽样误差 sampling error:由于抽样所导致的样本均数与总体均数之差(在抽样研究中,即使没有随机测量误差和系统误差,在样本指标和总体指标间仍可能存在误差这种误差是由于抽样所致)。
1 / 1010 数值变量资料又称计量资料,是对某种随机变量进行定量测量所得的资料。
11 统计工作一般包括研究设计、资料收集、数据整理和统计分析四个基本步骤。
统计分析包括统计描述和统计推断。
12 同质:影响研究指标的主要因素易控制的因素基本上相同。
13 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
第二章数据变量资料的统计描述 1 频数表的编制步骤:找全距(极差),定组距,写组段,划记,列频数表。
(重点具体看书) 2 集中趋势的描述有:算数均数,几何均数,中位数。
医学统计学名解和简答
医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。
2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。
3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。
4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。
5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。
如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。
6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。
7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。
8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。
9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。
10.方差:将离均差平方和再取平均其结果。
11.标准差:总体观察值中个体值的变异强度。
12.正态分布:标准差与均数结合能够完整地概括一个正态分布。
13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。
14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。
15.标准误:标本均数的标准差6-,又称(简写SE)。
16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。
17标准差:是一组观察值变异程度的指标。
18总变异=组间变异+组内变异。
19. 率:是表示某种现象发生的频率和强度。
20.构成比:表示事物内部各个组成部分所占整体的比重。
21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。
23. 确定组距:将全距除以组数可得到组距的近似值。
24.确定组限:实际组限在每组中只包含下限而不包含上限。
25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。
(完整)医学统计学名词解释及问答题
1、总体(population):是根据研究目的确定的同质研究对象的全体.2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标.11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数.14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学考试必会名词解释
观察单位某种观察值(变量值)的集合。
这种特征称为变量。
大小所得的资料,一般用度量衡单位。
进行分组,然后计数各组该观察指标的数目所得的资料。
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素是测量仪器或方法的灵敏度。
一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),称为负偏态。
用的平均数有算术均数、几何均数及中位数。
母μ表示总体均数,用x表演示样本均数。
态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。
即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X ×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2)比较均数相差悬殊的几组资料的离散程度。
及生化指标常数,也称正常值。
波动。
称为抽样误差。
本均数的标准差称为标准误,其计算公式为。
面。
般取α=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为0.05。
H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。
组观察单位数。
等级资料又称为有序资料。
或偏低。
取值服从特定的概率分布。
X服从正态分布N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
构成比、相对比。
频率或强度,又称频率指标。
常用百分率、千分率、万分率或十万分率等表示。
比,说明事物内部各部分所占的比重。
常用百分数表示。
倍或几分之几。
两个指标可以是绝对数、相对数或平均数;或以性质相同,也可以性质不同。
医学统计学复习题(名词解释和简答)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学名词解释、简答、问答
名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、总体(population):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。
19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。
20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。
21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
22、可信区间(confidence interval):指总体参数可能所在的范围。
23、率(rate):说明某现象发生的频率或强度。
24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。
25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。
28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。
29、自变量(independent variable):如果没有一个变量依赖于其他变量变化而变化的关系时,一般把测量比较简单的变量作为自变量。
30、因变量(dependent variable):测量比较复杂的变量称为因变量或应变量。
31、相关分析(correlation analysis):分析两个或多个变量间相互关系的统计分析方法。
32、线性回归分析(linear regression analysis):用直线回归方程或数学模型描述变量间数量关系的统计方法。
33、相关系数(coefficient of correlation):描述两个变量间线性相关关系密切程度与方向的统计指标。
34、回归系数(regression coefficient):即回归直线的斜率,表示自变量x每改变一个单位时,应变量y平均变化b个单位,B为回归系数。
35、决定系数(determinant coefficient):r2,表示由x与y的直线关系导致的y的变异SS回,在总变异SS总所占比重,即回归效果的好坏,决定系数越接近1,回归效果越好。
36、最小二乘法(least square method):以各实测点到直线的纵向距离的平方和最小来确定回归直线。
37、统计表(statistical table):将统计分析的事物及其指标用表格的形式列出来,直观地反映事物的数量关系及其趋势的一种表现形式。
38、统计图(statistical chart):用点的位置,线段的升降,直条的长短和面积大小等表达统计数据的一种形式。
39、单纯随机抽样(simple random sampling):是从总体中以完全随机的方法抽取一部分观察对象组成样本,是最简单的抽样方法。
40、整群抽样(cluster sampling):先将总体划分为N个群,每个群包含若干个观察对象,再随机抽取n个群(n<N),并将所抽取的各个群的全部观察对象组成样本。
41、系统抽样(systematic sampling):又称等距抽样,是按照一定的顺序,机械地每隔若干个观察单位抽取一个观察单位组成样本。
42、分层抽样(stratified sampling):按影响观察值变异较大的某种特征将总体分成若干层,再从每层内随机抽取一定数量的观察单位组成样本。
43、配对设计(paired design):是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况。
44、盲法(blind-method):在随机对比试验中,为避免出现偏倚,使研究者或研究对象不明确干预措施的分配的方法。
45、对照(control):处理因素与非处理因素的差异的科学对比,鉴别处理因素与非处理因素的效应差异。
46、随机区组设计(randomized block design):又称配伍设计,是将几个条件基本相同的受试对象划成一个区组,区组中观察对象的数量取决于对比组的组数。
将区组中的受试对象采用随机方法,分配到不同的对比组中。
47、随机对照试验(random-control trail):又称完全随机设计,属于单因素研究设计,是将受试对象按照随机分配的原则分配到实验组和对照组中,然后给予不同的处理因素,对各组的效应进行同期平行观察,比较各组观察指标有无差异。
48、实验研究(experimental study):是指研究者根据研究目的人为地对受试对象施加处理因素,控制混杂因素,观察、总结处理因素的效果的一种研究方法。
1、 什么是卫生统计学?应用统计学的基本原理与方法,研究医学卫生及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2、 统计学的基本步骤有哪些?①良好的研究设计;②有计划地搜集资料;③合理地整理资料;④正确地分析资料。
3、4、 抽样误差产生的原因有哪些?可以避免抽样误差吗?抽样误差的的根源在于个体变异,在抽样研究中是不可避免的。
5、6、 何为概率及小概率事件?概率P 是指某事件发生的可能性大小。
P ≤0.05的随机事件称为小概率事件,其原理是在一次实验中不大可能发生的。
7、 描述数值变量资料集中趋势的指标有哪些?其适用范围有何异同?均数、几何均数、中位数。
均数适用于计量资料正态分布或近似正态分布资料;几何均数适用于对数正态分布或近似对数正态分布资料,也可用于等比资料,但一般不能有观察值为0,也不能同时包含正负观察值。
中位数用于描述极偏态资料,有特大特小值资料,有不确定数据资料和分布不明的资料。
8、 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?极差、四分位数间距、方差和标准差、变异系数。
极差和四分位数间距用于描述偏态分布资料、一端或两端没有确定值的资料。
方差和标准差用于描述正态分布资料的离散程度。
变异系数描述的是相对离散程度,用于单位不同,或虽单位相同但均数相差较大的资料变异程度的比较。
9、10、 中位数与百分位数在意义上,计算和应用上有何区别于联系?中位数是将一组数据由小到大排列,位于中间位置的观测值。
百分位数也是一种位置指标,样本的第x 百分位数记作P x ,它表示将全部观察值x 1、x 2…x n ,由小到大排列后位于第x 百分位置的数值。
中位数M 是一个特殊的百分位数,即第50百分位数P 50。
11、 标准差与标准误的区别与联系:1.区别:①标准差衡量观察值的离散趋势(变异程度),越大表示观察值越分散,样本均数的代表性越差;反之,样本均数的代表性就越好;样本越大,标准差趋于稳定。
标准差主要用于医学参考值范围的估计。
②标准误代表样本均数的变异程度,表示抽样误差的大小,标准误越大,抽样误差越大,样本均数越离散,用样本均数估计总体均数的可靠性越差,反之样本均数的可靠性就好。
标准误主要用于总体均数可信区间的估计和假设检验。
2.联系:都是变异指标,反应离散趋势;标准误的大小可以由标准差的大小来估计,σx =σ/n ,σx 与σ成正比,与n 成反比;对于同一份资料,标准差越大,标准误也越大。
12、13、 可信区间与参考值范围有何不同?从意义上:①可信区间按是预先给定的概率1-α确定总体均数μ的可能范围,95%可信区间是按95%可信度估计总体均数所在的范围,此时估计正确率为95%,即有95%可能性包含了总体均数,说明总体均数的可能范围。
②参考值范围是绝大多数正常人的某项指标的波动范围,95%参考值范围指同质总体中包含95%个体值的估计范围,说明个体值的波动范围。
从计算上:①可信区间:正态分布,σ未知,n<100时,双侧s x ,t v x α±;σ未知,n ≥100时,双侧s x z x α±;σ已知,双侧σαχxz ±。
②参考值范围:正态分布,双侧S z αχ±,单侧s z α-x 或s x z α+;偏态分布,双侧P x 2/~P x 2/100-单侧P x 或P x -100。
从应用上:①可信区间用于总体均数区间估计,评价未知总体均数所在范围;②参考值范围可判断某项指标是否正常,评价个体指标是否正常。
14、15、假设检验与区间估计有何区别与联系?①可信区间用于推断总体参数所在范围,假设检验用于推断总体参数是否不同;②可信区间也可回答假设检验的问题,但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计学意义;③可信区间还可提示差别有无实际意义,假设检验有统计意义但无实际意义的资料,实际工作中可能不重要;④验证假设时,可选择假设检验,只对总体参数做估计时,可选用区间估计,两者结合可对问题进行更全面的说明。