医学统计学 名词解释 名解 复习资料
医学统计学名解
医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。
5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。
变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。
6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。
从总体中随机抽取的部分研究对象称为样本。
7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。
由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。
8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。
而通过样本资料计算出来的相应指标称为统计量。
9.概率:随机事件发生可能性大小的数值度量。
10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。
计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
一般具有度量衡单位,如身高(cm)、体重(kg)等。
11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。
一般无度量衡单位,如性别、职业、血型等。
12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。
各属性之间有程度的差别,互不相容。
14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。
【缩印整理版】医学统计学名词解释及问答题
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
医学统计学重点简答题和名词解释
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
医学统计学考试必会名词解释
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学考试重点资料
一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
6、参数:描述某总体特征的指标称为总体参数。
7、统计量:描述某样本特征的指标称为样本统计量。
8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
小概率原理是进行统计推断的依据。
(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。
11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。
12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。
13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。
14、中心极限定理:①从均数为U,标准差为。
的总体中独立随机抽样,当样本含量?增加时,样本均数的分布将趋于正态分布,均数为标准差为。
X②从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。
15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。
16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。
按一定的概率或可信度(La)用一个区间估计总体参数所在范围。
这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。
医学统计学名词解释及问答题汇编
1、总体(population):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学名词解释总结归纳 考前必看笔记·
医学统计学名词解释ANOV A 方差分析:,又称变异数分析或F 检验,它是一种以F 值为统计量的计量资料的假设检验方法。
它是以总方差分解为两(多)个部分方差和总自由度分解成相应各部分自由度为手段,目的在于推断两组或多组的总体均数是否相同或检验两个或者多个样本均数间的差异是否具有与统计学意义。
average 平均数:常用于描述一批观察值分布集中位置的一组统计指标,常用的有算数均数、几何均数和中位数三种。
Censored data 删失数据:规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,称为生存时间的删失数据。
complete data 完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据。
coefficient of product-moment correlation 线性相关系数:又称Peaeson 积差相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。
总体相关系数用ρ表示,样本相关系数用r 表示。
coefficient of variation CV 即变异系数:主要用于量纲不同的变量间,或均数相差较大的变量间的变异程度的比较。
Coefficient of determination 决定系数:即为复相关系数的平方,表示回归平方和回归SS 占总离均差平方和总SS 的比例。
即总回归SS 2SS R 。
用2R 可以定量评价在y 的变异中由x 变量组建立的线性回归方程所能解释的比例。
confidence interval CI 置信区间指按预先给定的概率确定的包含未知总体参数的可能范围。
确切含义是指随机变化的置信空间包含总体参数的可能性是1-a 。
homogeneity 同质:指被研究指标的影响因素相同,但在医学研究中有些影响因素往往是难以控制的甚至是未知的linear correlation 线性相关:两个随机变量X 、Y 之间呈线性趋势的关系称为线性相关,又称简单相关(simple correlation ),简称相关。
医学统计学名解
1.同质:指符合研究目的所确定的纳入对象和排除对象的条件组合。
观察单位性质大致相同2.变异:同质研究对象某种效应指标测量值的波动性。
性质相同的同质对象的某个或某几个特征的差异,而使得测量结果不同,这种个体间的差异即为变异。
3.计量资料(定量数据):通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
4.计数资料(定性数据):将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
5.总体:根据研究目的确定的同质研究对象测量值的全体,其某种变量值的集合。
6.样本:从总体中随机抽取的部分观察单位,其实测值的集合。
7.参数:总体的统计指标。
8.统计量:样本的统计指标,如样本均数、标准差。
9.系统误差:大小恒定、倾向性、周期性、累加性的偏离真值。
可以通过严格的实验设计预防和技术措施消除。
10.随机误差:排除系统误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小方向不一的随机变化,客观不可避免。
11.小概率事件:P ≤0.05的随机事件称为小概率事件。
12.小概率原理:在统计学上,小概率事件在一次抽样或一次实验中当作不发生。
13.统计描述:用适当的统计统计图(表)和统计指标对原始数据的分布规律及其数量特征进行测定和描述。
14.统计推断:用样本信息推论总体特征的过程。
15.正态分布:是统计学中一种最常见、最重要的连续型变量的对称分布,中间组段频数最多,两侧对称,规律下降。
16.偏态分布:指集中位置偏向一侧,频数分布不对称。
17.标准差:表示每一个数对均值的离散程度,是绝对变异指标。
18.标准误:样本统计量的标准差。
19.95%医学参考值范围:参考值范围是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
习惯确定包括95%的人的界值即95%医学参考值范围。
20.95%可信区间:表示该区间包括总体均数的概率为95%。
21.率:说明某现象发生的频率或强度。
医学统计学-名词解释
医学统计学-名词解释统计学1.医学统计学:是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。
(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素)2.同质:性质相同的事物成为同质的,否则成为异质的或间杂的。
(观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)3.变异:是指在同质的基础上各观察单位(或个体)之间的差异。
4.总体:总体是根据研究目的所确定的同质观察单位的全体。
5.样本:样本是从总体中随机抽取的部分个体。
(样本中包含的个体数称为样本含量)6.随机:即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。
(包括抽样随机、分组随机、实验顺序随机)7.统计量:由样本所算出的统计指标或特征值称为统计量。
(反映样本特性的有关指标)8.参数:总体的统计指标或特征值称为参数。
(总体参数是事物本身固有的、不变的,为常数)9.抽样误差:从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
这种在抽样研究中不可避免。
(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率:描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。
11.频率:用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。
显然有 f = m / n12.小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。
(为进行统计推断的依据)13.定量资料:以定量值表达每个观察单位的某项观察指标,如血脂,心率等。
医学统计学名词解释名解复习资料
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
医学统计学考试必会名词解释
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右x表演示样本均数。
R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。
=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。
医学统计学必考的名词解释
医学统计学必考的名词解释医学统计学是一门研究医学数据收集、分析和解释的学科。
在这个领域中,有许多重要的名词需要被掌握和理解。
本文将对其中几个必考的名词进行解释,以助于读者更好地理解医学统计学的核心概念。
一、样本和总体在医学统计学中,样本和总体是两个基本的概念。
总体是指我们想要了解的整个群体,而样本是从总体中选择的一小部分个体。
通过研究样本,我们可以推断总体的特征。
样本应该是有代表性的,并且选择要符合一定的随机原则,以避免观察误差和抽样偏差。
二、建立假设在医学统计学中,我们通常需要提出一个假设来研究和探索问题。
这个假设可以是一个关于总体参数的陈述,我们可以利用样本数据来判断这个假设是否成立。
一般来说,我们提出两个对立的假设,即原假设和备择假设。
原假设通常是一个无关或无差异的假设,而备择假设则是相反的。
三、显著性水平和P值显著性水平是用来评估某个观察结果是否由于偶然误差所导致的概率。
通常情况下,我们会将显著性水平设定为0.05或0.01,代表了我们对接受原假设的程度的容忍度。
而P值则是用来衡量观察结果的统计显著性。
如果P值小于设定的显著性水平,我们就可以拒绝原假设,认为观察结果是有统计学意义的。
四、置信区间置信区间是用来估计总体参数的一种方法。
它给出了一个范围,其中包含了总体参数的真实值的可能性。
置信区间的计算通常基于样本统计量和抽样误差的大小。
一般来说,置信区间的置信水平为95%或99%,意味着在重复抽样的情况下,有95%或99%的置信区间会包含真实值。
五、回归分析回归分析是医学统计学中常用的一种分析方法。
它可以用来探索和预测两个或多个变量之间的关系。
在回归分析中,我们通过建立一个数学模型来描述因变量和自变量之间的关系,并通过拟合该模型来预测未知观测值。
回归分析可以帮助我们理解和解释变量之间的相互作用,对于研究和应用医学中的复杂问题有着重要的意义。
六、生存分析生存分析是一种特殊的统计方法,用于研究在给定时间内发生某个事件的概率。
医学统计学名解和简答
医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。
2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。
3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。
4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。
5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。
如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。
6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。
7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。
8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。
9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。
10.方差:将离均差平方和再取平均其结果。
11.标准差:总体观察值中个体值的变异强度。
12.正态分布:标准差与均数结合能够完整地概括一个正态分布。
13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。
14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。
15.标准误:标本均数的标准差6-,又称(简写SE)。
16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。
17标准差:是一组观察值变异程度的指标。
18总变异=组间变异+组内变异。
19. 率:是表示某种现象发生的频率和强度。
20.构成比:表示事物内部各个组成部分所占整体的比重。
21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。
23. 确定组距:将全距除以组数可得到组距的近似值。
24.确定组限:实际组限在每组中只包含下限而不包含上限。
25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。
医学统计学考试必会名词解释
观察单位某种观察值(变量值)的集合。
这种特征称为变量。
大小所得的资料,一般用度量衡单位。
进行分组,然后计数各组该观察指标的数目所得的资料。
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素是测量仪器或方法的灵敏度。
一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),称为负偏态。
用的平均数有算术均数、几何均数及中位数。
母μ表示总体均数,用x表演示样本均数。
态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。
即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X ×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2)比较均数相差悬殊的几组资料的离散程度。
及生化指标常数,也称正常值。
波动。
称为抽样误差。
本均数的标准差称为标准误,其计算公式为。
面。
般取α=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为0.05。
H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。
组观察单位数。
等级资料又称为有序资料。
或偏低。
取值服从特定的概率分布。
X服从正态分布N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
构成比、相对比。
频率或强度,又称频率指标。
常用百分率、千分率、万分率或十万分率等表示。
比,说明事物内部各部分所占的比重。
常用百分数表示。
倍或几分之几。
两个指标可以是绝对数、相对数或平均数;或以性质相同,也可以性质不同。
医学统计学复习资料
医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
医学统计学复习题(名词解释和简答)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学复习资料
一、名词解释1。
概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。
2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
3。
医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95%4。
总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。
4。
总体:根据研究目的所确定的同质观察单位的全体。
5。
线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。
二、填空题1.统计资料的类型分:计量资料、计数资料、等级资料。
2。
统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料.3。
统计表的结构为:标题、标目、线条、数字.4。
可信区间的两个要素是:准确度、精密度.5。
方差分析的应用条件为:①各组样本是相互独立的随机样本②来自正态总体③各组总体方差相等,即方差齐性。
6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。
7。
从集中趋势、离散趋势两个方面来描述计量资料的分布特征.三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分)1。
将90名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 CA 作三个差值样本比较的 t 检验B 作三个差值样本比较的方差分析C 作配伍组设计资料的方差分析D 作两两比较的 t 检验2。
某地1952和1998年三种死因别死亡率绘制成统计图,宜用 BA 直条图B 百分条图C 圆图D 直方图3.下列哪个变量为标准正态变量 BA B C D4。
某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数5。
医学统计学
一、名词解释:定量数据:用仪器、工具等方法获得的数据。
定性数据:按某种属性分类,然后清点每类的数据。
有序分类资料:半定性或半定量的观察结果,有大小顺序。
统计学:是收集、分析、解释与呈现数据资料的一门科学。
同质:指事物的性质、影响条件或背景相同或非常相近。
变异:指同质的个体之间的差异。
参数:总体的统计指标。
统计量:样本的统计指标。
总体:根据研究目的而确定的同质单位。
样本:从总体中随机抽取部分观察单位某变量值的集合。
变量:是观测单位的某种特征或属性,变量的观测值就是变量值。
概率:是度量随机事件发生可能性大小的数值。
分类变量:其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组然后汇总各组个数所得到的数值。
数值变量:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位,所得资料称为计量资料。
普查:就是全面调查,即调查目标总体中全部观察对象。
抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。
极差:及全距,是全部数据中最低值与最小值之差。
上下限:每个组段的起点称为该组的下限,终点称为该组的上限。
平均数:反映资料的集中趋势的指标。
几何均数:变量对数值的算术平均数的反对数。
中位数:是一个位置指标,它是将一组观察值按大小顺序排列后位次居中的数值。
百分位数:是指将观察值从小到大排列后处于第X百分位置上的数值。
方差:样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。
标准差:将方差开方即得到标准差。
变异系数:是极差和方差一样都是反映数据离散程度的绝对值。
正态分布:就是一种重要的连续型随机变量的分布类型。
率:是指某种现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比:即比例,是指事物内部某一组成部分观察单位数与同一事物各组成分的观察单位总数之比。
相对比:简称比,是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有以下二种:系统误差和随机误差 。
11. 可信区间(confidence interval, CI ):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。
12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。
常用的可信度为95%和99%,故常用95%和99%的可信区间。
13. 变异(variation):同质事物间的差别。
由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。
14. 组间变异(variation between group):用各组均数与总均数的离均差平方和表示∑-=i 2i i )x x (n S 组间S ν组间=k -1,k 为实验分组数,组间均方为MS 组间=SS 组间/( k -1)15. 组内变异(variation within group):用各组均数与总均数的离均差平方和表示 ∑∑∑-=-=i 2i i i j 2i ij )s (n )x (x S 1组内S ,各组自由度为n i -1,则组内自由度为ν组内=N -k ,组内均方为MS 组内=SS 组内/( N -k ) 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。
这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。
17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。
适用于偏态分布资料或不规则分布资料和开口资料。
所谓“开口”资料,是指数据的一端或两端有不确定值。
当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。
18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。
19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。
100%X s/CV ⨯=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
20. 统计表(statistical table):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
21. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 试验的总次数发生的试验次数A ==n m f 称为事件A 在n 次试验中出现的频率(relative frequency)。
m 称为出现的频数(frequency)。
在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。
频率是概率的估计值。
22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。
描述随机事件发生的可能性大小的数值,常用P 来表示。
23. 统计量(statistic):由样本所算出的统计指标或特征值。
24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。
25. 回归系数(regression coefficient):直线回归方程Y ˆ= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。
26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。
绝大多数:可以是90%、95%、99%等等,最常用的是95%。
正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。
又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
习惯上是确定包括95%的人的界值。
27. 正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两种类型。
非对称分布又称为偏态分布,是指观察值偏离中央的分布。
当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,如人体中一些重金属元素的分布等。
反之,尾部偏向数轴负侧(或左侧)时,则称为负偏态(或左偏态)分布。
28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。
29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。
据此,样本均数的标准差X σ称为标准误。
30. 参数估计(parameter estimation):由样本信息估计总体参数。
它包括两种:点估计(point estimation)和区间估计(interval estimation)。
31. 点估计(point estimation):直接用样本统计量作为对应的总体参数的估计值。
32. 区间估计(interval estimation):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。
这种估计方法称为区间估计。
33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。
34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。
35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。
36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。
37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。
这类统计推断的方法叫参数统计或参数检验。
参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。
如t 、u 检验、方差分析。
38. 非参数检验:适用于任意分布(distribution free)的统计方法,这种方法称为非参数统计。
这种假设检验方法,比较的是分布而不是参数,故称为非参数检验。
非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametric test).39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。
常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。
其计算公式为:(K)比例基数单位总数可能发生某现象的观察单位数实际发生某现象的观察率⨯= 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:100%⨯=的观察单位总数同一事物内各组成部分位数某一组成部分的观察单构成比 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。
其计算公式为:比=A/B 。
统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。
总体(population ):大同小异的研究对象全体。