医学统计学-名词解释2
医学统计学名解
医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。
5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。
变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。
6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。
从总体中随机抽取的部分研究对象称为样本。
7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。
由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。
8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。
而通过样本资料计算出来的相应指标称为统计量。
9.概率:随机事件发生可能性大小的数值度量。
10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。
计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
一般具有度量衡单位,如身高(cm)、体重(kg)等。
11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。
一般无度量衡单位,如性别、职业、血型等。
12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。
各属性之间有程度的差别,互不相容。
14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。
医学统计学名词解释
医学统计学名词解释总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
分层抽样:先按对主要研究指标影响较大的某种特征,将总体分为若干类别再从每一层随机抽取一定数量的观察单位,合起来组成样本。
随机抽样:总体中的每一个观察单位都有同等机会进入样本。
整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。
系统抽样:又称为等间隔抽样或机械抽样。
首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r个观察单位组成样本。
抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。
调整后的率未标准化率,简称标化率,亦称调整率。
Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
医学统计学考试必会名词解释
,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学考试必会名词解释
P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右x表演示样本均数。
R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。
=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。
医学统计学名词解释
1.标准化法:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成的影响。
2.总体与样本:总体是同质的个体所构成的全体。
样本是指从总体中抽取的一部分个体(或按随机化原则从总体中抽出的部分观察单位的某变量值的集合)。
3.负偏态分布:频数分布的高峰向右偏移,长尾向左侧延伸的偏态分布,称为负偏态分布。
4.计数资料与计量资料:计数资料是先将研究对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料;计量资料是对每个观察对象德观察指标用定量方法测定其数值大小所得的资料。
5.均数的标准误:由抽样而造成的样本均数与总体均数之差异称为均数的抽样误差。
6.齐同可比性:两组间除处理因素不同外,其他可能影响实验结果的因素要求基本齐同。
7.参数与统计量:总体的指标值称为参数。
样本的指标值称为统计量。
8.正偏态分布:频数分布的高峰向左偏移,长尾向右侧延伸的偏态分布,称为正偏态分布。
9.区间估计与点估计:按预先给定的的概率估计未知总体均数的可能范围称为区间估计,用样本统计量直接作为总体参数的估计值称为点估计。
10.standard error of rate:率的标准误。
由抽样而造成的样本率与总体率之差异或各样本率之差异称为率的抽样误差。
11.P值:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率。
(或拒绝H0时可能犯错误的实际概率大小)12.均数抽样误差:由抽样造成的样本均数与总体均数的差异。
13.率和构成比:构成比表示一事物内部各组成部分所占整体的比重。
率为表示某事物发生频率或强度的指标。
14.非参数检验:不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验的统计方法。
15.P值与检验水准:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率(或拒绝H0时可能犯错误的实际概率大小);检验水准是指在检验前预先人为规定的拒绝H0时可能犯错误的最大概率。
医学统计学名词解释
医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
医学统计学名词解释
统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
16.方差(variance):又称均方差,反映一组数据的平均离散水平。
医学统计学名词解释
统计学(statistics)统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。
医学统计学(medical statistics)是以医学理论为指导,借助概率论和数理统计的原理和方法研究医学现象中数据的搜集、整理、分析和推断的一门应用学科。
变异(variation)是社会和生物医学中的普遍现象。
变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。
计量资料measurement data(定量变量quantitative data、数值变量)指对每个观察单位用定量方法测定某项指标所得的数值。
基本特征:①有定量手段或工具;②一般有度量衡单位;③往往带有小数点。
计数资料enumeration (counting) data(定性数据qualitative data、分类资料)指先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得资料基本特征为:①无顺序分组;②清点每组个数。
等级资料ranked data(有序分类资料ordinal data、有序资料)指先按某种属性的不同程度分组,再清点各组观察单位个数所得资料。
特征:①顺序分组;②清点各组个数变量variable——可以测量的任何特征或属性Any characteristic or attribute that can be measured。
(不同个体结果可能不同)随机变量random variable——在概率论中称变量为随机变量对随机变量的取值过程为测量。
取值所采用的标准为测量尺度。
同质(homogeneity):指对研究指标有影响的因素尽可能的相同。
变异(variation) :指观察结果间的差异和指标值间的不同。
总体population:根据研究目的确定的同质研究对象的全体(集合)。
分有限总体与无限总体样本sample:从总体中随机抽取的部分研究对象随机抽样random sampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)参数parameter:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
医学统计学名词解释
医学统计学名词解释医学统计学是一门研究医学领域中数据收集、分析和解释的科学,它广泛应用于医疗研究、临床试验和流行病学研究等领域。
以下是一些医学统计学中常用的名词解释。
1. 随机化:随机化是一种将研究对象随机分配到不同组别的方法,以减少样本偏差和实验结果的误差。
2. 试验组和对照组:在临床试验中,试验组接受新的治疗或干预措施,对照组接受已有的标准治疗或安慰剂,用于比较两种不同治疗方式的效果。
3. 双盲试验:在临床试验中,双盲试验是指研究人员和参与者都不知道所接受的治疗或干预措施是试验组还是对照组,以消除人为偏见的影响。
4. 抽样:抽样是收集研究数据的方法,通过从总体中选择一部分样本进行观察和测量,以推断总体的特征。
5. 样本量:样本量是指在研究中所使用的观察单元的数量,样本量的大小对于研究结果的可靠性和推广性具有重要影响。
6. 方差和标准差:方差是对数据分布离散程度的度量,标准差是方差的平方根,用于衡量数据的变异程度。
7. 显著性水平:显著性水平是在统计假设检验中所设定的接受或拒绝原假设的界限,通常用P值表示。
一般而言,如果P值小于设定的显著水平(通常为0.05),则拒绝原假设。
8. 效应大小:效应大小是用于衡量两组之间差异的大小,常用的度量指标包括风险比、相对危险度和绝对风险差等。
9. 相关性和因果关系:相关性是指两个变量之间存在某种关联,而因果关系则是指一个变量的改变导致另一个变量的改变,需要通过更严格的研究设计来确定因果关系。
10. 生存分析:生存分析是一种用于评估时间至事件发生的统计方法,常用于研究患者生存时间、复发概率和生存率等。
总之,医学统计学中的这些名词是为了帮助研究人员更好地理解、分析和解释医学数据,并进行科学的决策和推断。
医学统计学 名词解释
1、总体:指所有同质观察单位某种观察值的全体。
分为有限总体和无限总体。
2、样本:是从总体中抽取部分观察单位的观测值的集合。
误差:泛指实测值与真实值之差。
统计量:根据样本算得的某些数值特征。
3参数:是关于总体的某些数值特征。
4、抽样误差:即便采用概率抽样方法抽取样本,但样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。
小概率事件原理:当某事件发生概率小于等于0.05时,统计学习惯上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不能发生。
普查:就是全面调查即调查目标总体中全部调查对象。
抽样调查:是一种非全面调查即从总体中抽取一定数量的观察单位组成样本对样本进行调查。
5、常用的概率抽样方法:单纯随机抽样、系统抽样、整群抽样、分层抽样、具体抽样。
非概率抽样方法:偶遇抽样、立意抽样、定额抽样、雪球抽样等。
6、偶遇抽样:又称便利抽样,是指研究者根据实际现实情况,使用最便利的方法来选取样本,可以抽取偶然遇到的人或选择那些距离最近的、最容易找到的人作为调查对象。
7、根据受试对象的不同,实验可分为动物实验、临床试验和现场试验三类。
8、实验设计的基本原则:对照原则、随机化原则和重复原则。
9随机化原则:是指采用随机的方式,使每个受试对象均有同等机会被抽取或分配到实验组和对照组。
10、重复原则:指在相同实验条件下进行多次实验或观察,以提高实验结果的可靠性。
重复原则主要包括:(1)对多个受试对象进行实验。
(2)对同一受试对象进行重复观测。
准确度:指观察值与真值的接近程度,主要受系统误差的影响。
精密度:指在相同条件下对同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。
灵敏度:反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应比较敏感地显示出来。
特异度:反映鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。
11、完全随机设计:是采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察各组的实验效应,是一种考察单因素两水平或多水平效应的实验设计方法。
卫生统计学 名词解释
医学统计学名词解释1.总体与样本:总体是根据研究目的确定的同质研究对象的全体。
样本是总体中具有代表性的一部分个体。
2.交叉设计:一种特殊的自身对照设计。
克服了实验前后自身对照由于观察期间各种非实验因素造成的偏倚。
即将观察对象随机分为两组,并使一组对象先接受处理方式A,再接受处理方式B;另一组先接受B,再接受A,两种处理方式在研究过程中交叉进行。
3.方差:离均差平方和与观测例数之比,反映一组数据的平均变异。
4.检验效能:1-β,也称把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
5.相对比:表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
6.参数与统计量:总体的指标称为参数,用希腊字母表示;样本的指标称为统计量,用英文字母表示。
7.抽样研究与抽样误差:抽样研究是从总体中随机抽取样本,对样本信息进行研究,从而推断总体的研究方法。
抽样误差是由随机抽样造成的样本指标和总体指标之间、样本指标和样本指标之间的差异;其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本指标直接下结论。
8.概率:概率是某随机事件发生可能性大小(或机会大小)的数值度量。
小概率事件是指P ≤0.05的随机事件。
9.统计推断:根据已知的样本信息来推断总体特征的过程称为统计推断。
10.抽样误差:由个体差异和抽样所导致的样本均数和样本均数之间、样本均数和总体均数之间的差异称为均数的抽样误差。
11.第I类错误:指检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。
其发生的概率为α,为已知。
12.第II类错误:指假设检验H0本来不成立,经过检验后被接受了,即“取伪”。
其发生概率为β,为未知。
13.区间估计:区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。
14.随机化原则:随机化原则包括随机抽样和随机分组。
随机抽样是指保证总体中的每一个个体都有同等的机会被抽出来作为样本。
医学统计学名词解释
医学统计学名词解释 Company number【1089WT-1898YT-1W8CB-9UUT-92108】1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
医学统计学名词解释
参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值统计量:统计量是统计理论中用来对数据进行分析、检验的变量总体:是根据研究目的所确定的同质观察单位的全体。
样本:从总体中抽出供研究的观察单位就称为样本。
同质:是指观察单位(研究个体)间被研究指标的影响因素相同。
变量:如果一个变量的取值依赖于某随机现象的基本结果,则称该变量为随机变量,即取值随机会而定的变量,简称变量。
变量值;随机变量的取值称变量值。
变异;即使在同质基础上,个观察单位的特征数值也不尽相同。
计量资料;又称数值变量资料,是用定量方法测定每个观察单位的某项定量指标所得的数据资料。
定性资料;定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。
计数资料;又称分类变量资料,是先将观察对象按某种性质或类别分组,然后清点各组的观察单位数量所得的资料。
统计资料;也称统计信息,是统计部门或单位进行工作所搜集,整理,编制的各种统计数据资料的总称。
小概率事件;把概率很小的随机事件称为小概率事件,一般P小于等于0.05或p小于等于0.01的事件。
均数;是指在一组数据中所有数据之和再除以数据的个数。
平均数;是反映一组同质的数值变量资料的集中趋势或平均水平的指标。
中位数;将数据排序(从大到小或从小到大)后,位置在最中间的数值。
百分位数;如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
四分位间距;是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.抽样误差;由于抽样所致的误差称为抽样误差。
标准差;标准差(Standa rd Deviat ion),也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
医学统计学
一、名词解释:定量数据:用仪器、工具等方法获得的数据。
定性数据:按某种属性分类,然后清点每类的数据。
有序分类资料:半定性或半定量的观察结果,有大小顺序。
统计学:是收集、分析、解释与呈现数据资料的一门科学。
同质:指事物的性质、影响条件或背景相同或非常相近。
变异:指同质的个体之间的差异。
参数:总体的统计指标。
统计量:样本的统计指标。
总体:根据研究目的而确定的同质单位。
样本:从总体中随机抽取部分观察单位某变量值的集合。
变量:是观测单位的某种特征或属性,变量的观测值就是变量值。
概率:是度量随机事件发生可能性大小的数值。
分类变量:其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组然后汇总各组个数所得到的数值。
数值变量:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位,所得资料称为计量资料。
普查:就是全面调查,即调查目标总体中全部观察对象。
抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。
极差:及全距,是全部数据中最低值与最小值之差。
上下限:每个组段的起点称为该组的下限,终点称为该组的上限。
平均数:反映资料的集中趋势的指标。
几何均数:变量对数值的算术平均数的反对数。
中位数:是一个位置指标,它是将一组观察值按大小顺序排列后位次居中的数值。
百分位数:是指将观察值从小到大排列后处于第X百分位置上的数值。
方差:样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。
标准差:将方差开方即得到标准差。
变异系数:是极差和方差一样都是反映数据离散程度的绝对值。
正态分布:就是一种重要的连续型随机变量的分布类型。
率:是指某种现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
构成比:即比例,是指事物内部某一组成部分观察单位数与同一事物各组成分的观察单位总数之比。
相对比:简称比,是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。
医学统计学名词解释
1.统计学(Statistics):运用概率论、数理统计的原理及方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
医学统计学
医学统计学名词解释1.小概率事件:统计学上一般把P≤0.05的事件称为小概率事件,表示某事件发生的可能性很小。
2.一类错误:拒绝了实际上成立的H0,导致结论错误,发生的概率为α。
3.二类错误:不拒绝实际上不成立的H0,导致结论错误,发生的概率为β。
4.标准误:样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
5.同质:是指所研究的观察对象具有某些相同的性质或特征。
6.变异:指同质个体的某项指标之间的差异。
7.医学统计学:关于收集数据、分析数据和由数据得出结论的一组概念、原则和方法的一门学科。
研究对象是有变异的医学现象。
8.变量:是指观察个体的某个指标或特征.9.总体:是根据研究目的确定的同质研究对象的全体。
10.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
11.平均数:是描述一组同质变量值的平均水平或集中趋势的指标。
12.算术均数:描述一组数据在数量上的平均水平,总体均数用μ表示,样本均数用X表示。
【适合正态分布】13.几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平,记为G。
14.中位数:将一组数据由小到大排列,位于中间位置的观测值。
15.百分位数:是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
16.极差:亦称全距,即最大值与最小值之差。
17.四分位数间距:是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用。
18.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
19.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
20.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV表示。
计算:标准差/均数*100%21.正态分布:高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
医学统计学名词解释免费(2)
医学统计学名词解释免费(2)医学统计学名词解释免费26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。
绝大多数:可以是90%、95%、99%等等,最常用的是95%。
正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。
又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
习惯上是确定包括95%的人的界值。
28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。
29. 标准误(standard error, SE):在统计理论样本统计量的标准差称为标准误,用来衡量抽样误差的大小。
据此,样本均数的标准差σ称为标准误。
30. 参数估计(parameter estimation):由样本信息估计总体参数。
它包括两种:点估计和区间估计。
点估计:直接用样本统计量作为对应的总体参数的估计值。
区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI),又称置信区间。
这种估计方法称为区间估计。
33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。
34.Ⅰ类错误(typeⅠerror):统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。
35.Ⅱ类错误(typeⅡerror):统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。
36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学复习题-名词解释
1.总体和样本
总体:根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体。
假想的,无时间和空间概念的,称为无限总体。
样本:从总体中随机抽取的部分个体。
2.随机抽样:总体中的每一个观察单位都有同等机会进入样本。
3.变异:同质事物间的差别。
由于观察单位通常即为观察个体,故变异亦称为个体变异。
4.抽样误差:由个体变异和抽样造成的统计量与参数之间的差别,称为抽样误差。
5.概率与频率
频率:在n 次随机试验中,事件A 发生了m 次,则比值
试验的总次数
发生的试验次数A ==n m f 称为事件A 在n 次试验中出现的频率。
m 称为出现的频数。
概率:在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率,记作P(A)或P 。
描述随机事件发生的可能性大小的数值,常用P 来表示。
6.随机变量
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
7.参数和统计量
(总体)参数:总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
统计量:由样本所算出的统计指标或特征值。
8.百分位数:是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。
9.标准差:是描述个体值变异程度的指标,为方差的算术平方根。
10.变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。
100%X s/CV ⨯=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
11.频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。
12.四分位数间距:上四分位数与下四分位数之差,即L U Q Q Q -=。
其间包含了全部观察值的一半。
13.正态分布:又称高斯分布,如果随机变量X 的分布服从概率密度函数22/2σμ)(X e 2π
σ1f(X)--=(-∞<X <+∞),则称X 服从正态分布,记作X~N(μ, σ2),μ为X 的总体均数,σ2为总体方差。
14.标准正态分布:任何正态分布的X 值通过u 值转换后,称为标准化的正态分布,即u ~N(μ=0, σ2=1)。
μ)/σ(X u -=
15.标准化变换:若原分布服从正态分布,则Z 或u=(x-μ)/σ~N(0,1)就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。
故该变换被称为标准化变换。
16.统计推断:从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。
17.标准误:在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。
据此,样本均数的标准差X σ称为标准误。
18.可信区间:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。
19.检验效能:又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。
20.均方:离均差平方和除以相应自由度,其比值称为均方差,简称均方。
21.平均数:也叫平均值,是一组(群)数据典型或有代表性的值。
这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数、几何平均数、中位数等。
22.相对数:是两个有联系的数据的比值。
23.率:又称频率指标,用以说明某现象发生的频率或强度。
24.比:又称相对比,是两个有关的指标之比,说明两者的对比水平, 以倍数或百分数表示。
25.标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。
调整后的率为标准化率,简称为标化率,亦称调整率。
26.动态数列:是一系列按时间顺序排列起来的统计指标(可以为绝对数、相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。
27.构成比:又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。
28.率的标准误:即样本率的标准差,用来描述样本率的抽样误差,率的标准误越小,则率的抽样误差越小。
p)/n p(1s p -=
29.拟合优度:是指回归直线对观测值的拟合程度。
30.非参数统计:适用于任意分布的统计方法,这种方法称为非参数统计。
31.参数统计:统计推断的目的就是对未知参数进行估计或检验,这类统计推断方法称为参数统计。
32.秩和检验:通过秩次的排列求出秩和,从而对总体的分布进行假设检验的方法。
33.直线回归:又称简单回归,是用直线方程来描述两个变量之间的线性关系。
34.回归系数:直线回归方程Y
ˆ= a+b X ,其中系数b 称为回归系数,也就是回归直线的斜率,表示X 每增加一个单位,Y 平均改变 b 个单位。
35.直线相关:又称简单相关,用以描述呈二元正态分布的变量之间的线性共变关系,常简称为相关。
36.零相关:如果一个变量的增加或减少并不伴随着另一个变量的线性规律性改变,则它们之间没有相关关系,称为零相关,此时r =0。
37.相关系数:用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数。
38.决定系数:回归平方和与总平方和之比,R 2=SS 回/SS 总。
39.秩相关:或称等级相关,是用双变量等级数据作直线相关分析,这类方法由于对原变量分布不作要求,故而属于非参数统计方法。
40.多元线性回归:用回归方程定量地描述一个因变量Y 与多个自变量X 1、X 2、…间的线性依存关系,称为多元线性回归。
41.偏回归系数:多元线性回归模型Y=β0+β1X 1+β2X 2+…+βm X m +e ,其中系数β1, β2,…, βm 称为偏回归系数,简称回归系数。
42.复相关系数:2R R =称为复相关系数,可用来度量Y 与多个自变量间的线性相关程度,亦即
观察值Y 与估计值Y
ˆ之间的相关程度。
43.确定系数:相关系数的平方称为确定系数,它反映回归贡献的程度。
相当于在总离均差平方和中回归能解释的百分比。
即说明回归贡献占Y的总变异中的比例。
44.统计表和统计图
统计表:统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
统计图:用点的位置、线段的升降、直条的长短及面积的大小等几何图形表达事物的统计指标大小、对比关系及变化趋势。
45.安慰剂对照:给对照组受试者使用无药理活性的安慰剂称安慰剂对照。
46.混杂因素:影响效应的非处理因素。
47.系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
48.实验研究:是将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较不同处理因素的效应(或结果)。
49.抽样调查:是用某种抽样方法从总体中抽取一定数量的对象组成样本,再根据样本调查的结果来推断总体的性质,称为抽样调查。
50.简单随机抽样:将总体内的全部观察单位编上号码,再用随机数字表或计算机随机函数按要求产生若干随机数,根据随机数的大小进行抽样。
51.系统抽样:又称为等间隔抽样或机械抽样。
首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r 个观察单位组成样本。
52.分层抽样:在抽样过程中,将总体按某种特征划分为若干个组别、类型或区域等次级总体,统计中称之为层,分别从每层内独立抽取一个随机样本,再合成为总体的一个样本,这种方法称之为分层随机抽样。
53.整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。