名解(医学统计学名词解释)
医学统计学名解
医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。
5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。
变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。
6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。
从总体中随机抽取的部分研究对象称为样本。
7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。
由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。
8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。
而通过样本资料计算出来的相应指标称为统计量。
9.概率:随机事件发生可能性大小的数值度量。
10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。
计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
一般具有度量衡单位,如身高(cm)、体重(kg)等。
11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。
一般无度量衡单位,如性别、职业、血型等。
12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。
各属性之间有程度的差别,互不相容。
14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。
统计名解、填空、改错、问答
医学统计学名解
同质(homogeneity):给个体规定的一些相同性质(使研究变量的已知影响因素齐同) 变异(variation):同质个体的变量值的差异。
个体(individual ),观察单位:统计研究中的基本单位——据研究目的而定 总体(population ):即根据研究目的确定的特定研究对象中的所有观察单位的测量值。
总体的统计指标称为总体参数(param-eter ) ,是固定的常数。
无限总体(infinite population ), 总体中所有所有观察单位不能够标识。
计量资料(数值变量):用仪器、工具或其它定量方法获得的定量结果,一般带有计量单位。
变量值是定量的,表现为数值大小。
计数资料(无序分类变量):定性观察结果,先将观察单位按事物的属性或性质分组,然后清点每组的观察单位数。
是一群分类个体数 等级资料(半定量资料或有序分类变量):半定性或半定量观察结果,先将观察单位按照事物的某种属性的不同程度或某项指标量的大小分成等级,然后清点每个等级的观察单位数。
是一群分级个体数误差(error )指实际观察值与观察真值之差、样本指标与总体指标之差。
系统误差 由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。
随机误差(偶然误差) 是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机地变化,误差变量一般服从正态分布。
频率(frequency ) ,假设在相同条件下,独立地重复做n 次试验,A 在n 次试验中出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率。
当试验重复很多次时,有 P (A )≈ m/n 概率又称为机率(probability ),是度量某一随机事件A 发生可能性大小的一个数值,记作P (A ),0< P (A )<1 。
P (A )越大,A 发生的可能性越大,反之亦然。
医学统计学 名解+习题
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学 名词解释
29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。
30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。
31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料 称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。
24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。
25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
医学统计学名解
1.同质:指符合研究目的所确定的纳入对象和排除对象的条件组合。
观察单位性质大致相同2.变异:同质研究对象某种效应指标测量值的波动性。
性质相同的同质对象的某个或某几个特征的差异,而使得测量结果不同,这种个体间的差异即为变异。
3.计量资料(定量数据):通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
4.计数资料(定性数据):将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
5.总体:根据研究目的确定的同质研究对象测量值的全体,其某种变量值的集合。
6.样本:从总体中随机抽取的部分观察单位,其实测值的集合。
7.参数:总体的统计指标。
8.统计量:样本的统计指标,如样本均数、标准差。
9.系统误差:大小恒定、倾向性、周期性、累加性的偏离真值。
可以通过严格的实验设计预防和技术措施消除。
10.随机误差:排除系统误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小方向不一的随机变化,客观不可避免。
11.小概率事件:P ≤0.05的随机事件称为小概率事件。
12.小概率原理:在统计学上,小概率事件在一次抽样或一次实验中当作不发生。
13.统计描述:用适当的统计统计图(表)和统计指标对原始数据的分布规律及其数量特征进行测定和描述。
14.统计推断:用样本信息推论总体特征的过程。
15.正态分布:是统计学中一种最常见、最重要的连续型变量的对称分布,中间组段频数最多,两侧对称,规律下降。
16.偏态分布:指集中位置偏向一侧,频数分布不对称。
17.标准差:表示每一个数对均值的离散程度,是绝对变异指标。
18.标准误:样本统计量的标准差。
19.95%医学参考值范围:参考值范围是指特定健康人群的解剖、生理、生化等各种数据的波动范围。
习惯确定包括95%的人的界值即95%医学参考值范围。
20.95%可信区间:表示该区间包括总体均数的概率为95%。
21.率:说明某现象发生的频率或强度。
医学统计学-名词解释
医学统计学-名词解释统计学1.医学统计学:是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。
(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素)2.同质:性质相同的事物成为同质的,否则成为异质的或间杂的。
(观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)3.变异:是指在同质的基础上各观察单位(或个体)之间的差异。
4.总体:总体是根据研究目的所确定的同质观察单位的全体。
5.样本:样本是从总体中随机抽取的部分个体。
(样本中包含的个体数称为样本含量)6.随机:即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。
(包括抽样随机、分组随机、实验顺序随机)7.统计量:由样本所算出的统计指标或特征值称为统计量。
(反映样本特性的有关指标)8.参数:总体的统计指标或特征值称为参数。
(总体参数是事物本身固有的、不变的,为常数)9.抽样误差:从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
这种在抽样研究中不可避免。
(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率:描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。
11.频率:用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。
显然有 f = m / n12.小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。
(为进行统计推断的依据)13.定量资料:以定量值表达每个观察单位的某项观察指标,如血脂,心率等。
医学统计学名解
1、总体(population):是根据研究目的确定的同质研究对象的全体。
2、样本(sample):从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学名解
医学参考值范围:指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
标准误:表示样本均数间变异程度。
率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
变异:同一性质的事物,其观察值之间的差异。
可信区间:总体参数的所在范围通常称为参数的可信区间,即该区间以一定的概率包含总体参数。
这类“弃真”的错误称为I型错误。
I型错误:拒绝了实际撒谎能够成立的H0,II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。
参数检验:一种要求样本来自总体分布型已知,在这种假设基础上,对总体参数进行统计推断的假设检验。
非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。
直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。
相关系数没有单位,取值范围是-1〈=r〈=1,r的绝对值越大表明两变量的关系越密切。
等级相关:是对等级数据作相关分析,它又称为秩相关,是一种非参数统计方法。
随机抽样:是指按照随机化的原则(。
),从总体中抽取部分观察单位的过程。
计量资料:对每个观察单位用定量方法测定某项指标量的大小,所得资料为计量资料,一般有度量衡单位。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料,频率:在相同的条件下,独立重复做n 次试验,事件 A 出现了m 次,则比值m/n 称为随机事件 A 在n 次试验中出现的频率。
医学统计学名词解释名解复习资料
1. 总体(population):根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。
假想的,无时间和空间概念的,称为无限总体(infinite population)。
2. (总体)参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
3. 样本(sample):从总体中随机抽取的部分个体。
4. 样本含量(sample size):样本中所包含的个体数。
5. 变量(variable):观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。
变量的取值称为变量值或观察值(observation)。
根据变量的取值特性,分为数值变量和分类变量。
6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
对每个观察单位用定量的方法测定某项指标的数值,组成的资料。
7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。
2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。
医学统计学名词解释
医学统计学名词解释统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
医学统计学重点简答题和名词解释
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
医学统计学名词解释
统计学(statistics)统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。
医学统计学(medical statistics)是以医学理论为指导,借助概率论和数理统计的原理和方法研究医学现象中数据的搜集、整理、分析和推断的一门应用学科。
变异(variation)是社会和生物医学中的普遍现象。
变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。
计量资料measurement data(定量变量quantitative data、数值变量)指对每个观察单位用定量方法测定某项指标所得的数值。
基本特征:①有定量手段或工具;②一般有度量衡单位;③往往带有小数点。
计数资料enumeration (counting) data(定性数据qualitative data、分类资料)指先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得资料基本特征为:①无顺序分组;②清点每组个数。
等级资料ranked data(有序分类资料ordinal data、有序资料)指先按某种属性的不同程度分组,再清点各组观察单位个数所得资料。
特征:①顺序分组;②清点各组个数变量variable——可以测量的任何特征或属性Any characteristic or attribute that can be measured。
(不同个体结果可能不同)随机变量random variable——在概率论中称变量为随机变量对随机变量的取值过程为测量。
取值所采用的标准为测量尺度。
同质(homogeneity):指对研究指标有影响的因素尽可能的相同。
变异(variation) :指观察结果间的差异和指标值间的不同。
总体population:根据研究目的确定的同质研究对象的全体(集合)。
分有限总体与无限总体样本sample:从总体中随机抽取的部分研究对象随机抽样random sampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)参数parameter:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
名词解释医学统计学
名词解释医学统计学《名词解释医学统计学》医学统计学,这名字听起来就有点高大上,可实际上呢,它就像咱们生活中的一个小管家,不过管的是医学数据这个大家庭。
医学统计学呀,它主要就是和医学里的各种数据打交道。
想象一下,在医院里每天都有各种各样的信息产生,病人的身高、体重、血压、血糖数值,还有生病的天数、吃了多少药等等。
这些数据就像一群调皮的小娃娃,零零散散地在那。
医学统计学呢,就有本事把这些小娃娃按照一定的规则给排列组合起来。
比如说,把同一种病的病人的相关数据放在一块儿,看看这些病人的年龄分布是啥样的,是年轻人得这种病多呢,还是老年人多。
它还会像个侦探一样,从这些数据里找线索。
比如某种新药上市了,医生给一些病人用了这个药。
医学统计学就可以去分析用了药的这些病人的症状改善情况,是大部分人都变好了呢,还是只有少数人有效果。
这就好比在一堆沙子里找金子,它得通过特殊的方法把那些有用的信息给筛选出来。
再讲讲那些复杂的统计方法吧。
就像做菜一样,不同的菜有不同的做法。
在医学统计学里,有均值、中位数这些概念。
均值就像是把一群人的身高都加起来,然后除以人数得到的那个平均身高。
中位数呢,就是把这些身高数值按照大小顺序排好,正中间的那个数值。
这就好比是在一堆苹果里找最中间的那个苹果。
有时候这个中间的苹果能更好地代表这一堆苹果的情况呢。
在做医学研究的时候,医学统计学可太重要了。
假如有个研究人员想知道某种生活习惯对健康有没有影响。
他收集了一大堆数据,可是没有医学统计学的知识,这些数据就只能是一堆乱糟糟的数字。
而有了医学统计学,就能算出到底这种生活习惯和健康之间有没有联系,联系有多强。
就像两个人之间的关系,是好朋友那种紧密的关系呢,还是只是认识的那种比较淡的关系。
从医生的角度看,医学统计学也是个得力助手。
医生可以根据统计出来的数据来判断疾病的发展趋势。
比如说某种传染病,通过医学统计学对以往病例数据的分析,医生就能大概知道这个传染病在什么季节可能会高发,感染的人群大概会有哪些特征。
医学统计学名词解释
医学统计学名词解释 Company number【1089WT-1898YT-1W8CB-9UUT-92108】1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
医学统计学 名解
absolute frequency频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
age-sexpyramid人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。
它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
Analysis of Variance,简称ANOVA方差分析:又称F检验,是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。
binomial distribution二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
Coefficient of variation变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。
confidence interval可信区间:按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间。
constituent ratio构成比:是指事物内部某一组成部分观察单位数与事物内部各组成部分观察单位总数之比,常用百分数表示。
Correlation coefficient相关系数:又称Pearson积距相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。
dependent variable因变量:指实验中由于实验变量而引起的变化和结果。
Dynamic Series动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势Error误差:观察值与真实值之间的差,一般偏差也称误差。
experimental effect实验效应:处理因素作用于受试对象长生的反应或结局。
factor analysis析因分析:是将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实验因素的单独效应、主效应和因素间的交相呼应geometricmean几何均数:变量对数值的算数均数的反对数。
医学统计学名解和简答
总体:是同质的个体所构成的全体。
样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。
定量资料:是用定量的方法测定观察单位某项指标数值的大小,所得的资料抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。
极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。
使用于:说明传染病食物中毒的最短,最长潜伏期等。
算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。
中位数:居中的位置的数值,当观察例数N为奇数时,中位数是按顺序排列在第N+1/2项的观察值。
当观察例数为偶数时,则中位数是按顺序排列在N/2和N/2+1项之间,即该两项的平均值。
方差:将离均差平方和再取平均其结果。
表示一组数据的平均离散情况标准差:是方差的正平方根,总体观察值中个体值的变异强度。
标准化法:就是在一个指定的标准构成条件下进行率的对比的方法变异:由于生物个体的各种指标所受影响因素是极其复杂的,同质的个体间各种指标存在差异,这种差异成为变异。
正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料符合~标准误:标本均数的标准差6-,又称(简写SE)。
P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。
标准差:是一组观察值变异程度的指标。
总变异=组间变异+组内变异。
率:是表示某种现象发生的频率和强度。
构成比:表示事物内部各个组成部分所占整体的比重。
相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。
一型错误:拒绝了实际上是成立的H。
,这叫一型错误,其概率大小用α表示;第2型错误:接受了实际上不成立的H。
,这类错误称~,概率大小用B表示相关系数:又称积差相关系数,以符号r表示样本相关系数,p表示总体相关系数。
它是说明具有直线关系的两个变量间。
相关关系的密切程度与相关方向的指标描述定量资料集中趋势产用指标有(算术均数),(几何均数),(中位数)描述一群变量值离散趋势常用的指标(方差,极差,四分位数间距,标准差和变异系数实验设计的三个基本要素(受试对象,处理因素,实验效应)统计资料的类型有(定量资料,定性资料,等级资料)统计工作的内容:实验设计收集资料整理资料分析资料资料的类型:1)计量资料2)计数资料3)等级分组资料。
医学统计学的名词解释
医学统计学的名词解释医学统计学是统计学在医学领域的应用与发展。
它的主要目标是通过收集、整理和分析大量的医学数据,从中提取有用的信息和结论,用于解决医学问题和支持医疗决策。
本文将对医学统计学中的一些重要名词进行解释,以便读者更好地理解和应用这些概念。
一、假设检验假设检验是医学统计学中十分常见的方法之一,其目的是通过对样本数据进行分析,评估关于总体的假设是否可以被接受或拒绝。
假设检验基于样本对总体特征进行推断,通常包括对均值、比例、方差等参数的检验。
通过对样本数据进行假设检验,可以帮助医生和研究人员确定某项治疗是否有效,或者某种风险是否存在。
二、风险比风险比是医学统计学中衡量两个不同暴露组风险比较的指标之一。
它通常用于研究风险因素对疾病的影响,比如吸烟与肺癌之间的关系。
风险比可以通过比较两组的发病率得出,其计算公式为发病率1/发病率2。
如果风险比大于1,表示对应的风险因素可能增加患某种疾病的风险。
三、生存分析生存分析是医学统计学中研究个体生存的一种方法。
它主要应用于评估治疗方法对患者生存时间的影响,或者预测某种疾病的生存率。
在生存分析中,经常使用的常见统计指标有生存曲线、中位生存时间和生存率等。
生存分析的应用可以帮助医生和研究人员评估治疗效果,制定更合理的治疗方案。
四、相关系数相关系数是医学统计学中衡量两个变量相关性的指标之一。
它可以帮助研究人员了解两个变量之间的关系强度和方向。
常见的相关系数有皮尔逊相关系数和斯皮尔曼等级相关系数。
皮尔逊相关系数适用于对两个连续变量之间的关系进行衡量,而斯皮尔曼等级相关系数适用于对两个有序变量之间的关系进行衡量。
相关系数的取值范围为-1到1,接近1表示正相关,接近-1表示负相关。
五、敏感性和特异性敏感性和特异性是医学统计学中评估一种诊断方法准确性的重要指标。
敏感性指的是在实际患病情况下,诊断为阳性的比例;特异性则指的是在实际未患病情况下,诊断为阴性的比例。
敏感性和特异性一般在构建诊断试验或疾病筛查模型时得到评估。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小概率原理:某一事件发生的概率很小,称为小概率事件;进而认为在一次事件中不会发生。
抽样误差:由于个体变异及随机抽样而导致的样本统计量之间的差异及样本统计量与总体参数之间的差异。
95%可信区间:用某一范围去估计总体参数所在的位置,可信度是95%。
95%可信区间的可信度:从某总体中随机抽样100次,可计算100个可信区间,理论上来说,其中有95个包含了总体均数。
相关系数:用以说明具有直线关系的两变量间相关关系的密切程度和相关方向的指标。
回归系数b:lxy/lxx 回归直线的斜率表示x每增加一个单位y平均改变b个单位
回归中S y·x :称剩余标准差。
指在总变异中,扣除可由X解释的部分后剩余部分的变异。
假设检验中:P含义:从H0总体中抽样,获得现有差别或更大差别样本的概率。
α水准:在假设检验之前设定的,说明按不超越多大的误差为条件作结论,是犯I型错误的最大风险。
I型错:H0成立,但假设检验拒绝H0接受H1,即弃真,这时所犯的错误。
II型错:H1成立,但假设检验没有接受H1(不拒绝H0),即存伪,这时所犯的错误。
检验效能:又称把握度,(1-β),两总体确有差别,按α水准能发现它们有差别的能力。
中心极限:从均数为u,标准差为sigm的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布均数为u,标准差为sigm X bar.
描述集中趋势的指标有?各用于何情况?答:有算术均数:适用于单峰对称分布的资料。
几何均数:适用于对数变换后单峰对称的资料。
中位数和百分位数:适用于任何资料。
描述离散趋势的指标有?各用于何情况?答:极差:适合任何资料。
四分位数间距:适用于不对称的资料。
方差和标准差:适用于单峰对称分布的资料。
变异系数:用于度量单位不同或均数相差悬殊的两组或多组资料。
标准差和标准误的区别和联系:区别:1)概念不同:标准差是由个体变异造成的,标准误是由抽样误差引起的。
将样本统计量的标准差称为标准误。
2)计算公式不同。
3)性质不同:n越大标准差越稳定,标准误越趋近于0。
4)用途不同:标准差用来估计参考值范围,计算标准误;标准误用来估计参数的可信区间或做假设检验。
联系:1)两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。
2)当样本含量不变时,标准差大,标准误也大,均数的标准差与标准误成正比。
参考值范围和可信区间的区别: 可信区间:按一定概率(可信度)确定的包含未知总体参数的可能范围。
标准差越大,区间越宽;n越大,区间越窄。
参考值范围:按一定比例确定的绝大多数正常人所在的范围。
标准差越大,区间越宽;n越大,区间越稳定。
秩和检验的适用范围:等级资料;定量资料,有截尾值;定量资料,极度偏态;定量资料,分布未知;定量资料,完全随机设计,两组方差悬殊很大;兼有等级和定量性质的资料。
影响样本含量估计的因素有?数据种类;指标间差值;变异度;各组例数分配;设计方法;检验水准、检验效能的大小。
假设检验的基本步骤答:1建立假设检验2确定检验水准3计算检验统计量,界定p值。
4推断结论影响样本含量估计的因素有哪些?数据种类,指标间差值,变异度,各组例数分配,设计方法,检验水准、检验效能的大小。