卫生统计学 名词解释
卫生统计学名词解释
1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位;例如:体重与身高3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数4.二分类变量:称为0-1变量;例如,性别男、女、疾病有、无和结局生、死等;二分类变量常用0和1来编码,0-1变量常称为假变量dummy variable或哑变量,可以和真变量一样参与计算5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质7.变异:同质事物个体间的差异8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合;简言之,研究对象的全体;9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本;简言之,总体中有代表性的一部分;10.参数parameter:是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数mean和总体方差variance11.统计量statistic:由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差;12.因果关系causality:在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系;但也需要时间顺序等标准进行因果判断13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差;主要有以下二种:系统误差和随机误差随机测量误差,抽样误差;14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差;特点:具有累加性;有倾向性;可以消除15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的;特点:随测量次数增加而减小;16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致;特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差;17.抽样误差消除了系统误差,并把随机测量误差控制在一定的范围内,在抽样研究中由于个体差异的存在,造成的样本统计量与总体参数以及样本统计量之间的差别;特点:无倾向性;不可避免;统计上可以计算并在一定范围内控制抽样误差;18.概率:描述随机事件发生的可能性大小的数值,常用P来表示;19.小概率事件:一次试验中不可能发生的事件;通常P﹤或P﹤的事件为小概率事件20.方差:为了能反映每个观察值之间的离散情况,同时又能考虑到观察单位数多少的影响,可取离均差平方和的均数,简称方差21.标准差:由于每一离均差都经过平方,使原来观察值的度量单位也都变为平方单位了;为了还原成为原来的度量单位,所以又将方差开平方,这就是标准差22.变异系数:标准差与均数之比用百分数表示23.率:指某现象实际发生数与可能发生某现象的总数之比,用以说明某现象发生的频率或强度,常以百分率、千分率、万分率或十万分率表示24.构成比:事物内部某一部分的观察数与事物内部各部分的观察单位数总和之比,以百分数表示;说明事物内部各部分所占的比重或分布率构成比概念发生的频率或强度各组成部分所占的比重强调点随机发生事件各部分的构成资料获得较难容易特点不一定合计为100%25.死亡率:指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平26.死因构成:指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性27.死因顺位:是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性28.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率强度;29.患病率:指某时点检查时可能发生某病的一定人群中现患某种疾病的频率;30.二项分布:如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为1-;而且各个观察对象的结果是相互独立的,那么,重复观察n个人,发生阳性结果的人次数X的概率分布为二项分布,记作BX ;n,π;31. Poisson 分布:是一种离散型分布,用以描述罕见事件发生次数的概率分布;常用于研究单位时间内或单位空间内某事件发生不同次数的分布32. 正态分布:正态分布是一种重要的连续型分布;若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布;通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N ;33. 假设检验:又称显着性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断;34. 样本均数抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异;35. 样本均数标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度36. 参数估计的概念:指用样本指标统计量估计总体指标参数;37. 95%可信区间:总体均数的95%置信区间的涵义是指:从理论上来说,做100次抽样,可算得100个可信区间,平均有95个可信区间包括μ估计正确,只有5个可信区间不包括μ估计错误;38. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示;39. 1-β称为假设检验的功效power of a test;其意义是,当所研究的总体与H 0确有差别时,按检验水平α能够发现它拒绝H 0的概率40. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α;41. 相关系数:又称Pearson 积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向;42. 确定系数: 复相关系数的平方称为确定系数, 或决定系数,记为R2,表示回归平方和占总平方和的比例,用以反映线性回归模型能在多大程度上解释反应变量Y 的变异性;其定义为:43. 复相关系数 :确定系数的算术平方根44. 偏相关系数:一般地,扣除其他变量的影响后,变量Y 与X 的相关,成为Y 与X 的45. 实验效应是处理因素作用于受试对象的反应response 和结局outcome,它通过观察指标统计学常将指标称为变量来体现46. 单盲法:受试对象不知道自己分在哪一组;47. 双盲法:受试对象和实验执行者均不知道受试对象分在哪一组;48. 三盲法:受试对象、实验执行者和统计分析人员三者均不知道受试对象分在哪一组;49.寿命表life table,又称生命表、死亡表、死亡率表等,是根据某一特定人群的年龄别死亡率编制出来的一种统计表;50.m x是根据各年龄组的平均人口数P X与相应的死亡数D X计算,它近似地反映X岁年龄组人口在X~X+n年内的死亡率,用公式表示为:51.q x是同时出生的一代人死于某年龄组X~X+n的概率,表示X 岁尚存活者l x在今后n年内死亡的可能性概率;52.尚存人数l x是同时出生的一代人到刚活满X岁时尚生存的人数53.死亡人数d x是同时出生的一代人死于各年龄组X~X+n的人数54.生存人年数是同时出生的一代人,X岁尚存者在今后X~X+n 岁期间的生存人年数,亦称寿命表人口数55.生存总人年数是同时出生的一代人中活到X岁者今后尚能生存的总人年数,是X岁以上各年龄组生存人年数L x的累计和56.期望寿命是同时出生的一代人活到X岁时,尚能生存的平均年数,也称平均可享寿命或平均余年;。
卫生统计学 名词解释
1、动态数列dynamic series--按时间顺序将一系列统计指标(可以使绝对数、相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。
2、统计表的种类---简单表sample table--只按单一变量分组,由一组横标目和一组纵标目组成。
复合表--将两个或两个以上变量结合起来分组,即由一组横标目和两组及以上纵标目结合起来。
3、编制统计表应注意的事项--简明扼要,重点突出;合理安排主语谓语的位置;表内数据要认真核对、准确可靠;4、条图bar chart--用等宽直条的长短表示相互独立的各项指标数量的大小,所比较的数据可以是绝对数也可以是相对数(单式条图/复式条图)。
5、百分条图percent bar chart--表示事物内部各部分的比重或所占比例。
与圆图pie chart类似。
6、线图line chart--线图是用线段的升降表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续性变量。
7、半对数线图semi-logarithmic line chart--用于表示事物的发展速度(相对比);横轴为算术尺度,纵轴为对数尺度;线图上的数量关系为相对数关系。
在比较几组数据的变化速度时,特别是两组数据相差悬殊时,宜选用半对数线图。
8、散点图scatter chart--用点的密集程度、趋势表示两变量间的相关关系。
9、直方图histogram--表示连续型变量的频数或频率分布10、统计地图statistical chart--表示某种现象在地域空间上的分布。
11、箱式图box plot--描述连续型变量的分布特征(5个特征值-最小值、下四分位数、中位数、上四分位数、最大值)12、中心极限定理设从均值为μ,方差为σ的任意一个总体中抽取样本量为n的样本,当n足够大时,样本均值的抽样分布近似服从均值为μ,方差为σ的正态分布。
13.。
卫生统计学
第一章绪论一,名词解释参数:根据总体分布的特征而计算的总体统计指标。
总体:研究目的确定的同质观察单位的全体。
同质:总体中个体具有相同的性质。
变异:同质基础上的个体差异。
样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。
统计量:由总体中随机抽取样本而计算的相应样本指标。
概率:描述随机事件发生的可能性大小的数值。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n 次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
)抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。
二,问答题。
统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。
总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。
抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。
抽样误差不能避免,但可以随着样本含量的增大而减小。
何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。
第二章定量资料的统计描述一、名词解释频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。
标准差:也称均方差,是各数据偏离平均数的距离的平均数。
中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。
几何均数:变量对数值的算数均数的反对数。
四分位数间距:百分位数P75和百分位数P25之差。
卫生统计学名词解释
卫生统计学名词解释一、基础概念1.总体(Population):在一定时空范围内同质的所有观察单位或个体的集合。
2.样本(Sample):从总体中随机抽取的一部分观察单位的集合。
3.变量(Variable):观察单位的基本特征或特性,可以分为定量变量和定性变量。
4.总体参数(Population Parameter):描述总体特征的概括性数值,如总体均数、总体率等。
5.样本统计量(Sample Statistic):描述样本特征的数值,如样本均数、样本率等。
二、资料类型与搜集方法1.计数资料(Count Data):通过计数或分类得到的资料,一般用相对数(率)表示。
2.计量资料(Measure Data):通过测量得到的数值资料,一般用均数、中位数等表示。
3.等级资料(Ordinal Data):具有一定顺序或等级的资料,一般用等级或有序分类表示。
4.调查法(Survey Method):通过问卷、访谈等方式收集资料的方法,常用于大样本调查。
5.实验法(Experimental Method):通过实验设计、随机分组等方式收集资料的方法,常用于实验研究。
6.观察法(Observational Method):通过观察记录收集资料的方法,常用于临床观察、生态学研究等。
7.纵向研究(Longitudinal Study):对同一组观察单位在不同时间点进行重复观察的方法,可获取纵向数据。
8.横向研究(Cross-sectional Study):在某一时间点对不同组观察单位进行同时观察的方法,可获取横截面数据。
9.随机抽样(Random Sampling):按照随机原则从总体中抽取样本的方法,保证每个观察单位被抽中的概率相等。
10.系统抽样(Systematic Sampling):按照某种规则或顺序从总体中抽取样本的方法,如每隔一定数量的观察单位抽取一个样本。
三、卫生统计学方法1.描述性统计(Descriptive Statistics):通过对数据进行整理、归类、简化和表示,描述数据的基本特征和分布情况。
卫生统计学名词解释
,样本医学研究中实际观测或调查地一部分个体称为样本,参数用来描述总体特征地指标叫做参数.,统计量,抽样误差抽样误差是指由于随机抽样地偶然周素使样本各单位地结构对总体各单位结构地代表性差别,而引起地抽样指标和全及指标之间地绝对离差.如抽样平均数与总体平均数地绝对离差,抽样成数与总体成数地绝对离差等等.文档收集自网络,仅用于个人学习,概率,小概率事件,定量资料定量资料是以数字形式表现出来地研究资料.,定性资料定性资料是以文字、图形、录音、录象等非数字形式表现出来地研究资料.定性资料有两个来源——实地源和文献源.文档收集自网络,仅用于个人学习,正态分布指变量地频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形地一种概率分布,正态曲线高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交地光滑曲线图().这条曲线称为频数曲线或频率曲线,近似于数学上地正态分布文档收集自网络,仅用于个人学习,医学参考值范围医学参考值范围是指绝大多数正常人地人体形态、功能和代谢产物等各种生理及生化指标地波动范围.这里地“绝大多数”可以是%、%或%等,最常用地是%.所谓“正常人”不是指完全健康地人,而是指排除了影响所研究指标地疾病和有关因素地同质人群.对于服从正态分布地指标,其参考值范围可根据正态分布曲线下面积分布规律确定;对于不服从正态分布地指标,可先进行变量变换使之服从正态分布或直接利用百分位数法制定医学参考值范围.制定某指标地医学参考值范围时,应根据专业知识确定计算双侧参考值范围或单侧参考值范围.若一个指标过大或过小均属异常,则相应地参考值范围既有上限,又有下限,是双侧参考值范围;若一个指标仅过大属于异常,则参考值范围仅有上限;若一个指标仅过小属于异常,参考值范围仅有下限,即所谓单侧参考值范围.文档收集自网络,仅用于个人学习,置信区间总体率地估计包括点估计和区间估计.点估计是直接用样本率来估计总体率,没有考虑抽样误差.区间估计则考虑到抽样误差,按一定地概率-α(即置信度为-α)估计总体率地可能范围,此范围称为总体率地置信区间.文档收集自网络,仅用于个人学习,率,构成比,相对比,相关系数,回归系数,统计推断( ):通过样本指标来说明总体特征,这种通过样本获取有关总体信息地过程称为统计推断.文档收集自网络,仅用于个人学习:非参数检验,针对某些资料地总体分布难以用某种函数式来表达,或者资料地总体分布函数式是未知地,只知道总体分布是连续型地或离散型地,用于解决这类问题需要一种不依赖总体分布地具体形式地统计分析方法.由于该方法不受总体参数地限制,故称为非参数检验,或称为不拘分布地统计分析方法,又称为无分布形式假定地统计分析方法.文档收集自网络,仅用于个人学习、方差():是用来描述一组数据平均离散程度地指标,由离均差地平方和除以样本个数得到.文档收集自网络,仅用于个人学习标准正态分布:均数为,标准差为地正态分布被称为标准正态分布( ),通常记为(, ).文档收集自网络,仅用于个人学习检验效能( ):β称为检验效能,它是指当两总体确有差别,按照规定地检验水准α所能发现该差异地能力.文档收集自网络,仅用于个人学习、总体:根据研究目地确定地同质地观察单位其变量值地集合.、计量资料:又称为定量资料,指构成其地变量值是定量地,其表现为数值大小,有单位.、抽样误差:由于抽样造成地统计量与参数之间地差别,特点是不能避免地,可用标准误描述其大小.、总体均数地可信区间:按一定地概率大小估计总体均数所在地范围().常用地可信度为%和%,故常用%和%地可信区间.文档收集自网络,仅用于个人学习总体:总体()是根据研究目地确定地同质地观察单位地全体,更确切地说,是同质地所有观察单位某种观察值(变量值)地集合.总体可分为有限总体和无限总体.总体中地所有单位都能够标识者为有限总体,反之为无限总体.样本:从总体中随机抽取部分观察单位,其测量结果地集合称为样本().样本应具有代表性.所谓有代表性地样本,是指用随机抽样方法获得地样本..随机抽样:随机抽样()是指按照随机化地原则(总体中每一个观察单位都有同等地机会被选入到样本中),从总体中抽取部分观察单位地过程.随机抽样是样本具有代表性地保证. .变异:在自然状态下,个体间测量结果地差异称为变异().变异是生物医学研究领域普遍存在地现象.严格地说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值地参差不齐..计量资料:对每个观察单位用定量地方法测定某项指标量地大小,所得地资料称为计量资料().计量资料亦称定量资料、测量资料..其变量值是定量地,表现为数值大小,一般有度量衡单位.如某一患者地身高()、体重()、红细胞计数()、脉搏(次分)、血压()等计数资料:将观察单位按某种属性或类别分组,所得地观察单位数称为计数资料().计数资料亦称定性资料或分类资料.其观察值是定性地,表现为互不相容地类别或属性.如调查某地某时地男、女性人口数;治疗一批患者,其治疗效果为有效、无效地人数;调查一批少数民族居民地、、、四种血型地人数等.等级资料:将观察单位按测量结果地某种属性地不同程度分组,所得各组地观察单位数,称为等级资料().等级资料又称有序变量.如患者地治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量地测定结果分为、、等.等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列.等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料..概率:概率()又称几率,是度量某一随机事件发生可能性大小地一个数值,记为(),()越大,说明事件发生地可能性越大.﹤()﹤.频率:在相同地条件下,独立重复做次试验,事件出现了次,则比值称为随机事件在次试验中出现地频率().当试验重复很多次时() .文档收集自网络,仅用于个人学习概率是描述随机事件发生可能性大小地数值,常用表示.随机事件概率地大小在与之间,越接近,表示某事件发生地可能性越大;越接近,表示某事件发生地可能性越小.习惯上将≤地事件,称为小概率事件,表示在一次实验或观察中该事件发生地可能性很小,可视为不发生. . 随机误差:随机误差()又称偶然误差,是指排除了系统误差后尚存地差.它受多种因素地影响,使观察值不按方向性和系统性而随机地变化.误差变量一般服从正态分布.随机误差可以通过统计处理来估计.抽样误差()是指样本统计量与总体参数地差别.在总体确定地情况下,总体参数是固定地常数,统计量是在总体参数附近波动地随机变量..系统误差:系统误差( )是指由于仪器未校正、测量者感官地某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值地两侧,而是有方向性、系统性或周期性地偏离真值.系统误差可以通过实验设计和完善技术措施来消除或使之减少..随机变量:随机变量()是指取指不能事先确定地观察结果.随机量地具体内容虽然是各式各样地,但共同地特点是不能用一个常数来表示,而且,理论上讲,每个变量地取值服从特定地概率分布..参数:参数()是指总体地统计指标,如总体均数、总体率等.总体参数是固定地常数.多数情况下,总体参数是不易知道地,但可通过随机抽样抽取有代表性地样本,用算得地样本统计量估计未知地总体参数..统计量:统计量()是指样本地统计指标,如样本均数、样本率等.样本统计量可用来估计总体参数.总体参数是固定地常数,统计量是在总体参数附近波动地随机变量.文档收集自网络,仅用于个人学习.频数表()用来表示一批数据各观察值或在不同取值区间地出现地频繁程度(频数).对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡,,…个病人地天数.对于散布区间很大地离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数.文档收集自网络,仅用于个人学习.算术均数()描述一组数据在数量上地平均水平.总体均数用μ表示,样本均数用表示.文档收集自网络,仅用于个人学习.几何均数()用以描述对数正态分布或数据呈倍数变化资料地水平.记为.文档收集自网络,仅用于个人学习.中位数()将一组观察值由小到大排列,为奇数时取位次居中地变量值;为偶数时,取位次居中地两个变量地平均值.反映一批观察值在位次上地平均水平.文档收集自网络,仅用于个人学习.极差()亦称全距,即最大值与最小值之差,用于资料地粗略分析,其计算简便但稳定性较差..百分位数()是将个观察值从小到大依次排列,再把它们地位次依次转化为百分位.百分位数地另一个重要用途是确定医学参考值范围.文档收集自网络,仅用于个人学习.四分位数间距()是由第四分位数和第四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料地分布特征,较极差稳定.文档收集自网络,仅用于个人学习.方差():方差表示一组数据地平均离散情况,由离均差地平方和除以样本个数得到..标准差()是方差地正平方根,使用地量纲与原量纲相同,适用于近似正态分布地资料,大样本、小样本均可,最为常用.文档收集自网络,仅用于个人学习.变异系数()用于观察指标单位不同或均数相差较大时两组资料变异程度地比较.用表示.计算:标准差均数* 文档收集自网络,仅用于个人学习.统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息地过程称为统计推断().文档收集自网络,仅用于个人学习.抽样误差:由个体变异产生地,抽样造成地样本统计量与总体参数地差异,称为抽样误差().文档收集自网络,仅用于个人学习.标准误及:通常将样本统计量地标准差称为标准误.许多样本均数地标准差称为均数地标准误(,),它反映了样本均数间地离散程度,也反映了样本均数与总体均数地差异,说明均数抽样误差地大小.文档收集自网络,仅用于个人学习.可信区间:按预先给定地概率确定地包含未知总体参数地可能范围.该范围称为总体参数地可信区间(,).它地确切含义是:可信区间包含总体参数地可能性是α ,而不是总体参数落在该范围地可能性为α .文档收集自网络,仅用于个人学习.参数估计:指用样本指标值(统计量)估计总体指标值(参数).参数估计有两种方法:点估计和区间估计.文档收集自网络,仅用于个人学习.假设检验中地含义:指从规定地总体随机抽得等于及大于(或等于及小于)现有样本获得地检验统计量值地概率.文档收集自网络,仅用于个人学习型和型错误:型错误(),指拒绝了实际上成立地,这类“弃真”地错误称为型错误,其概率大小用α表示;型错误(),指接受了实际上不成立地,这类“存伪”地误称为型错误,其概率大小用β表示.文档收集自网络,仅用于个人学习.检验效能:β称为检验效能(),它是指当两总体确有差别,按规定地检验水准所能发现该差异地能力.文档收集自网络,仅用于个人学习.检验水准:是预先规定地,当假设检验结果拒绝,接受,下“有差别”地结论时犯错误地概率称为检验水准(),记为α . 文档收集自网络,仅用于个人学习..率()又称频率指标,说明一定时期内某现象发生地频率或强度.计算公式为:发生某现象地观察单位数可能发生某现象地观察单位总数*,表示方式有:百分率()、千分率(‰)等.文档收集自网络,仅用于个人学习.构成比()又称构成指标,说明某一事物内部各组成部分所占地比重或分布.计算公式为:某一组成部分地观察单位数同一事物各组成部分地观察单位总数*,表示方式有:百分数等.文档收集自网络,仅用于个人学习.比()又称相对比,是、两个有关指标之比,说明是地若干倍或百分之几.计算公式为:,表示方式有:倍数或分数等. 文档收集自网络,仅用于个人学习.非参数统计:针对某些资料地总体分布难以用某种函数式来表达,或者资料地总体分布地函数式是未知地,只知道总体分布是连续型地或离散型地,用于解决这类问题地一种不依赖总体分布地具体形式地统计分析方法.由于这类方法不受总体参数地限制,故称非参数统计法(),或称为不拘分布()地统计分析方法,又称为无分布型式假定()地统计分析方法.文档收集自网络,仅用于个人学习.参数统计:通常要求样本来自总体分布型是已知地(如正态分布),在这种假设地基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计( )文档收集自网络,仅用于个人学习.秩次:变量值按照从小到大顺序所编地秩序号称为秩次()..秩和:各组秩次地合计称为秩和(),是非参数检验地基本统计量..直线回归()建立一个描述应变量依自变量变化而变化地直线方程,并要求各点与该直线纵向距离地平方和为最小.直线回归是回归分析中最基本、最简单地一种,故又称简单回归().文档收集自网络,仅用于个人学习.回归系数()即直线地斜率(),在直线回归方程中用表示,地统计意义为每增(减)一个单位时,平均改变个单位.文档收集自网络,仅用于个人学习.相关系数:用以描述两个随机变量之间线性相关关系地密切程度与相关方向地统计指标.卫生统计学中地概念资料地类型、总体和样本、参数和统计量、概率和频率.(一)资料地类型.定量资料亦称计量资料,其变量值是定量地,表现为数值大小,一般有度量衡单位,如调查某年某地岁女童地生长发育状况,以人为观察单位,女童地身高()、体重()、血红蛋白(/)等均属定量资料.文档收集自网络,仅用于个人学习.定性资料亦称分类资料,其观察值是定性地,表现为互不相容地类别或属性,分为两种情况:()无序分类资料:包括:①二项分类.如调查吸毒者地感染情况,结果分为阳性与阴性两类,表现为互不相容地两类属性.②多项分类.如人类地血型,以人为观察单位,结果分为型、型、型与型,表现为互不相容地多个类别.文档收集自网络,仅用于个人学习()有序分类资料:各类之间有程度地差别,给人以“半定量”地概念,亦称等级资料.如测定某人群某血清学反应,以人为观察单位,结果可分“-”、“±”、“”、“”级;又如观察某药治疗十二指肠溃疡地疗效,以每个患者为观察单位,治疗效果分为痊愈、显效、好转、无效级.文档收集自网络,仅用于个人学习(二)总体和样本总体就是所有同质观察单位某种观察值(即变量值)地集合.样本是总体中随机抽取部分观察单位地观测值地集合.文档收集自网络,仅用于个人学习(三)参数和统计量总体地数值特征称为参数,用希腊字母表示.根据样本算得地某些数值特征称为统计量,用英文字母表示.在抽样研究中,由个体变异产生,随机抽样引起地样本统计量与总体参数之间地差别称为抽样误差.文档收集自网络,仅用于个人学习(四)概率和频率概率是描述随机事件发生可能性大小地数值,常用表示.随机事件概率地大小在与之间,越接近,表示某事件发生地可能性越大;越接近,表示某事件发生地可能性越小.习惯上将≤地事件,称为小概率事件,表示在一次实验或观察中该事件发生地可能性很小,可视为不发生.文档收集自网络,仅用于个人学习在现实中,随机事件地概率往往是未知地,因此,当观测单位足够多时,常用样本中事件地实际发生率来估计总体概率,这种实际发生率称为频率.设在相同条件下,独立重复进行次试验,事件出现次,则事件出现地频率为/.如治疗例患者,名患者治愈,治愈率为%,这就是一个频率.当观测单位较少时,用频率估计概率是不可靠地.文档收集自网络,仅用于个人学习。
实用卫生统计学中经常考到的一些名词解释
实用卫生统计学中经常考到的一些名词解释1. 总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
例如,研究某地区成年人的血压情况,该地区的所有成年人的血压值就构成了一个总体。
2. 样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
比如从上述某地区成年人中随机抽取的一部分人的血压值,就是一个样本。
3. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
例如,身高、体重、血压等的测量值资料。
4. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
如某班级学生的性别(男、女),某种疾病的患病情况(患病、未患病)等资料。
5. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
比如,临床疗效分为治愈、显效、好转、无效等不同等级的资料。
6. 变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。
在自然状态下,个体间测量结果存在差异是普遍现象。
7. 算术均数:描述一组数据在数量上的平均水平。
总体均数用希腊字母μ表示,样本均数用$\bar{x}$表示。
8. 几何均数:可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平,适用于对数正态分布或数据呈倍数变化的资料。
9. 中位数:将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;n 为偶数时,取位次居中的两个变量的平均值。
10. 四分位数间距:是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,用于描述偏态分布资料的分布特征,比极差稳定。
11. 方差:表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,可用来描述数据的离散趋势。
13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
卫生统计学名词解释
【下载本文档,可以自由复制内容或自由编辑修改内容,更多精彩文章,期待你的好评和关注,我将一如既往为您服务】卫生统计学名词解释总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。
样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料变量:观察单位或个体的某种属性或标志称为变量变量值:对变量进行测量或观察的值称为变量值。
分类变量变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
数值变量:概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1.小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。
频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
算术均数:描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示。
几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
卫生统计学名词解释
卫生统计学名词解释
1、健康统计学:健康统计学是一门应用统计学原理分析健康情况的科学。
它主要着
重于研究健康、疾病和死亡的结构与模式。
2、疾病统计学:疾病统计学是一种应用统计学方法来研究疾病发生状况,以及发病
病因、发病风险、具体确诊、基因变异、治疗策略与预后等。
3、预防医学统计学:预防医学统计学是一门研究应用统计学原理来预测,诊断和控
制疾病发生和传播的科学学科,其目的是为了健康提供预防措施。
4、流行病学统计学:流行病学统计学是指利用统计学方法,对流行病的起源、传播、疫情的时序、拓展及最终的控制,以及社会和环境因素如生活方式、卫生保健和营养等与
疾病发生关系的研究。
5、生活质量统计学:生活质量统计学是研究利用统计学方法,评价疾病和对某项病
症所面临的威胁及疾病治疗和护理所产生的影响。
它可用于有效评估患者的最终疗效情况,改进患者的健康状况,以及优化改善患者的生活质量。
6、母婴卫生统计学:母婴卫生统计学是指利用统计学方法研究分析母婴的健康状况,以及母婴卫生保健服务、母婴健康管理和干预护理方法对母婴健康状况的影响,以及可能
存在的风险和危害因素。
7、公共卫生统计学:公共卫生统计学是了解、识别和控制公共卫生行业中复杂健康
问题的科学。
它结合统计学方法、生物数据学和社会行为研究的原理,分析卫生问题,并
找出有效的应对之道。
卫生统计学 名词解释
1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
例如:体重与身高3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数4.二分类变量:称为0-1变量。
例如,性别(男、女)、疾病(有、无)和结局(生、死)等。
二分类变量常用0和1来编码,0-1变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质7.变异:同质事物个体间的差异8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。
简言之,研究对象的全体。
9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。
简言之,总体中有代表性的一部分。
10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance)11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。
12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。
但也需要时间顺序等标准进行因果判断13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。
14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
卫生统计学名词解释
卫生统计学名词解释1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。
2、标准误:将样本统计量的标准差称为标准误。
3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。
4、u分布:若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,1 2),即u分布。
5、t分布:在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。
6、可信区间:是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。
其确切含义为:如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间。
7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。
然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
8、Ⅰ型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。
Ⅱ型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。
9、检验效能:1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。
10、变量转换:是指原始数据作某种函数转换,如转换为对数值等。
1、方差分析:又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。
2、单向方差分析(one way analysis of variance)是指处理因素只有一个。
这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。
3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)4、LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。
卫生统计学名词解释(带英文)
1.医学统计学(medical statistics)
:是描述、归纳、探索医学数据分布特征和解释数据规律的一门学科,是科研工作者运用概率论与数理统计原理,进行数据的获取、存储及管理和分析,评价人类健康水平,探索疾病发生与发展规律,进行预测评价的方法,是循证实践中数据挖掘不可或缺且起关键作用的一种技术手段。
2、变量(variable)【对应“常量”】
:根据研究目的,对研究对象的某个或某些特征(研究指标或项目)实施观测,这些特征称为变量。
3、P值:在H0成立的条件下,出现该实验结果或更极端情况的概率值。
卫生统计学名词解释
卫生统计学名词解释总体(population):依据研讨目标肯定的同质不雅察单位的不雅察值全部所构成的聚集.样本(sample):从研讨总体中抽取的一部分知足代表性的个别不雅察值所构成的聚集.计量材料:对每个不雅察单位用定量的办法测定某项指标量的大小,所得的材料称为计量材料.计数材料:将不雅察单位按某种属性或类别分组,所得的不雅察单位数称为计数材料.等级材料:将不雅察单位按测量成果的某种属性的不合程度分组,所得各组的不雅察单位数,称为等级材料变量:不雅察单位或个别的某种属性或标记称为变量变量值:对变量进行测量或不雅察的值称为变量值.分类变量变异:在天然状况下,个别间测量成果的差别称为变异(variation).变异是生物医学研讨范畴广泛消失的现象.严厉的说,在天然状况下,任何两个患者或研讨群体间都消失差别,其表示为各类心理测量值的整洁不齐.数值变量:概率:又称几率,是器量某一随机事宜A产生可能性大小的一个数值,随机事宜A产生的概率记为P(A),随机事宜的概率取值在0~1之间,即0≤P≤1.小概率事宜:假如随机事宜产生的概率P≤,或P≤,暗示该事宜产生的可能性很小,对于一次随机抽样,一般认为是不成能产生的事宜.频数表:用来暗示一批数据各不雅察值或在不合取值区间的消失的频仍程度(频数).对于离散数据,每一个不雅察值即对应一个频数,如某病院某年度一日内逝世亡0,1,2…20个病人的天数.对于分布区间很大的离散数据和持续型数据,数据分布区间由若干组段构成,每个组段对应一个频数.算术均数:描写一组数据在数目上的平均程度.总体均数用μ暗示,样本均数用 X 暗示.几何均数:用以描写对数正态分布或数据呈倍数变更材料的程度.记为G.中位数:将一组不雅察值由小到大分列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值.极差:亦称全距,即最大值与最小值之差,用于材料的粗略剖析,其盘算轻便但稳固性较差.百分位数:是将n 个不雅察值从小到大依次分列,再把它们的位次依次转化为百分位.百分位数的另一个重要用处是肯定医学参考值规模.四分位数间距:是由第 3 四分位数和第 1 四分位数相减盘算而得,常与中位数一路应用,描写偏态分布材料的分布特点,较极差稳固.方差:方差暗示一组数据的平均离散情形,由离均差的平方和除以样本个数得到.尺度差:是方差的正平方根,应用的量纲与原量纲雷同,实用于近似正态分布的材料,大样本.小样本均可,最为经常应用.变异系数:用于不雅察指标单位不合或均数相差较大时两组材料变异程度的比较.用CV暗示.正态分布:二项分布:尺度正态变换:将屈服正态分布的原始变量x~n(u,σ),进行变量变换u=(x-u)/σ,这种变换叫尺度正态变换.正常值规模:抽样误差(尺度误):在统一总体中随机抽取样本含量雷同的若干样本时,样本指标之间的差别以及样本与总体指标的差别,称为抽样误差.可托区间:总体参数地点的规模.正常值规模:医学上常把绝大多半正常人的某指标规模称为该指标的参考值规模,也叫正常值规模.构成比:又称构成指标,它暗示事物内部个构成部分所占的比重或分布.相对数:是由两个接洽的指标之比,是分类变量经常应用的描写性统计指标,经常应用的相对数有率.构成比.相比较.率的尺度化法:是用于内部构成不合的两个或多个率比较的一种办法.统计描写:用统计图表或盘算统计指标的办法表达一个群体的某项特点,称为统计描写.假设磨练:是先对总体做出某种假定(磨练假设),然后依据样本信息揣摸其是否成立的一类统计办法.统计揣摸,经常应用办法是参数估量和假设磨练.抽样研讨:从所研讨的总体中随机抽取一部分有代表性的样本进行研讨,用样本指标推论总体,最终达到懂得总体的目标.这种用样本指标推论总体参数的办法称为抽样研讨.参数估量:是指用样本统计量估量总体参数,重要有两种办法:点估量和区间估量.统计表:是以表格的情势列出统计指标,它是对材料进行统计描写时的一种经常应用手腕.统计图:是以各类几何图形(如点.线.面或立体)显示数据的大小.起落.分布以及关系等,它也是对材料统计描写时一种经常应用手腕.均方:均方差(MS)或方差,是由离均差平方和被自由度相除而得.方差剖析:方差剖析(analysis of variance,ANOVA)就是依据材料的设计类型,即变异的不合起源将全部不雅察值总的离均差平方和与自由度分化为两个或多个部分,除随机误差外,其余每个部分的变异可由某个身分的感化(或某几个身分的交互感化)加以解释.经由过程各变异起源的均方与误差均方比值的大小,借助F 分布作出统计揣摸,断定各身分对不雅测指标有无影响.总变异:样本中全部试验单位差别称为总变异.其大小可以用全部不雅察值的均方(方差)暗示.组间变异:遍地理组样本均数之间的差别,受处理身分的影响,这种变异称为组间变异,其大小可用组间均方暗示.组内变异:遍地理组内部不雅察值大小不等,这种变异称为组内变异,可用组内均方暗示.完整随机设计:只斟酌一个处理身分,将全部受试对象随机分派到遍地理组,然后不雅察试验效应,这种设计叫做完整随机设计.随机区组设计:事先将全部受试对象按天然属性分为若干区组,原则是各区组内的受试对象的特点雷同或邻近,且受试对象数与处理身分的程度数相等.然后再将每个区组内的不雅察对象随机地分派到遍地理组,这种设计叫做随机区组设计.非参数磨练:是一种不依附总体分布类型,也不合错误总体参数进行统计揣摸的假设磨练.随机抽样:是指按照随机化的原则(总体中每一个不雅察单位都有一致的机遇被选入到样本中),从总体中抽取部分不雅察单位的进程.随机抽样是样本具有代表性的包管.等级材料:将不雅察单位按测量成果的某种属性的不合程度分组,所得各组的不雅察单位数,称为等级材料.等级材料又称有序材料.如患者的治疗成果可分为治愈好转.有用.无效.逝世亡,各类成果既是分类成果,又有次序和等级不同,但这种不同却不克不及精确测量.参数:是指总体的统计指标,如总体均数.总体率等.总体参数是固定的常数.多半情形下,总体参数是不轻易知道的,但可经由过程随机抽样抽取有代表性的样本,用算得的样本统计量估量未知的总体参数.统计量:是指样本的统计指标,如样本均数.样本率等.样本统计量可用来估量总体参数.总体参数是固定的常数,统计量是在总体参数邻近摇动的随机变量.直线回归:树立一个描写应变量依自变量变更而变更的直线方程,并请求各点与该直线纵向距离的平方和为最小.直线回归是回归剖析中最根本.最简略的一种,故又称简略回归,在直线回归方程顶用b暗示,b的统计意义为X每增(减)一个单位时,Y平均转变b个单位.直线相干:又称简略相干,用于双变量正态分布材料.有正相干.负相干和零相干等关系.直线相干的性质可由散点图直不雅的解释.相干系数:又称积差相干系数,以符号r暗示样底细关系数,ρ暗示总体相干系数.它是解释具有直线关系的两个变量间,相干关系的亲密程度与相干偏向的指标.秩相干又称等级相干,是用双变量等级数据作直线相干剖析,实用于下列材料:⑴不屈服双变量正态分布而不宜作积差相干剖析;⑵总体分布型未知;⑶用等级暗示的原始数据.参数统计:平日请求样本来自总体分布型是已知的(如正态分布),在这种假设的基本上,对总体参数(如总体均数)进行估量和磨练,称为参数统计.秩次:变量值按照从小到大次序所编的秩序号称为秩次.秩和:各组秩次的合计称为秩和,长短参数磨练的根本统计量..随机抽样:是指查询拜访者用随机抽样的办法抽取样本,然后以样本统计量揣摸总体参数的一种研讨办法.经常应用的随机抽样办法有:单纯随机抽样.体系抽样.整群抽样和分层抽样.磨练水准:也称明显性水准,符号位a,是预先划定的概率值,平日取,它是“是否谢绝H0的界线”.磨练效能:又称磨练功能(1-β),它的寄义是:当两总体确切有不同时,按划定的磨练水准a,可以或许发明两总体间差此外才能.可比性:是指除了处理身分外,其他可能影响成果的非处理身分在各组间应当尽可能雷同或邻近,即“齐同”.发病率:指一准时代内,可能产生某病的人群中产生某病新病例数的强度,经常应用于描写急性病的发病情形.患病率:可分为时点患病率与时代患病率,经常应用于描写在这个时光点或时代是否曾处于患病状况,实用于慢性病或发病时光不轻易肯定的疾病患病情形,时代患病率也可以用于估量就医的需求状况.某病病逝世率:指在某一时代内患某病者因该病逝世亡的百分比,可解释一种疾病的轻微程度,也可以反应一个医疗单位医疗水温和医疗质量.某病逝世亡率:是一准时代内或人群因某病而逝世亡的频率.动态数列:按时问次序将一系列统计指标(可认为绝对数,相对数或平均数)分列起来,用以不雅察和比较该事物在时光上的变更和成长趋向生齿金字塔:生齿金字塔:是将生齿的性别和年纪材料联合起来,以图形的方法表达生齿的性别和年纪构成.它以年纪为纵轴,生齿数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以剖析曩昔生齿的出逝世活亡情形以及往后生齿的成长趋向.总和生育率:假定同时出生的一代妇女,按照某年的年纪别生育程度渡过其平生的生育历裎,各年纪别生育率之和乘以年纪组组距,就是这一代妇女平均每人可能生育的后代数.。
卫生统计学名词解释
卫生统计学名词解释(总1页) --本页仅作为文档封面,使用时请直接删除即可--
--内页可以根据需求调整合适字体及大小--
名词解释
1、双盲:研究对象和研究者均不知道研究对象的分组情况,而是由研究设计者来安排和控制全部试验。
2、队列研究:是将人群按照是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。
3、配伍组设计:将全部受试对象按某个或某些重要的属性分组,把条件最接近的k个受试对象分在同一个区组内,然后,用完全随机的方法将每个区组中的全部受试对象分配到k个组中去。
4、试验因素:研究者根据研究目的施加于受试对象,需要观察并阐明其效应的因素。
5、重复测量设计:当受试对象接受某种处理后,在几个不同的时间点上从同一受试对象身上重复获得指标的观测值,有时是从同一个体的不同部位上重复获得指标的观测值,这种试验方法称~
2。
卫生统计学名词解释和简答题
卫生统计学一、名词解释1、总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
2、样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
3、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
4、计量资料定量资料(quantitative data ):亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如上例中的身高(cm)、体重(kg)资料等均为定量资料。
5、定性资料:定性资料(qualitative data ):亦称分类资料(categorical data ),其观察值是定性的,表现为互不相容的类别或属性,一般无度量衡单位。
可进一步细分为以下两种资料。
6、变异系数:变异系数是一种相对变异指标,常用于比较度量单位不同或单位相同但均数相差悬殊的两组或多组对称分布特别是正态分布资料的变异程度。
7、回归系数:b称为回归系数(coefficient of regression),含义为当x每变化1个单位,因变量γ平均变化b个单位。
8、决定系数:也称判定系数或者拟合优度。
它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。
9、率:说明某现象发生的频率或强度的指标。
10、构成比:说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
11、粗出生率:指某年某地平均每千人口的活产数,是反映一个国家或地区的人口自然变动的基本指标。
12、粗死亡率:指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
二、简答题1.简述方差分析的基本思想和应用条件。
方差分析的基本思想:将全部观察值之间的变异按照设计的要求和分析的需要分解成两个或多个部分,然后再作分析。
方差分析的应用条件为:1、各样本是相互独立的随机样本;2、各样本均来自正态分布总体;3、各样本的总体方差相等,即方差齐。
卫生统计学的名词解释重点
卫生统计学的名词解释重点卫生统计学是一门关于卫生与健康领域的统计学科,通过搜集、处理和分析卫生数据,以揭示人类健康状况、疾病发病规律、卫生问题的影响因素,并为卫生政策制定和卫生服务规划提供科学依据。
本文将重点解释卫生统计学中的几个重要概念。
1. 流行病学:流行病学是卫生统计学的基础,它研究人群中疾病的分布、发生率和影响因素。
通过对流行病学的研究,我们可以了解疾病在不同人群中的患病情况,推测可能的病因,制定预防控制策略。
流行病学方法包括横断面研究、队列研究和病例对照研究等。
2. 发病率与死亡率:发病率指在特定时期内某病在人群中新出现的病例数;死亡率指在特定时期内某病造成的死亡人数。
发病率和死亡率通常以每10万人口为单位进行计算,能够客观反映疾病的流行程度和危险程度。
通过比较不同地区、不同人群和不同时间的发病率与死亡率,可以评估疾病的负担和疫情的严重程度。
3. 相对风险与绝对风险:相对风险是指暴露因素与发病率或死亡率之间的关系,用于衡量某一暴露因素对疾病产生风险的相对大小。
绝对风险是指某一暴露因素在人群中发病率或死亡率的绝对值。
了解相对风险和绝对风险有助于我们评估某一暴露因素对疾病的影响程度,进而采取相应的控制措施。
4. 生存分析:生存分析是用于研究疾病发展进程和预测生存时间的统计方法。
它通过分析患者发病到死亡或出现特定事件的时间,给出存活曲线和预测患者生存率。
生存分析可以应用于各种疾病研究,包括癌症、心血管疾病等,为医学决策提供依据。
5. 数据质量:在卫生统计学中,数据质量至关重要。
数据质量涉及数据的完整性、准确性、一致性和可靠性等方面。
在数据收集和处理过程中,需确保数据来源可靠、采样方法合理、数据录入准确、数据分析可靠等,以保证研究结果的科学性和有效性。
6. 规范化:规范化是卫生统计学中常用的分析方法,用于比较不同人群、地区或时间的卫生指标。
规范化可以按照不同的变量进行,如年龄、性别、人群特征等。
卫生统计学 名词解释
医学统计学名词解释1.总体与样本:总体是根据研究目的确定的同质研究对象的全体。
样本是总体中具有代表性的一部分个体。
2.交叉设计:一种特殊的自身对照设计。
克服了实验前后自身对照由于观察期间各种非实验因素造成的偏倚。
即将观察对象随机分为两组,并使一组对象先接受处理方式A,再接受处理方式B;另一组先接受B,再接受A,两种处理方式在研究过程中交叉进行。
3.方差:离均差平方和与观测例数之比,反映一组数据的平均变异。
4.检验效能:1-β,也称把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
5.相对比:表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
6.参数与统计量:总体的指标称为参数,用希腊字母表示;样本的指标称为统计量,用英文字母表示。
7.抽样研究与抽样误差:抽样研究是从总体中随机抽取样本,对样本信息进行研究,从而推断总体的研究方法。
抽样误差是由随机抽样造成的样本指标和总体指标之间、样本指标和样本指标之间的差异;其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本指标直接下结论。
8.概率:概率是某随机事件发生可能性大小(或机会大小)的数值度量。
小概率事件是指P ≤0.05的随机事件。
9.统计推断:根据已知的样本信息来推断总体特征的过程称为统计推断。
10.抽样误差:由个体差异和抽样所导致的样本均数和样本均数之间、样本均数和总体均数之间的差异称为均数的抽样误差。
11.第I类错误:指检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。
其发生的概率为α,为已知。
12.第II类错误:指假设检验H0本来不成立,经过检验后被接受了,即“取伪”。
其发生概率为β,为未知。
13.区间估计:区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。
14.随机化原则:随机化原则包括随机抽样和随机分组。
随机抽样是指保证总体中的每一个个体都有同等的机会被抽出来作为样本。
卫生统计学名词解释
卫生统计学名词解释卫生统计学是指在卫生领域中应用统计学原理和方法进行数据收集、分析和解释的学科。
下面是对一些卫生统计学中常用的名词进行解释:1. 流行病学:研究人群中疾病的发生、分布、传播和控制的科学。
它通过对人群中的风险因素、暴露因素和流行病学指标的研究,来了解疾病的原因及其影响。
2. 统计学:研究如何收集、整理、解释、分析和推断数据的科学。
在卫生统计学中,统计学被用来揭示人群中疾病的分布规律、风险因素和影响因素。
3. 母数:指整个人群中某一属性的真实值。
在卫生统计学中,例如对于某种疾病的患病率,整个人群中的患病率即为母数。
4. 样本:指从整个人群中抽取的一部分个体。
在卫生统计学中,通过对样本进行调查和观察,可以推断出人群整体的情况,例如通过对1000名患者进行调查,了解某种疾病的发病情况。
5. 抽样误差:由于样本抽取的随机性,导致样本的特征和整个人群的特征之间出现差异的误差。
抽样误差的大小会影响对人群整体情况的推断,因此在卫生统计研究中需要尽量减小抽样误差。
6. 随机化:在实验研究中,将研究对象随机分配到不同的处理组中,以消除研究者主观的影响。
通过随机化,可以更加确保实验组和对照组之间的比较结果是真实和可靠的。
7. 平均数:一组数据的加总除以数据个数所得到的值。
在卫生统计学中,平均数常被用来描述人群中某一指标的中心位置,例如平均发病率、平均年龄等。
8. 标准差:用来描述一组数据离散程度或变异性的统计量。
标准差越大,表示数据的离散程度越大;标准差越小,表示数据的离散程度越小。
在卫生统计学中,标准差常被用来描述疾病发病率在人群中的变异程度。
9. 置信区间:用来估计样本统计量与母数之间差异的一种区间估计方法。
在卫生统计学中,置信区间常被用来估计疾病患病率、死亡率等指标在整个人群中的范围。
10. 显著性检验:用来检验两组或多组数据是否具有显著差异的统计方法。
在卫生统计学研究中,显著性检验常被用来确定某种因素对疾病是否产生影响,以及差异是否由于随机因素引起。
卫生统计的名词解释
名解(红色字体的营销专业不要求,蓝色字体的非营销专业不要求)1、非参数检验(nonparametric test )如已知总体分布与检验所要求的条件不符,即使经变量变换仍不满足条件,或不知道所研究样本来自的总体分布型,应用时可以不考虑被研究对象为何种分布以及分布是否已知,也由于这种假设检验方法并非是参数间的比较,而是用于分布之间的比较,故称为非参数检验。
2、参数检验(parametric test)以某一特定分布(如正态分布)为前提,推断两个或两个以上的总体参数是否相等的假设检验方法。
3、相关系数:说明具有直线关系的两变量间相关方向与相关的密切程度4、动态数列:按照一定的时间顺序,将某事物的统计指标依次排列起来,以便于观察和比较该事物在时间上的发展变化趋势。
5、同质(homogeneity):指被研究指标的影响因素相同.6、变异(variation):指在同质的基础上各观察单位之间的差异叫变异。
7、总体(population):是根据研究目的同质个体的全体,更确切地说,是其个体值的全体。
8、样本(sample):是从总体中随机抽取的一部分个体或个体值,每个被抽到的个体可称为样品,样本中所包含的个体或个体值的个体称为样本含量。
9、总体参数:根据总体个体值统计计算出来的描述总体(更确切地说,是指有规律分布的总体)的特征量,称为总体参数。
10、样本统计量:与总体均数相对应,根据样本个体值计算出来的描述样本的特征量。
11、抽样误差:由于变异与抽样造成的样本统计量和总体参数的差别。
12、概率(probability):是描述随机事件发生可能性大小,用P 表示。
(0≤P ≤1)13、统计描述:指用统计指标、统计表和统计图对资料的数量特征及分布规律进行描述。
14、统计推断 : 指由样本统计量推断总体参数和分布,即由样本信息对相应总体的特征进行推断.。
15、计量资料:为测定每个观察单位某项指标的大小而获得的资料。
卫生统计学名词解释
卫生统计学名词解释卫生统计学名词解释1、typical survey:典型调查,典型调查就是在调查对象中有意识的选择若干具有典型意义或者代表的单位进行非全面调查。
2、箱式图(box plot):用于多组数据的直观比较分析。
一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。
3、二项分布(binorminal distribution):若一个随机变量X,它的可能取值是0,1,…,n,而且相应的取值概率为称此随机变量X服从n,π为参数的二项分布。
4、morbidity statistics:疾病统计,是居民健康统计的重要内容之一,它的任务是研究疾病在人群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提供科学依据。
5、life expectancy:期望寿命,是指x岁尚存者预期平均尚能存活的年数,它是评价居民健康状况的主要指标。
6、life table:寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。
由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影响,不同人群的寿命表指杯具有良好的可比性。
7、预测(forecast):这是回归方程的重要应用方面。
所谓预测就是把预测因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计,其波动范围可以按照个体Y值容许区间方法计算。
8、standard deviation:标准差,常用来描述数据离散趋势的统计指标,其能反映均数代表性的好坏,以及变量值与均数的平均离散程度。
9、cluster sampling:整群抽样,首先将总体按照某种与研究目的无关的分布特征(如地区范围、不同的团体、病历、格子等)划分为若干个“群”组,每个群包括若干观察单位;然后根据需要随机抽取其中部分“群”,并调查被抽中的各”群”中的全部观察单位。
这种抽样方法称为整群抽样。
10、precision:精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随机误差11、正交设计(orthogonal design):当实验涉及的因素在三个或三个以上,且因素间可能存在交互作用时,可用正交试验设计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量
2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
例如:体重与身高
3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数
4.二分类变量:称为0-1变量。
例如,性别(男、女)、疾病(有、无)和结局(生、死)等。
二分类变量常用0和1来编码,0-1
变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算
5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料
6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质
7.变异:同质事物个体间的差异
8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。
简言之,研究对象的全体。
9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。
简言之,总体中有代表性的一部分。
10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance)
11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。
12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。
但也需要时间顺序等标准进行因果判断
13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。
14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
特点:具有累加性;有倾向性;可以消除
15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
特点:随测量次数增加而减小。
16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致。
特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差。
17.抽样误差消除了系统误差,并把随机测量误差控制在一定的范围内,在抽样研究中由于个体差异的存在,造成的样本统计量与总体参数以及样本统计量之间的差别。
特点:无倾向性;不可避免。
统计上可以计算并在一定范围内控制抽样误差。
18.概率:描述随机事件发生的可能性大小的数值,常用P来表示。
19.小概率事件:一次试验中不可能发生的事件。
通常P﹤0.05或P﹤0.01的事件为小概率事件
20.方差:为了能反映每个观察值之间的离散情况,同时又能考虑到观察单位数多少的影响,可取离均差平方和的均数,简称方差21.标准差:由于每一离均差都经过平方,使原来观察值的度量单位也都变为平方单位了。
为了还原成为原来的度量单位,所以又将方差开平方,这就是标准差
22.变异系数:标准差与均数之比用百分数表示
23.率:指某现象实际发生数与可能发生某现象的总数之比,用以说明某现象发生的频率或强度,常以百分率、千分率、万分率或十万分率表示
24.构成比:事物内部某一部分的观察数与事物内部各部分的观察单位数总和之比,以百分数表示。
说明事物内部各部分所占的比重或分布
率构成比
概念发生的频率或强度各组成部分所占的比重
强调点随机发生事件各部分的构成
资料获得较难容易
特点不一定合计为100%
25.死亡率:指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平
26.死因构成:指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性
27.死因顺位:是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性
28.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率(强度)。
29.患病率:指某时点检查时可能发生某病的一定人群中现患某种疾病的频率。
30.二项分布:如果每个观察对象阳性结果的发生概率均为 ,阴
性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人次数X 的概率分布为二项分布,记作B (X ;n ,π)。
31. Poisson 分布:是一种离散型分布,用以描述罕见事件发生次数的概率分布。
常用于研究单位时间内(或单位空间内)某事件发生不同次数的分布
32. 正态分布:正态分布是一种重要的连续型分布。
若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。
通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N 。
33. 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。
34. 样本均数抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。
35. 样本均数标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度
36. 参数估计的概念:指用样本指标(统计量)估计总体指标(参数)。
37. 95%可信区间:总体均数的95%置信区间的涵义是指:从理论上来说,做100次抽样,可算得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。
38. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。
39. 1-β称为假设检验的功效(power of a test )。
其意义是,当所研究的总体与H 0确有差别时,按检验水平α能够发现它(拒绝H 0)的概率
40. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α。
41. 相关系数:又称Pearson 积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。
42. 确定系数: 复相关系数的平方称为确定系数, 或决定系数,记为R2,表示回归平方和占总平方和的比例,用以反映线性回归模型能在多大程度上解释反应变量Y 的变异性。
其定义为:
43. 复相关系数 :确定系数的算术平方根
44. 偏相关系数:一般地,扣除其他变量的影响后,变量Y 与X 的相关,成为Y 与X 的
45. 实验效应是处理因素作用于受试对象的反应(response)和结局(outcome),它通过观察指标(统计学常将指标称为变量)来体现
46.单盲法:受试对象不知道自己分在哪一组;
47.双盲法:受试对象和实验执行者均不知道受试对象分在哪一组;
48.三盲法:受试对象、实验执行者和统计分析人员三者均不知道受试对象分在哪一组。
49.寿命表(life table),又称生命表、死亡表、死亡率表等,是根据某一特定人群的年龄别死亡率编制出来的一种统计表。
50.m x是根据各年龄组的平均人口数(P X)与相应的死亡数(D X)计算,它近似地反映X岁年龄组人口在X~X+n年内的死亡率,用公式表示为:
51.q x是同时出生的一代人死于某年龄组X~X+n的概率,表示X 岁尚存活者(l x)在今后n年内死亡的可能性(概率)。
52.尚存人数l x是同时出生的一代人到刚活满X岁时尚生存的人数
53.死亡人数d x是同时出生的一代人死于各年龄组X~X+n的人数
54.生存人年数是同时出生的一代人,X岁尚存者在今后X~X+n 岁期间的生存人年数,亦称寿命表人口数
55.生存总人年数是同时出生的一代人中活到X岁者今后尚能生存的总人年数,是X岁以上各年龄组生存人年数(L x)的累计和56.期望寿命是同时出生的一代人活到X岁时,尚能生存的平均年数,也称平均可享寿命或平均余年。