《卫生统计学》课程复习资料
《卫生统计学》考试重点复习资料
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。
其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。
总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。
样本应具有代表性。
所谓有代表性得样本,就是指用随机抽样方法获得得样本。
抽样:从研究总体中抽取少量有代表性得个体,称为抽样。
概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性得任何特征或属性。
随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。
随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。
系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计与完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。
xx年中南大学卫生统计学复习题及参考答案
xx年中南大学卫生统计学复习题及参考答案《卫生统计学》课程复习资料一、名词解释:1.计量资料2.计数资料3.等级资料4.总体5.样本6.变异7.频数表8.算术均数9.中位数10.极差 11.方差12.标准差 13.变异系数 14.正态分布 15.标准正态分布16.统计推断 17.抽样误差 18.标准误 19.可信区间xx年麻疹发病率,其分母为[ E ] A.该地体检人数 B.该地年平均就诊人数 C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群人数32.两个独立小样本计量资料比较的假设检验,首先应考虑[E ] A.用t 检验 B.用u检验 C.用Wilcoxon秩和检验D.检验或Wilcoxon秩和检验均可E.资料符合t检验还是Wilcoxon秩和检验条件33.若决定系数为,则下列说法错误的是[ A ] A.散点图中所有的实测点都排列在一条回归线上 B.决定系数即是r 的总变异中有4%可以x的变化来解释D.相关系数r=E.回归贡献相对较小34.老年人口系数下降,可使[ B ] A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对35.标准化以后的总死亡率[ D ] A.标化后的率比原来的率低 B.标化后的率比原来的率高C.反映了实际水平D.反映了相对水平,仅作为比较的基础E.不随标准选择的变化而变化36.配对样本差值的Wilcoxon符号秩检验,确定P值的方法为[D ] 越大,P越大越大,P越小值在界值范围内,P小于相应的? 值在界值范围内,P大于相应的? 值即u值,查u界值表37.关于回归系数的描述,下列说法错误的是[ A ] ?0,表示回归直线与y轴交点在原点上方 ?0,回归直线与x轴平越大,则回归直线越陡一般有单位?0表示回归直线从左上方走向右下方38.实验设计和调查设计的根本区别是[ D ] A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组D.实验设计可人为设置处理因素E.两者无区别39.少年儿童人口系数下降,可使[ A ]A.粗死亡率上升B.粗死亡率下降C.出生率上升D.出生率下降E.生育率下降40.以下对于标准化法的描述错误的是[ C ] A.标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性B.样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需做假设检验C.标准化率代表真实的死亡率水平D.一般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率E.当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法第3页共7页241.多样本计量资料的比较,当分布类型不清时选择[ D ]2检验检验 C.μ检验检验检验42.回归系数的假设检验,其无效假设H0是[ E ] A.β=1 B.β≠0 C.β>0 D.β<0 E.β=043.估计样本含量时,所定第Ⅱ类误差愈小,则[ A ] A.所要的样本含量愈大 B.所要的样本含量愈小C.不影响样本含量 D.所定的样本含量愈准确 E.所定的样本含量愈粗糙44.欲计算某年新生儿死亡率,则应选用作为分母的是[ B ] A.某年新生儿总数 B.某年活产总数 C.当年怀孕的妇女数 D.妊娠28周以上的妇女数 E.妊娠28周以上出生并存活的新生儿45.用以说明某现象发生的频率或强度的指标为[ A ] A.率 B.构成比 C.相对比 D.绝对数E.均数 46.当四个样本率比较,得到?2>?,3,则可以认为[ D ] A.四个样本率都不相同 B.四个总体率都不相同 C.四个样本率不同或不全相同 D.四个总体率不同或不全相同 E.以上都不对47.成组设计两样本比较的秩和检验,其检验统计量T 是[ C ] A.以秩和较小者为T B.以秩和较大者为T C.以例数较小者秩和为T D.以例数较大者秩和为T E.当两样本例数不等时,可任取一样本的秩48.直线回归分析中,有直线回归方程Y=+,代入两点描出回归线。
卫生统计学考前复习材料.doc
基本概念总体(population):根据研究目的确定同质观察单位(亦称个体)的全体。
样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。
抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。
目的是为了用样本的信息(或统计量)推断总体的特征(或参数)。
同质与变异homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属性。
同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。
概率(probability):是描述随机事件发生的可能性大小的数值,常用P表示,范围在0与1之间。
P越接近1,标明某事件发生的可能性越大;P越接近0,表明某事件发生的可能性越小;PW0.05 的事件称为小概率事件。
统计资料的类型:1 .定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。
一般有度量衡单位。
如身高、体重、浓度。
2,分类资料(enumeration data)将观察单位按某种属性或类别分组所得各组的观察单位数。
(1)二项分类:阳性、阴性。
(2)多项分类:A、B、0、AB血型。
3,等级资料(rankeddata)将观察单位按某种属性的不同程度分组所得各组的观察单位数。
如血清反应分为一,+, + + , + + + , + + + +五级。
资料可以由高级向低级转化计量资料:个体的血红蛋白(g/dl)计数资料:正常人数、异常人数(按正常异常分组)等级资料:0〜,重度贫血6〜,中度贫血9〜,鞍度贫血12〜,正常16〜,增高(按血红蛋白量的多少分组)统计工作的基本步骤:1.设计,design2,资料收集,collection data3.资料整理,sorting data4,资料分析,analysis data统计描述、参数估计、假设检验、统计结论。
统计表:基本要求:1 .标题概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。
卫生统计学复习题库(含答案)
卫生统计学复习题库(含答案)1.根据某地6至16岁学生近视情况的调查资料制作统计图,反映患者的年龄分布。
适用的图形种类是直方图,因为6至16岁是连续变量,得到的是连续变量的频数分布。
2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
4.调查某疫苗在儿童中接种后的预防效果,样本是1000名易感儿童,因为这是研究的总体。
5.要通过样本作统计推断,样本应该是总体中随机抽取的一部分。
6.关于均数,正确的说法是均数是所有观察值的平均值。
7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,适用的描述平均水平的指标是几何均数。
The geometric mean is used to reflect the average level of a set of variable values that are XXX or a log-normal n (skewed n)。
such as antibody titers。
XXX us diseases。
XXX.According to the n d data of 164 cases of Salmonella food poisoning patients。
the one-sided 95% upper limit of the n d was calculated using the percentile method as 57.8 hours。
This means that approximately 5% of the patients have an n d greater than 57.8 hours.A is incorrect: Approximately 5 people have an n d greater than 57.8 hours。
《卫生统计学》考试重点复习资料
②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
卫生统计学复习资料
卫⽣统计学复习资料2007级预防⾏政班卫⽣统计学复习资料第三节统计⼯作的基本步骤统计设计收集资料整理资料分析资料⼀、统计设计1、调查设计2、实验设计(详见第⼗三章)⼆、收集资料资料来源(1)统计报表(2)⽇常医疗⼯作原始记录和报告卡(3)专题调查三、整理资料1.⽬的将收集的原始资料系统化、条理化,便于进⼀步计算和分析2.整理分组⽅式(1)性质分组(2)数量分组三、分析资料1、统计描述2、统计推断第四节统计图表⼀、统计表1、统计表的作⽤代替冗长的⽂字叙述,便于计算、分析和对⽐。
2、统计表的结构1)标题2)标⽬横标⽬(主语):说明表各横⾏数字的涵义,通常列在表的左侧纵标⽬(谓语):说明表各纵栏数字的涵义主语和谓语连贯起来能读成⼀句完整⽽通顺的话3、统计表的种类:1)简单表:只按单⼀变量分组2)组合表:按两个或两个以上变量分组某地1980年男、⼥HBsAg阳性率━━━━━━━━━━━━━━━━性别调查数阳性数阳性率(%)────────────────男4234 303 7.16⼥4530 181 4.00──────────────合计8764 484 5.52━━━━━━━━━━━━━━━━4、列表原则:重点突出,简单明了;主谓分明,层次分明5、统计表的基本要求:1)标题:概括地说明表的内容,必要时注明资料的时间和地点,写在表上⽅。
常见的缺点:过于简略,甚⾄不写标题;或过于繁琐;或标题不确切。
2)标⽬:⽂字简明扼要,有单位的标⽬要注明单位。
常见的缺点:标⽬过多,层次不清3)线条:不宜过多,除上⾯的顶线,下⾯的底线,纵标⽬与合计之间的横线外,其余线条⼀般均省去。
表的左上⾓不宜有斜线。
4)数字:A、数字⼀律⽤阿拉伯数字表⽰B、同⼀指标的⼩数位数应⼀致,位次对齐C、表内不宜留空格,暂缺或未记录,⽤“…”表⽰,⽆数字,⽤“—”表⽰,数字为0,填写0D、绝对数太⼩⽽⽆法计算指标,则⽤“…”代替。
5)备注:⼀般不列⼊表内,必要时可⽤“*”号标出,写在表的下⾯。
卫生统计学考试要点复习资料
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
卫生统计学知识点(笔记)
第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
卫生统计学-重点整理资料东大
卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
卫生统计学复习资料
科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。
实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。
随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。
拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。
它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息.除了分析主因素外,还可分析交互作用。
非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体.我们试图就某个总体下结论,这个总体便称为目标总体.资料常来源于目标总体中的一个部分,它称为研究总体。
科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。
一些个体处于同一总体,就是指他们大同小异,具有同质性。
同一总体内的个体间存在差异又是绝对的,这种现象称为变异。
本书把变量分成定性与定量两种类型。
定性变量中最常见的是分类变量或名义变量.最简单也最常用的分类变量是二分类变量。
另一类定性变量是有序变量或等级变量.定量变量可以分为两种类型,离散型变量和连续型变量。
离散型变量只能取整数值.连续型变量可以取实数轴上的任何数值。
变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。
在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。
理论上,正态分布有两个参数:总体均数和总体方差。
这种由观察资料计算出来的量称为统计量。
第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。
(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。
卫生统计学重点
卫生统计学1.医学统计学:是运用概率论与数理统计的原理及方法,研究居民健康状况以及卫生服务领域中数字资料的搜集、整理分析与推断的一门学科。
2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
4.样本的特征:(1)代表性(2)随机性(3)可靠性(4)可比性(comparable)5.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
6.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
7.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
8.减少抽样误差的方法:9.(1)改进抽样方法,增加样本的代表性。
(2)增加样本量n 。
(3)选择变异程度较小的研究指标。
10.统计工作的步骤:设计、收集资料、整理资料、分析资料。
11.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率(强度)。
12. 患病率:又称为现患率,指某时点检查时可能发生某病的一定人群中现患某种疾病的频率。
患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
13.治愈率(cure rate):表示受治病人中治愈的频率。
14.生存率(survival rate):指病人能活到某一时点的概率。
15.标准化率:标准化法就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
16.二项分布的图形特征(1)0.5时,图形是对称的,如图5-1。
(2)0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。
当n太靠近0或1,当nP和n(1-P)都大于5时,二项分布近似于正态分布。
卫生统计学复习资料
科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。
实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。
随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。
拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。
它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。
除了分析主因素外,还可分析交互作用。
非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体。
我们试图就某个总体下结论,这个总体便称为目标总体。
资料常来源于目标总体中的一个部分,它称为研究总体。
科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。
一些个体处于同一总体,就是指他们大同小异,具有同质性。
同一总体内的个体间存在差异又是绝对的,这种现象称为变异。
本书把变量分成定性与定量两种类型。
定性变量中最常见的是分类变量或名义变量。
最简单也最常用的分类变量是二分类变量。
另一类定性变量是有序变量或等级变量。
定量变量可以分为两种类型,离散型变量和连续型变量。
离散型变量只能取整数值。
连续型变量可以取实数轴上的任何数值。
变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。
在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。
理论上,正态分布有两个参数:总体均数和总体方差。
这种由观察资料计算出来的量称为统计量。
第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。
(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。
《卫生统计学》考试重点复习资料
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《卫生统计学》课程复习资料一、名词解释1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计量资料亦称定量资料、测量资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
等级资料又称有序变量。
4.总体:总体指特定研究对象中所有观察单位的测量值。
5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。
6.变异:同质个体间研究因素的差异。
7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。
8.算术均数:描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示。
9.中位数:将一组观察值由小到大排列,位次居中的那个数。
10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
14.正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。
通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。
15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N 。
16.统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。
17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。
18.标准误:通常将样本统计量的标准差称为标准误。
19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
20.参数估计:指用样本统计量估计总体参数。
参数估计有两种方法:点估计和区间估计。
21.假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
22.I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。
23.检验效能:1-β称为检验效能,它是指当两总体确有差别,按规定的检验水准α所能发现该差异的能力。
24.检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α。
25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。
26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。
然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。
27.相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。
28.标准化法:是常用于内部构成不同的两个或多个总率比较的一种方法。
标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
29.构成比(proportion ):表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。
常以100%为比例基数。
计算公式为100%=⨯某一组成部分的观察单位数构成比同一事物各组成部分的观察单位总数30.Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates’ correction)。
31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。
由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-free statistics )的统计分析方法,又称为无分布型式假定(assumption free statistics )的统计分析方法。
32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归。
33.相关系数:又称积差相关系数,以符号r 表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。
35.回归系数b :是直线的斜率(slope ),其统计意义是当X 变化一个单位时Y 的平均改变的估计值。
0b >时直线从左下方走向右上方,Y 随X 的增大而增大;0b <时直线从左上方走向右下方,Y 随X 的增大而减小;0b =时直线与X 轴平行,Y 与X 无直线关系。
b 的计算公式为2()()()XY XXX X Y Y lb l X X --==-∑∑二、单项选择题1.观察单位为研究中的( D )。
A.样本B.全部对象C.影响因素D.个体 2.总体是由( C )。
A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成 3.抽样的目的是( B )。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。
A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的( A )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( B )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( A )。
A.变异系数B.方差C.极差D.标准差 8.以下指标中( )可用来描述计量资料的离散程度。
( D )A.算术均数B.几何均数C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是( C )。
A.算术平均数B.中位数C.几何均数D.平均数10.两样本均数的比较,可用( C )。
A.方差分析B.t 检验C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中,ν配伍等于( D )。
A.ν总-ν误差B.ν总-ν处理C.ν总-ν处理+ν误差D.ν总-ν处理-ν误差12.在均数为μ,≥-||μX ( )的概率为5%。
( B )A.1.96σ0.052,t s νD.0.052,X t S ν13. D )。
A.各处理组样本均数相等B.各处理组总体均数相等C.各处理组样本均数不相等D.各处理组总体均数不全相等14.已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男, 而乙乡男多于女,适当的比较方法是( D )。
A.分别进行比较B.两个率比较的χ2检验 C.15.率的标准误的计算公式是( D )。
A.)1(p p -B.np p )1(- C.1-n p 16.非参数统计应用条件是( C )。
A.总体是正态分布 B.若两组比较,要求两组的总体方差相等 C.不依赖于总体分布 D.要求样本例数很大 17.下述哪些不是非参数统计的特点( D )。
A.不受总体分布的限定B.多数非参数统计方法简单,易于掌握C.适用于等级资料D.检验效能总是低于参数检验 18.设配对设计资料的变量值为X 1和X 2,则配对资料的秩和检验( A )。
A.把X1与X2的差数绝对值从小到大编秩 B.把X 1和X 2综合从小到大编秩 C.把X 1和X 2综合按绝对值从小到大编秩 D.把X 1与X 2的差数从小到大编秩 19.秩和检验和t 检验相比,其优点是( A )。
A.计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小 20.对两样本均数作比较时,已知n 1、n 2均小于30,总体方差不齐且分布呈偏态,宜用( C )。
A.t 检验 B.u 检验 C.秩和检验 D.F 检验 21.等级资料的比较宜用( B )。
A.t 检验B.秩和检验C.F 检验D.四格表X 2检验 22.两个小样本比较的假设检验,应首先考虑( D )。
A.t 检验B.秩和检验C.任选一种检验方法D.资料符合哪种检验的条件 23.对于配对比较的秩和检验,其检验假设为( B )。
A.样本的差数应来自均数为0的正态总体B.样本的差数应来自均数为0的非正态总体C.样本的差数来自中位数为0的总体D.样本的差数来自方差齐性和正态分布的总体 24.用最小二乘法确定直线回归方程的原则是各观察点( B )。
A.距直线的纵向距离相等B.距直线的纵向距离的平方和最小C.与直线的垂直距离相等D.与直线的垂直距离的平方和最小 25.实验设计的三个基本要素是( D )。
A.受试对象、实验效应、观察指标B.随机化、重复、设置对照C.齐同对比、均衡性、随机化D.处理因素、受试对象、实验效应 26.实验设计的基本原则( D )。
A.随机化、盲法、设置对照B.重复、随机化、配对C.随机化、盲法、配对D.随机化、重复、设置对照 27.实验设计和调查设计的根本区别是( D )。
A.实验设计以动物为对象B.调查设计以人为对象C.实验设计可随机分组D.实验设计可人为设置处理因素 28.标准正态分布的均数与标准差分别为( A )。