卫生统计学 预防09复习
卫生统计学考试复习题库大全附答案
卫生统计学考试复习题库大全附答案1 、统计推断的两个方面为A 、点估计与区间估计B 、参数估计与假设检验 ( 正确答案 )C 、统计图表与假设检验D 、统计图表与参数估计E 、统计预测与统计控制2. 总体的定义是指根据研究目的确定的总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种观察值变量值的集合。
A 、所有样本的全体B 、观察单位的全体C 、根据研究目的确定的同质观察单位的全体 ( 正确答案 )D 、观察单位某种变量值的集合E 、样本中同质观察单位某种变量值的集合3. 计量资料的正确定义是指计量资料又称数值变量,其变量值是定量的,表现为数值大小,一般有度量衡单位。
A 、每个观察单位的观测值都是绝对数的资料B 、每个观察单位的观测值都是相对数的资料C 、每个观察单位的观测值都是平均数的资料D 、每个观察单位都有 1 个数值,无论该观测值是绝对数、相对数还是平均数的资料 ( 正确答案 )E 、将每个观察单位按某种属性或类别分组,然后清点各组的观测单位数得到的资料4. 下列关于总体和样本说法正确的是总体:根据研究的目的所划定范围内的同质的个体构成的全体,所有同质观察单位某种观察值(即变量值)的集合。
样本:总体中随机抽取的一部分观察单位的观测值的集合。
A 、总体的指标称为参数,用拉丁字母表示B 、样本的指标称为统计量,用希腊字母表示C 、总体中随机抽取的部分观察单位组成了样本D 、总体中随机抽取的部分观察单位的变量值组成了样本 ( 正确答案 )E 、总体中随意抽取的部分观察单位的变量值组成了样本5. 欲测量某地 2002 年正常成年男子的血糖值,其总体为A 、该地所有成年男子B 、该地所有成年男子血糖值C 、 2002 年该地所有正常成年男子血糖值 ( 正确答案 )D 、 2002 年所有成年男子E 、 2002 年所有成年男子的血糖值答案解析:欲测量某地 2002 年正常成年男子的血糖值,其总体为 2002 年该地所有正常成年男子的血糖值,所以答案选 C 。
卫生统计学复习题库(含答案)
卫生统计学复习题库(含答案)1.根据某地6至16岁学生近视情况的调查资料制作统计图,反映患者的年龄分布。
适用的图形种类是直方图,因为6至16岁是连续变量,得到的是连续变量的频数分布。
2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
4.调查某疫苗在儿童中接种后的预防效果,样本是1000名易感儿童,因为这是研究的总体。
5.要通过样本作统计推断,样本应该是总体中随机抽取的一部分。
6.关于均数,正确的说法是均数是所有观察值的平均值。
7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,适用的描述平均水平的指标是几何均数。
The geometric mean is used to reflect the average level of a set of variable values that are XXX or a log-normal n (skewed n)。
such as antibody titers。
XXX us diseases。
XXX.According to the n d data of 164 cases of Salmonella food poisoning patients。
the one-sided 95% upper limit of the n d was calculated using the percentile method as 57.8 hours。
This means that approximately 5% of the patients have an n d greater than 57.8 hours.A is incorrect: Approximately 5 people have an n d greater than 57.8 hours。
预防医学卫生学医学统计学考试重点
1.卫生学:是在‘预防为主’的卫生工作方针指导下,研究外界环境因素与人体健康的关系,阐述环境因素对人体健康影响的规律,提出改善和利用环境因素的卫生要求的理论根据和措施的原则,以达到预防疾病,促进健康,提高生命质量的目的。
2.食物链:生态系统中一种生物被另一种生物所食,后者再被第三种生物所食,彼此形成了一个以食物连接起来的链状关系为食物链3.环境污染:由于各种人为或自然的原因,使环境的成分发生重大变化,造成环境质量恶化,破坏了生态平衡,对人类健康造成直接、间接或潜在有害影响称之为环境污染4.生态平衡:生态系统的生产者、消费者和分解者之间,生物群落与非生物环境之间,物质、能量的输出和输入,生物学种群和数量,以及各种数量之间的比例,始终保持着一种动态平衡关系5.生物富集作用:一些重金属和难分解的有机化学物可在生物体内蓄积,使生物体内的浓度远远高于其在环境介质中的浓度,这种作用称为生物富集作用,6.生物放大作用:环境中某些污染物沿食物链在生物体之间转移并在生物体内的浓度逐级增高,使高位营养级生物体内的浓度高于低位营养级生物体内的浓度,此过程称为生物放大作用7.公害病:严重的环境污染引起的区域性疾病8.富营养化:是指含有大量氮、磷等营养物质的污水进入湖泊、河流等缓流水体,引起藻类及其他浮游生物迅速繁殖。
水体盗解氧含量下降、水质恶化,鱼类及其他生物大量死亡的现象9.生物地球化学性疾病:由于某地区地壳元素分布不均衡,导致当地水、土壤、植物中某种微量元素过高或缺乏,使当地人和动物从外界环境中获得该元素的量不能满足或超过机体正常需要而引起某些特异性疾病称为生物地球化学性疾病10.营养素:食物中具有营养功能的物质,通过食物被人体吸收利用,具有供给能量,构成组织及调节生理功能的物质。
包括蛋白质、脂类、碳水化合物、无机盐、维生素和水六大类11.必需氨基酸:是指人体内不能合成或合成数量不足,必须每日由膳食提供才能满足机体生理需要的12.限制氨基酸:在人体合成蛋白质的过程中,各种氨基酸要有适宜的比例,如果某一氨基酸过少,就要影响其他氨基酸的利用,营养学上称这种氨基酸为限制氨基酸13.蛋白质的互补作用:由于各种蛋白质中EAA的含量和比值不同,故可将富含某种EAA的食物与缺乏该种EAA的食物相互搭配而混合食用,使混合蛋白质的EAA成分更接近合适比值,从而提高蛋白质的BV,称之为蛋白质的互补作用14.维生素:是人体必需的一类微量的低分子有机化合物,以本体或可被人体利用的前体形式存在于天然食品中15.膳食纤维:是指食物中不能消化利用的纤维性物质,重要生理作用有:1通便防癌,2降低血清胆固醇,3降低餐后血糖,辅助治疗糖尿病,4吸附化学物质16.基本膳食:也称为医院常规饮食,包括普通膳食、软食、半流质和流质17.食物中毒:食物中毒是指摄入了含有生物性、化学性有毒有害物质的食品或将有毒有害物质当做食品摄入后所出现的非传染性的急性、亚急性疾病18.职业病:职业病是指劳动者在职业活动中接触职业病危害因素所引起的特定疾病19.职业禁忌症:劳动者从事特定职业或接触特定职业病危害因素时,比一般人群更易于遭受职业病危害和患职业病或者可能导致自身疾病病情加重,或者从事作业过程中诱发可能对他人生命健康构成危险的疾病的个人特殊生理或者病理状态20.尘肺:是由于长期吸入生产性粉尘引起的以肺组织弥漫性纤维化为主的全身性疾病21.中暑:是在高温环境下机体因热平衡和(或)水盐代谢紊乱等而引起的一种以中枢神经系统和(或)心血管系统障碍为主要表现的急性热相关疾病按发病机制分为三种类型:热热射病,热痉挛,热衰竭22.局部振动病:又称手臂振动病,属我国法定职业病,是长期从事手传振动作业所引起的以手部末梢循环和(或)手臂神经功能障碍为主的疾病。
(完整word版)卫生统计学重点整理-预防医学
1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。
否则称为异质(heterogeneity)的或者间杂的。
3.变异(variation):同质事物之间的差别称为变异。
[没有个体变异,就没有统计学!]4.总体(population):根据研究目的所确定的同质观察单位的全体。
5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。
6.样本含量(sample size):样本中包含的观察单位个数。
7.参数(parameter):反映总体特征的指标。
特点:未知、唯一,希腊字母表示,如总体均数、总体率等。
8.统计量(statistic):根据样本观察值计算出来的指标。
特点:已知、不唯一,拉丁字母表示,如样本均数、样本率等。
9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。
10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value).11.资料(data):变量值的集合称之为资料.12.定量资料(quantitative data):变量值是定量的,表现为数值大小。
特点:一般有度、量、衡单位,一般属连续性资料。
13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。
特点:一般无度、量、衡单位,一般属于离散型资料。
可进一步分为计数资料和等级资料。
14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。
可进一步分为二项分类资料和无序多项分类资料.15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点各组观察单位所得的资料。
卫生统计学考试要点复习资料
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
卫生统计复习题及答案
卫生统计复习题及答案09徐医本科班医学统计学练习题及答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1. 常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
卫生统计学复习题及参考答案
卫生统计学复习题及参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
卫生统计学(复习课)
复习课
Lu Yunxia Dept. of Epidemiology and Biostatistics School of Public Health Tongji Medical College Huazhong University of Science and Technology
第二部分:高级统计方法
生存分析
基本概念(截尾数据、完全数据、生存函数、风 险函数)
生存分析的基本方法(非参数法、参数法、半参
数法) 生存率的估计(K-M法、寿命表法)及生存曲线 的比较(LogRank 法) Cox比例风险回归模型
Байду номын сангаас
第二部分:高级统计方法
生存分析
基本概念(截尾数据、完全数据、生存函数、风 险函数)
离散趋势(range, variance, SD,CV)
思考题: 1.不同的集中趋势指标和离散趋势指标在应用上有什么区 别?
第一单元:基本统计方法
统计学描述
分类变量的统计学描述 率
构成比
相对比
思考题: 1.率、构成比、相对比在应用上有什么区别? 2.应用相对数应该注意什么事项? 3.计算标准化率的主要意义是什么?它与实际率的 关系是什么?标准化率主要应用在什么条件下?
第一单元:基本统计方法
几组重要的统计学基本概念
总体与样本
同质与变异
参数与统计量
变量的分类
第一单元:基本统计方法
几组重要的统计学基本概念
总体与样本 同质与变异 参数与统计量
变量的分类
数值型变量 分类型变量
第一单元:基本统计方法
统计学描述
数值变量的统计学描述 集中趋势(mean, median, geometric mean)
卫生统计学综合复习汇总
统计学复习基本概念部分 总体和样本 观察单位 随机样本和非随机样本的随机化 变量、随机变量;变量的类型 连续变量:有单位,理论上变量值可以充满区间。
分类变量:属性。
无序分类变量,虽可以用数值表示第几类,但数值无意义,只是代号。
有序分类变量,虽可以用数值量化,但数值的大小无意义,意义在于数值之间的间距 和顺序关系。
计数变量:特点是离散、有序。
实际频数分布 观察单位个数的分布。
连续变量要按变量值分组段, 计数变量要按观察时间单位、 分类变量要按类别总结观察单位的个数。
实际上,后面两种变量在只有一次抽样时无法完成实际频数分布的刻画。
数据的集中趋势和离散趋势集中趋势 连续变量对称分布:算术平均数(简称均数) 数。
分类变量:具有所关心特征(类别)的观察单位的个数(频数) 率、比。
计数变量:单位时间、单位面积内所关心事件的发生数。
求和问题。
离散趋势:衡量距集中趋势远近的程度连续变量对称分布:离均差平方和、方差、标准差。
连续变量非对称分布:百分位数 间距。
抽样变异和抽样分布 抽样变异:反复抽样后,每个样本都是不同的。
反复抽样指每次抽样的样本量相同。
抽样分布:反复抽样后,样本集中趋势的分布。
对于连续变量样本标准差当然也是有分 布的,但本处不考虑。
连续变量:样本均数的分布 — 按样本均数值分组段,总结各组段样本的个数。
分类变量:具有所关心特征(类别)的观察单位的个数(频数)的分布 — 按观察单位 的个数总结样本的个数。
计数变量: 单位时间、 单位面积内所关心事件的发生数的分布 — 按发生数总结样本的 个数。
抽样分布的集中趋势和离散趋势 连续变量:反复抽样样本均数的均数 — 集中趋势;反复抽样样本均数的标准差(标准 误) —离散趋势。
分类变量:反复抽样样本具有所关心特征(类别)的观察单位的个数(频数)的均数 —集中趋势;具有所关心特征(类别)的观察单位的个数(频数)的标准差(标准误)某些情况下可以按连续变量处理。
《卫生统计学》考试重点复习资料
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
卫生统计学 预防09复习PPT文档共44页
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
卫生统计学 预防09复习
31、园日涉以成趣,门虽设而常关。 32、鼓腹无所思。ቤተ መጻሕፍቲ ባይዱ起暮归眠。 33、倾壶绝余沥,窥灶不见烟。
34、春秋满四泽,夏云多奇峰,秋月 扬明辉 ,冬岭 秀孤松 。 35、丈夫志四海,我愿不知老。
谢谢你的阅读
卫生统计学 预防09复习共44页
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。
39、没有不老的誓言,没有不变的承 诺,踏 上旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
25、学习是劳动,是充满思想的
卫生统计学 预防09复习共44页文档
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
44
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。—上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
卫生统计学考试重点总结复习
卫生统计学考试重点总结复习一、绪论1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。
2.样本:从总体中随机抽取部分观察单位所组成的集合。
3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。
4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。
5.变量的类型及其转换:①定性变量: a.分类变量(计数资料)i.二分类变量ii.多项无序分类b.有序变量(等级资料)②定量变量: a.连续型变量b.离散型变量变量只能由“高级”向“低级”转化:定量→有序→分类→二值。
6.概率:是描述随机事件发生的可能性大些的数值。
7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。
9.卫生统计学的研究对象:有变异的事物。
10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。
11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。
12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。
13.误差可分为:系统误差、随机测量误差、抽样误差。
14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。
二、定量资料的统计描述1.频率分布表的编制步骤:①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。
2.频率分布表的用途:①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。
②便于进一步计算统计指标和进行统计分布处理。
③便于发现某些特大和特小的可疑值。
④当样本含量比较大时,可用各组段的频率作为概率的估计值。
3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/6/20
均数间的两两比较 • 均数间任意两i法 --- Tukey法 • 一个对照组与其它组的比较 --- Dunnett-t检验
综合复习
北京大学公共卫生学院 流行病与卫生统计学系
82801619
康晓平
2020/6/20
2013.5.16
“学习” 统计的步骤:
统计方法
数值变量
分类变量
统计描述 统计推断
统计描述 统计推断
统计指标
假设检验
统计指标 假设检验
-- 平均数
-- t 检验
-- 变异指标 -- 方差分析
-- 指标的应用 -- 秩和检验
1. 样本可比性 2. 选用的假设检验方法应符合其应用条件 3. 正确理解差别有无显著性的统计意义 4. 均数的区间估计与假设检验 5. 正确理解假设检验过程中样本均数与总体均数
间的关系 6. 单,双侧检验的选择 7. 两类错误与检验功效
2020/6/20
假设检验的结论可能发生的两类错误
客观实际
H0成立
t 检验 F 检验 秩和 2检验
2020/6/20
论文
线性相关回归 2检验
统计方法的几个基本概念
总体
•个体 •变量值 •变异
随机抽样 样 本
抽样研究
参数 ( , )
统计量 (x , s )
系统误差; 随机测量误差; 抽样误差
2020/6/20
三种常用平均数
平均数
适用资料
算术均数 变量值呈对称分布,
正态分布及正态曲线下面积的分布规律
1. 标准正态分布: 当正态分布μ和б已知时,
z X
若μ和б未知,
z XX s
2. 估计观察值所在范围(95%参考值范围)
X z / 2s
X z s
2020/6/20
标准差与标准误的区别
比较内容
标准差
标准误
──────────────────────
意义 表示个体观察值间的变异
--相关分析
--线性回归
2020/6/20
-- 频率指标 -- 卡方检验 -- 构成指标 -- 秩和检验 --指标的应用
注意事项 -- 可比性(分层、标化) -- 适用条件 -- 结果解释
“应用” 统计的步骤:
样本数据 (数值变量、分类变量)
确定分组变量、结局变量 统计描述,注意事项
两组或 多组数据对比分析 两变量关联性分析
--- 其目的是检验多个总体均数是否相等。
2020/6/20
SS总=SS组间+SS组内
总=组间+组内
完全随机设计方差分析的计算公式
变异来源 总变异 组间变异
SS
MS
F
a ni
( yij y)2
i1 j1
N-1
a
ni ( yi y )2 a - 1 SS组间/ 组间 MS组间/ MS组内
i 1
体均数比较
一个标准值(经验值)
• 配对资料或同一 批对象试验前 后比较的t检验
配对设计,计算一组样 本数据差值的均数
• 两个样本均数比较 成组设计,有两个随机 样本均数
2020/6/20
计算方法 t X 0
sX t d d
sd
F s12 s22
t X1 X2 sX1 X2
假设检验的注意事项
变异程度说明均数的
说明样本均数或样本
代表性
率的可靠
* 计算变异系数
* 估计总体参数的95%或99%
* 计算均数的标准误
的置信区间
* 当原始数据的分布近似
大样本资料:
正态分布时, 结合X 估计95%或99%的观察值
X z / 2sX p z / 2s p
小样本资料:
所在范围
X t / 2, sX
2.选定检验方法和计算统计量 3.确定概率P值,作出推断结论
t t0.05,v , P 0.05,差别无统计学意义。 t t0.05,v ,P 0.05,差别有统计学意义。 t t0.01,v ,P 0.01,差别有统计学意义。
2020/6/20
均数的t检验
t检验
设计类型
• 样本均数与总
有一个随机样本均数和
指标
计算公式
适用条件
极差R
最大值-最小值 任何分布
四分位数间距 Q
方差2、s2
Q=P75-P25
s2 ( X X )2 n 1
①偏态分布,②末端无确定 值
对称分布,尤其正态分布
标准差、s
变异系数CV
2020/6/20
s ( X X )2 n 1
对称分布,尤其正态分布
CV s 100% X
①量纲不同的资料②均数相 差悬殊的资料
尤其正态分布
计算方法 直接法 (未分组资料) 加权法 (分组资料)
几何均数
等比级资料, 对数正态分布
直接法 (未分组资料) 加权法 (分组资料)
中位数 呈偏态分布,分布不清楚, 直接法(未分组资料)
分布一端(或两端)
位次居中的数值
2020/6/20
无确定值
频数表法(分组资料)
常用描述离散趋势的指标
表示样本均数间的变异
程度,说明观察值x围绕样本 均数x分散程 度的指标
程度, 说明样本均数x 围绕总体均数 的分散 程度,或者样本率p与 总体率分散程度的指标
计算方法
2020/6/20
直接法 加权法
均数的标准误
sX
s n
率的标准误
sp
p(1 p) n
应用 * 表示一组观察值之间的 * 表示抽样误差的大小,
2020/6/20
* 总体参数的假设检验 (例如,均数的t检验和z 检
验; 率的z 检验)
均数的假设检验
• 假设检验的基本概念 所比较的两个样本均数x1 x2 两种可能性: 两样本均数来自两个相同的总体
两样本均数来自两个不同的总体
2020/6/20
• 假设检验的一般步骤
1.建立假设,确定检验水准 无效假设H0, 1 = 2, (x1 x2) 备择假设H1 1 2, = 0.05
H0不成立,H1成立
假设检验的结论
拒绝H0
Ⅰ型错误()
不拒绝H0 推断正确(1-)
推断正确(1-) Ⅱ型错误()
当 P < 0.05时,可能发生 错误 当 P > 0.05时,可能发生 错误
检验功效
2020/6/20
=
1-
方差分析
•
方差分析的基本思想
--- 多个样本均数的比较用方差分析
(analysis of variance,简称为ANOVA),
组内变异 SS总 – SS组间 N - a SS组内/ 组内
2020/6/20
随机区组设计方差分析的计算公式
变异来源
SS
MS
F
总 处理组间
SS总 SS处理
N-1 a-1
SS处理/ 处理 MS处理/ MS误差
区组间
SS区组
n - 1 SS区组/ 区组 MS区组/ MS误差
误差
SS总–SS处理组 (a-1)(n-1) SS误差/ 误差