卫生统计学-第一章-绪论
卫生统计学1赵耐青

医学试题精编丛书卫生统计学主编赵耐青副主编施学忠康晓平贺佳余红梅编委朱炎贵阳医学院毕煜复旦大学杨永利郑州大学李强西安交通大学李丽霞广东药学院余红梅山西医科大学金欢复旦大学赵杨南京医科大学赵耐青复旦大学施学忠郑州大学贺佳第二军医大学康晓平北京大学彭斌重庆医科大学缪之文北京大学复旦大学出版社前言卫生纺计学是分析和处理医学研究中随机现象的一门学科。
随着医学科学的发展,医学研究的研究设计、资料收集和结果分析越来越多地运用卫生统计学知识,已经成为医学研究中的一个重要组成部分,卫生统计学已经是医学各专业本科生和研究生的必修课程。
许多医学生都感到卫生统计学比较难学,甚至有些医学生对卫生统计学的课程有一定的恐惧感,特别是对卫生统计学的习题感到困难更大。
针对上述情况,本书的上篇以人民出版社出版的《卫生统计学》内容为基本框架,先对每一章的学习要点进行归纳,列出每一章的学习重点,然后针对性地列出每章的基本习题及其解答;下篇针对读者常见的数据统计分析中的困难,以高等教育出版社的普通高等教育“十一五”国家级规划教材《卫生统计学》的内容为基本学习要点,列出综合性的练习题及题其解。
本书可以作为五年制预防医学专业本科生和其他医学专业的本科生和研究生学习卫生统计学的参考书。
本书的出版得到了复旦大学出版社的大力支持,在此表示衷心的感谢。
本书凝聚着全国10所院校14位编委的智慧和心血,在此谨向各位同仁致以崇高敬意和深深谢意!我们也特别珍惜在本书编写过程结下的友谊!由于编者能力所限,不足之处,敬请广大师生提出宝贵意见。
编者2009年7月目录上篇第一章绪论 (1)第二章定量资料和统计描述 (9)第三章定性资料的统计描述 (15)第四章常用概率分布 (25)第五章参数估计基础 (32)第六章假设检验 (38)第七章χ2检验 (47)第八章实验设计 (59)第九章方差分析 (63)第十章基于秩次的非参数检验 (69)第十一章两个变量的关联性分析 (76)第十二章简单回归分析 (82)第十三章多重性回归与相关 (90)第十四章调查设计 (99)第十五章总体特征抽样调查的设计与分析 (103)第十六章横断面研究资料的统计分析 (110)第十七章队列研究的设计与分析 (117)第十八章病例一对照研究的设计与分析 (124)第十九章logistic回归分析 (131)第二十章生存分析 (143)第二十一章综合评价 (152)第二十二章Meta分析 (164)下篇综合习题 (176)上篇第一章绪论学习要点1.总体与样本的定义和理解。
雷静卫生统计学-第一章 绪论

2019/11/22
西安医学院公共卫生系
二、教与学的方法:
统计学不是数学!应用是根本目的。不需 要死记硬背,理解概念与动手实践是根本。
对统计公式,只要求了解其意义、用途和 应用条件,不必深究其数学推导。
2019/11/22
西安医学院公共卫生系
卫生统计学的主要内容:
(1)基本原理和方法 数据处理:统计描述 统计推断 -- 参数估计 假设检验 研究设计:实验研究设计、调查研究设计
• 频率一般是不确定的数,概率则为确定的数; 当试验次数足够多时,频率相对稳定,便把 频率作为概率的近似值。
即P(A)≈W(A)。
2019/11/22
西安医学院公共卫生系
概率的三个性质
• (1)对于任何事件A,有0≤P(A)≤1; • (2)对于必然事件,P(A)=1; • (3)对于不可能事件,P(A)=0。
2019/11/22
西安医学院公共卫生系
二、同质与变异: 同一总体中的个体间具有同质性
• 变异:即同一总体中个体间存在差异的现象。 由众多的、偶然的、次要的因素造成。
∴不能由个体代替总体,如许多药物广告
2019/11/22
西安医学院公共卫生系
三、变量的类型 变量,即总体中个体的某种特性,
用一个或多个数量来描述。 ห้องสมุดไป่ตู้ 分定性和定量变量两种
20世纪初,Fisher提出随机化实验,认为统 计学家在实验的设计阶段就必须参与,否则 这样的实验可能会毫无意义。
2019/11/22
西安医学院公共卫生系
Austin Bradford Hill,一位著名的英国公 共卫生学家、统计学家,是现代临床试验的 主要推动者。他有三项重要的贡献:
1- 第一章 绪论-卫生统计学

我们能否可依据统计描述( 20%与15%)的数量差,去作“否 定”?的结论。在作任何回答之前,必须判断20%与15%之间的差别 是真实的差异,还是仅仅由于“机遇”所致。
例2、某杂志的一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为 78%,平均疗程为三周左右。
14
调查设计-实例
• 城市老年人生活质量的研究设计:
– 研究目的是了解城市老年人生活质量现状并探讨影响老年人生活 质量的主要因素;
– 研究方法是以问卷访谈和体格检查相结合的方式来评价老年人的 生活质量状况;
– 资料收集是由经过专门培训的调查员对老年人进行入户访问获得; – 调查量表采用专门生活质量量表; – 收集到的资料经核查后用EPI软件建立数据库,并用SPSS统计分
– 统计描述是根据研究设计的要求,选用适当的统计指标、统计表、 统计图等方法,对资料的数量特征及分布规律进行测定和描述。
– 统计推断是根据概率分布和抽样的原理,在随机变量的样本信息 基础上推断总体特征。统计推断包括参数估计和假设检验。
• 在进行统计分析时,要根据统计设计的目的和要求,选用 正确的统计推断方法,对样本资料进行准确的描述和推断, 才能得到真实可靠的分析结果。
定性资料的变量值只能代表事物的某些属性或分类,不能反映 程度上的差别。
30
定性资料又分为两种属性和多重属性 如果变量只有相互独立的两种属性,称为二分类变量,这是
最简单的数据类型,如性别有男或女;检查乙肝表面抗原的携带 情况,有阳性或阴性;给小白鼠注射药物,其结局有生存或死亡 等。
如果变量的观察结果表现为相互独立的多种属性,称为多分 类变量,比如血型分为相互独立的四类:A型、B型、O型和AB型, 肺癌可分为腺癌、鳞癌、腺鳞癌、未分化癌、类癌和支气管腺癌 等,各类之间只有性质的不同,没有大小和程度上的差别。
卫生统计学

《卫生统计学》第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体 (population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异 (variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2.变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察 300 名病人的血压情况,确切地说,研究总体是:A.这 300 名高血压患者B.这 300 名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率 P 的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1.正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用x= ∑ x/n 公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为 0 的常数后:A. x不变、CV 变B. x变或 CV 变C. x不变、CV 不变D. x变、CV 不变E. x、CV 均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
《卫生统计学》PPT课件:01 绪论-

定量变量 定性变量
• 若按正常3人,异常2人分组→二分类变量
• 若按过低1人,正常3人,过高1人分组→ 等级资料
第四节 基本概念
• 总体与样本 • 误差 • 概率和频率 • 参数与统计量
总体与样本
总体(population):就是根据研究目的确定的同 质观察单位的全体,确切的说,是同质的所有观察单 位某种变量值的集合。
误差
误差:统计上所说的误差泛指测量值与真实值之 差。主要有以下二种:
(1)系统误差:指数据搜集和测量过程中由于仪器
不准确、标准不规范等人为原因,造成观察结果
偏大或偏小,这种误差称为系统误差。 (2)随机误差:由于一些非人为的偶然因素使得结 果或大或小,是不确定、不可预知的。
A、 随机测量误差
在消除了系统误差的前提下,由于非人为的偶 然因素,对于同一样本多次测定结果不完全一样, 结果有时偏大有时偏小。
问题讨论: 新药米氮平治疗抑郁症是否疗效?
讨论:如果你是这个科研项目的负责 人该怎么做?
• 米氮平治疗抑郁症患者10例8 例有效,有效率80%?
• 米氮平治疗抑郁症患者100例 80例有效,有效率80%?
• 米氮平治疗抑郁症患者100例80 例有效,有效率80%
• 安慰剂治疗抑郁症患者100例60 例有效,有效率60%?
• 根据统计显示,多数车祸发生在车子行 驶于一般车速的时候,只有少数发生在 车速超过每小时150公里以上的时候。这 是否表示开快车比较安全?
• 解析:不是,多数人以一般中速开车, 自然多数车祸发生于一般车速。
• 统计显示在亚利桑那州有较多的人死于 肺部疾病,这是否表示和别的州比较起
来,亚利桑那的气候比较容易感染肺部 疾病?
卫生统计学绪论

由于生物个体的各种指标所受影响因素极其复杂,
同质的个体间各种指标的观察值参差不齐,存在差
异,这种差异称为变异。
编辑ppt
16
统计学的任务就是在同质的基础上,对个体变异进 行分析研究,揭示由变异所掩盖的同质事物内在的 本质和规律。
编辑ppt
17
(二)总体与个体
总体是根据研究目的所确定的同质观察单位的集合.
编辑ppt
12
是根据设计的要求,获得准确可靠的原始资料,是统计 分析结果可靠的重要保证。
统计报表。如法定传染病报表,职业病报表,医院工 作报表等。
经常性工作记录。如经常性的卫生监测记录、健康检 查记录等。
专题调查或实验
编辑ppt
13
整理资料目的就是将搜集到的原始资料进行反复核 对和认真检查,纠正错误,分类汇总,使其系统化、 条理化,便于进一步的计算分析。
净化原始数据,使其系统化、条理化,便于进一步计
算和分析。
数据查错及缺失值的处理
编辑ppt
14
根据设计的需求,对整理后的数据进行统计分析, 结合专业知识,做出科学合理的解释。
统计描述(descriptive statistics):指用统计指标、统计 表、统计图等方法,对资料的数量特征及其分布规律 进行描述。
样本的观察单位数称为样本含量。
抽样的要求: 1. 随机抽样,要保证总体中各个观察单位都有同等
的概率被抽中进入样本; 2. 样本中要有足够的样本含量。编辑ppt源自19(三)参数与统计量
总体的统计指标称为参数,习惯用希腊字母表示总
体参数,如 表示总体均数, 表示总体标准差,
π表示总体率;
样本的统计指标被称为统计量,用拉丁字母表示统 计量,如用 X表示样本均数,S表示样本标准差,p 表示样本率。
卫生统计学第1章 绪论01 ppt课件

学习目标思考:
1、本堂课你学到了什么? 2、为什么要学这门课? 3、你准备用什么方法学?
21世纪教育: 学会求知、学会做事、
学会共处、学会生存。
“学会”与“会学”
“学生、学校、教师”
2
通知
1、实验地点:预防医学实验室 四楼 2、实验课须带课本、16K作业本。
2、统计研究设计:含医学实验设计、调查设计。 3、常用医学人口疾病统计指标及应用,寿命表的
编制与应用。 4、多因素的统计分析,如多元回归与相关分析、
Logistic回归分析等。
7
三、 统计工作的基本步骤
(也是科研工作的基本步骤) 1、设计 (design) 在统计分析和研究之前 必须进行周密的设计。(包括拟定题目、文 献复习,了解研究的背景、确定研究的目的 意义、定研究方法,定研究对象、研究内容 和指标、误差的控制、结果预测等) 。 2、收集资料 (collection of data) 卫生统计 资料来自三个方面:
作业成绩占本课成绩的20%,且3次不上实验 不允许考试。
3
统计学功能是:
从事专业,总结专业规律,提高专业 水平的方法学
进行科学研究,探索专业领域新事物 新规律的方法学
通向更高学历层次的桥梁科学
6
二、卫生统计学的主要内容:
1、卫生统计学常用的基本方法:包括描述统计 (分布的应用)、统计推断、直线相关与回归分 析等。
叫随机事件;
小概率事件:发生的可能性p≤0.05的随机事
件。即在一次观察中发生的可能性很小。
23
主要参考书
倪宗瓒、徐勇勇主编: 《医学统计学》※
杨树勤主编: 《医学统计学》(医学百 科全书分册)
卫生统计学第一章绪论

第一节 统计学与公共卫生休戚与共
2.公共卫生是统计学的用武之地与发展动力 (1) Graunt (1620-1674) 寿命表,开创人口统计学 (2) Snow (1813-1858)首次详细研究了伦敦霍乱流 行。应用了数学和统计学建模和分析。 (3) Doll 和Hill吸烟与肺癌的创新性研究。
卫生统计学
第一章 绪论
什么是统计学(statistics)?
“A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data” (Webster's International Dictionary)。
公共卫生不仅是统计学应用的一个重要领 域,而且更成为现代统计学研究和发展的 巨大动力。
第二节 统计学的若干概念
1. 总体与样本 总体(population): 大同小异的对象全体。 目标总体(target population): 试图下结论的某
个总体. 例如,英国成年男子为目标总体
研究总体(study population) : 资料来源的较 小的总体.
揭示不同总体的异质性 (heterogeneity)。
3. 变量的类型 变量(variable):个体特性的数量描述 (1) 定性变量
(i) 分类变量(categorical variable) 或 名义变量(nominative variable)。 分类变量的水平(level) 代码(code) 用1、2、3、4、5等来表示各个水平。 二分类变量(binary variable), 也称0-1变量或假
第一章(绪论)卫生统计学

第二节
统计工作的基本步骤
*(一)研究设计(design)(关键) (二)搜集资料(collection of data) (三)整理资料(sorting data)
(四)分析资料(analysis data)
(一)研究设计(design)(关键)
1、明确研究目的与确定研究指标; 2、确定研究对象和观察单位; 3、选择合适的调查方法; 4、采取的调查方式; 5、设计调查表格和调查项目; 6、样本含量的估计;
值(测量值)是区间内任意值。如身高、体重、 血压等。
(2)分类变量(定性变量)
计数资料(categorical variable): 将观察对象按某种性质、类别或属性 进行分组,然后清点各组的例数所得
到的资料。
特点:
(1)分组组数≥2组
(2)各组没有量的差异,只有质不同
分类:
(1)无序分类变量(unordered categories )
2、统计工作的基本步骤:(1)设计(design); (2)收集资料(collecting data) ;(3)整理资料 (sorting data) ;(4)分析资料(analyzing data) ,包 括统计描述和统计推断两个方面的内容。统计描述是 通过相应的统计指标、选用适当的统计表或统计图来 阐明数据特征;统计推断是在概括样本信息的基础上, 推断研究总体的特征。
2、变量值(value of variable)或观察值(observed
value),亦称资料:是指对变量进行测量或观察所得 的结果。
例如:以人为观察单位调查3岁儿童的生长发育情况,儿
童的性别是特征,即变量,它分为男性和女性;身高是 特征,即变量,可分为高、矮,其变量值就是测量得的 身高是多少cm。
卫生统计学 第一章 绪论

第三节 统计学的若干概念
2011-12-22
第一章卫生统计学绪论
23
一、总体与样本
1、总体(population ) :同质个体所构 、总体( 同质个体所构 成的全体(大同小异的对象全体) 成的全体(大同小异的对象全体)。 全体 的对象全体 例如: 例如:一个国家的所有成年人 某地的所有小学生 所有的肺结核患者
2011-12-22
Raymond Pearl Ronald A. Fisher Hill 爵士
第一章卫生统计学绪论
第二节 统计学与公共卫生的关系
公共卫生专业人员的得力工具: 公共卫生专业人员的得力工具: 得力工具 统计设计:抽样、样本量、 统计设计:抽样、样本量、统计方法等 统计描述: 统计描述:群体事件的分布特征 统计推断:找危险因素、评价效果、 统计推断:找危险因素、评价效果、决策等 历史成就: 历史成就:John Graunt 、William Farr 寿命表); );John (霍乱发生原因 霍乱发生原因) (寿命表);John Snow (霍乱发生原因); 吸烟与肺癌)。 Doll 和Hill (吸烟与肺癌)。
试验组 8 对照组 8
2011-12-22
第一章卫生统计学绪论
16
患者的X 光片分别由两位放射 患者的X-光片分别由两位放射 分别 学家和一位临床学家独立评价 独立评价, 学家和一位临床学家独立评价,这 种盲法和重复评价明显增加了评价 种盲法和重复评价明显增加了评价 的客观性,结果试验组的存活率和 的客观性, 放射学改善均优于对照组。 放射学改善均优于对照组。
2011-12-22 第一章卫生统计学绪论 14
两组患者的生存率不同是个 体差异还是疗法的效果? 体差异还是疗法的效果? 两组患者的生存率经假设检 验,得 异。
天津医科大学卫生统计学

卫生统计学第一章绪论一,名词解释1.参数:能统计计算出来描述总体的特征量,即总体的统计指标。
2.总体:根据研究目的确定的同质研究对象的全体集合。
3.同质:除了实验因素外,影响被研究指标的非试验因素相同被称为同质。
4.变异:在同质的基础上被观察个体或单位之间的差异被称为变异。
5.样本:从总体中随机抽取的部分研究对象。
6.统计量:由观察资料计算出来的量,即样本的统计指标。
7.概率:表示一个事件发生的可能性大小的数。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率.)8.抽样误差:由抽样造成的样本均数与总体均数或各样本均数之间的差异。
二,问答题.1.统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。
2.总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。
3.抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起.抽样误差不能避免,但可以随着样本含量的增大而减小。
4.何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
小概率事件是指习惯上将P《=0.05或P《=0.01称为小概率事件,表示某事件发生的可能性很小。
第二章定量资料的统计描述一,名词解释1.频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数.2.方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。
3.标准差:也称均方差,是各数据偏离平均数的距离的平均数。
4.中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。
卫生统计学第01章 绪论

第01章绪论第一节概述【统计学】※(statistics):统计学是处理数据中变异性的科学与艺术,内容包括数据的收集(collection)、分析(analysis)、解释(interpretation)和表达(presentation),目的是求得可靠的结果。
第四版教材中概念:是研究数据的收集、整理、分析和推断的一门科学。
第二节医学统计资料的来源与分类基本概念:【变量及变量值】※:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),也称为【资料】。
①定性变量分为:分类变量(无序分类变量)或名义变量包括:多分类变量、二分类变量有序变量(有序分类变量)或等效变量②定量变量分为:离散型变量(有缝隙):只能取整数值连续型变量(无缝隙):在实数轴上是连续的按变量值的性质可将资料分为:定性资料定量资料1.【定性资料】(分类资料、分类变量)定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
特点:①没有度量衡单位②多为间断性资料(通过枚举或记数得来)2.【定量资料】(计量资料、数值变量)定义:通过度量衡的方法,测量每个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
特点:①表现为数值大小②有度量衡单位③多为连续性资料(通过测量得到)3.【等级资料】(有序变量)定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
特点:①每一个观察单位没有确切值②各组之间有性质上的差别或程度上的不同。
第三节统计学中常用的几个基本概念1.总体与样本【总体】:根据研究目的确定的同质的、所有观察单位的某种变量值的集合。
【样本】:从总体中随机抽取的、具有代表性的部分研究对象,其实测值的集合。
2.随机抽样为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到样本中)。
3. 同质与变异【同质】:研究对象具有的相同的状况或属性等共性称同质或同质性;【变异】:对于同质的各观察单位,其某变量值之间的差异,称为变异。
卫生统计学和医学统计学 第一章 绪论【考研背诵笔记】【期末考试资料】

第一章绪论一、卫生统计学就是运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的收集、整理、分析和推断的一门科学。
二、同质和变异同质:针对被研究指标来讲,其影响因素相同。
变异:同质观察单位之间的个体差异。
三、总体和样本总体:根据研究目的确定的同质观察单位的全体。
确切地说,是同质的所有观察单位某种变量值的集合。
样本:从研究总体中随机抽取部分有代表性的观察单位。
样本量:样本中所含的观察单位的数量。
抽样:从总体中抽取样本的过程。
抽样研究:从总体中抽取样本,根据样本信息来推断总体特征。
四、参数与统计量参数:是根据总体分布的特征而计算的总体统计指标,是一个固定的常数,通常是未知的。
统计量:由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。
五、变量的类型( 选择题高频考点)(一)定量变量1.离散型定量变量2.连续型定量变量(二)定性变量1.分类变量(名义变量):二分类变量和多分类变量2.等级变量(有序变量)六、频率与概率概率:描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用p来表示。
频率:在相同的条件下,独立地重复进行n次实验,随机事件A 出现了f次,则称f/n为事件A出现的频率。
↓(高频考点)小概率事件:习惯上将P≤0.05或P≤0.01称为小概率事件,通常表示某事件发生的可能性很小,在一次随机抽样中不会发生。
七、误差↓(高频考点)抽样误差:由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。
包括系统误差和随机误差(不可避免的,类似抽样误差)。
随机误差:是一类恒定的、随机变化的误差,由多种尚无法控制的因素引起。
系统误差:是实验过程或者干预产生的误差。
过失误差:偶然失误造成的误差。
八、统计工作步骤(↓简答题高频考点)(一)统计设计(最关键的一环)拟定包括资料收集、整理和分析的计划和设想和如何遵循设计的三个基本原则(随机化、重复、对照)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两组患者的生存率不同是个
体差异还是疗法的效果?
两组患者的生存率经假设检
验,得
P<0.05,有显著性差
异。
2019/10/25
第一章卫生统计学绪论
15
随机化分组两组患者的病情比较
身体状况
血沉(mm.h-1)
分组
Байду номын сангаас
好 一般 差 0~ 11~ 21~ >50
试验组 8 17 30 0 3 16 36
2019/10/25
第一章卫生统计学绪论
3
例1
我的红细胞数比其他同事都
低,我是病了吗?
2019/10/25
第一章卫生统计学绪论
4
150名正常成年男子的红细胞数(1012/L)
3.98 5.39 4.54 4.74 5.13 4.43 4.81 4.67 4.67
4.96 3.79 5.49 4.66 5.26 4.90 4.90 5.40 5.29
对照组 8 20 24 1 2 20 29
2019/10/25
第一章卫生统计学绪论
16
患者的X-光片分别由两位放射
学家和一位临床学家独立评价,这
种盲法和重复评价明显增加了评价
的客观性,结果试验组的存活率和
放射学改善均优于对照组。
2019/10/25
第一章卫生统计学绪论
17
描述 统计
生物医学 客观现象
卫生统计学
2019/10/25
第一章卫生统计学绪论
1
Fisher在1938年印度统计学 大会演讲时说:“作完实验后才找统 计学家,就好象要他作尸体解剖。 他会说,这实验死于什么原因”。
2019/10/25
第一章卫生统计学绪论
2
第一章 卫生统计学绪论
统计学: 是一门处理数据中变异性的科学与艺, 内容包括收集、整理、分析、解释和表 达数据,目的是求得可靠结果。
抽样误差
1879-1940 Raymond Pearl
医院统计,生物统计
1890-1962 1897-1991
Ronald A. Fisher Hill 爵士
现代统计学奠基、误差理论 极大似然《实验设计》随机
26
17.3
18
12.0
10
6.67
4
2.67
1
0.67
150
100.0
2019/10/25
第一章卫生统计学绪论
6
35 30
频 25 数 20
15 10 5 0
3.70
4.10 4.50 4.90 5.30
红细胞数(1012/L)
5.70
某地150名正常成年男子红细胞数 (1012/L)频数分布图
第一章卫生统计学绪论
13
结果:试验组生存率为93%(51/55) 对照组生存率为73%(38/52) 试验组的放射学改善优于对照组。
1、两组患者的生存率不同是个体差异还是疗 法的效果?
2、上两组患者的病情是否相同或相似?
3、结果的评价是否客观,有无偏倚?
2019/10/25
第一章卫生统计学绪论
14
例2
1、用某药治某病,治疗1例有效,能说 该药的有效率为100%吗?
2、治疗2例都有效,能说该药的有效率 为100%吗?
3、治疗10例9例有效,能说90%有效 吗?
2019/10/25
第一章卫生统计学绪论
8
例3
某医生用某药治疗胃溃疡病出血患者
107例,有效101例,有效率为94.4%。
如果别的医生也用同样的药来治疗胃
2019/10/25
第一章卫生统计学绪论
5
150名成年男子的红细胞数(1012/L)频数分布
组段
频数 f
频率(%)
3.7~ 3.9~ 4.1~ 4.3~ 4.5~ 4.7~ 4.9~ 5.1~ 5.3~ 5.5~ 5.7~5.9 合计
1
0.67
4
2.67
11
7.33
17
1.13
26
17.3
32
21.3
例:链霉素治疗肺结核疗效的临床试验
从15~30岁肺双侧进行性肺结核患者 (总体)中抽取107例患者(样本),随 机分为两组,试验组55例接受链霉素加 卧床休息的治疗,对照组52例用常规治 疗(单纯卧床休息)。6个月后,患者的 X-光片分别由两位放射学家和一位临床 学家独立评价,结果见下:
2019/10/25
4.17 4.28 4.63 4.94 4.33 4.84 4.75 4.77 5.38
4.01 4.49
……
……
……
……
……
5.30 4.97 5.29 4.85 5.88 4.49 4.62 4.77 5.38
4.53 4.10 4.53 4.70 4.80 5.23 5.67 5.15 4.57
第一章卫生统计学绪论
10
例5
对某地25~30岁妇女进行一项研究发
现:在服用口服避孕药者中,宫颈癌年
发病率为6/10万,而未服用者为3/10万。
据此认为服用口服避孕药是引起宫颈癌
的危险因素,此结论正确吗?
2019/10/25
第一章卫生统计学绪论
11
例6
《肿瘤患者体外淋巴细胞转化率检查及其评价》的研 究中,研究对象是67例恶性肿瘤患者,其中44例为肿 瘤患者(消化道癌23例,肺癌13例,其它癌肿8例), 男39人,女5人,年龄36~73岁;23例为白血病患者 (急淋7例,急粒8例,慢粒8例),男18人,女5人, 年龄16~54岁。 正常对照:33例正常人,均为健康献血员,男20人, 女13人,年龄21~33岁。 作者得出肿瘤组和白血病组平均淋转率比正常组低 ( P<0.01 )。
1787-1872
Louis
临床疗效,对照
1822-1911 Francis Galton
分布与变异
2019/10/25
第一章卫生统计学绪论
19
卫生统计思维进化与概念
时期
科学家
发明与应用
1857-1936 Karl Pearson 1880-1949 Major Greenwood
现代统计学之父 相关分析,x2
溃疡病出血患者,其有效率也一定是
94.4%吗?
2019/10/25
第一章卫生统计学绪论
9
例4
某项关于某种药物的广告声称:“在服 用本制剂的1000名上呼吸道感染的儿童中, 有970名儿童在72小时内症状消失”,因 此推断此药治疗儿童的上呼吸道感染是非 常有效的,可以推广应用。这项推论正确 吗?
2019/10/25
揭示生物医学 客观总体内在 数 量 规律
推断 统计
统计学探索生物医学数量规律过程
第一节 医学中统计思维的进化
统计思维的进化(发展简史)
时期
科学家
发明与应用
1749-1827 Pierre-Simon Laplace
研究概率
(probability)。
1745-1826 Philippe Pinel 应用概率研究疗效