卫生统计学(案例版)复习资料.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学复习整理
一、统计工作基本步骤
1、设计
2、收集资料
3、整理资料
4、分析资料
二、调查研究的特点
1、不能人为施加干预措施
2、不能随机分组
3、很难控制干扰因素
4、一般不能下因果结论
三、常用的基本抽样方法
1、单纯随机抽样
先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签等方法之一随机抽取〃(样本大小)个编号,由这〃个编号所对应的〃个观察单位构成研究样本。
2、系统抽样
又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分隔成〃(样本大小)个部分, 每一部分内含/〃个观察单位;然后从第一部分开始,从中随机抽出第了号观察单位,依此用相等间隔/〃机械地在第二部分、第三部分直至第〃部分内各抽出一个观察单位组成研究样木。
3、分层抽样
先按对观察指标影响较大的某项或某儿项特征,将总体分成若干层(strata),该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。
将总体划分为群(初级观察单位),各群由次级观察单位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。
5、多阶段抽样
抽样误差比较:分层抽样〈系统抽样〈单纯随机抽样〈整群抽样
四、实验设计的特点
1、研究者可人为设置处理因素
2、受试对象接受何种处理因素或处理因素的何种水平是随机的五、实验设计的三个基本要素
1、处理因素(或研究因素)
2、受试对象
3、实验效应
六、实验设计的基本原则
•对照原则
•随机原则
•重复原则
•均衡原则
七、常用的实验设计方案
•完全随机设计
•配对设计
•随机区组设计八、定量资料集中趋势的描述指标:描述数据分布中心位置(平均水平)的指标。
■算术均数
适用于对称分布特别是正态分布资料。
■几何均数
/儿何均数适用
%1对数正态分布
%1等比级数资料
/观察值中不能有0
■中位数和百分位数
I应用:中位数:适用于偏态分布、分布不明确或分布末端无确定数据的资料。
百分位数:百分位数:非正态分布资料
九、描述离散趋势指标:描述数据分布的离散程度(变异程度)的指标。
■极差:适用于分布末端有确定数据的资料。
■四分位间距:适用于描述偏态分布、分布不明确或分布末端无确定数据资料的离散趋势。
■标准差:描述对称分布特别是正态分布资料的离散程度。
■方差:描述对称分布特别是正态分布资料的离散程度.
■变异系数:度量衡单位不同的资料;单位相同但均数相差悬殊的两组或多组资料
十、正态分布的应用:制定医学参考值范围
—、常用相对数
绝对数:表示某事物在某时、某地发生的实际水平。
相对数:两个相关指标的比值,便于相互比较与分析。
■常用相对数:
率:率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象发生的频率或强度。
构成比:构成比是事物内部矣一卷/蔡巢度会与事物内部各组成部分型/时衣的忍教之比,说明事物内部各部分所占的比重。常以百分数表示。
相对比:相对比是两个有关的指标之比,用以描述两者的对比水平。两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。
十二、应用相对数注意的事项
■计算相对数分母不宜过小
■不能以构成比代替率
■计算合计率时,不能简单地相加求平均
■率的比较时应注意可比性
■对样本率(或构成比)的比较应做假设检验
十三、抽样误差与标准误
1.、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。
2、标准误
2.1样本统计量的标准差称为标准误。
2.2样本均数的标准差称为均数的标准误
十四、标准差与标准误的区别
1、标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。
2、标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假
设检验。
十五、可信区间的涵义
从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100 个可信区间,平均有95个估计正确。即,95%的可能性落在这个区间内,5%的可能性不落在这个区间内。
十六、假设检验的步骤
1、建立检验假设,确定检验水准
(1川1二四2:称检验假设,也称无效假设,怖表示。
⑵四2:称备择假设,也称对立假设,用表示。
(3) Q:称检验水准,也称显著性水准,是确定小概率事件的标准。
2、选定统计方法,计算检验统计量
不同的统计方法均有其应用条件,根据实验设计及数据的条件来选用合适的统计方法,计算合适的统计量。
3、确定P值,作出统计推断
⑴当PW0.05时,拒绝110,接受H1,有显著性意义,表明两样本间的不一致由抽样误差引起的可能性W0. 05,即两样本不是来自同一总体。
⑵当P>0. 05时,拒绝H1,接受H0,无显著性意义,表明两样本间的不一致由抽样误差引起的可能性>0. 05, 即不能排斥两样本不是来自同一总体。
十卡、假设检验与区间估计的联系
酬点7-5]
1. 假赠验与可信跑的目的不同,假跪酬于推觥体缄有顽
的不同,毗区间用于估计鲜参数的大小。
2. 毗跑也可回翻雌验邮题。但不能蛾糊的PfiL痔盼
出在琲崔上故M博毂,
3. 硼区毗假雌睡艘多的信息,除航成假赠验的任斜,
蹴供醐岫有多大,是否瞬觥
十八、t检验的适用条件
1、未知;
2、n较小3〈60);
3、样本来自正态总体;
4、两样本所来自的总体方差齐,即勇=勇
公式:]=三二但v = n-l
S//n
十九、ss^ = ss组间+SS组内
二十、方差分析的应用条件:独立性;正态性;方差齐性
二十一、四格表资料>2检验的条件
1、当n>40且所有T>5时,用普通的%2检验