卫生统计学(案例版)复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫⽣统计学(案例版)复习资料
卫⽣统计学复习整理
⼀、统计⼯作基本步骤
1、设计
2、收集资料
3、整理资料
4、分析资料
⼆、调查研究的特点
1、不能⼈为施加⼲预措施
2、不能随机分组
3、很难控制⼲扰因素
4、⼀般不能下因果结论
三、常⽤的基本抽样⽅法
1、单纯随机抽样
先将调查总体的全部观察单位统⼀编号,然后采⽤随机数字表、统计软件或抽签等⽅法之⼀随机抽取n(样本⼤⼩)个编号,由这n个编号所对应的n个观察单位构成研究样本。
2、系统抽样
⼜称机械抽样或等距抽样。
事先将总体内全部观察单位按某⼀顺序号等距分隔成n(样本⼤⼩)个部分,每⼀部分内含m个观察单位;然后从第⼀部分开始,从中随机抽出第i号观察单位,依此⽤相等间隔m机械地在第⼆部分、第三部分直⾄第n部分内各抽出⼀个观察单位组成研究样本。
3、分层抽样
先按对观察指标影响较⼤的某项或某⼏项特征,将总体分成若⼲层(strata),该特征的测定值在层内变异较⼩、层间变异较⼤,然后分别从每⼀层内随机抽取⼀定数量的观察单位结合起来组成样本。
4、整群抽样
将总体划分为群(初级观察单位),各群由次级观察单位组成。
随机抽取⼀部分群,调查抽中群的全部次级观察单位。
5、多阶段抽样
抽样误差⽐较:分层抽样<系统抽样<单纯随机抽样<整群抽样
四、实验设计的特点
1、研究者可⼈为设置处理因素
2、受试对象接受何种处理因素或处理因素的何种⽔平是随机的
五、实验设计的三个基本要素
1、处理因素(或研究因素)
2、受试对象
3、实验效应
六、实验设计的基本原则
对照原则
随机原则
重复原则
均衡原则
七、常⽤的实验设计⽅案
完全随机设计
配对设计
随机区组设计
⼋、定量资料集中趋势的描述指标:描述数据分布中⼼位置(平均⽔平)的指标。
算术均数
适⽤于对称分布特别是正态分布资料。
⼏何均数
⼏何均数适⽤
①对数正态分布
②等⽐级数资料
观察值中不能有0
中位数和百分位数
应⽤:中位数:适⽤于偏态分布、分布不明确或分布末端⽆确定数据的资料。
百分位数:百分位数:⾮正态分布资料
九、描述离散趋势指标:描述数据分布的离散程度(变异程度)的指标。
极差:适⽤于分布末端有确定数据的资料。
四分位间距:适⽤于描述偏态分布、分布不明确或分布末端⽆确定数据资料的离散趋势。
标准差:描述对称分布特别是正态分布资料的离散程度。
⽅差:描述对称分布特别是正态分布资料的离散程度。
变异系数:度量衡单位不同的资料;单位相同但均数相差悬殊的两组或多组资料
⼗、正态分布的应⽤:制定医学参考值范围
⼗⼀、常⽤相对数
绝对数:表⽰某事物在某时、某地发⽣的实际⽔平。
相对数:两个相关指标的⽐值,便于相互⽐较与分析。
常⽤相对数:
率:率是指某现象实际发⽣数与可能发⽣某现象总数之⽐,⽤以说明某现象发⽣的频率或强度。
构成⽐:构成⽐是事物内部某⼀观察单位数与事物内部各组成部分观察单位的总数之⽐,说明事物内部各部分所占的⽐重。
常以百分数表⽰。
相对⽐:相对⽐是两个有关的指标之⽐,⽤以描述两者的对⽐⽔平。
两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。
⼗⼆、应⽤相对数注意的事项
计算相对数分母不宜过⼩
不能以构成⽐代替率
计算合计率时,不能简单地相加求平均
率的⽐较时应注意可⽐性
对样本率(或构成⽐)的⽐较应做假设检验
⼗三、抽样误差与标准误
1.、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。
不可避免、可以控制。
2、标准误
2.1样本统计量的标准差称为标准误。
2.2样本均数的标准差称为均数的标准误
⼗四、标准差与标准误的区别
1、标准差表⽰个体差异的⼤⼩;标准误描述样本均数的变异程度,说明抽样误差的⼤⼩。
2、标准差描述资料的频数分布状况,可⽤于制定医学参考值范围;⽽标准误⽤于总体均数的区间估
计和假设检验。
⼗五、可信区间的涵义
从总体中作随机抽样,每个样本可以算得⼀个可信区间。
如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。
即,95%的可能性落在这个区间内,5%的可能性不落在这个区间内。
⼗六、假设检验的步骤
1、建⽴检验假设,确定检验⽔准⑴µ1=µ2:称检验假设,也称⽆效假设,⽤
表⽰。
⑵µ1≠µ2:称备择假设,也称对⽴假设,⽤表⽰。
⑶α:称检验⽔准,也称显著性⽔准,是确定⼩概率事件的标准。
2、选定统计⽅法,计算检验统计量
不同的统计⽅法均有其应⽤条件,根据实验设计及数据的条件来选⽤合适的统计⽅法,计算合适的统计量。
3、确定P 值,作出统计推断
⑴当P ≤0.05时,拒绝H0,接受H1,有显著性意义,表明两样本间的不⼀致由抽样误差引起的可能性≤0.05,即两样本不是来⾃同⼀总体。
⑵当P>0.05时,拒绝H1,接受H0,⽆显著性意义,表明两样本间的不⼀致由抽样误差引起的可能性>0.05,即不能排斥两样本不是来⾃同⼀总体。
⼗七、假设检验与区间估计的联系
⼗⼋、t 检验的适⽤条件
1、未知;
2、n 较⼩(n<60);
3、样本来⾃正态总体;
4、两样本所来⾃的总体⽅差齐,即公式:
⼗九、
⼆⼗、⽅差分析的应⽤条件:独⽴性;正态性;⽅差齐性
⼆⼗⼀、四格表资料χ2检验的条件
1、当 n>40 且所有 T ≥5 时,⽤普通的χ2检验
2、当 n ≥40 但有 1≤T<5 时,⽤校正的χ2检验
0H 1H 2221σσ=n S x t /0µ-=1n ν-=SS SS SS =+总组间组内
3、当n<40或有T<1时,不能⽤χ2检验,改⽤确切概率法。
⼆⼗⼆、直线相关的概念
直线相关,⼜称简单相关,是⽤来描述具有直线关系的两变量x 、y 的相互关系的统计⽅法;要求两变量服从于双变量正态分布;两变量不分主次,处于同等地位。
⼆⼗三、直线回归分析的应⽤条件
1、线性,⾃变量x 与应变量y 呈线性关系
2、独⽴性,个体间相互独⽴
3、正态性,⾃变量x 取不同值时,应变量y 服从正态分布
4、⽅差相等,⾃变量x 取不同的xi 值,应变量y 的条件⽅差相等
⼆⼗四、直线回归与直线相关的区别与联系
区别:资料要求不同;统计意义不同;分析⽬的不同
联系:1、变量间关系的⽅向⼀致:r 与b 正负号⼀致 2、假设检验等价 3、r 与b 值可相互换算
4、⽤回归解释相关⼆⼗五、⽣存资料的特点
1. 蕴涵有结局和时间两个⽅⾯的信息
2. 结局为两分类互斥事件
3. ⼀般是通过随访收集得到,随访观察往往是从某统⼀时间点开始,观察到某规定时间点截⽌
4. 常因失访等原因造成某些研究对象的时间数据不完整,分布类型复杂,⼀般不能采⽤t test 、
ANOVA 、卡⽅检验等进⾏统计分析
⼆⼗六、⽣存分析的⼏个基本概念
⽣存分析是将事件的结局(“⽣存”和“死亡”)和出现这⼀结局所经历的时间,结合起来分析的⼀⼤类统计⽅法。
死亡事件:⼜称失效事件,不单是指通常意义下的⽣物体死亡,⽽是泛指标志某种处理措施失败
或失效的特征事件。
⼴义概念,⼀般是在设计阶段根据研究⽬的确定
⽣存时间:指观察到的“存活”时间。
不单是指通常意义下⽣物体的存活时间,⽽是泛指研究者
所关⼼的某现象的持续时间。
根据其特点,可分为以下两种类型:
(1)完全数据:是指从观察起点到发⽣死亡事件所经历的时间
(2)截尾数据:简称截尾值,⼜称删失值或终检值。
观察过程的终⽌不是由于死亡事件,⽽是由于其他原因。
失访;退出(死于其它原因);终⽌(截⽌随访结束时尚存活)
⼆⼗七、样本含量估计的意义及应具备的条件
意义:样本含量的估计是研究设计的重要内容之⼀,是研究设计中重复性原则的体现
应具备的条件:
1、I 型错误的概率α
2、II 型错误的概率β或检验效能1-β
3、容许误差或差值δ
4、总体参数(µ,σ,π)
b r t t
=r
=b =222/xy xy xx xx yy yy l l l SS r l l l SS ===回总。