变量的分类及统计方法的选择
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计方法的应用条件
应用统计方法前,先看是否满足检验方法所需的前 提条件,必要时可做变量转换。
例如:
成组t检验
资料满足独立性、正态、方差齐
χ2检验
样本量大于40且最小理论频数大于5
单变量分析 双变量分析 多变量分析
单变量分析
不含自变量,仅有因变量的资料称为进行分析 称为单变量统计分析。 应用包括: 样本推断总体参数和可信区间 单组样本资料的假设检验 配对样本的假设检验 检验样本的总体分布
对相关系数ρ进行假设检验
r0
tr
sr
r 1 r2 n2
分母为相关系数r的标准误,自由度=n-2。
等级相关
如果X、Y不服从双变量正态分布,总体分布类型 未知,数据本身有不确定值或为等级资料,应用秩相关 (rank correlation)或称等级相关来描述两个变量间 相关的程度与方向。相关系数称为Spearman秩相关系 数或等级相关系数,用rs 表示
1. 因变量为定量资料 总体均数估计:通过样本统计量推断总体参数。
点估计 区间估计 当总体标准差σ已知,或σ未知但样本量足够大时可信区间为
x Z /2 x x Z /2
n
为总体标准差,如计算95%可信区间,Z0.05/2=
1.96,如计算99%可信区间,Z0.01/2=2.58。
当不知时,可用下式计算
S x t s / 2 , v x x t / 2 ,v n
x 为样本均数,n为样本含量,S x为标准误,S为样
本标准差(代替总体标准差),t,是按自由度
=n-1的t分布曲线下,两侧尾部面积各占 所对应 的临界值。
单组样本资料的假设检验
通过样本均数 与已知总体均数之间的差异与标准
误比值,来推断样本均数所代表的未知总体均数与已知 总体均数差异是否是抽样误差造成的,即是否相同。
因变量为定量资料
是
是否二分类 是
T检验
是
自变量为定量资 料
因变量符合正态 分布
否
否
是
自变量为性 否
量资料
单因素方差分析
是否服从正态分布 否
变量转换
秩相关线 性回归 是
是否二分类
是 M-W检验
否 K-W检验
否
是
是否服从正态分布
秩相关
线性相 关分析
图2 因变量为定量资料的双变量统计方法选择流程图
1. 因变量自变量均为定量资料
析
分析 析
析
生存分 析
Meta分 析
设计类型 不同设计类型,对应着不同统计方法
常见的设计类型包括 完全随机设计、配对设计、随机区组设计、交叉设 计、析因设计、和重复设计等
分析资料前,首先区分变量的类型和特征,再 根据研究目的选择适当的统计方法
根据资料的性质采用相应的统计学方法 1)计数资料与计量资料和等级资料
b
( X X )2
a Y bX
X Y ( X )( Y ���������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
临床研究的资料统计与分析
临床流行病与循证医学教研室 王海龙
第一节 临床科研中变量的类型
定性变量和定量变量
定量变量(quantitative variable) 称数值变量,是对每个观察对象用定量方法测定某项指 标大小所得的资料,一般有度量衡单位。 常见计量单位包括:
年龄、身高、体重、血压等
类型 离散型变量 连续性变量
检验公式
t
d 0
S /
n
d
d 为样本中各对差值d的均数,n为对子数, 为样本差值的标S准d 差
因变量为定性资料
是 总体参数估计
是否参 数估计
是
2. 因变量为定性资料,应用包括
总体率的参数估计
否
是否检验总体符合 何种分布
单组样本频率的假设检验等 检验样本来自的总体分布(如二项分布、 Poisson分布等)
σ已知或样本量≥30
Z检验
σ未知
t检验
t
x
S/ n
Z
x
/ n
注意:无论t检验还是Z检验都要求样本来自于正态分布
配对样本的假设检验
将受试对象按一定条件配成对子(同种属、同年龄 组、同性别等),再随机分配每对中的受试对象到不同 处理组。
wk.baidu.com
若差值服从正态分布,可采用配对t检验;否则, 采用配对资料的符号秩和检验。
线性相关
相关程度用Pearson积矩相关系数(Pearson product-
moment correlation coefficient)表示,符号为r,计算公
式
r ( X X )(Y Y )
( X X )2 (Y Y )2
r无单位,介于-1~1之间,绝对值≥0.7,表示相关程度较强;0.4≤ |r值 的绝对值 |≤ 0.7,表示中等程度相关;r值的绝对值< 0.4,表示相关程 度较弱。
根据研究变量在在疾病过程中的发生作用,可以分 为四类:
自变量、因变量、中介变量、混杂变量
第二节 统计方法的选择
统计方法选择基本原则
① 研究目的 ② 设计类型 ③ 资料类型 ④ 统计方法的应用条件
统计方法的具体应用
① 单变量分析 ② 双变量分析 ③ 多变量分析
统计描述:通过统计指标、统计图或统计表,对数 据资料进行最基本的统计分析,使其反应数据资料 的基本特征。
计数资料:常用的显著性检测方法为卡方检验( X2-test ); 计量资料:常用的显著性检测方法包括t检验(小样本),u检 验(大 样本)及F检验 (多因素方差分析)、非参数检验; 等级资料:常用的显著性检测方法为Ridit分析及非参数检验等 2)多组间的比较
先作多组间的显著性差异分析,只有多组间存在显著性差异时, 才能作多组间的两两比较。
p
p
Z
p
(1 ) / n
p为样本率,为总体率, 为p 率的标准误,n为样本
数。
如果资料服从二项分布,但n<5时,用二项分布概率函数直接求出 累积概率,然后与规定的作比较。
双变量分析
双变量分析是指对只含有一个因变量和一个自 变量的资料进行分析,因此统计分析方法的选择不 仅要考虑因变量的类型,还要考虑自变量的类型。
统计推断:利用样本提供的信息对总体进行推断, 包括参数估计和假设检验。
统计方法选择基本原则
分析不同 干预措施 间效果有 无差异
分析不同 因素间关 系
变量或记 录分成若 干类别
分析影响 生存时间 和生存结 局
对同类 结果进 行定量 分析
t检验 卡方检 方差分 秩和检 相关分
验
析
验析
回归分 主成分 聚类分 判别分
100(1 )% C I p Z / 2 S p
Sp
p (1 p ) n
p为样本率,Sp为率的标准误
当样本含量较小(n50),且p很接近0或1时,总体率的可信区间可按二 项分布原理计算
单组样本频率的假设检验
当样本量n较大时,n 及n(1- )均大于5时,可利
用样本频率p的分布近似正态分布,进行单组样本频率 的Z检验。
定性资料(categorical variable) 也称分类变量,先将观察对象按某种属性或类别分组,然 后清点各组观察对象的个数所得的资料。
按照变量之间的顺序、等级划分 有序变量 名义变量
按照类别数划分 二分类变量 多分类变量
变量的转换 注意:搜集数据阶段尽可能搜集定量数据
按研究因素间的因果联系分类
简单线性回归 应用:存在线性关系,可进行简单线性回归(simple linear regression)分析。 方法:最小二乘法
回归方程: yˆ a b x
x,y为相应的两个变量;a为截距,b为直线的
斜率,又称回归系数(regression coefficient),
计算公式:
( X X )(Y Y )
二项分布或Poisson 分布检验
单组样本频率的假 设检验
是
否
是否n较大时,nπ及n
(1-π)均大于5
单组样本频率Z检验
用二项分布概率直接求出
图1 定性资料单变量分析统计方法选择流程图
单变量分析
总体率的参数估计 样本量n足够大时(n>50),np和n(1-p)均大于5,p的分布接近正态
分布,用下式计算总体概率(1-)的可信区间(CI)