统计方法的分类与选择(精简)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

条件logistic回归分析
医学中经常需要作配对病例-对照研究。所谓的配对病例-对 照研究指的是在病例-对照研究中,对每一个病例配以性别、 年龄或其它条件相似的一个(1:1)或几个(1:M)对照,然后分 析比较病例组与对照组以往暴露于致病因素的经历。 分析配对病例-对照研究资料的统计分析方法一般采用条件 logistic回归分析。 条件logistic回归分析的数学模型以及分析原理方法均和 非条件logistic回归分析类似。因为参数的估计公式涉及到 条件概率理论,所以称为条件logistic回归分析
总体率的估计
----
单变量、不同研究设计类型的数据分析方法选择
研究设计类型 变量类型 两组比较 两组以上比较 实验前后比较 重复测量 重复测量的方差分 析
数值变量
t检验
方差分析
配对t检验
分类变量 有序变量
χ 2检验
χ 2检验
配对χ 2检验 Wilcoxon 符号秩和检验
Mann-Whitney Kruskal-Wallis 秩和检验 秩和检验
Logistic回归分析和线性回归分析的异同点
相同点: 都可以校正混杂因子的影响; 都可以利用模型来筛选危险因子; 都可以用来做预测。 不同点: 前者对因变量无分布要求,后者要求因变量是正态分 布变量; 前者要求因变量必须是分类型变量,后者要求因变量 必须是连续型数值变量。 前者不要求自变量和因变量呈线性关系,后者要求自 变量和因变量呈线性关系; 前者是分析因变量取某个值的概率与自变量的关系, 后者是直接分析因变量与自变量的关系。
多元线性回归的应用条件与分析步骤
应用条件 1、独立性:各观察对象间相互独立。 2、线性:自变量与应变量间的关系为线性。 3、正态性:自变量取不同值时,应变量的分布为正态。 4、方差齐性:自变量取不同值时,应变量的总体方差相等。 5、当不符合条件时,可对自变量进行变换。 如: 2
ˆ b0 b1 x1 b2 lg( x2 ) b3 x3 y
推断两个或多个样本率及构成比之间的差别有无统计学意 义。 配对设计分类变量的卡方检验。 频数分布的拟合优度检验等。 分类变量的关联性分析。
R(行)×C(列)表(完全随机设计)
R:为组数 C:为观察结果的类别数
1、2×2表(2行Βιβλιοθήκη Baidu列):两个率的比较。 2、R×2表(R>2):多个率的比较。 3、2×C表(C>2):两个构成比的比较。 4、R×C表(RC均>2):多个构成比的比较。
χ2检验的注意事项
1、χ 2 检验要求理论频数不宜太小,一般认为不宜有 1/5以上格子理论频数小于5,或一个格子的理论频 数小于1。对理论频数太小有三种处理方法: (1)增大样本例数。 (2)删除理论数太小的行(列)或与其邻行(列)合并。 (3)改用其它方法。 2、当多个样本率(或构成比)比较的χ 2 检验结论为 拒绝H0时,只能认为各总体率(或总体构成比)之 间总的说来有差别,但不能说它们彼此间都有差别 或某两者间有差别。
统计方法的分类与选择
单变量、一组资料的分析方法选择
变量(资料) 类型
分析目的
统计描述 统计推断 总体均数的估计
平均数:均数 几何均数 中位数 数值变量-计 变异程度:极差 四分位数间距 标准差 量资料 分布:参考值范围 分类变量-计 相对数:率 构成比 相对比 数资料 有序变量-等 相对数:构成比 级资料
两组以上数据的比较 1各样本是相互独立的随机样本; 2各样本要来自正态总体; 3要求各个样本的总体方差齐同。
多个样本均数间的多重比较 Newman-Keuls检验,亦称Student-Newman-Keuls(SNK) 检验,简称q检验。 最小显著性差距(LSD)t检验。 多重比较的意义
c2 检验主要应用
有序变量
相关分析:线性 等级 回归分析:线性 c2检验:列联系数
分类变量
有序变量
相关分析:等级 c2检验:列联系数
T检验的应用条件
两组数据的比较: 1样本量比较小(n<50); 2样本来自正态总体; 3两样本总体方差齐同;
当两样本方差不齐时可以采用t’检验,变量变换,或者
秩和检验。
方差分析的应用条件
两个及以上的变量的数据分析方法选择
因变量
自变量
数值变量
数值变量 相关分析:线性 等级 回归分析:线性 非线性 logistic回归分析 判别分析,聚类分析 logistic回归分析 判别分析,聚类分析
分类变量
协方差分析 多元回归分析 c2检验:列联系数 logistic回归分析 c2检验:列联系数 logistic回归分析
R×C表的分类及其分析方法的选择1
R×C表可以分为双向无序、单向有序、双向有序属性相同与 双向有序属性不同4类。
1、双向无序R×C表 R×C表中两分类变量皆为无序分类变量对于该类资料: A 若研究目的为多个样本率(或构成比)比较, 可用行×列表资料的卡方检验; B 若研究目的为分析两个分类变量间有无关联性 及关系的密切程度时,可用行×列表资料的卡 方检验及Pearson列联系数进行分析。
R×C表的分类及其分析方法的选择2
2、单向有序,有两种形式: 一种是R×C表中的分组变量(如年龄)是有序的,而指 标变量(如传染病的类型)是无序,其研究的目的是分析不同 年龄组的构成情况,此资料可用卡方检验。 另一种是R×C表中的分组变量(如不同疗法)是无序的, 而指标变量(如疗效按等级分)是有序。在比较各效应有无差 别时宜采用秩和检验法,如作卡方检验只能说明各处理组的效 应在构成比有无差别。如下表:
三种药物治疗百日咳疗效比较
组别
中药 西药 中药+西药
治愈
68 33 41
好转
无效
27 31 31
合计
13 35 29 108 99 101
合计
142
89
77
308
R×C表的分类及其分析方法的选择3
3、双向有序属性相同 R×C表中两分类变量皆为有序且为属性相同。实际是2×2配 对设计的扩展,即水平数大于等于2的诊断配伍设计,如两种方法 同时对同一批样品的测定结果。其目的是分析两种检测方法的一 致性,此时宜用一致性检验(也称Kappa检验)。如想分析两法测 定结果的概率分布有无差别,宜采用χ 2检验。 4、双向有序属性不同 R×C表中两分类变量皆为有序,但属性不同。 A 若目的为分析不同年龄组患者疗效之间有无差别,可 把它视为单向有序R×C表资料,选用秩和检验; B 若研究目的为分析有序分类变量间是否存在相关关 系,用卡方检验或等级相关。
分析步骤 1、计算截距和各偏回归系数。 2、多元回归方程的显著性检验: A、整个方程的显著性检验:用方差分析。 B、对各偏回归系数的显著性检验:F检验与 t检验。
要比较各个自变量对于应变量的作用大小,不能用偏回归系数,因为各偏回归系数
的单位不同。必须把偏回归系数标准化,化成没有单位的标准偏回归系数. 消除不同单位的影响后,标准偏回归系数的绝对值越大,该自变量对于应变量的作用 越大,但该差别是否有统计意义,也必须经过检验。
相关文档
最新文档