统计学方法选择与结果解释
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两样本(成组)t检验 单因素方差分析 2检验(独立样本) 两样本Wilcoxon秩和检验或多样本 Kruskal-Wallis秩和检验
匹配设计
配对t检验 方差分析 配对(Wilcoxon单样本秩和检验)或配伍设计 的秩和检验(Friedman秩和检验) McNemar检验
Βιβλιοθήκη Baidu
资料类型
资料类型不同分布不同统计描述的指 标不同
明年龄是影响肺癌死亡率的唯一因素)
数据的分组问题
分组:就是将专业上认为性质相同的个体 归在一起,将性质不同的个体区别开来
试图在专业上反映出组内的同一性和组间的差 异性
在此基础上进行的数据分析才有可能揭示 出事物的本质和规律
损失信息 专业意义
同一性 变异性
美国儿科杂志曾报道了医生间关于口服氨
苄青霉素副作用研究的一场有趣的争论。
对于不具可比性的资料,基本的统计调整 技术
分层分析 标准化 CMH卡方检验 多因素分析
混杂因素
某病两种疗效的治愈率比较
病情 轻型 重型 合计 甲疗法 病人数 80 120 200 治愈率(%) 90.00 70.00 78.00 60 40 100 乙疗法 病人数 治愈率(%) 90.00 70.00 82.00
n=60
=?次/分
?
高原
样本
x =155g/L
s = 24g/L
统计 描述
一般
0=140g/L
统计推断
混杂因素的控制
综合效应
处理因素 非处理因素
均衡/可比性—各组观测指标之间的差异只 能归因于研究因素而不是其它原因 混杂因素
不具可比的非处理因素
混杂因素
某病两种疗效的治愈率比较
病情 轻型 重型 合计 甲疗法 病人数 80 120 200 治愈率(%) 90.00 70.00 78.00 60 40 100 乙疗法 病人数 治愈率(%) 90.00 70.00 82.00
B医生认为,在缺乏未服氨苄青霉素对照组时,只好 以50mg组与较大剂量组比较。若腹泻与剂量无关, 则两组腹泻发生率差异应无统计学意义。因此,将 较大剂量各组合并(见表2)。
表2 表1合并后的结果
剂量(mg/kg/ 天) 50 结果: >50
无腹泻例数 79 199
有腹泻例数 21 101
较大剂量组的腹泻发生率(约30%)高于50mg组(21%), 2 检 验 P<0.05。因此,认为腹泻与药物剂量有关。
A医生认为:“腹泻副作用不论剂量大小均常发生,虽随剂量
增加而增加,但无统计学意义(Pearson2
检验P>0.05)”。见表
1。
表1 口服氨苄青霉素的副作用
剂量(mg/kg 天) 50 100 150 200
无腹泻例数 79 70 61 68
有腹泻例数 21 30 39 32
合计例数 100 100 100 100
生态学谬误
群体数据结论向个体推论
一个经典例子:Durkheim资料分析所下的结论
对若干地区的调查发现,地区中基督徒人数所占比例越大, 自杀率就越高。 相关和回归分析结果表明,基督徒人数比例与自杀率呈现 出很强的联系,即基督徒自杀率高于其它宗教人群。
但这种因果推论很可能是有问题的!
因为并不知道这些自杀者到底来自哪些人群,它完全可能 是另外一种情况,即在基督徒占大多数的地区,天主教徒 或其它宗教信徒由于宗教歧视而更可能趋向于自杀。
变量间关系
回归分析—数量依存关系
简单直线回归 多重线性回归—对反应变量为定量变量进行的 多变量分析 logistic回归—对反应变量为分类变量所进行的 多变量分析 Cox比例风险回归—对反应变量为含有截尾数 据的生存时间所进行的分析 曲线回归
关联性分析
直线相关 秩相关 偏相关 列联系数
生存分析
C医生认为,假如上述合并后面三组再比较的方法 妥当的话,则反过来并组也应一样,即<200mg组 的腹泻发生率应低于200mg组。
表3 按另一种分组合并的结果
剂量(mg/kg/天)
无腹泻例数
有腹泻例数
200
<200
结果:
68
210
32
90
两组腹泻发生率分别为30%和32%, 2 检验P>0.5。因此, 不能同意腹泻发生率与口服氨苄青霉素剂量有关。
样本例数
分布
样本例数 足够大 t分布 二项分布 Poisson分布 正态分布 正态分布
2
2分布
统计分析应注意的问题
分析的步骤
数据探测
异常值/离群值 直方图、散点图、趋势线图等 正态性、方差齐性检验
统计描述
选择合适的指标表达群体指标分布 最有代表性的值
统计推断
区间估计 假设检验
引例分析
目的 随机抽样
应变量为含有截尾数据的生存时间 Cox比例风险回归分析
由于肺癌死亡率与年龄有关,通常随年龄增高
而增高;
A、B两地区各年龄组人口构成不同,A地区高 年龄组人口构成大于B地区,这就造成了A地 区总的肺癌死亡率高于B地区;
上述矛盾是因为两地人口年龄构成不同造成的
所谓可比性问题其实与研究目的有关。
如肺癌一例,假定已知年龄是肺癌死亡率的影响 因素,如果想探索除了年龄之外还有没有其它因 素影响肺癌死亡率,那么就应该对年龄进行标准 化(如果标化后A、B两地肺癌死亡率相同,则说
配对t检验
随机区组设 计方差分析
Wilcoxon符号 秩和检验 2
Friedman秩 和检验
RR
2
定 无序 性
检验、 Fisher确切 概率法
表资料 检验、Fisher 确切概率法
配对四格表 检验
配对 列联表
检
表2 双变量(多变量)资料的关联性分析方法小结
数据特征 x、y服从双变量正态分布 定量资料 相 关 分 R C 析 定性资料 ( 表) x、y不服从双变量正态分 布
定量资料 定性资料 等级资料
分析条件—考察数据特征
参数分析方法本身的分析条件
正态 独立 方差齐
变量变换 非参数分析
降低检验效能
对比组数
两总体间比较
t检验或2检验 秩和检验 方差分析 Z检验(大样本正态近似) 二项分布
多总体间比较—两两比较增大犯I型错误的 概率
调整水准 多总体综合比较
方差分析 R×C 2检验 秩和检验 进一步两两比较 – LSD、SNK、 2分割等
结局 时间 截尾
例如,一个四格表资料可以进行的统计 分析或计算的统计量至少有差异性检验 和独立性检验、列联系数、kappa系数、 OR值、RR值、灵敏度、特异度等。
甲、乙两药治疗小儿上消化道出血的效果
组别 甲药
有效 27
无效 18
合计 45
乙药
合计
40
67
5
23
45
90
设计类型
自身带有
水平1 研究总体 水平2 水平m …
地 预期死亡数 ni Pi (4)=(2) (3) 0.148 0.647 2.148 5.935
20~ 40~ 60~ 合 计
8.878( ni P ) i
23 SMR 2.59 8.878
比较A、B两地区肺癌死亡率的高低,总 的肺癌死亡率A地区高于B地区,但B地 区各年龄组肺癌死亡率却均高于A地区
可 比 性
随机 匹配 限制
外来施加
设计类型
涉及设计中引入的因素
试验性研究
完全随机设计—单因素
配对/配伍设计(两因素无重复设计)—2因素
析因设计(两因素有重复设计)—2因素+交互效应 交叉设计—处理因素、顺序、阶段、个体
观察性研究—独立总体
横断面研究 队列研究
病例对照研究
独立样本假设检验
结果的正确解释
统计学检验与客观事实
用概率的方法,利用样本信息验证客观事实是 否真正存在
概率基础上的结果—犯错误
I型错误 II型错误—样本例数过小,检验效能过低
统计学结论和专业意义 统计学结果和因果推论
不同类型研究结果的论证强度
横断面研究 病例对照研究 队列研究 试验性研究
不同分析单位数据分析结果
分析方法 直线相关分析 Spearman秩相关
双向无序
双向有序、属性不同 双向有序、属性相同
检验
Spearman秩相关、线性趋势检验 一致性检验(kappa系数的假设检验)
一个应变量,一个自变量:直线回 归分析 回 应变量为连续型定量变量,服从正态分 一个应变量,多个自变量:多重线 归 布 性回归分析 分 析 应变量为定性变量 logistic回归分析
正确理解可比性
均衡/可比性
各组观测指标之间的差异只能归因于研究因素 而不是其它原因
表 5.10 间接法计算某地 2000 年恶性肿瘤标准化死亡率(1/10 万) 年龄组
i (1) 0~
标准死亡率
某 人口数 ni (3) 3066 2516 1440 1738 8760
Pi (2) 4.83
25.73 149.14 341.48 53.86
第22章 统计学方法选择 与结果解释
统计方法选择的基本思路
研究目的 设计类型
资料类型
数据特征 对比组数 样本含量
综合判断
研究目的
影响因素分析
通过比较观测指标(分布)的差别说明是否归因 于处理因素或分组因素——假设检验 分析变量之间是否存在某种联系——相关或回 归分析
评价 预测 ……
总体间比较
t检验(t’检验) 2检验 秩和检验 方差分析 Z检验(大样本正态近似) 二项/Poisson分布
表1
单变量资料差异比较的分析方法小结
资 料 数据 类 特征 型
完全随机设计 单组设 计 两组 多组 两组
配对或配伍设计 多组
样本与 正态、 总体均 定 方差齐 数比较 的t检验 量 资 非正态 Wilcoxo 料 和/或 n符号 方差不 秩和检 齐 验
二项分 布直接 计算概 率法、 正态近
单因素方差分 两样本t检验 析 t¢ 检验、 Wilcoxon秩 2 和检验 KruskalWallis H秩和 2 RC 检验
匹配设计
配对t检验 方差分析 配对(Wilcoxon单样本秩和检验)或配伍设计 的秩和检验(Friedman秩和检验) McNemar检验
Βιβλιοθήκη Baidu
资料类型
资料类型不同分布不同统计描述的指 标不同
明年龄是影响肺癌死亡率的唯一因素)
数据的分组问题
分组:就是将专业上认为性质相同的个体 归在一起,将性质不同的个体区别开来
试图在专业上反映出组内的同一性和组间的差 异性
在此基础上进行的数据分析才有可能揭示 出事物的本质和规律
损失信息 专业意义
同一性 变异性
美国儿科杂志曾报道了医生间关于口服氨
苄青霉素副作用研究的一场有趣的争论。
对于不具可比性的资料,基本的统计调整 技术
分层分析 标准化 CMH卡方检验 多因素分析
混杂因素
某病两种疗效的治愈率比较
病情 轻型 重型 合计 甲疗法 病人数 80 120 200 治愈率(%) 90.00 70.00 78.00 60 40 100 乙疗法 病人数 治愈率(%) 90.00 70.00 82.00
n=60
=?次/分
?
高原
样本
x =155g/L
s = 24g/L
统计 描述
一般
0=140g/L
统计推断
混杂因素的控制
综合效应
处理因素 非处理因素
均衡/可比性—各组观测指标之间的差异只 能归因于研究因素而不是其它原因 混杂因素
不具可比的非处理因素
混杂因素
某病两种疗效的治愈率比较
病情 轻型 重型 合计 甲疗法 病人数 80 120 200 治愈率(%) 90.00 70.00 78.00 60 40 100 乙疗法 病人数 治愈率(%) 90.00 70.00 82.00
B医生认为,在缺乏未服氨苄青霉素对照组时,只好 以50mg组与较大剂量组比较。若腹泻与剂量无关, 则两组腹泻发生率差异应无统计学意义。因此,将 较大剂量各组合并(见表2)。
表2 表1合并后的结果
剂量(mg/kg/ 天) 50 结果: >50
无腹泻例数 79 199
有腹泻例数 21 101
较大剂量组的腹泻发生率(约30%)高于50mg组(21%), 2 检 验 P<0.05。因此,认为腹泻与药物剂量有关。
A医生认为:“腹泻副作用不论剂量大小均常发生,虽随剂量
增加而增加,但无统计学意义(Pearson2
检验P>0.05)”。见表
1。
表1 口服氨苄青霉素的副作用
剂量(mg/kg 天) 50 100 150 200
无腹泻例数 79 70 61 68
有腹泻例数 21 30 39 32
合计例数 100 100 100 100
生态学谬误
群体数据结论向个体推论
一个经典例子:Durkheim资料分析所下的结论
对若干地区的调查发现,地区中基督徒人数所占比例越大, 自杀率就越高。 相关和回归分析结果表明,基督徒人数比例与自杀率呈现 出很强的联系,即基督徒自杀率高于其它宗教人群。
但这种因果推论很可能是有问题的!
因为并不知道这些自杀者到底来自哪些人群,它完全可能 是另外一种情况,即在基督徒占大多数的地区,天主教徒 或其它宗教信徒由于宗教歧视而更可能趋向于自杀。
变量间关系
回归分析—数量依存关系
简单直线回归 多重线性回归—对反应变量为定量变量进行的 多变量分析 logistic回归—对反应变量为分类变量所进行的 多变量分析 Cox比例风险回归—对反应变量为含有截尾数 据的生存时间所进行的分析 曲线回归
关联性分析
直线相关 秩相关 偏相关 列联系数
生存分析
C医生认为,假如上述合并后面三组再比较的方法 妥当的话,则反过来并组也应一样,即<200mg组 的腹泻发生率应低于200mg组。
表3 按另一种分组合并的结果
剂量(mg/kg/天)
无腹泻例数
有腹泻例数
200
<200
结果:
68
210
32
90
两组腹泻发生率分别为30%和32%, 2 检验P>0.5。因此, 不能同意腹泻发生率与口服氨苄青霉素剂量有关。
样本例数
分布
样本例数 足够大 t分布 二项分布 Poisson分布 正态分布 正态分布
2
2分布
统计分析应注意的问题
分析的步骤
数据探测
异常值/离群值 直方图、散点图、趋势线图等 正态性、方差齐性检验
统计描述
选择合适的指标表达群体指标分布 最有代表性的值
统计推断
区间估计 假设检验
引例分析
目的 随机抽样
应变量为含有截尾数据的生存时间 Cox比例风险回归分析
由于肺癌死亡率与年龄有关,通常随年龄增高
而增高;
A、B两地区各年龄组人口构成不同,A地区高 年龄组人口构成大于B地区,这就造成了A地 区总的肺癌死亡率高于B地区;
上述矛盾是因为两地人口年龄构成不同造成的
所谓可比性问题其实与研究目的有关。
如肺癌一例,假定已知年龄是肺癌死亡率的影响 因素,如果想探索除了年龄之外还有没有其它因 素影响肺癌死亡率,那么就应该对年龄进行标准 化(如果标化后A、B两地肺癌死亡率相同,则说
配对t检验
随机区组设 计方差分析
Wilcoxon符号 秩和检验 2
Friedman秩 和检验
RR
2
定 无序 性
检验、 Fisher确切 概率法
表资料 检验、Fisher 确切概率法
配对四格表 检验
配对 列联表
检
表2 双变量(多变量)资料的关联性分析方法小结
数据特征 x、y服从双变量正态分布 定量资料 相 关 分 R C 析 定性资料 ( 表) x、y不服从双变量正态分 布
定量资料 定性资料 等级资料
分析条件—考察数据特征
参数分析方法本身的分析条件
正态 独立 方差齐
变量变换 非参数分析
降低检验效能
对比组数
两总体间比较
t检验或2检验 秩和检验 方差分析 Z检验(大样本正态近似) 二项分布
多总体间比较—两两比较增大犯I型错误的 概率
调整水准 多总体综合比较
方差分析 R×C 2检验 秩和检验 进一步两两比较 – LSD、SNK、 2分割等
结局 时间 截尾
例如,一个四格表资料可以进行的统计 分析或计算的统计量至少有差异性检验 和独立性检验、列联系数、kappa系数、 OR值、RR值、灵敏度、特异度等。
甲、乙两药治疗小儿上消化道出血的效果
组别 甲药
有效 27
无效 18
合计 45
乙药
合计
40
67
5
23
45
90
设计类型
自身带有
水平1 研究总体 水平2 水平m …
地 预期死亡数 ni Pi (4)=(2) (3) 0.148 0.647 2.148 5.935
20~ 40~ 60~ 合 计
8.878( ni P ) i
23 SMR 2.59 8.878
比较A、B两地区肺癌死亡率的高低,总 的肺癌死亡率A地区高于B地区,但B地 区各年龄组肺癌死亡率却均高于A地区
可 比 性
随机 匹配 限制
外来施加
设计类型
涉及设计中引入的因素
试验性研究
完全随机设计—单因素
配对/配伍设计(两因素无重复设计)—2因素
析因设计(两因素有重复设计)—2因素+交互效应 交叉设计—处理因素、顺序、阶段、个体
观察性研究—独立总体
横断面研究 队列研究
病例对照研究
独立样本假设检验
结果的正确解释
统计学检验与客观事实
用概率的方法,利用样本信息验证客观事实是 否真正存在
概率基础上的结果—犯错误
I型错误 II型错误—样本例数过小,检验效能过低
统计学结论和专业意义 统计学结果和因果推论
不同类型研究结果的论证强度
横断面研究 病例对照研究 队列研究 试验性研究
不同分析单位数据分析结果
分析方法 直线相关分析 Spearman秩相关
双向无序
双向有序、属性不同 双向有序、属性相同
检验
Spearman秩相关、线性趋势检验 一致性检验(kappa系数的假设检验)
一个应变量,一个自变量:直线回 归分析 回 应变量为连续型定量变量,服从正态分 一个应变量,多个自变量:多重线 归 布 性回归分析 分 析 应变量为定性变量 logistic回归分析
正确理解可比性
均衡/可比性
各组观测指标之间的差异只能归因于研究因素 而不是其它原因
表 5.10 间接法计算某地 2000 年恶性肿瘤标准化死亡率(1/10 万) 年龄组
i (1) 0~
标准死亡率
某 人口数 ni (3) 3066 2516 1440 1738 8760
Pi (2) 4.83
25.73 149.14 341.48 53.86
第22章 统计学方法选择 与结果解释
统计方法选择的基本思路
研究目的 设计类型
资料类型
数据特征 对比组数 样本含量
综合判断
研究目的
影响因素分析
通过比较观测指标(分布)的差别说明是否归因 于处理因素或分组因素——假设检验 分析变量之间是否存在某种联系——相关或回 归分析
评价 预测 ……
总体间比较
t检验(t’检验) 2检验 秩和检验 方差分析 Z检验(大样本正态近似) 二项/Poisson分布
表1
单变量资料差异比较的分析方法小结
资 料 数据 类 特征 型
完全随机设计 单组设 计 两组 多组 两组
配对或配伍设计 多组
样本与 正态、 总体均 定 方差齐 数比较 的t检验 量 资 非正态 Wilcoxo 料 和/或 n符号 方差不 秩和检 齐 验
二项分 布直接 计算概 率法、 正态近
单因素方差分 两样本t检验 析 t¢ 检验、 Wilcoxon秩 2 和检验 KruskalWallis H秩和 2 RC 检验