临床科研中正确抉择统计学方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(四)常用的假设检验方法
计量资料的假设检验 计数资料的假设检验 等级资料的假设检验
1、常用计量资料的假设检验
比较目的 样本与总体比较 应用条件 例数较大 例数较小 两组资料的比较(完全 随机设计) 例数较大 u检验 t检验 u检验 统计方法
例数较小,来自正态分 成组设计的t检验 布且方差齐 例数较小且非正态分布 成组设计的秩和检验/ 或方差不齐 中位数检验
(I)用金标准诊断为"有病"的病例数为a + c; (2)上述"有病"的病例经诊断性试验检测,结果阳性者为a,阴性 者为c; (3)金标准诊断"无病"的例数为b+d,其中经诊断性试验检测阳性 者为b,阴性者为d; (4)列出四格表,将a,b,c,d的例数分别填入下列四格表(表1); 如从论著资料中数据,不能列出四格表的诊断性试验,则 无法进行评价。
自变量
属性
因变量
属性
统计方法
对数-线性
属性或数值
属性或数值 属性
属性 (二分)
属性 (多分) 数值
logistic回归
判别分析 方差分析
数值
数值或属性 数值
数值
数值 (有截缩) ─
多元回归
Cox回归 协方差分析 因子分析或聚类分析
属性 (有混杂) 数值
1、常用计量资料的假设检验(续表)
2.
当p> α时,做出“不拒绝其无差别的假设,还不
能认为各总体间有差别”的结论时就有可能犯第 二类错误(type Ⅱ)其犯错误的概率用β表示,通
常β为未知数,但假设检验p值越大,犯第二类错
误的概率就越小
注意:当认为干预有负影响时,应使用 双侧检验法。除非你有非常可信的证据 证明这种差异仅在一个方向存在,否则, 你需要用双侧检验法。
2.
3.
三、盲法比较诊断性试验与金标准的结果
评价诊断性试验时,采用盲法具有十分重要的意义, 即要求判断试验结果的人,不能预先知道该病例用 金标准划分为"有病"还是"无病",以免发生疑诊偏倚。 新的诊断性试验,对疾病的诊断结果应当与金标准 诊断的结果进行同步对比,并且列出格表,以便进 一步评估,其方法如下。
表1 四格表的排列
金标准(诊断标准)
合计 有病 + 诊断性 试验 _ 合计 真阳性a 假阴性c a+c 无病 假阳性b 真阴性d b+d a+b a+c n
敏感度(sensitivity,SN)是正确诊断的真阳性病例在中风组中所占的百 分率,计算公式为:SN = a/(a+c)100% 特异度(specificity,SP) 是正确诊断的真阴性部分所占百分率,计算公 式为:SP = d/(b+d)100% 准确性 (accuracy,AC) 反映了诊断试验结果与金标准试验结果的符合 或一致程度,计算公式为:AC = (a+d)/N 阳性预测值(positive predictive value,PPV)是诊断试验为阳性结果中金 标 准 证 实 患 中 风 者 所 占 的 百 分 率 , 计 算 公 式 为 : PPV = a/(a+b)100% 阴性预测值(negative predictive value,NPV)是诊断试验为阴性结果中金 标准证实未患中风者所占的百分率,计算公式为:NPV = d/(c+d) 100% . 阳性似然比(positive likelihood ratio, LR+)为患中风组真阳性率和未患 中风组假阳性率的比值,计算公式为:LR+ =SN/(1-SP) ,表明诊断 性试验为阳性时患病于不患病的比值,比值越大则患病的概率越大. 阴性似然比(negative likelihood ratio, LR-)为患中风组假阴性率与未患 中风真阴性率的比值,计算公式为:LR- =(1-SN)/SP,表明诊断试验 为阴性时,患病与不患病时机会的比值.
数理统计与概率论是统计的理论基础 只有当某个或某些条件满足时,某个
数理统计统计公式才成立
涉及最多是数据分布特征 其次方差齐性 理论数大小
二、数据资料的描述
(一)数值变量资料的描述
描述集中趋势的指标,用以反映一组数 据的平均水平 描述离散程度的指标,用以反映一组数 据的变异大小 (两类指标的联合应用才能全面描述一组 数值变量的基本特征)
2、常用计数资料假设检验方法(续表)
比较目的 应用条件 统计方法 配对X2检验 较正配对X2检验
配对四格表比较 b+c >40 (配对设计) np>5且n(1-p)>5
多个率或构成比 全部格子T>5或少于 列联表的X2检验 的比较(完全随 1/5的格子1<T<5 机设计) 若有T<1或有多于 1/5的格子1<T<5 列联表的确切概率 法
临床科研中正确抉择 统计学方法
一、四个因素
熟悉和掌握下述四个因素是正确进行统计
分析的基础
(一)分析目的
统计描述
– 统计指标、统计图或统计表 – 均数、标准差、率、构成比
统计推断(参数估计、假设检验) 相关分析
– 以相关系数来衡量各因素间的密切程度和方向
回归分析
– 研究某因素与另一因素的依存关系
统计学处理方法的选择
单个自变量资料的统计学分析方法 自变量 因变量 统计方法
属性
二分 (属性) 多分 (属性) 属性 数值
属性
数值 数值 数值 (有截缩) 数值
卡方 (χ2) 检验
t-检验 方差分析 寿命表法 / 积限法 回归 (或相关) 分析
统计学处理方法的选择
两个或以上自变量资料的统计学分析方法
均数与标准差联合使用描述正态分布或 近似正态分布资料的基本特征 中位数与四分位数间距联合使用描述偏 态分布或未知分布资料的基本特征 最为常见的错误是不考虑这些指标的适 用范围和条件的滥用
(二)分类变量资料的描述
以比代率,即误将构成比(proportion) 当作率(rate)来描述某病发生的强度和 频率 把各种不同的率相混淆,如把患病率与 发病率、死亡率与病死率等概念混同
(二)资料类型
数值变量资料-计量资料 无序分类变量资料-计数资料 有序分类变量资料-等级资料 注意:不宜将定量资料转化为分类资料
(三)设计方法
每一种科研设计方法都有与之相适应
的统计方法
成组设计t检验 配对t检验 条件Logistic回归 非条件Logistic回归
(四)数理统计条件
在一定时间(一般为1年) 内,某人群中发生某种疾 病的新病例频率。
某特定时间内某人群中 发现有某种疾病者的比 例。
死亡率=一年内总死亡数/同年平均 在一定时间(一般为1年) 人口数 内,某人群中死亡的频率。
病死率Case fatality ra tio
因某病死亡人数/患该病的总数
患某病者中因该病死亡 者占的比例。
比较目的
配对资料的比较 (配对设计)
应用条件
例数较大(任意分布) 例数较小,差值来自正态
统计方法
配随设计u检验 配对设计的t检验
例数较小,差值为非正态 多组资料的比较 各组均数来自正态分布 且方差齐
配对设计的秩和检验 成组设计的方差分析
成组设计的秩和检验 配伍设计的方差分析 配伍设计的秩和检验
(完全随机设计) 各组为非正态分布且 方差不齐 配伍资料的比较 (配伍设计) 各组均数来自正态分布 且方差齐 各组为非正态分布且 方差不齐
(二)假设检验的基本步骤
建立检验假设(三个内容)
1. 无效假设(null hypothesis)H0
2. 备择假设(alternative hypothesis)H1 3. 检验水准(size of test)α
计算统计量 根据统计量的值来得到概率(p)值; 再按概率值的大小得出结论
(三)假设检验的注意事项
三、数据资料的比较
(一)假设检验的基本思想
样本数据间的不同有两种原因所致
1. 样本来自同一总体,样本指标间的不同是
由于抽样误差所引起
2. 样本分别来自不同的总体,其样本指标间
的不同是由于来源于不同的总体所致
假设检验是反证法原理的统计应用
假设两个样本均数可能来源于同一总体, 然后计算出在此假设下的某个统计量的 大小,当这个统计量在其分布中的概率 较小时(如p≤0.05)我们就拒绝其假设, 而接受其对立假设,认为两样本分别来 自不同的总体。
前提
1. 研究者需要通过样本的信息去推断总体的
结论
2. 各样本资料对其总体应具有良好的代表性
假设检验的概率大小与结论的关系
1. 当p≤ α时,概率越小,越有理由拒绝H0假
设(无差别的假设),即拒绝H0假设的可
信程度就越大
2. 注意:当p≤ α时,不能说“概率越小,组
间的差别就越大”
假设检验的结论不能绝对化
注意:相关关系并不等于因果关系
1、常用数值资料的关系分析方法
比较Baidu Nhomakorabea的
两变量的 依存关系
应用条件
正态单变量资料 正态双变量资料
统计方法
直线回归Ⅰ型 直线回归Ⅱ型 直线相关 等级相关
两变量的 相关关系
正态双变量资料 两变量均不服从正态
2、无序分类变量(计数资料)的相关分析
前瞻性研究
–相对危险度(RR)
描述数值变量资料的常用指标
指标名称 均数(X) 中位数(M) 几何均数(G) 标准差(s) 四分位数间距 极差(R) 变异系数(CV) 适用的资料 正态分布或近似正态分布 偏态分布、分布未知、两端无界 对数正态分布、等比资料 正态分布或近似正态分布 偏态分布、分布未知、两端无界 观察例数相近的数值变量 比较几组资料间的变异大小
–在作出结论时,要避免使用绝对的或肯定的
语句
–当p≤ α时,只要p≠0,我们无法完全拒绝
无差别的假设,即不能肯定各总体间有差别
–当p> α时,只要p≠1,我们无法完全接受
无差别的假设,即不能肯定各总体间无差别
两组与多组比较
1. 两组比较:t检验、u检验、两组秩和检验、
四格表和较正四格表的X2检验等
–归因危险度(AR)
回顾性研究
–比值比(OR)
3、有序分类变量(等级资料)等级相关
参数检验
–积矩相关系数(Pearson’sγ)
非参数检验
–Spearman等级相关系数
诊断性试验的研究与评价
第一节 诊断性试验研究的方法与评价条件
一、确定金标准
1. 诊断性试验的金标准(gold standard)是指当前临床医师 公认的诊断疾病最可靠的方法,也称为标准诊断。 应用金标准可以正确区分“有病”或“无病”。 2. 拟评价的诊断性试验对疾病的诊断,必须有金标准 为依据,所谓金标准包括活检、手术发现、细菌培 养、尸检、特殊检查和影象诊断,以及长期随访的 结果。
2、常用计数资料假设检验方法
比较目的
样本率与总体 率的比较 两个率或构成 比的比较(完 全随机设计)
应用条件
n较小时
统计方法
二项分布的直接法
np>5且n(1-p)>5
np>5且n(1-p)>5 n>40且T>5 n>40且1<T<5 n<40或T<1
二项分布的u检验
二项分布的u检验 四格表的X2检验 较正四格表的X2检 验 四格表的确切概率 法
二、选择研究对象
1. 诊断性试验的研究对象,应当包括两组;一组是用金 标准确诊"有病"的病例组,另一组是用金标准证实为 "无病"的患者,称为对照组。所谓"无病"的患者,是 指没有金标准诊断的目标疾病,而不是完全无病的正 常人。 病例组应包括各型病例:如典型和不典型的,早、中 与晚期病例,轻、中与重型的,有和无并发症者等, 以便使诊断性试验的结果更具有临床实用价值。 对照组可选用金标准证实没有目标疾病的其他病例, 特别是与该病容易混淆的病例,以期明确其鉴别诊断 价值。正常人一般不宜纳人对照组。
3、常用等级资料假设检验方法
比较目的 两组比较(完全随机设计) 多组比较(完全随机设计) 配伍设计 配对设计 统计方法 两组比较的秩和检验 多组比较的秩和检验 配伍设计的秩和检验 符号秩和检验
四、变量间的相关分析
数据资料的比较,是同一指标的不同处 理组间的比较。 在临床研究工作中,常常涉及疾病危险 因素的研究和疾病危险因素的探讨,即 分析某个因素与疾病间的关系
描述分类变量资料的常用指标
指标名称 率 构成比 计算公式 发生某现象的观察单位数 可能发生某现象的观察单位数 A×100% A+B+…. 意义 描述事件发生的强度和 频率 事物内部各组成部分所 占的比重
发病率 Incidence
患病率(现患率) Prevalence 死亡率 Mortality
一年内发生的某病新病例数/同年 平均人口数
2. 多组比较:方差分析、多组秩和检验、行
乘列X2检验等(也可用于两组比较)
3. 注意:错误使用两组比较的方法代替多组
比较的情况并不少见,如,三个均数比较 用三个t检验、四个t检验
假设检验结论的两类错误
1.
当p≤ α时,做出“拒绝其无差别的假设,可认为 各总体间有差别”的结论时就有可能犯错误,这 类错误称为第一类错误(typeⅠ error)其犯错误 的概率用α 表示,若α取0.05,此时犯Ⅰ型错误的 概率≤0.05,若假设检验的p值比0.05越小,犯第 一类错误的概率就越小。