统计方法选择与常见的误用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
等级资料比较(单向有序资料)
要点和注意事项
(1)方法:
(2)注意:比较大小时用平均秩和。但是,大好 或小好要根据具体的赋值。
(双变量资料)
(同一观察对象同时测两个不同的(计量)指标。)
要点和注意事项
(1)方法:有无关系:相关分析; 能否推算:回归分析
(2)注意: 1)x,y呈直线趋势:直线回归,否则曲线拟合 2)x,y均呈正态分布:线性相关,否则等级相关
构成比 有无差 别
秩和检验:P=0.042;X2检验:P=0.051
如改为下表: (为了更有机会得出有差别的结论)
X2=5.677,P=0.017 建议还是采用秩和检验(从科学的态度)
八、多样本均数比较,采用多个t检验比较
后果:犯一类错误的概率增大。
小贴士: 多样本均数比较应用方差分析及其两 两比较(当不满足方差分析条件时:改用秩和 检验)
(1)个体差异大小(S) (2)样本例数多少(n)
3、检验水准α的高低
二、描述结果错误
计量资料的结果全部用 x s表示。
资料:来自广西医科大学学报,2006,23(6):883
集中趋势指标 离散趋势指标
选择判断的步骤:
资料
是 抗体滴度
G、S
否 是
偏态、开口
M、Q
否 X、S
单位不同
均数相差悬殊
CV
(双向有序资料)
要点和注意事项
(1)方法:等级相关分析
(2)注意:PEMS选择计数资料相关分析; SPSS相关分析:Spearman相关分析
要点和注意事项
(1)方法:一致性分析(X2检验)
(2)注意:也可用PEMS选择计数资料相关分析 (参照P62,例6.6)
7 1个Y,多个X的资料
多因素分析模型
统计分析的两大方面 统计描述 统计推断
根据数据类型选择统计方法
(摘自:娄 冬 华.从变量的类型看统计方法. 数理医药学杂志, 2003,16(3):282-283)
(计量资料的比较)
要点和注意事项
(1)方法:分析这两类变量之间的关系采用的统计 方法用t检验;若分类变量的分类数多于两类时方差 分析。 (2)条件:当然t检验或方差分析要求数据来自于 正态分布,且方差齐。 (3)备用方法:当条件不满足时,可以采用与分布 形式无关的非参数分析方法(秩和检验)。
药物治疗高血压后,血压下降 某种意义上说,经统
了5mmHg,经统计学检验,差 异有显著意义。但降低5mmHg 对改善临床症状无意义。(该 结论:经统计学检验,t=3.12,
Leabharlann Baidu
计学分析有差别,只 是说:在H0假设下, 由抽样误差造成两样 本的差别的概率很小, 即认为不是抽样误差
P=0.0023, 差异有统计学意义, 造成的(推算两总体
小贴士:
有理论数T<1的格,或1< T<5的格数超过 总格数的1/5,应采用适当的处理方法,否则, 会导致分析的偏性。
错误三:多组率的两两比较采用一般四格表X2 检验。
小贴士: 应采用 2 分割法。
七、单向有序资料(等级资料)仍用X2检验
小贴士: 单向有序资料比较应用秩和检验 等级资料
疗效有 无差别
该药有效。)
不同)。
没有统计学是万万不能的,但是统计学不是万能的。
六、X2检验的错误
错误一:四格表资料X2检验该校正未校正 小贴士:
① T>5,且n>40:不用校正 ② 1≤T<5,且n>40:必须校正 ③T<1,或 n <40:不能用X2检验,
改用Fisher确切概率法
错误二:R×C表资料,该处理而未处理。
二、描述结果的错误
计量资料的结果全部用 x s表示。
资料:来自广西医科大学学报,2006,23(6):883 应该用M±Q
三、没说明所用的统计方法(不规范)
现象一:没有写清所用统计方法的具体名称或根 本不写论文中所用的统计方法。如果交待不清或 根本不予交待,则审稿者或读者对论文结论的正 确与否将无法判断。 实例:
资料:来自广西医科大学学报,2006,23(6):940
现象二:“简略法” :计量资料比较采用t检验; 计数资料比较采用X2检验。配对设计与成组设计 数据的统计方法就不同,如果只说用了t检验,则 很难判断其正确性。
现象三:有的文章中只提一句“经统计学处理”后, 就写出结论;有的甚至干脆不提“统计”二字,直 接用P值说明问题了事。
(计数资料的比较)
要点和注意事项
(1)方法:
(X2检验或Fisher确切概率法)
(2)注意:校正条件。
1)n>40,T≥5:不用校正 2)n>40, 但1≤T<5:需校正 3)n <40,或T<1:Fisher 确切概率法
3 X是无序分类变量,Y是有序分类变量
例3 试分析针刺不同穴位的镇痛效果有无差别?
X±S
X±S
甲指标 3.48±1.65 4.76±2.52
0.10
两均数相差1.28
乙指标 5.23±1.12 6.38±1.21
0.01
两均数相差1.15
差值大小
u x1 x2 s x1 x2
x1 x2
s12
s
2 2
n1 n2
变异度
抽样误差大小
例数多少
是否拒绝H0,取决于: 1、被研究的事物有无本质的差异; 2、抽样误差大小:
9.47 100.00
一、未对资料进行统计分析就下结论
(最低级的错误)
一些文章仅计算均数、率等指标,没
有进行必要的统计分析,就进行比较,下结
论。
组别 例数 均数 标准差
甲组 20 2.13 0.98
乙组 20 2.33 1.04
结论:乙组高于甲组。 (t=0.3259, p=0.5351)
甲组(n=180) 乙组(n=120) P值
小贴士:应写出具体的统计方法。
四、假设检验结果表达错误
错误实例一:“P值越小,差别越大 ” P<0.05, “两者有显著差别” P<0.01,“两者有极显著差别”
最低级的 错误!
改正: P<0.05, “两者差异有统计学意义” P<0.01,“两者差异有统计学意义”
五、统计学意义与实际意义(拉虎皮作大 旗) 有统计学意义,不一定有实际意义!
多元回归分析 Logistic回归分析
Cox模型 聚类分析 判别分析
科研论文中常见的统计学误用
某大学学报(医学版)论文中统计推断 应用缺陷分析
(目前的情况)
% 16.84 27.37 9.47 24.21 12.63
Ⅰ、Ⅱ、Ⅳ(方法误用):占68.42% Ⅲ(注意事项):9.47% Ⅴ(没介绍方法):12.63 Ⅵ(低级错误):9.47%
要点和注意事项
(1)方法:
(2)注意:比较大小时用平均秩和。但是,大好 或小好要根据具体的赋值。
(双变量资料)
(同一观察对象同时测两个不同的(计量)指标。)
要点和注意事项
(1)方法:有无关系:相关分析; 能否推算:回归分析
(2)注意: 1)x,y呈直线趋势:直线回归,否则曲线拟合 2)x,y均呈正态分布:线性相关,否则等级相关
构成比 有无差 别
秩和检验:P=0.042;X2检验:P=0.051
如改为下表: (为了更有机会得出有差别的结论)
X2=5.677,P=0.017 建议还是采用秩和检验(从科学的态度)
八、多样本均数比较,采用多个t检验比较
后果:犯一类错误的概率增大。
小贴士: 多样本均数比较应用方差分析及其两 两比较(当不满足方差分析条件时:改用秩和 检验)
(1)个体差异大小(S) (2)样本例数多少(n)
3、检验水准α的高低
二、描述结果错误
计量资料的结果全部用 x s表示。
资料:来自广西医科大学学报,2006,23(6):883
集中趋势指标 离散趋势指标
选择判断的步骤:
资料
是 抗体滴度
G、S
否 是
偏态、开口
M、Q
否 X、S
单位不同
均数相差悬殊
CV
(双向有序资料)
要点和注意事项
(1)方法:等级相关分析
(2)注意:PEMS选择计数资料相关分析; SPSS相关分析:Spearman相关分析
要点和注意事项
(1)方法:一致性分析(X2检验)
(2)注意:也可用PEMS选择计数资料相关分析 (参照P62,例6.6)
7 1个Y,多个X的资料
多因素分析模型
统计分析的两大方面 统计描述 统计推断
根据数据类型选择统计方法
(摘自:娄 冬 华.从变量的类型看统计方法. 数理医药学杂志, 2003,16(3):282-283)
(计量资料的比较)
要点和注意事项
(1)方法:分析这两类变量之间的关系采用的统计 方法用t检验;若分类变量的分类数多于两类时方差 分析。 (2)条件:当然t检验或方差分析要求数据来自于 正态分布,且方差齐。 (3)备用方法:当条件不满足时,可以采用与分布 形式无关的非参数分析方法(秩和检验)。
药物治疗高血压后,血压下降 某种意义上说,经统
了5mmHg,经统计学检验,差 异有显著意义。但降低5mmHg 对改善临床症状无意义。(该 结论:经统计学检验,t=3.12,
Leabharlann Baidu
计学分析有差别,只 是说:在H0假设下, 由抽样误差造成两样 本的差别的概率很小, 即认为不是抽样误差
P=0.0023, 差异有统计学意义, 造成的(推算两总体
小贴士:
有理论数T<1的格,或1< T<5的格数超过 总格数的1/5,应采用适当的处理方法,否则, 会导致分析的偏性。
错误三:多组率的两两比较采用一般四格表X2 检验。
小贴士: 应采用 2 分割法。
七、单向有序资料(等级资料)仍用X2检验
小贴士: 单向有序资料比较应用秩和检验 等级资料
疗效有 无差别
该药有效。)
不同)。
没有统计学是万万不能的,但是统计学不是万能的。
六、X2检验的错误
错误一:四格表资料X2检验该校正未校正 小贴士:
① T>5,且n>40:不用校正 ② 1≤T<5,且n>40:必须校正 ③T<1,或 n <40:不能用X2检验,
改用Fisher确切概率法
错误二:R×C表资料,该处理而未处理。
二、描述结果的错误
计量资料的结果全部用 x s表示。
资料:来自广西医科大学学报,2006,23(6):883 应该用M±Q
三、没说明所用的统计方法(不规范)
现象一:没有写清所用统计方法的具体名称或根 本不写论文中所用的统计方法。如果交待不清或 根本不予交待,则审稿者或读者对论文结论的正 确与否将无法判断。 实例:
资料:来自广西医科大学学报,2006,23(6):940
现象二:“简略法” :计量资料比较采用t检验; 计数资料比较采用X2检验。配对设计与成组设计 数据的统计方法就不同,如果只说用了t检验,则 很难判断其正确性。
现象三:有的文章中只提一句“经统计学处理”后, 就写出结论;有的甚至干脆不提“统计”二字,直 接用P值说明问题了事。
(计数资料的比较)
要点和注意事项
(1)方法:
(X2检验或Fisher确切概率法)
(2)注意:校正条件。
1)n>40,T≥5:不用校正 2)n>40, 但1≤T<5:需校正 3)n <40,或T<1:Fisher 确切概率法
3 X是无序分类变量,Y是有序分类变量
例3 试分析针刺不同穴位的镇痛效果有无差别?
X±S
X±S
甲指标 3.48±1.65 4.76±2.52
0.10
两均数相差1.28
乙指标 5.23±1.12 6.38±1.21
0.01
两均数相差1.15
差值大小
u x1 x2 s x1 x2
x1 x2
s12
s
2 2
n1 n2
变异度
抽样误差大小
例数多少
是否拒绝H0,取决于: 1、被研究的事物有无本质的差异; 2、抽样误差大小:
9.47 100.00
一、未对资料进行统计分析就下结论
(最低级的错误)
一些文章仅计算均数、率等指标,没
有进行必要的统计分析,就进行比较,下结
论。
组别 例数 均数 标准差
甲组 20 2.13 0.98
乙组 20 2.33 1.04
结论:乙组高于甲组。 (t=0.3259, p=0.5351)
甲组(n=180) 乙组(n=120) P值
小贴士:应写出具体的统计方法。
四、假设检验结果表达错误
错误实例一:“P值越小,差别越大 ” P<0.05, “两者有显著差别” P<0.01,“两者有极显著差别”
最低级的 错误!
改正: P<0.05, “两者差异有统计学意义” P<0.01,“两者差异有统计学意义”
五、统计学意义与实际意义(拉虎皮作大 旗) 有统计学意义,不一定有实际意义!
多元回归分析 Logistic回归分析
Cox模型 聚类分析 判别分析
科研论文中常见的统计学误用
某大学学报(医学版)论文中统计推断 应用缺陷分析
(目前的情况)
% 16.84 27.37 9.47 24.21 12.63
Ⅰ、Ⅱ、Ⅳ(方法误用):占68.42% Ⅲ(注意事项):9.47% Ⅴ(没介绍方法):12.63 Ⅵ(低级错误):9.47%