常见统计学错误
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对数剂量
回归方程: Y = 61.782-6.884 log(剂量) 决定系数: R2=0.095。 回归方程无统计学意义,无剂量反应关系! 若反应和剂量间散点图呈曲线状,剂量可作适当变换。
4. 重复测量资料不能逐个时间点两组比较
例4 为研究某食物对血清胆固醇浓度的影响,各取7只兔子, 分别以正常食物和待研究食物喂养,在实验前、喂养5周、10 周后,各取血测量其中胆固醇浓度,其自然对数转换后的数据 见表22.1,问血清胆固醇浓度随时间变化的趋势是否受该食物的 影响。 处理组 对照组
正确作法:随机区组资料的方差分析
将处理间的差别与扣除区组间变异后的随机误差 进行比较,识别差异的能力大大提高。 本例, 处理组间 F=8.23, P=0.003 差别有统计学意义 区组间 F=1.21,P=0.36 差别无统计学意义
2.析因设计不能用单因素方差分析
例2 收集甲状腺术中正常甲状腺组织做成16份标本, 按析因设计随机分为四个处理组。将处理后的标本分 别行免疫组化染色,作单位面积HLA-Ⅱ抗原阳性细 胞计数。试分析如下数据:
AB的交互效应 = [(第四组均数 第二组均数)(第三组均数 第一组均数)] /2 =[(1.9 - 1.8)- (2.2-2.5)] /2 = 0.2
检验
iii) A的主效应:F=1.37,P=0.26 ; B的主效应: F=47.13,P=0.00 A与B的交互效应:F=0.03,P=0.87
ຫໍສະໝຸດ Baidu
为什麽不对?
这是典型的两因素2水平的析因设计! i) 有负初衷——分析各因素的效应! ii)直接比较四组资料,组间变异大,不敏感!
正确作法:析因设计的方差分析
i) 主效应:某一因素各水平间的平均差别。 A因素的主效应 =[(第三组均数+第四组均数)(第一组均数+第二组均数)] / 2 =[(2.2+1.9)(2.5+1.8)]/2 = 0.1 ii) 交互效应:若某因素的单独效应随另一因素水平的变化而 有较大变化,则称这两个因素间存在交互效应。
为什麽不对? 均数做因变量造成假象 ! * 回归方程是否有统计学意义与反应的变异状况有关 * 以诸个体反应值的均数作回归计算,掩盖变异性, 造成假象
噬菌率(均数)
对数剂量
正确作法:用个体资料作回归分析
90
80
噬
70
菌 60 率 50 ( 原
30 40
始 数 据
20 -.5 0.0 .5 1.0 1.5 2.0 2.5
单因素方差分析 ?!
直接比较四组资料间的差别 F=60.00,P=0.00 认为:四组间差别具有统计学意义
表2 析因设计下的实验结果(均数)
A 因素(培养) B 因素(时间) 95%空气和 5%CO2 95%O2 和 5%CO2 7天 2.5(第一组) 2.2(第三组) 14 天 1.8(第二组) 1.9(第四组)
第1组(经95%空气和5%CO2培养 7天):2.5, 2.4, 2.6, 2.5 第2组(经95%空气和5%CO2培养14天):1.8, 1.9, 1.7, 1.8 第3组(经95%O2 和5%CO2培养 7天):2.2, 2.3, 2.1, 2.2 第4组(经95%O2 和5%CO2培养14天):1.9, 1.8, 1.7, 1.9
结论:B因素(培养天数)的效应具有统计学意义。
检验 A的主效应:F=1.37,P=0.26 ; B的主效应: F=47.13,P=0.00 A与B的交互效应:F=0.03,P=0.87 结论:B因素(培养天数)的效应具有统计学 意义。
3.剂量-反应关系 不能用单因素方差分析
例3 有人分析蛇毒因子(CVF)的剂量对血液白细 胞噬菌率的影响,得表3的数据,欲讨论剂量-反应 关系。
组数 1 2 3 4 5 6 CVF 剂量 0 10 20 40 80 160 例数 5 5 5 5 5 5 噬菌率(均数) 60.0±17.0 57.0±15.2 54.0±16.6 51.0±17.2 48.0±16.0 45.0±16.4
i) 单因素方差分析?!
F=0.701,P>0.5, 均数间差别无统计学意义
单因素方差分析 ?!
同时比较A,B,C,D四个处理组均数间的 差异, 得F=0.55, P=0.59 认为:四个处理组均数的差异无统计学意义。
为什麽不对?
(1)辜负了设计的苦心 —— 随机区组设计! * 同一件标本为一个区组; * 同一区组内4种处理有较好的可比性。 无视区组的存在,组内个体间变异较大,识别差异的能力 大大降低。 (2)不能翻来覆去比较! * 6次t 检验会增大第一类错误 ! 设 每次t 检验犯第一类错误的概率为0.05, 则 6次t 检验中 一次不错的概率 = (1-0.05)6 第一类错误的概率 = 至少一次出错的概率 = 1-(1-0.05)6 = 0.27
1. 随机区组设计不可用成组分析方法
例1 有5件标本I,II,III,IV,V,每一件均匀分成 4份,随机分配给4种处理A,B,C,D,得下表资 料,试比较处理间的差别。
区组 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ A 0.80 0.74 0.31 0.48 0.76 B 0.36 0.38 0.20 0.18 0.26 处理组 C 0.17 0.42 0.38 0.44 0.28 D 0.28 0.36 0.25 0.22 0.13
不恰当做法: 视纵向4列为4组数据,进行4组间比较。
多次t检验 ?!
分别作两组比较的t检验,得
A与B t值 P值 3.30 0.02 A与C 2.60 0.03 A与D 3.61 0.01 B与C 0.96 0.37 B与D 0.51 0.63 C与D 1.43 0.19
认为:A与B,A与C,A与D 差异具有统计学意义; B与C,B与D,C与D 差异无统计学意义。
为什麽不对?
有负初衷 —— 探讨反应随剂量变化的趋势 * 由多个剂量组的比较只能得知均数间是否有差异 * 有差异不等于有剂量反应关系
均数关于log (剂量)的回归分析 ?!
62 60 58 56 54 52 50 48 46 44 -. 5 0. 0 .5 1. 0 1. 5 2. 0 2. 5
回归方程: Y=61.786 - 6.886 log(剂量) 决定系数: R2=0.914。