FreeKaoYan效果量的意义及测定方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大
0. 8 0. 7 0. 6
中
0. 5 0. 4 0. 3
小
0. 2 0. 1 0. 0
从表 2 可以看出 ,0. 8 的效果量意味着处理组 的平均数位于未处理组平均数的第 79 个百分等级 位置上 ; 也意味着两个分布不重叠的部分为 47. 4 % (An ES of 0. 8 indicates t hat t he mean of t he t reated
当具有统计上的显著性后一定要计算效果量看你进行的研究是否有价值评价效果量大小的标准关于评价效果量大小的标准cohen出当对两个独立组平均数之差进行显著性检验时可以使用biserialcorrelationcoefficientpb作为效果010效果小059效果中138效果大当进行方差分析时可以使用是在总体范围内使用的
表3 焦虑水平下两样本回忆成绩的比较
x n s
样本 1 23 17 9
样本 2 20 15 7. 5
根据表 3 求得 , ( t ) = 22 . 94 , p < 0. 05 。将值代 入公式 ( 2) ,得
( t) 2 2 . 94 2 = = 0 . 22 2 ( t ) + df 2 . 94 2 + 30 其中 , df = 17 + 15 - 2 = 30 , r pb =
2 r pb = 0. 138 ( 效果大) 2 当进行方差分析时 , 可以使用η 和 ω2 做效果 2 量η ; 2 是在样本范围内使用的 ,ω 是在总体范围内 2 使用 的 。关 于 效 果 量 ω 的 高 低 判 断 方 面 , Cohen ( 1982 ,1988) 提出的标准是 : 解释变异量 6 % 以下 者 ,显示变量间关系微弱 ; 解释变异量在 6 %以上到
表 1 t 值随着样本容量的增大而变大 平均数差异
4 4 4
样本标准差
8. 0 8. 0 8. 0
t
df
p
1. 37 2. 09 4. 11
28 68 268
0. 19 0. 05
0. 0001
Chow ( 1988) 对测定效果量的重要意义概括为 : 第一 ,通过效果量可以了解自变量作用的大小 。 统计显著性检验不能指出自变量效果的大小 , 而效 果量能够指出自变量作用的大小 ,所以 ,效果量的测 量正好是对统计显著性检验的补充 。在同一个实验 中 ,如果有几个自变量 ,可以根据效果量把自变量的 重要性排序 。 第二 ,效果量可以被用来概括包含同样的自变
group is at t he 79t h percentile of t he unt reated group . An ES of 0. 8 indicates a nonoverlap of 47. 4 % in t he two dist ributions. ) 。
2 关于效果量的测定 2. 1 d 的意义及其测定
2 η 关键词 : 效果量 ; d ; r2pb ; ; ω2 2 2 2
中图分类号 :B841. 7 文献标识码 :A 文章编号 :1003 - 5184 ( 2003) 02 - 0039 - 06
1 测定效果量的重要意义及评价标准 1. 1 效果量的意义
在进行推论统计检验的时候 , 我们对确定自变 量是否有效果感兴趣 。但是 , 推论统计检验的一个 限制是检验的结果受实验中样本大小的影响 。这就 是说 ,如果自变量有一定效果 ,那么用来检验自变量 效果的 F 比率将随着样本容量的增加而增加 。甚 至当自变量没有效果的时候 , F 比率也能增加 。这 就意味着 ,我们需要一个不是统计检验但能测量自 变量 效 果 的 一 个 量 数 。这 个 量 数 就 是 “效 果 量” ( t he size of an effect ,SE) 。 “效果量” 是不依赖于样 本大小 、 反映自变量和因变量关联强度的指标 。 关于研究效果量的重要意义 , 美国的 Cohen 等 做了精辟的论述 。Cohen 指出 ,在心理学文献中 ,很 多都是仅讲结果是否显著 ,似乎只要在 0. 05 水平上 显著就是对心理学理论的发展做出了贡献 。实际 上 ,统计的显著性与效果量不是一回事 。在 0. 05 水
8 ,那么检验的结果 , 差异不显著 。但是当两组的样
本人数增加到 135 、 两组的平均数之差和标准差都 不变时 , 差异极其显著 。因此 , 虽然统计结果 “显 著” ,而下结论说该种心理治疗方法对于治疗忧郁症 有显著效果是不能令人信服的 。这样 , 通过扩大样 本使得统计检验显著花的代价就太大了 ( 见表 1) 。
40
心理学探新
2003 年
上面提到的三个问题只能用效果量进行回答 , 推论统计检验的 F 比率却不能回答 。然而却不能 说推论统计检验没有用处 。在检验理论以确定自变 量是否有效果的实验中 ,推论统计检验是有用的[ 3 ] 。 效果量的计算还为改进研究设计 、 提高检验能 力提供了根据 。例如 ,通过 t 检验 ,发现 t 值不足以 拒绝虚无假设 。这时可以计算效果量 , 如计算出的 效果量的值达到中等以上 , 就可以通过增加实验中 的样本容量的办法再进行实验 , 这时候就能够拒绝 虚无假设 。从上面的论述中我们可以看到 , 计算效 果量对于心理学的研究具有重大的意义 。 正因为效果量的测定如此重要 , 所以美国心理 学会 1994 年发出通知 ,要求公开发表的研究报告包 含效果量的测定结果 。当具有统计上的显著性后 , 一定要计算效果量 ,看你进行的研究是否有价值[ 4 ] 。
量或因变量的一系列实验的结果 。这样使得一系列 实验结果的定量比较成为可能 。例如 , 可以利用效 果量弄清楚某个自变量在所有的实验中是否始终有 同样的影响 。 第三 ,把许多效果量加以平均以提供某自变量 在一系列实验中综合的效果量 。这种比较在应用研 究方面 ,例如在研究教育改革或心理治疗方法的效 果方面是特别重要的 。
第 23 总第 86 期
心理学探新 PSYCHOLO GICAL EXPLORA TION
2003 年 第2期
效果量的意义及测定方法
权朝鲁
( 山东师范大学 教育科学学院 ,济南 250014)
摘 要 : 文介绍了效果量在心理学研究中的意义以及评价效果量大小的标准 , 特别是说明了
d , r pb η , 和 ω 几个效果量的测定方法 ,并提出了提高效果量的措施及对效果量作研究的评论 。
1. 2 评价效果量大小的标准
Cohen 的标准
关于评价效果量大小的标准 , Cohen ( 1988 ) 指 出 ,当对两个独立组平均数之差进行显著性检验时 , 可以使用 d ( 详见表 1 ) 和点二列相关系数 (point biserial correlation coefficient ) 的平方 r2pb 作为效果 量: d = 0. 2 ( 效果小 ) ; d = 0. 5 ( 效果中 ) ; d = 0. 8 ( 效果大) 2 2 r pb = 0. 010 ( 效果小 ) ; r pb = 0. 059 ( 效果中 ) ;
两个样本大小
15 35 135
[1 ]
平上显著 ,自变量不一定有 “大” 的作用 ; 同样 ,在 0. 01 水平上显著 , 自变量的作用也不一定 “很大 ” 。 他为许多研究在统计上是显著但效果量却很小而惋 惜 ,告戒研究者不仅应该注意统计上有无显著性 ,而 且应该注意效果量的大小[ 2 ] 。实际效果的 “显著” 和推论统计上的 “显著” 既有联系也有区别 。统计推 论检验 “显著” 并不一定意味着实际效果的显著 。例 如 ,研究某种心理治疗方法对治疗忧郁症患者是否 有效 ,实际结果是实验组比控制组平均高 4 分 ,实验 组与控制组的取样人数都是 15 ,两组的标准差都是
2 效果就越大 , 自变量对因变量越重要 。如果η 很 2 η 小 ,即使有统计上的显著性 ,也没有实际效果 。 有 2 广泛的用途 。这里介绍在六种研究条件下η 的应
公式 2 可以测定两独立样本实验的效果量 , 也 可以测定两相关样本实验的效果量 。不过 , 前者的 自由度为 df = n 1 + n 2 - 2 , n 1 、 n 2 分别是两个样本 的容量 ; 后者的自由度为 df = n - 1 , n 是成对分数 的数目 。 如果在一个两独立样本的实验中 , 样本容量分 别为 n 1 = 17 , n 2 = 15 ,自变量是焦虑水平 ,因变量是 回忆成绩 。实验结果见表 3 。
16 %以下者 ,显示变量间属中等关系 ; 解释变异量在 16 %以上者 ,显示变量间关系强 [ 5 ] 。
表 2 d 与百分等级和不重叠的百分数之间的关系 效果量 ( Effect Size)
2. 0 1. 9 1. 6 1. 4 1. 2 1. 0
百分等级 ( Percentile Standing)
97. 7 97. 1 94. 5 91. 9 88 84 79 76 73 69 66 62 58 54 50
不重叠的百分数 ( Percent of Nonoverlap )
81. 1 % 79. 4 % 73. 1 % 68. 1 % 62. 2 % 55. 4 % 47. 4 % 43. 0 % 38. 2 % 33. 0 % 27. 4 % 21. 3 % 14. 7 % 7. 7 % 0%
d 是实验研究中经常使用的效果量数 。它是一
种比率 。在对两独立组平均数之差的显著性进行 t 检验时 , d 是实验组的平均数和对照组的平均数的 差与对照组标准差的比率 ( 见公式 1) 。
d = x 实验组 - x 对照组 s对照组 ( 1)
尽管效果量很重要 , 但是我国的心理统计的教 科书至今没有介绍效果量的计算方法 。本文试图做 些介绍 ,以弥补不足 。因为效果量的指标有许多 ,本 2 η 文只讨论比较常用的几个效果量 : r2pb望确实影响人的行为[ 6 ] 。 2. 2 r2pb的意义及其测定
r pb是点二列相关系数的平方 。计算公式是 : r pb =
2 2
( t) 2 ( t ) 2 + df
( 2)
个自变量能够解释因变量的 67 %的变异量 ,自变量 的效果是大的 。 2 η 2. 3 的意义及其测定 2 ( eta - squared) 的意义 , 首先应该了解 要了解η η的意义 。希腊小写字母η( 读 eta ) 是一种相关系 数 ,它既可以表示两个变量之间直线相关的程度 ,又 η 系数的 可以表示两个变量之间曲线相关的程度 。 范围在 0. 00 到 1. 00 之间 , 不存在负的曲线相关 。 因为直线相关可以被看成曲线相关的特殊形式 , 所 2 以η 也可以在直线相关下使用 。因此 , 可以用η 取 代皮尔逊相关系数 r [ 7 ] 。它与决定系数 ( coefficient of determination) 不同 。决定系数只是表示两个变 量之间的直线关系 。假如 ,一组学生被试 ,有言语智 商测验的分数和阅读成绩的分数 。两者之间的决定 系数是 0. 64 η , 2 是 0. 90 。在这种情况下 , 学生的阅 读成绩分数的 90 %的变异量可以被学生的言语智 商测验分数进行直线的或非直线的预测 ; 学生的阅 读成绩分数的 64 %的变异可以由学生的言语智商 测验分数进行直线的预测 。因此 , 学生的阅读成绩 分数的变异的 26 % ( 0. 90 ~ 0. 64 ) 可以由非直线的 预测 [ 8 ] 。 2 η 是效果量的一种 。它属于样本统计量 , 用来 2 η 解释样本中自变量的效果 。 越大 , 说明自变量的
2
我们可以说焦虑水平这个自变量能够解释因变 量的 22 %的变异量 。 又如 ,对 5 名有相同心理障碍的人进行心理治 疗 。治疗前后 , 对他们的心理障碍的程度用同一个 量表进行测定 ; 使用相关的 t 检验 ,假设检验的结果 是 , t = 2 . 88 , p < 0. 05 。将值代入公式 2 ,得
Rosent hal ( 1994) 对 345 个关于实验者效应的实 验结果进行元分析 ,使用这种效果量 ,总的平均效果 量是 0. 70 。根据 Cohen 提出的判断效果量大小的 标准 ,0. 70 > 0. 5 , 效果量为中等 。所以研究者得出
第2期
权朝鲁 效果量的意义及测定方法