统计功效和效应值(讲稿子1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计功效与效应量

华中师范大学心理学院 刘华山

一、统计功效(检验功效,效力,Power )

统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。用1-β表示。

或说:当总体实际上存在差异(备择假设H 1为真),应该拒绝虚无假设时,正确地拒绝虚无假设的概率,或不犯β错误的概率 。它表示某个检验探查出实际存在的差异,正确拒绝虚无假设的能力。在实验设计中,统计功效反映了假设检验能够正确侦查到真实的处理效应的能力。

统计功效的大小取决于四个条件:

1.两总体差异。当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大;(在α错误概率不变的情况下,1-β变大)

2.显著性标准α:也称显著性水平,是一个特定的值,一个决策标准。通过p 与α的决策比较,作出统计决策。

而当假设H 0是真实的时候,观察到的差异完全是由随机误差所致的概率称为观察概率p 。

显著性标准α越大,则β错误越小,从而统计功效1-β越大;反之,α变小,1-β变小

3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。

4.样本容量。样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦

◆ 单总体检验

◆ α错误的解释 ◆ β错误的解释 ◆ 统计功效1-β

◆ 决定统计功效的条件

削,统计功效越大。

二、效应量 (效应大小,Effect Size,ES )

效应量,反映处理效应大小的度量。效应量表示两个总体分布的重叠程度。ES越大,表示两总体重叠的程度越小,效应越明显。其实,两样本平均数的差异本身就是一个效应量。由计算出的ES大小,可由专门的表格中查出两样本分布的重叠的百分比。故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小。或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大。

三、效应量检验的功能

1.效应量有助于我们判断统计上显著差异是否有实际的意义

已有统计显著性检验的条件下,检验效应大小的必要性:

统计显著性与实际显著性的区别:差异的统计显著性、相关的统计显著性只是告诉你在特定的条件下,这差异、这相关系数是存在的、并不是完全由抽样误差造成的,但并不意味着这差异有实际意义。统计量是否显著,是在一定条件下取得的,这条件与与上述统计功效的条件是一致的。也就是说差异是否显著受几个条件影响:一是实际差异的大小,或处理效应的大小(从t检验的待检验的统计量t的计算公式上可看出);二是要求的置信度1-α的大小(或说是指定的显著性水平);三是样本规模的大小,四是检验的方向。在降低对做结论的把握的要求、增大样本规模的条件下,一个完全没有实际意义的差异或处理效应可以取得统计显著的结果。

大样本比较容易获得统计显著性的结果,但这并不意味着差异是有意义的。例如如果有两个省的平均收入相差0.001元,由于样本规模达到几千万,这一微小差异在统计上一定是显著的。一个很容易的检测方法是在SPSS有关窗口下,将一套数据复制下来,再贴到原来的数据之后。这样以来,样本规模扩大了一倍。统计结果仍然保持原来的水平不变(数据的实际意义不变),但显著性水平得到了明显的提高。

由于样本容量影响显著性水平,故即使统计检验显著,仍然应检查有实际意义的有关指标,如典型相关系数的平方所代表的典型变量之间的共享方差比例到底有多大,以判断其有无实际意义。反过来,统计不显著时,也许是因为样本容

量太小。此时典型相关系数的平方仍然可以提供信息,以判断是否值得收集更多案例来重新进行分析。

2.在元分析中,将各个不同的相关研究进行概括分析的基础便是各个不同研究的效应量(的合成)。由于同类研究的各个具体研究的设计、因变量、数据收集方法、所用工具、样本容量很不相同,如何加以整合,以作出一个概化的结论呢?格拉斯(Glass,1976)提出以效应量作为估计值。

APA出版手册第五版要求报告差异检验结果时一般要报告SE值。

四、效应量和统计功效

前述统计功效与两总体差异(或说处理效应大小)、样本容量、显著性水平、检验的方向性四个因素有关。而两总体差异大小与两样本分布的重叠有关。效应量恰恰表示两个总体分布的重叠程度。可见,效应量和统计功效有关。统计功效受效应量的制约。在检验方向、样本容量、显著性水平固定的条件下,效应量与统计功效有对应关系。见下表。【独立样本】

表1 在0.05水平下假设检验的统计功效

样本容量

效应大小

0.2 0.5 0.8

单尾10 0.11 0.29 0.53

20 0.15 0.46 0.80

30 0.19 0.61 0.92

40 0.22 0.72 0.97

50 0.26 0.80 0.99

100 0.41 0.97 1.00 双尾10 0.07 0.18 0.39

20 0.09 0.33 0.69

30 0.12 0.47 0.86

40 0.14 0.60 0.94

50 0.17 0.70 0.94

100 0.29 0.94 1.00

【此表反映了决定统计功效的几个因素:检验方向、样本规模、显著性水平、差异大小(效应量)。】表中上栏中的3个数字为效应量,下栏对应的3列各数字为统计功效。从中可看出,在相同情况下(相同的检验方向、相同的样本容量,显著性水平),效应量越大,统计功效越高。其他项相同的条件下,样本容量越大,检验功效越高;其他项相同的条件下,单尾检验比双尾检验统计功效高。实际上当效应量较小时,而计算出的1-β越大,说明统计功效很高,即较小的效应量是对统计功效的严格检验。

五、独立样本t 检验的效应大小

,E .11除121-22112

12

122

1而是标准误公式本分布的标准误不是两平均数之差的样注意:是一限制。

因为平均数对样本数据——,其中即

以两样本自由度之和,本离差平方和之和即两样算术平方根,合成方差是两个样本合成方差的,而—X X p p p P

S S n df ,n df df df ss ss S S S X X ES .==++=

=

的一部分。即公式

部分的平方根。

———中的

————2

)1()1(2

)11(2)1()1(2122

2211212

1212

22211n n s

n s n n n df n n n n s n s n SE DX +++=+++=

即2

)1()1(212

2

2211———n n s n s n ++

上述效应量公式等价于

2

n n ss ss X X SE 21212

1-++-=

此公式的含义是以两样本平均数的差异用两样本的联合方差的平方根(联合标准差)去度量所得的量数,作为效应量的指标。【也应是Cohen ’s d 的一种?】

从本公式中可看出:t 检验公式中的),n ,n (n n n n )n n (

时2当11

1212

12121≥≤+=+其作用是:当样本容量越大时,)n n (

2

11

1+越小,t 越大,差异越显著。现在求S p

相关文档
最新文档