心理统计之效果量
统计检验力和效果量

02 统计检验力与假设检验
CHAPTER
假设检验的基本概念
假设检验是一种统计推断方法,通过对样本数据的分析,对总体参数做出推断。
假设检验的基本步骤包括提出假设、选择合适的统计方法、进行统计推断、得出结 论。
假设检验的结论是概率性的,有一定的风险,即存在误判的可能性。
统计检验力在假设检验中的应用
统计检验力和效果量
目录
CONTENTS
• 统计检验力概述 • 统计检验力与假设检验 • 效果量概述 • 效果量与效应大小 • 统计检验力与效果量在实际研究中的应用
01 统计检验力概述
CHAPTER
定义与概念
统计检验力是指一个研究或实验能够正确拒 绝或接受某一假设的能力,即当实际效应存 在或不存在时,研究结果能够证明该效应的 能力。
选择适当的统计方法
根据数据特点和问题背景选择 合适的统计方法,能够提高统 计检验力。
降低显著性水平
显著性水平是决定是否拒绝原 假设的临界值,降低显著性水 平可以提高统计检验力。
重复实验
通过重复实验,可以降低随机 误差的影响,提高统计检验力
。
03 效果量概述
CHAPTER
定义与概念
效果量是指一个干预措施或条件 变化对个体或群体的影响程度, 它反映了实验或观察结果的变化
02
在统计分析中,常用的效果量计算方法包括Cohen's d、eta squared(η²)、phi (φ)等,这些方法可以帮助研究者了解干预措施或条件变化对个体或群体的具体 影响程度。
03
计算效果量时需要注意其适用范围和局限性,以确保结果的准确性和可靠性。
效果量的作用与意义
1
效果量可以帮助研究者了解实验或观察结果的可 靠性和实用性,为后续的研究和实践提供有价值 的参考。
心理学常用效应量的选用与分析

心理学常用效应量的选用与分析在心理学研究中,效应量是指某种干预或处理对研究对象产生的效果,通常以数量化的形式表示。
正确地选用和解析效应量对于心理学研究结论的可靠性具有重要意义。
本文将介绍一些常用的效应量及其选用方法,以期帮助读者更好地理解和应用心理学研究结果。
效应量定义:效应量是指某种干预或处理对研究对象产生的效果,通常以数量化的形式表示。
效应量特点:效应量具有客观性、量化性和可比较性。
客观性指效应量的值是真实存在的,不是主观臆断的;量化性指效应量以数值形式表示,可以进行数学运算;可比较性指不同研究中的效应量可以相互比较,从而评价研究之间的效果差异。
效应量应用:效应量在心理学研究中广泛应用于评估干预措施的效果、比较不同研究之间的效果差异、以及推断研究结果的可靠性和稳定性。
例如,在教育心理学中,效应量可以用来评估不同教学方法对学生学习成绩的影响;在临床心理学中,效应量可以用来评价不同心理疗法对抑郁症患者的疗效。
(1)研究问题:不同研究问题涉及的效应量可能不同。
例如,在探究情绪调节策略时,可能需要使用情绪调节效能感作为效应量;而在研究团队冲突解决策略时,可能需要使用团队冲突解决效能感作为效应量。
(2)研究设计:不同研究设计需要选用不同的效应量。
例如,实验研究和准实验研究通常选用平均差异、率等作为效应量;相关研究则通常选用相关系数、回归系数等作为效应量。
(3)数据特点:不同类型的数据特点需要选用不同的效应量。
例如,对于计数数据,通常选用平均数、率等作为效应量;对于等级数据,则可能需要选用秩和、等级相关系数等作为效应量。
选用优缺点评估(1)优点:选用正确的效应量可以有效评估研究效果,量化研究结果,方便不同研究之间的比较和分析。
同时,效应量的使用还可以提高研究的可靠性和稳定性,有利于推进心理学研究的进展。
(2)缺点:效应量的选用也可能存在一些缺点。
例如,不同研究者可能对效应量的选择存在主观性,从而导致研究结果之间的可比性降低。
“效果大小”的含义、计算方法及在应用中的常见问题

Howell-2011
Gravetter-2011
1 Introduction …… 12.6 Effect Size …… 15 Power 381
…… 8.6 Statistical Power 9.3 Measure Effect size for the t test 13.5 Effect size for ANOVA …… 16.4 Measure Effect size for the ChiSquare ……
为了让读者鉴赏研究发现的大小或重要性,在论文的“结果”部
分几乎总是要提供所报告的每一种效应的某种量度…很多时候,
报告效应大小时既用原始单位,也用某种标准化的单位或单位 “1”(例如: Cohen d值),或者,一种标准化的回归权重 …”
例一:JEP-G,2011.2,P173-174
Experiment 1……Results We conducted planned comparisons between judgments in the strong and weak alternatives conditions. Diagnostic judgments in the weak alternatives condition (M = 81.7) were higher than in the strong alternatives condition (M = 58.5), t(19) = 5.0, p < .001, Cohen’s d = 1.1 . Predictive judgments did not differ significantly (Mstrong = 75.3; Mweak = 69.6) t(19) = 1.3, ns. Corroborating this analysis, we also found that there was no significant difference between judgments of P and Wc, t(39) = 0.60, ns.
关于心理咨询效果的评估

关于心理咨询效果的评估心理咨询是一种帮助人们了解自己内心问题以及解决这些问题的服务。
随着社会的发展,心理咨询在人们日常生活中的应用越来越广泛。
那么,我们如何评估心理咨询的效果呢?心理咨询的效果评估是指通过科学方法和技术,对心理咨询过程和结果进行全面、客观、准确的调查、测量和评价。
其目的是为了更好地反映心理咨询的质量和效果,发现和解决问题,并为后续的干预提供参考和依据。
评估心理咨询效果的方式和方法很多,下面介绍几种常用的方法:一、问卷调查法通过向咨询者发放问卷,了解咨询者在接受心理咨询过程中的体验、咨询效果、消费满意度等方面的情况。
由于问卷调查涉及到信息的采集以及统计分析等多个环节,所以它可以反映出比较全面的效果信息,并且具有量化分析的特点。
二、观察法观察法是一种通过直接观察咨询者的行为、情绪以及反应等来评估咨询效果的方法。
通过观察咨询者的外表和表现来判断他们的情绪和行为变化,并分析这些变化是否与咨询过程和目标相符合。
观察法的最大优点是直接、客观,缺点则是观察者的自身意见以及主观性对结果的影响。
三、个案研究法个案研究法是一种更为深入、全面评估心理咨询效果的方法。
它将咨询者作为一个独立而独特的案例,并从多个方面对该案例进行评估,包括咨询问题、咨询目标、咨询过程、咨询成效等。
个案研究法的优势是在于可以全面深入地了解咨询者的情况,但同时需要花费较长时间和资源,难以大规模应用。
总体而言,评估心理咨询效果的方法应该根据咨询服务所针对的人群、服务的内容和目标进行选择。
不同的评估方法都有其各自适用的范围和优势,需要根据具体情况选择合适的方法进行评估。
对心理咨询效果的评估是一个综合性的工作,需要利用多种方法和技术,结合不同的评估标准进行分析和综合,以便更好地了解咨询服务的质量和效果,为人们提供更好的心理健康服务。
统计检验力和效果量

再点击“选项”,选中“功效 估计”和“检验效能”;点击“继 续”、“确定”,于是得到“观察 到的效力=0.91”,这就是统计检验 力。
八戒晃着脑袋说:我最怕做计算了,现 在有了SPSS可好了,点击一下就帮我算 出来了! 唐僧:由于计算效果量和统计检验力的 方法较多,不同方法得到的结果是不能 进行比较的,因此,还是要把基础知识 搞清楚啊!
七、卡方检验的效果量和统计检验 力 八、积差相关系数的效果量和统计 检验力
来自扬子江畔的余老师 给同学们连灌好几天数学公式, 有人已经开始消化不良了, 如果再来数学演算, 看样子要“胃结石”了, 我们来说说“西游记后传”吧!
话说天蓬元帅猪八戒, 虽然表面上对悟空恭恭敬敬, 但内心仍然看不起 这个基层干部弼马温, 特别是花果山的儿童团猴小兵。
3、确定α水平及相应的临界值。 4、计算实际得到的Z值与α水平临 界值的差。
5、根据Z值与α水平临界值的差查 正态分布表,确定可能犯的第二类 错误概率β,于是得到统计检验力 1- β。
例题: 我们分别在猪宝宝与猴小兵中 分别抽取100名被试进行智商测查, 得到两组被试的智商平均数分别为 115分和111分。根据常模,该年龄 组智商的标准差为15分,请计算这 两组被试智商差异显著性检验的统 计检验力。
唐僧立刻截获了八戒的短信,暗想:这 个呆子,怎就忘记了出家人是从来不碰 荤腥的,我怎能稀罕灌汤包和筒子鸡? 唐僧不动声色:关于两个样本平均数的 差异,还可以计算它们的效果量。
三、两个独立样本平均数差异 显著性检验的效果量
效果量d:当两个独立样本的方差 和容量都相等时:
d
1
沙僧:师父说得对啊,我们一定要把各 种计算方法都搞明白。 刚才介绍了单因素方差分析的情况,那 么对于两因素方差分析,该如何计算效 果量和统计检验力呢?
统计功效和效应值(重要内容)

统计功效与效应大小华中师范大学心理学院刘华山一、统计功效(检验功效,效力,Power)统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。
用1-β表示。
或说:当总体实际上存在差异,应该拒绝虚无假设时,正确地拒绝虚无假设的概率,或不犯β错误的概率。
在实验设计中,统计功效反映了假设检验能够正确侦查到真实的处理效应的能力。
统计功效的大小取决于四个条件:1.两总体差异。
2.显著性标准α。
显著性标准α越大,则β错误越小,从而统计功效1-β越大。
3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。
4.样本容量。
样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。
二、效应量 (Effect Size,ES )效应量,反映处理效应大小的度量。
其实,两样本平均数的差异就是一个效应量。
效应量表示两个总体分布的重叠程度。
ES越大,表示两总体重叠的程度越小,效应越明显。
三、效应量检验的功能1.效应量有助于我们判断统计上显著差异是否有实际的意义。
2.有些效应量,如相关系数,点二列相关系数的平方r pb2,η2,可以反映自变量解释因变量变异的百分比。
3.在同一个实验中,如果有几个自变量,可以根据效应量大小对自变量的重要性排序。
4.原分析的基础。
在元分析中,将各个不同的相关研究进行概括分析的基础便是各个不同研究的效应量。
5. 效果量的计算还为改进研究设计、 提高检验能力提供了根据。
APA 出版手册第五版要求报告差异检验结果时一般要报告SE 值。
四、效应量和统计功效前述检验功效与两总体差异(或说处理效应大小)、样本容量、显著性水平、检验的方向性四个因素有关。
而两总体差异大小、两样本分布的重叠恰恰是与效应量有关的概念。
可见,效应量和统计功效有关。
统计功效受效应量的制约。
在检验方向、样本容量、显著性水平固定的条件下,效应量与检验功效有对应关系。
见下表。
【独立样本】表 在0.05水平下假设检验的功效样本容量效应大小0.2 0.5 0.8 单尾 10 0.11 0.29 0.53 20 0.15 0.46 0.80 30 0.19 0.61 0.92 40 0.22 0.72 0.97 50 0.26 0.80 0.99 100 0.41 0.97 1.00 双尾 10 0.07 0.18 0.39 20 0.09 0.33 0.69 30 0.12 0.47 0.86 40 0.14 0.60 0.94 50 0.17 0.70 0.94 1000.290.941.00五、独立样本t 检验的效应大小.1,1除d s Cohen'.122112121221——,其中以两样本自由度之和本离差平方和之和即两样算术平方根,合成方差是两个样本合成方差的,而—n df n df df df ss ss S S S X X p p P==++==例?在大学一年级新生中选取10名双性化学生和20名非双性化学生,对他们施测自尊量表。
效果量的意义及测定方法_权朝鲁

效果量的意义及测定方法权朝鲁(山东师范大学 教育科学学院,济南250014) 摘 要:文介绍了效果量在心理学研究中的意义以及评价效果量大小的标准,特别是说明了d,r2pb,η2和ω2几个效果量的测定方法,并提出了提高效果量的措施及对效果量作研究的评论。
关键词:效果量;d;r2p b;η2;ω2中图分类号:B841.7 文献标识码:A 文章编号:1003-5184(2003)02-0039-061 测定效果量的重要意义及评价标准1.1 效果量的意义在进行推论统计检验的时候,我们对确定自变量是否有效果感兴趣。
但是,推论统计检验的一个限制是检验的结果受实验中样本大小的影响。
这就是说,如果自变量有一定效果,那么用来检验自变量效果的F比率将随着样本容量的增加而增加。
甚至当自变量没有效果的时候,F比率也能增加。
这就意味着,我们需要一个不是统计检验但能测量自变量效果的一个量数。
这个量数就是“效果量”(the size of an effect,SE)。
“效果量”是不依赖于样本大小、反映自变量和因变量关联强度的指标[1]。
关于研究效果量的重要意义,美国的Cohen等做了精辟的论述。
Cohen指出,在心理学文献中,很多都是仅讲结果是否显著,似乎只要在0.05水平上显著就是对心理学理论的发展做出了贡献。
实际上,统计的显著性与效果量不是一回事。
在0.05水平上显著,自变量不一定有“大”的作用;同样,在0. 01水平上显著,自变量的作用也不一定“很大”。
他为许多研究在统计上是显著但效果量却很小而惋惜,告戒研究者不仅应该注意统计上有无显著性,而且应该注意效果量的大小[2]。
实际效果的“显著”和推论统计上的“显著”既有联系也有区别。
统计推论检验“显著”并不一定意味着实际效果的显著。
例如,研究某种心理治疗方法对治疗忧郁症患者是否有效,实际结果是实验组比控制组平均高4分,实验组与控制组的取样人数都是15,两组的标准差都是8,那么检验的结果,差异不显著。
教育与心理统计学 第六章 方差分析六 多因素方差分析、事后检验、协方差分析、统计功效与效果量、重要

第六章方差分析(六)第五节多因素方差分析一、多因素方差分析的定义多因素方差分析是用来研究两个及两个以上控制变量是否会对观测变量产生显著影响。
多因素方差分析不仅能够分析多个因素对观测变量 的独立影响,更能够分析多个控制因素的交互作用是否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。
多因素 方差分析包括完全随机设出随机区组设计。
二、平均数差异检验、单因素方差分析、多因素方差分析比较当需要比较两个以上平均数的差异时,要使用单因素方差分析,而不进行多次平均数差异检验,这样就可以降低统计误差。
如果单次进行 平均数比较率,即显著性水平是a ,进行两两平均数比较的次数是N ,多次两两平均数差异的错误率:P N =l-(l-a)n o 同理多因素方差由于 同时进行两个因素以上的方差分析,亦能降低统计误差,同时,也能处理交互作用。
第六节事后检验(多个平均数之间的比较)一、事后检验[事后多重比较]事后检验的定义:方差分析所要检验的零假设是所有k 个处理的总体平均数没有显著性差异,相应的备择假设是k 个处理中至少有2个处 理的总体平均数之间存在显著差异。
但方差分析不拒绝零假设时,表明至少有2个处理的总体平均数不等,若方差分析F 检验的结果表明 差异显著就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟哪一对或哪几对的差异显著,确定两变量关系的本质。
事后检验也被称作事后多重比较,在这也叫做多个平均数之间的比较。
事后检验的目的:当方差分析表明一个主效应显著时,它只能提供几个变量之间是否存在显著差异的结果,又因为多重t 检验会使得I 型 错误发生的概率大大增加[吃1-Q :业L 因而我们只能采取事后检验。
二、事后检验的方法[1]N-K 法,也叫q 检验法;[2]HSD 检验(又叫Turkey 真实检验,更敏感,统计检验力更强,要求各组容量相等);[3]Scheffe 检验(匕啜保守,适用于样本容量不等,最大限降低了第一类误差a 水平,可能最安全);⑷费舍的最小显著差异法(LSD);一、协方差分析协方差分析的定义:协方差表示的是交互效应项,将处理引起的变异分解为处理在变量x 上引起的变异、在变量y 上引起的变异和在交互效应项xy 上引起的 变异。
心理统计主观题2011答案版

2009年简答题
• 简述统计假设检验中两类错误的定义及其关系。 • 【答案要点】 • (1)统计检验中两类错误即α错误和β错误。α 错误是指当零假设成立时,拒绝零假设犯的“弃 真”错误,也叫I型错误;β错误是指当零假设不 成立时,未拒绝零假设所犯的“取伪”错误,也 叫Ⅱ型错误。 • (2)α错误和β错误相互之间的关系是:α大时 ,β小;α和β不能同时减少。
(一)统计图表
• 简述编制分组次数分布表的步骤。
次数分布表
分组 2.7~ 3.1~ 3.5~ 3.9~ 4.3~ 4.7~ 5.1~ 5.5~ 5.9~6.3 频数 (f) 6 12 25 28 31 19 15 8 6 频率 (P)% 4.00 8.00 16.67 18.67 20.67 12.67 10.00 5.33 4.00 累计频数 (fc) 6 18 43 71 102 121 136 144 150 累计频率 (Pc)% 4.00 12.00 28.67 47.33 68.00 80.67 90.67 96.00 100.00
心理统计主观题
2007年简答题
• 在一项英语单词记忆实验中,要求一批被试分别采 用机械式、联想式、理解式方法记忆100个英语单 词。各组被试正确回忆量的方差如下表所示。试检 验各组方差是否齐性。(取α=0.05)(2007)
机械式 29 2.5 记忆方法 联想式 30 3.0 理解式 31 4.5
统计检验之统计检验力和效果量

2
本例中:
115 111 d 0.27 15
Cohen认为:d=0.2为低效果; d=0.5为中效果; D=0.8为高效果 本例为较低效果。
八戒松了一口气: 我请河南大学研究生对猪宝宝进行智力 开发,虽然效果不显著,但还算是有些 效果的,看样子还要坚持下去啊!
假设检验的两类错误
虚无假设:
H 0 为真
H 0 为假
H 0 : 1 2
备择假设:
拒绝 H 0 I 型错误
H 1 : 1 2
接受 H 0 正确决策, 1 II 型错误
1 统计检验力 正确决策,
在其他条件不变的前提下 α 和 不可以同时增大或减小
八戒可真聪明:我明白了, 虚无假设H0认为“猪宝宝与猴小兵”的智力 没有显著差异, 备择假设H1认为“猪宝宝与猴小兵”的智力 存在显著差异。 唐僧:不论我接受或拒绝哪个假设,都有可 能犯错误,这涉及到统计检验力的问题。
4、计算Z值和临界值的差: 1.89-1.96=-0.07
5、查正态分布表 从中心点为零到右边0.07个标 准差所占的面积为0.0279,约等于 0.03,加上中心点左侧的0.5的面积, 共有曲线下0.53的面积,这就是犯 II型错误的概率β。于是统计检验力 (1- β)=0.47。
再点击“选项”,选中“功效 估计”和“检验效能”;点击“继 续”、“确定”,于是得到“观察 到的效力=0.91”,这就是统计检验 力。
八戒晃着脑袋说:我最怕做计算了,现 在有了SPSS可好了,点击一下就帮我算 出来了! 唐僧:由于计算效果量和统计检验力的 方法较多,不同方法得到的结果是不能 进行比较的,因此,还是要把基础知识 搞清楚啊!
统计心理学考研试题及答案

统计心理学考研试题及答案一、单项选择题(每题2分,共20分)1. 在统计心理学中,以下哪项不是描述数据分布特征的指标?A. 均值B. 中位数C. 众数D. 方差答案:D2. 以下哪个统计量用于衡量变量之间的相关程度?A. 标准差B. 相关系数C. 回归系数D. 信度答案:B3. 在进行假设检验时,如果原假设为H0: μ = 50,备择假设为 HA: μ ≠ 50,那么这个检验是什么类型的检验?A. 单尾检验B. 双尾检验C. 左尾检验D. 右尾检验答案:B4. 下列哪个选项是统计心理学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 曼-惠特尼U检验答案:D5. 在统计心理学中,如果一个样本的方差未知,通常使用哪种类型的t检验?A. 独立样本t检验B. 配对样本t检验C. 单样本t检验D. 以上都是答案:A二、简答题(每题10分,共30分)1. 简述中心极限定理的含义及其在统计心理学中的应用。
答案:中心极限定理指出,大量独立同分布的随机变量之和,在样本量足够大时,其分布接近正态分布,与原始数据的分布无关。
在统计心理学中,即使原始数据不是正态分布,通过中心极限定理,我们仍然可以使用基于正态分布的统计方法来进行假设检验,如t检验和z 检验。
2. 解释什么是效应量,并说明它在心理学研究中的重要性。
答案:效应量是衡量研究中干预或处理效果大小的统计量,它提供了除了统计显著性之外的实际意义。
在心理学研究中,效应量有助于评估结果的实际重要性,指导样本大小的确定,以及跨研究的比较。
三、计算题(共50分)1. 某心理学研究中,研究者想要了解两组被试在某个心理测试上的表现是否存在显著差异。
以下是两组被试的测试成绩(分数):对照组:20, 25, 30, 35, 40实验组:15, 18, 22, 27, 33请计算两组数据的均值、标准差,并进行独立样本t检验,判断两组之间是否存在显著差异。
答案:对照组均值:(20+25+30+35+40)/5 = 30对照组标准差:sqrt(((20-30)^2+(25-30)^2+(30-30)^2+(35-30)^2+(40-30)^2)/5) = 7.58实验组均值:(15+18+22+27+33)/5 = 23实验组标准差:sqrt(((15-23)^2+(18-23)^2+(22-23)^2+(27-23)^2+(33-23)^2)/5) = 6.67t检验公式:t = (M1 - M2) / sqrt((SD1^2/n1) + (SD2^2/n2))t值 = (30 - 23) / sqrt((7.58^2/5) + (6.67^2/5)) = 3.87自由度:df = n1 + n2 - 2 = 5 + 5 - 2 = 8查阅t分布表,当自由度为8时,双尾检验的显著性水平为0.05时的临界值大约是2.306。
“效果大小”的含义、计算方法及在应用中的常见问题

舒华
(2008,P75)
课题的选择与问题的提出 实验设计的确定 被试的选择 材料的选择 仪器的选择和程序的确定
搜集和分析数据
对数据理论意义的讨论和推论 撰写论文并提交发表
The process of conducting research can be divided into five steps (Whitley, 2013)
心理学研究效应大小统计功效计算解析

心理学研究效应大小统计功效计算解析在心理学研究中,准确理解和应用效应大小(Effect Size)与统计功效(Statistical Power)的计算是至关重要的。
这两个概念不仅对于研究结果的解读和评估具有关键意义,还能为研究设计的优化提供有力的依据。
首先,让我们来搞清楚什么是效应大小。
简单来说,效应大小就是衡量两个或多个组之间差异程度的一个指标。
比如说,我们研究一种新的教学方法是否能提高学生的考试成绩,那么通过比较使用新方法和传统方法的学生成绩差异,这个差异的大小就是效应大小。
常见的效应大小指标包括Cohen's d、η² 等。
Cohen's d 主要用于衡量两组均值之间的差异。
假设我们有两组数据,一组是控制组的成绩,另一组是实验组(使用新教学方法)的成绩。
通过计算两组均值之差除以合并标准差,就能得到 Cohen's d 值。
这个值越大,说明两组之间的差异越显著。
η² 则常用于方差分析中,它表示由某个因素引起的方差占总方差的比例。
例如,在研究不同学习环境对学生注意力的影响时,如果η² 较大,就意味着学习环境这个因素对学生注意力的影响较为明显。
接下来,再谈谈统计功效。
统计功效可以理解为当确实存在差异(即效应存在)时,我们能够正确检测到这种差异的概率。
想象一下,假如我们进行一项实验,实际上新的治疗方法是有效的,但由于样本量太小或者其他因素,导致我们没有检测到这种效果,这就是统计功效不足。
统计功效的高低受到多个因素的影响。
其中,最主要的因素包括效应大小、样本量、显著性水平(α)和检验类型。
效应大小越大,统计功效就越高。
这就好比差异越明显,我们越容易发现它。
样本量越大,统计功效也会增加。
因为更多的数据能提供更准确的信息,减少抽样误差的影响。
显著性水平通常设定为 005,如果我们把这个标准放宽松,比如设定为 01,统计功效会提高,但同时犯第一类错误(即错误地拒绝了真的零假设)的概率也会增加。
统计检验力和效果量

16 …… 0.88 0.96 .099
…… ……
在本例中,K=3,dfw=15,接近 于表中的16,=2.79,查表,得到 统计检验力在0.96~0.99之间。
2、根据f计算,再查表。 =f n
本例中,=0.93 6 = 2.28 查表,得到统计检验力在0.88~
0.96之间。
5、根据Z值与α水平临界值的差查 正态分布表,确定可能犯的第二类 错误概率β,于是得到统计检验力
1- β。
例题:
我们分别在猪宝宝与猴小兵中 分别抽取100名被试进行智商测查, 得到两组被试的智商平均数分别为 115分和111分。根据常模,该年龄 组智商的标准差为15分,请计算这 两组被试智商差异显著性检验的统 计检验力。
D=0.8为高效果 本例为较低效果。
八戒松了一口气:
我请河南大学研究生对猪宝宝进行智力 开发,虽然效果不显著,但还算是有些 效果的,看样子还要坚持下去啊!
进行差异显著性检验和计算效果量时, 可能会出现以下四种情况:
(1)大效果量及差异显著:说明结论 可信度高,我们应该接受结论。
虚无假设H0认为“猪宝宝与猴小兵”的智力 没有显著差异,
备择假设H1认为“猪宝宝与猴小兵”的智力 存在显著差异。
唐僧:不论我接受或拒绝哪个假设,都有可 能犯错误,这涉及到统计检验力的问题。
一、统计检验力和效果量的含义
统计检验力: 当虚无假设H0为假(备择假设
H1为真)时,正确拒绝H0的概率, 它等于1-。
唐僧:且听我细细道来。
六、两因素方差分析的效果量 和统计检验力
可以通过SPSS获得,也可以采用 公式计算。
介绍SPSS的方法(SPSS18.0中文版)
(完整版)统计功效和效应值(重要内容)

统计功效与效应大小华中师范大学心理学院刘华山一、统计功效(检验功效,效力,Power)统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。
用1-β表示。
或说:当总体实际上存在差异,应该拒绝虚无假设时,正确地拒绝虚无假设的概率,或不犯β错误的概率。
在实验设计中,统计功效反映了假设检验能够正确侦查到真实的处理效应的能力。
统计功效的大小取决于四个条件:1.两总体差异。
2.显著性标准α。
显著性标准α越大,则β错误越小,从而统计功效1-β越大。
3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。
4.样本容量。
样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。
二、效应量 (Effect Size,ES )效应量,反映处理效应大小的度量。
其实,两样本平均数的差异就是一个效应量。
效应量表示两个总体分布的重叠程度。
ES越大,表示两总体重叠的程度越小,效应越明显。
三、效应量检验的功能1.效应量有助于我们判断统计上显著差异是否有实际的意义。
2.有些效应量,如相关系数,点二列相关系数的平方r pb2,η2,可以反映自变量解释因变量变异的百分比。
3.在同一个实验中,如果有几个自变量,可以根据效应量大小对自变量的重要性排序。
4.原分析的基础。
在元分析中,将各个不同的相关研究进行概括分析的基础便是各个不同研究的效应量。
5. 效果量的计算还为改进研究设计、 提高检验能力提供了根据。
APA 出版手册第五版要求报告差异检验结果时一般要报告SE 值。
四、效应量和统计功效前述检验功效与两总体差异(或说处理效应大小)、样本容量、显著性水平、检验的方向性四个因素有关。
而两总体差异大小、两样本分布的重叠恰恰是与效应量有关的概念。
可见,效应量和统计功效有关。
统计功效受效应量的制约。
在检验方向、样本容量、显著性水平固定的条件下,效应量与检验功效有对应关系。
见下表。
【独立样本】表 在0.05水平下假设检验的功效样本容量效应大小0.2 0.5 0.8 单尾 10 0.11 0.29 0.53 20 0.15 0.46 0.80 30 0.19 0.61 0.92 40 0.22 0.72 0.97 50 0.26 0.80 0.99 100 0.41 0.97 1.00 双尾 10 0.07 0.18 0.39 20 0.09 0.33 0.69 30 0.12 0.47 0.86 40 0.14 0.60 0.94 50 0.17 0.70 0.94 1000.290.941.00五、独立样本t 检验的效应大小.1,1除d s Cohen'.122112121221——,其中以两样本自由度之和本离差平方和之和即两样算术平方根,合成方差是两个样本合成方差的,而—n df n df df df ss ss S S S X X p p P==++==例?在大学一年级新生中选取10名双性化学生和20名非双性化学生,对他们施测自尊量表。
心理统计学基础讲义 第七章 方差分析、统计效力

第七章 方差分析、统计效力方差分析原理:综合的F检验应用:两个以上平均数之间的差异检虚无假设:H0:μ1 = μ2 = μ3方差可分解,实验数据的总变异分解为若干不同来源的分变异,一般分为组内变异和组间变异组内变异:实验误差、被试差异等组间变异:不同实验条件造成的变异考察F = 组间均方/ 组内均方的显著性方差分析的前提总体正态分布变异互相独立各实验条件的方差齐性方差分析的步骤a. 求总和方、组间和方、组内和方b. 求总自由度、组间自由度、组内自由度c. 求组间均方、组内均方d. 计算F观测值e. 列方差分析表f. 查F表求F临界值g. 作判断符号系统K = 处理条件或组的数目n i = 第i 组的被试数目,若每组被试相等,则为n N = Σn i = 总被试数T i = ΣX ij = 每个组分数值的和 G = ΣX ij = 所有分数的总和 P = 每个被试的观察数目 单因素完全随机方差分析例:检验三个不同的学习方法的效应。
将学生随机分配到3个处理组 方法 A :让学生只读课本, 不去上课. 方法 B :上课,记笔记,不读课本.方法 C :不读课本,不去上课, 只看别人的笔记解:虚无假设H 0:μ1 = μ2 = μ3 ,三种方法学习效果没有差异 备择假设:至少有一个组和其他不同G=30, N=15, 215G ==, 2106,3XK ==∑SS 总= ΣX 2 - G 2 / N =106 – 900 / 15 = 106 – 60 = 46 SS 组内= SS 1 + SS 2 + SS 3 = 6 + 6 + 4 = 16SS组间= Σ(T2/n i) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 –60 = 30实际SS组间可以用SS总- SS组内快速求得,但不推荐df总= N – 1 = 15 -1 = 14df组内= N –K = 15 - 3 = 12df组间= K – 1 = 3 – 1 = 2MS组内= SS组内/ df组内= 16/12 = 1.333MS组间= SS组间/ df组间= 30/2 = 15F obs = MS组间/ MS组内= 15 / 1.333 = 11.25F0.05(2, 12) = 3.88F obs = 11.25 > F0.05(2, 12) = 3.88所以拒绝H0,至少有一组和其他不同事后检验N-K检验HSD检验Scheffe检验……注意:不能用两两之间t检验,P = 1 - (1 - α)n,例如本例P = 1 - (1 –0.05)3 = 0.143随机区组设计的方差分析又称重复测量方差分析,单因素组内设计,相关组设计,被试内设计解:G = 305.5,N = 32,ΣX2 = 2934.91,K = 4, n = 8SS总= ΣX2 - G2 / N = 2934.91 –305.52 / 32 = 18.33SS组内= SS1 + SS2 + SS3 + SS4 = 2.8 + 3.14 + 1.535 + 1.429 = 8.894SS组内= SS被试间+ SS误差SS被试间=Σ(P2/K) - G2/N = 1544.49/4 + 1482.25/4 + 1584.04/4 + 1310.44/4 + 1303.21/4 + 1444/4 + 1755.61/4 + 1274.49/4 - 305.52/32 = 8.062SS误差= SS组内- SS被试间= 8.894 - 8.062 = 0.832SS组间= Σ(T2/n i) - G2/N = 80.82/8 + 79.62/8 + 75.42/8 + 69.72/8 –305.52/32 = 816.08 + 792.02 + 710.645 + 607.261 –2916.57 = 9.436df总= N – 1 = 32 -1 = 31df组内= N –K = 32 - 4 = 28df组间= K – 1 = 4 – 1 = 3df被试= n – 1 = 8 – 1 = 7df误差= df组内–df被试= 28 –7 = 21MS误差= SS误差/ df误差= 0.832/21 = 0.040MS组间= SS组间/ df组间= 9.436/3 = 3.145F obs = MS组间/ MS误差= 3.145 / 0.040 = 78.63F0.01(3, 21) = 4.87F obs = 78.63 > F0.01(3, 21) = 4.87所以拒绝H0,至少有一组和其他不同事后检验:略协方差分析在某些实际问题中,有些因素在目前还不能控制或难以控制,如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。
心理学研究效应大小统计功效计算解读

心理学研究效应大小统计功效计算解读在心理学研究中,效应大小和统计功效计算是非常重要的概念。
它们不仅有助于我们更准确地理解研究结果,还能为后续的研究设计提供有力的指导。
接下来,让我们一起深入探讨一下这两个关键概念。
首先,什么是效应大小呢?简单来说,效应大小就是衡量两个或多个组之间差异程度的一个指标。
比如说,我们想研究一种新的教学方法是否能提高学生的学习成绩,那么成绩提高的幅度就是效应大小。
效应大小可以帮助我们判断这种差异是微不足道的,还是具有实际意义的。
常见的效应大小指标有很多种,比如 Cohen's d、r 等。
Cohen's d 通常用于比较两组的均值差异,而 r 则用于衡量两个变量之间的相关性。
以 Cohen's d 为例,如果 d = 02 被认为是小效应,05 是中等效应,08 及以上则是大效应。
这就像是我们用尺子去测量差异的大小,不同的数值范围代表着不同程度的差异。
那么为什么要关注效应大小呢?想象一下,如果我们只看统计检验的结果(比如 p 值),得出了“有显著差异”的结论,但却不知道这个差异到底有多大,这对于实际应用和理论发展的帮助是有限的。
效应大小能够让我们更直观地了解研究结果的实际意义。
比如,一种药物可能在统计上显著地降低了血压,但如果降低的幅度非常小,可能在临床上就不具有太大的价值。
接下来,我们谈谈统计功效。
统计功效可以理解为当实际存在差异时,我们能够正确地检测到这种差异的概率。
比如说,如果一种新的治疗方法确实有效,但由于我们的研究设计或者样本量等原因,没有检测到这个效果,这就是统计功效不足。
统计功效受到多个因素的影响,其中最重要的两个因素是效应大小和样本量。
效应大小越大,越容易检测到差异,统计功效也就越高;样本量越大,数据的稳定性和代表性就越好,同样能提高统计功效。
举个例子,如果我们想研究一种心理疗法对抑郁症患者症状的改善效果,假设这种疗法确实能带来中等程度的改善(效应大小为 05),如果我们的样本量很小,比如只有 10 个患者,那么很可能因为样本的随机性和不稳定性,导致我们无法检测到这个真实的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
请自行计算第一问 请用以下两个公式计算并比较第二问
三、关于效果量的测定[1]
2、 r2pd的意义及测定 r2pd是点二列相关系数的平方。可以测定两独立样本 实验的效果量,也可以测定两相关样本实验的效 果量。 独立样本的自由度为df=n1+n2-2,n1、n2分别是两个样 本的容量。 相关样本的自由度为df=n-1,n是成对分数的数目。
三、关于效果量的测定
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 表 专家与新手对不同棋局棋子位置的记忆成绩方差分析表[3]。
注:[3]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011,3
三、关于效果量的测定
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 结果分析[3]。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定
3、 η2的意义及测定 例:有人研究了个人表现的反馈类型对其自尊的影 响。让15名被试参加一项知识测验,每组各5名被 试。不管被试在测验中的实际表现如何,对积极反 馈组,都告诉他们水平很高;对消极反馈组,都告 诉他们表现很差;对控制组,不提供任何反馈信息。 最后,让所有的被试都参加一个自尊测验,测验总 分为100分,得到的分数越高,表明自尊越强。实 验结果如表所示,问不同反馈类型的各组被试的自 尊水平是否存在显著差异[3]?
注:[3]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011,3
三、关于效果量的测定
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 表 专家与新手对不同棋局棋子位置的记忆成绩[3]。
注:[3]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011,3
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
表二:d与百分等级和不重叠的百分数之间的关系
二、评价效果量大小的标准[1]
当进行方差分析时,可以使用η2和ω2做效果量; η2是在样本范围内使用, ω2是在总体范围内使用。
η2是效果量的一种。它属于样本统计量,用来解释样 本中自变量的效果。 η2 越大,说明自变量的效果就 越大,自变量对因变量越重要。如果η2很小,即使有 统计上的显著性,也没有实际效果。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
注:[2]焦璨,张敏强.迷失的边界:心理学虚无假设检验方法探究. [J].中国社会科学,2014,2.
一、效果量的意义[1]
显著性=效果量?
推论统计上的“显著”并不一定意味着实际效果的显著。
Cohen指出,在心理学文献中,很多都是仅讲结果是否显著, 似乎只要在0.05水平上显著就是对心理学理论的发展做出 了贡献。实际上,统计的显著性与效果量不是一回事。在 0.05水平上显著,自变量不一定有“大”的作用;同样, 在0.01水平上显著,自变量的作用也不一定“很大”。
四、增加效果量的措施[1]
要增加效果量,就要进一步搞好研究设计,减少 抽样误差、测量误差、操纵本身出现的误差等。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
心理统计之效果量
两个必须首先提出的问题: 1、什么是效果量?
2、为什么要在心理统计中引入效果量?
一、效果量的意义[1]
效果量(the size of an effect,SE):“效果量”是不依赖 于样本大小、反映自变量和因变量关联强度的指标。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
一、效果量的意义
推论统计中虚无假设检验的限制:对样本容量的依赖以 及无法估计研究结论的可重复性、可推广性,是研究 者对虚无假设检验提出的最为主要和尖锐的批评[2]。
如,检验结果受实验中样本大小的影响。如F比率将随 着样本容量的增加而增加[1]。 你是否干过统计结果不显著,然后再去发点问卷,再找 点实验被试的活?
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定[1]
2、 r2pd的意义及测定 如焦虑水平对回忆成绩的影响。
表 焦虑水平下两样本回忆成绩的比较
根据表可求得(t)=22.94,p<0.05.
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定[1]
4 、 ω2的意义及测定 d、 ω2是解释总体的自变量和因变量关联程度的指标,属 于参量。事实上,每一个η2都有一个对应的ω2。在一般 情况下,只要计算η2就够了。如果对单因素多独立组实 验总体的自变量的效果量进行估计,可以使用如下公式。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 例:有人想采用2 × 2两因素完全随机实验方法来研究专 业知识对记忆的影响,其中因素A为被试的专业性质 (含新手—专家两个水平),因素B为棋局类型(含随机 摆放—比赛中两个水平)。实验结果如表所示,请检验 专业知识和棋局类型对记忆成绩是否有显著影响,而这 是否存在交互作用;方差分析后各因素和两因素交互作 用的效果大小及统计检验力各为多少[3]。
三、关于效果量的测定[1]
3、 η2的意义及测定 a、 η2在独立样本t检验中的应用 例子:在两种识记方法对回忆效果的影响的实验中, 一种是机械记忆,一种是意义识记,结果如表。 计算η2的值。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定[1]
3、 η2的意义及测定 b、 η2在单因素方差分析中的应用 假如,我们进行了一项教学法实验,自变量有三个 水平;因变量是学生的学习成绩。实验结果见表。 计算η2的值。
所以说,“显著性”能说明“A”和“B”有差异,但是差异是什么 造成的?特别是是否为自变量的作用?却无法回答了,所以需要 “效果量”来回答。
记住:显著性≠效果量
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
一、效果量的意义[1]
例如,研究某种心理治疗方法对治疗抑郁症患者是否有效, 实际结果是实验组比控制组平均高4分,实验组与控制组 的取样人数都是15,两组的标准差都是8,那么检验的 结果,差异不显著。但是当两组的人数增加到135、两 组的平均数和标准差不变时,差异极其显著。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
一、效果量的意义[1]
测定效果量的意义:
1、通过效果量可以了解自变量作用的大小; 2、效果量可以被用来概括包含同样的自变量或 因变量的一系列实验的结果 3、把许多效果量加以平均以提供某自变量在一 系列实验中综合的效果量
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定[1]
3、 η2的意义及测定 表 不同反馈类型对被试自尊水平影响的方差分析表
注:[3]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011, 3
三、关于效果量的测定[1]
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 在两因素方差分析中,我们要计算三个平方和:一 是因素A的;一是因素B的;一是交互作用的。所 以用的公式是:各自的平方和分别除以总平方和。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
三、关于效果量的测定[1]
3、 η2的意义及测定 c、 η2在两因素方差分析中的应用 假如,我们进行了一项单词的频率(A)与回忆时有无线 索(B)对回忆成绩的实验研究,单词的频率有3个水平, 回忆分有线索和无线索两个水平。实验结果见表。
三、关于效果量的测定
1、d的意义及测定 例子:在参加了全国统一考试后,已知考生某科成绩服从正 态分布。在甲省抽取了657名考生的成绩,得到平均分为 57.41分,且该省的总标准差为5.77分;在乙省抽取686 名考生的成绩,得到平均分为55.95分,该省的总标准差 为5.17分。问两省在该次考试中,平均分是否有显著的差 异?其效果量如何?
二、评价效果量大小的标准[1]
Cohen(1988)指出,当对两个独立组平均数之差进行显著性 检验时,可以使用d和点二列相关系数的平方r2pd作为效 果量。
d=0.2(效果小) ;d=0.5(效果中);d=0.8(效果大)
r2pd =0.2(效果小) ; r2pd =0.5(效果中); r2pd =0.8(效果大)
三、关于效果量的测定[1]
3、 η2的意义及测定 a、 η2在独立样本t检验中的应用 η2的含义是“实验处理的变异在总变异中所占的比重[4]”, η2的指标值大,反映实验效果大 ,η2的指标小,则反映 实验效果小,因此这一指标所反映的效果大小的内涵最 容易让人们所理解。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2. 注:[4]张敏强.教育与心理统计学[M].人民教育出版社,2010,11:221-222.
表一:t值随着样本容量的增大而变化
结果能令人信 服吗?
通过扩大样本使得统计检验显著花的 代价很大,结果却不尽入人意。
注:[1]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003,2.
一、效果量的意义[1]
因此,效果量它是反应自变量与因变量之间关系的强弱, 是研究对象之间差异的大小、实验效应大小的真实程 度、研究结果重要性指标。
注:[3]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011,3