实验设计部分(外加自由度的分解)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因素数量
(变量个数)设计类型被试分配自由度的分解
被试间设计(完全随机实验
设计)a1a2a3
S1S2S3
S4S5S6
S7S8S9p:自变量水平数量(处理数)
n:每一处理下的被试数量
变异来源自由度
处理间p-1
处理内p(n-1)
合计np-1
被试内设计(重复测量实验
设计)a1a2a3
S1S1S1
S2S2S2
S3S3S3
p:自变量水平数量(处理数)
n:被试的数量
变异来源自由度
被试间n-1
被试内p(n-1)
A p-1
误差(p-1)(n-1)
合计np-1
单因素实验设计
随机区组实验设计a1a2a3
S11S12S13
S21S22S23
S31S32S33
p:自变量水平数量(处理数)
n:区组的数量
变异来源自由度
处理间
(A)
p-1
处理内p(n-1)
区组n-1
误差
(p-1)(n-
1)
合计np-1
两因素实验设计
被试间设计
(完全随机实验
设计)
a1b1a1b2a2b1a2b2
S1S2S3S3
S4S5S6S6
S7S8S9S9
p:自变量A的水平数量
q:自变量B的水平数量
n:每一处理下的被试数量
变异来源自由度
处理间pq-1
A p-1
B q-1
AB(p-1)(n-1)
处理内pq(n-1)
合计npq-1
被试内设计(两因素均为重复测量)a1b1a1b2a2b1a2b2
S1S1S1S1
S2S2S2S2
S3S3S3S3
p:自变量A的水平数量
q:自变量B的水平数量
n:每一处理下的被试数量
变异来源自由度
被试间n-1
被试内n(pq-1)
A p-1
A×被试(p-1)(n-1)
B q-1
B×被试(q-1)(n-1)
AB(p-1)(q-1)
AB×被试(p-1)(q-1)(n-1)
合计npq-1
混合设计(一个因素为重复测量)
b1b2
a1
S1
S2
S1
S2
a2
S3
S4
S3
S4
p:自变量A的水平数量
q:自变量B的水平数量
n:组间变量每一水平下的被试数

变异来源自由度
被试间np-1
A p-1
被试(A)p(n-1)
被试内n(pq-1)
B q-1
AB(p-1)(q-1)
B×被试(A)(p-1)(n-1)
合计npq-1
两因素实验设计
随机区组实验设计a1b1a1b2a2b1a2b2
S11S12S13S14
S21S22S23S24
S31S32S33S34
p:自变量A的水平数量
q:自变量B的水平数量
n:每一处理下的被试数量
变异来源自由度
处理间pq-1
A p-1
B q-1
AB(p-1)(q-1)
处理内pq(n-1)
区组n-1
合计npq-1
变量类型种类操纵与控制
自变量①刺激特点自变量(用来操
纵);
②环境特点自变量(照明情
况或照明强度);
③被试特点自变量(年龄、
性别、智力、受教育水平);
④暂时造成的被试差别(疲
劳、焦虑、被试给予不同指
导语)。

①对自变量下操作定义(指
用可感知、度量的事物、时
间、现象和方法对自变量或
指标作出具体的界定。

防止
操作定义单一性偏差,从而
影响研究的构想效度);
②确定自变量的各个水平
(又叫检查点、处理水平);
③校准测量自变量的仪器
(降低系统误差和随机误差,
保证实验的内在效度);
④控制刺激的呈现方式(包
括呈现时间的长短、呈现次
序、空间位置,都应根据要
求加以控制)。

因变量客观指标:反应速度、反应
速度差异、反应的准确性、
反应标准、反应的难度、生
化指标等;
主观指标:口语报告、量表
分数、评价者的评定分数等。

①反应简单控制
用指导语来控制被试的反应;
规范的指导语应该:内容确
定、完全、简单明确、标准
化;
②选择恰当的因变量指标
明确的操作定义+因变量指标
(有效性、客观性、数量化);
③避免量程限制
量程不够大,造成天花板效
应或地板效应,从而使指标
的有效性遭受损失。

额外变量①被试方面——要求特征
霍桑效应、安慰剂效应、约
翰·亨利效应、罗密欧与朱
丽叶效应;
②主试方面——实验者效应
期待效应、罗森塔尔效应、
皮革马利翁效应;
③实验设计方面——顺序效

例如,练习效应、疲劳效应、
空间误差、顺序误差、习惯
误差;
④环境方面
⑤数据处理方面
①排除法(如声光实验的隔
音室、暗室、双盲控制法);
②恒定法(如实验仪器、物
理条件等);
③随机化法(平衡被试差异,
人数一般大于30);
④匹配法(人为将被试划分
若干组,每组同质);
⑤抵消平衡法(ABBA设计、
拉丁方设计,针对顺序误差、
空间误差、习惯误差、疲劳
效应和练习效应等);
⑥统计控制法(通过剔除极
端数据、统计矫正、协方差
分析等,保证数据的可靠性)。

类型评价统计方法
单组后测设计优点:
可作为真实验设计研究的前奏。

缺点:
①没有对照组,没有前测,因此很难
排除历史、成熟、和选择等作用的影
响(影响内部效度);
②容易出现自变量混淆。


单组前测后测
设计优点:
前测可以提供被试的基线数据以及其
他有关信息,较单组后测设计前进了
一步,减少了不确定性。

缺点:
①很难控制历史和成熟等因素造成的
影响;
②前测可能对后测造成影响。

成对样本t
检验;
符号检验法;
符号秩次检
验法。

前实验设计
固定组比较
设计优点:
①由于使用了控制组,所以能对历史、
成熟等因素进行控制;
②由于没有进行前测,所以控制了测
验效应和仪器因素的干扰。

缺点:
①对选择缺乏控制:不能在随机基础
上选择和分配被试;
②对选择和成熟的交互作用以及选择
与实验处理的交互作用缺乏控制。

独立样本t
检验;
秩和检验法
(曼-惠特
尼U检验法);
中位数检验
法;
卡方检验。

相关研究设计皮尔逊极差相关;
点二列相关;斯皮尔曼等相关
非实验设计
事后设计
准则组设计优点:
①为提出因果关系的假设提供依据;
②在更少人为干预或无法进行人为干
预的条件下使用;
更节省人力、物力
缺点:
不能操纵自变量或随机分配被试。

独立样本t
检验;
秩和检验;
中位数检验
法。

非:不能随机对被试进行取样和分配,一般在自然环境中进行。

不需要对额外变量进行控制。

类型评价统计方法
时间序列设计优点:
①较好地控制了成熟和测验因素的干
扰;
②较好地控制了统计回归的因素;
③不必设置控制组,因为免去了寻找
控制组的麻烦并节省了被试数量。

缺点:
①无控制组,很难对其他额外变量加
以控制;
②测验与处理的交互作用难以控制;
③多次前测可能降低或增加被试对测
试的敏感性。

X前后的回
归直线差异
检验;
X前后的两
次成绩的差
异检验。

单组
准实验设计
相等时间样本
设计
(广泛用于学习研究)优点:
历史因素得到了较好地控制;
缺点:
①测验的反作用效果;
②实验安排的反作用效果;
③选择偏差与实验变量的交互作用难
以控制;
④重复实验处理等因素会影响实验的
外在效度。

对两种实验
条件进行比
较;
对两种实验
条件下的顺
序效应进行
比较。

不相等实验组控制组前测后测设计优点:
①很好地控制了历史、成熟、测验等
因素;
②通过前测可以了解两组间起始态的
差异(对选择因素进行一定的控制);
缺点:
①没有随机分配被试,所以两组不等;
②选择与成熟以及选择与实验处理的
交互作用可能会降低实验效度。

对两组前测
后测差值分
数的平均数
进行t检验;
秩和检验;
中位数检验
法;
协方差分析
(前测分数
为协变量)。

准实验
设计
多组
准实验设计
不相等组实验组控制组前测后测时间序列设计优点:
①内部效度的影响因素基本得到了有
效控制;
缺点:
对实验组均
数差值和控
制组均数差
值进行比较;
①多次测验可能会影响被试对处理的
敏感性;
②选择偏差可能会与实验处理产生交互作用。

回归直线的差异检验。

准:不能对被试进行随机取样和分配,对额外变量有一定程度的控制。

环境自然或非严格。

类型评价统计方法
随机实验组控制组前测后测设计优点:
①可以控制选择、被试的中途退出及
选择与成熟的交互作用的干扰;
②有控制组,能控制历史、成熟、测
验、仪器等因素的影响。

缺点:
前测会影响外部效度。

对差值分数
进行t检验;
秩和检验;
中数检验法
协方差分析
(前测分数
为协变量)。

随机实验组控制组后测设计优点:
①控制了历史和成熟、选择和被试中
途退出等对内部效度的影响;
②控制了测验与实验处理交互作用对
外部效度的影响。

是理想的实验设计!
t检验;
秩和检验;
中数检验。

完全随机单
因素设计
随机多组后测
设计
同上方差分析
完全随机多因素实验设计交互作用的个数=2N-N-1
简单效应的个数=n(N-1)
n代表水平个数;
N代表变量个数。

简单效应:一个因素的水平在另一个因素的某个水平上的变异(一对多)。

真实验设计
随机区组设计优点:
考虑到个体差异对实验结果的影响,并在统计分析时将这种影响从组内误差中分离出来,节省了大量的实验被试,省时省力。

局限:
主要是划分区组有一定的困难。

影响因素
内部效度①主试—被试间的相互作用(主试效应、
被试效应,控制方法是双盲实验法);
②被试的一些固有的和习得的差异(性别、年龄、经验、个性等);
③成熟(即被试身心的成熟);
④被试的亡失;
⑤历史(即实验时间跨度中所发生的会影
响实验结果的事);
⑥选择(控制方法:随机选择和分配被试);
⑦测验(练习、临场经验等);
⑧仪器的使用;
⑨上述诸多因素的交互作用;
⑩统计回归(控制方法:匹配法和协方差
分析)
外部效度
(推广效度、生态效度)①实验环境的人为性;
②被试样本的代表性;
③测量工具的局限性。

构想效度①理论构思的代表性问题(过窄或过宽);
②具体而言有操作化前对构思的分析不够完整;
③混淆构思和构思层次;
④构思与构思之间有限制的推广力;
⑤被试的要求特征;
⑥实验者的期望效应;
⑦被试对评价的不安感(社会赞许性);
⑧单一操作的偏差;
⑨单一方法的偏差;
⑩不同处理间的交互作用;
⑾测验与实验处理的交互作用。

效度
统计结构效度①统计检验力低;
②所用统计方法依据的前提(假设条件)满足的程度;
③测量工具的信度;
④实验处理执行的信度(即主试对实验设计要求遵守的程度);
⑤实验环境中,不确定非相关时间的影响。

⑥被试的随机变异。

⑦多重比较和误差异。

信度考察实验信度的方法:推断统计、实验验证。

直接验证:重复验证;
系统验证:引入原来未加控制的变量;
概念验证:某种程度上与原先设计有很大不同。

相关文档
最新文档