第三讲 真实验设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三讲真实验设计
一、实验设计概念的由来
1:广义的,实验者预料或者设计出来的,包括对实验变量的操纵,对无关变量的控制,对因变量的测量和统计分析方法的研究计划。
2:狭义的,对各种变量和实验程序加以安排和规定的实验模式。
按照舒华(1994):实施实验处理的一个计划方案以及与计划方案有关的统计分析。实验设计包括如下活动:
1.建立与研究假说的统计假说;
2.确定实验中使用的实验处理(自变量)和必须控制的多余条件(无关变量);
3.确定实验中需要的实验单元(被试)的数量以及被试抽样的总体。
4.确定将实验条件分配给被试的方法;
5.确定实验中每个被试要记载的测量(因变量)和使用的统计分析。
所谓真实验设计-----在随机化原则基础上分配被试,能够充分控制全部内在的无效变异源和外在无关因素的影响,以获得比较准确的实验结果的设计。它是相对于准实验设计而言的。
所谓真实验设计是在各种设计方法中要求控制条件最严密、操纵自变量最有效和测定记录因变量最准确的一种。为了达到这些目标,常常需要将这类研究置于实验室条件下进行,也称为实验室研究设计(张一中,1998)。
二、心理学实验设计中的随机化问题
1随机化的概念和意义
所谓随机化(RANDOMIZATION)就是研究者根据概率的原则进行选择或者分配变量的过程。随机化是近代实验设计的基本要求之一,是控制实验中无关因素的有效手段。
2实验设计中需要随机化的因素
首先是被试的取样(抽样统计分析)
心理学的实验研究是通过被试样本实现的,根据样本的研究结果来推断总体的某些特点。在实验研究中,要求被试样本完全是按照随机化的原则从总体中抽取得到的,因此,按照随机化的原则和方法获得的样本就称为随机样本。
在取样之前,我们要懂得研究总体和样本的概念。
所谓总体就是研究对象的全体,总体可以是无限的,也可以是有限的。一般而言,在具体研究中,被试的取样总是以有限总体为研究对象的。一般情况下,对总体全部进行研究是不可
能的,也是不必要的。这时就涉及到从总体中取样的问题,采用能够代表总体的样本作为研究的被试。当总体同质性高时,抽样比较容易,总体同质性低时,抽样要求比较高。
抽样之所以重要就在于它要真正能够代表研究总体。
心理学研究中常用抽样的方法介绍
随机抽样:按照随机性原则从总体中抽取样本个体的方法。就是在取样的过程中,使总体中的每一个个体都有同样的机会被抽取到样本中去。比较常见的有简单随机抽样和分层比例随机抽样。
(1)简单随机抽样适应于总体中个体数量不太多的情况,例如将一个班级作为总体,丛中随机抽取一定数量的学生,就可以采用该方法。具体的做法是把总体中的每个对象编号,然后采用抽签或者查随机数字表的方法,取得足够数量的被试样本。
(2)分层比例随机抽样:如果研究总体中情况和条件比较复杂,就需要按照研究的需要以一定的标准对总体区分出不同的层。例如,以一个城市的居民作为研究总体,就需要分为不同的年龄段、性别、文化程度、职业等各种层次,根据有关的资料掌握各种层次的居民在全市居民中所占的比例,然后按照这种比例计算出在每一层次中应抽取到样本中去的人数,并用简单随机抽样法在每一层次中抽取足够数量的被试,所有被抽取来的被试就构成了分层随机抽样的样本。
抽样对于调查结果的影响无论如何估计都不过分。
例如,1936年Franklin Delano Roosevelt 和共和党的候选人Kansa 州州长Alfred Landon 竞选下一任美国总统。当时绝大多数观察家认为Roosevelt会获胜,《文学摘要》却预言,Landon会以57% 对43%的压倒多数获胜。其根据是约有240万人参加的一次民意测验(poll)。在此之前,自1916年以来历届选举中,《文学摘要》(the literary digest)都准确地预测了获胜的一方。但结果是Roosevelt以62%对38%的绝对优势获胜。
接受民意测验的人数绰绰有余,但预测误差幅度之大令人吃惊。与此同时,有一个较GEORGE GALLUP的人创立了一个调查机构,只调查大约50000人就正确预测了Roosevelt 会以56%对44%获胜。那么,《文学摘要》预测的误差来自哪里呢?
后来,研究者从样本抽取过程中发现了问题所在。
《文学摘要》的程序是将问卷邮给1000万人,他们的名字和地址摘自诸如电话薄或者俱乐部会员名册。这样做的结果是筛选掉那些不属于俱乐部成员或者没有安装电话的穷人,而这些人正是支持民主党人Roosevelt的。在《文学摘要》的抽样程序中严重地存在着排挤穷人的选择偏向。而当时Roosevelt的主张有利于穷人,Landon的主张有利于富人。
这是原因之一。这只是第一步的错误。
当选择程序有偏向时,抽取一个大的样本并没有帮助。它只不过是在叫大的规模下重复基本错误。
在确定样本后,还要去调查他们的想法。如果样本中的大多数人实际上不回答问卷或提问,那将产生严重的扭曲,称为不回答偏倚。例如,那一年中,给芝加哥登记的选民每三个人邮
寄一份问卷,约20%回答,其中超过半数支持Landon ,但是在选举中是选民对Roosevelt 和Landon的支持率为2:1。
结论:不回答者可能非常不同于回答者,样本中不回答的个体比例很高时,防止不回答偏倚。
结论:《文学摘要》的民意调查中,收到问卷的1000万人中只有240万人回答问卷。而在240万人并不能代表被测验的1000万人。
有鉴于此,现代调查机构更喜欢采用亲自询问来代替邮寄问卷。尽管如此,亲自询问依然存在不回答偏倚问题。例如。访问者来访时,不在家的人和接受访问的人可能在工作时间。家庭关系,社会背景方面有较大的差异,从而看法也不一样。
民意测验杜威(deway)当选年
1948年共和党人THOMAS DEW AY , ALBANY州州长与在位的HARRY TRUMAN (罗斯福死后,接任总统)。
三家主要的民意测验采访了竞选情况,代表HEARST报的CROSSLEY;联合了100家报纸的GALLUP,以及财富杂志《FORTUNE》的ROPER:统计资料使得ROPER相信杜威是胜利者,将领先5%。结果如下表所示:
预测实际结果
候选人CROSSLEY GALLUP ROPER
TRUMAN 45 44 38 50
DEW AY 50 50 53 45
THURMOND 2 2 5 3
WALLACE 3 4 4 2
为什么会出现这么大的偏差呢?
他们采用的是定额抽样方法。根据该程序,访问者访问的各种对象都规定了固定的名额,此外某些范畴也是固定的,例如,居住地区,性别,年龄,种族和经济状况。在其他方面,访问人员可以自由挑选。
问题是:在规定的定额内,访问人员可以自由选择他喜欢的任何人,这就给人为选择留有过多的余地,而人为选择经常容易出现偏倚。
英国统计学家Fisher(1890-1962)最早提出实验设计的概念。
三、实验设计的基本原则
1:随机化原则
1)能够使可能存在的无关变量的效应受到控制,相互抵消;
2)可获得由每个自变量及其每个因素水平所引起的因变量的平均值以及他们之间的差异的恰当估计量。