研究的效度

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

研究的效度

心理学研究的选题、理论构思、设计、实施、统计和推论以及评价，是一组相互影响、密切联系的科学活动，整个研究的效度也取决于研究各个方面的效度，在此过程中，人们需要对以下问题作出判断和决策：(1)所研究的两个或多个变量之间是否存在一定的关系？尤其是，研究的自变量与因变量之间是否有关系？(2)如果所研究的变量之间存在一定关系，这种关系是否因果关系？(3)如果变量之间可能存在因果关系，它所包含的具体的因果关系构思是什么？(4)假定变量之间的因果关系构思明确，这种因果关系对于其他的人员、背景条件和时间的普遍意义如何？第(1)种研究中的自变量与因变量之间的关系属于内部效度的问题；第(2)种在变量之间判定因果关系，这是统计结论效度的问题；第(3)种因果关系的构思性质，是构思效度；第(4)种变量之间关系的普遍意义，是研究的外部效度问题。

内部效度指研究中自变量和因变量之间存在关系的明确程度。如果在测量中，排除对结果产生影响的无关因素，因变量所产生的变化都是由研究者所操纵的自变量所引起，说明这个研究具有好的内部效度。内部效度的获得，一是由于正确地选择了研究的自变量和因变量，这样才有可能作出有关变量之间因果关系的陈述；二是周密的实验或研究设计，在进行实验设计时，明确地意识到各种影响内部效度的因素，运用多种设计措施，控制这些影响因素，突出自变量与因变量之间的关系。影响内部效度的因素有：(1)历史因素，可分为前摄历史因素和后摄历史因素，前摄指被试固有的和习得的差异，一般用随机化来平衡，后摄指在研究过程中发生的对研究结果可能产生影响的一个或多个特定事件，这些事件可能会影响被试的反应，有两种情况，一是在研究过程中，发生特定事件，可能和自变量一起对被试的行为产生干扰，二是在实验组和控制组实验中，某些事件只对其中的一个组产生影响。(2)成熟，在研究期间，由于被试自身的生理与心理发展、成长或变化引起的系统变异，因而随着时间的推移而产生某种系统效应，降低内部效度。控制的方法是尽可能随机化，并设立对照组。

(3)被试选择因素，就是前摄历史因素，一般有这些特征：年龄，性别，民族，力量，成熟，动机，灵活性，文化程度，智力，态度，阅读能力，社会经济地位，信仰，心理健康，强壮，风俗习惯，职业。(4)被试的更换和淘汰，研究过程中，被试由于事故、生病或研究调整等原因而被更换或停止参加研究，这会降低内部效度，在纵向研究中较易出现这类情况，被试有合作型、消极型、评价担忧型和忠实型。(5)测验，主要指先前的处理对被试在随后的处理中的反应产生影响，常见的有练习效应、疲劳效应和敏感效应（前测的使用使被试对后测更加警觉和有意识，使他们对随后所发生的处理更加敏感和做出更积极的反应），一般通过设立无事前测定组加以控制。(6)实验处理和程序，(a)有关实验处理和程序的信息的扩散和交流，使对照组实际上得到了实验处理或受其影响；(b)实验处理的实施包含着其他好处，产生补偿性等同效应；(c)由于实验处理而使实验组十分引人注目或炫耀，产生补偿性竞争。

(7)研究工具，实验仪器的使用和实验人员的变化，包括仪器使用不当出现问题或主试身心发生变化，控制的办法是将所有程序标准化，研究前对研究工具进行校准，实验人员保持良好的生理心理状态。(8)统计回归，在进行重复测量时，初测时获高、低极端分数者会在重测时倾向于向平均值偏移，即高分者随着时间的推移成绩下降，低分者随着时间的推移成绩升高。控制的办法是在研究中把极端分数者单独分成对照组和实验组，注意它们的结果差异，进而作出有关自变量效应的正确结论。(9)多种研究条件和因素的交互作用，在研究过程中由于测试程序、因素控制和实验安排等方面的原因，造成多种条件和因素之间的交互作用，从而影响效度。控制的办法有单盲法或双盲法，还有就是采用具有较高内部效度的设计，所罗门四组设计，它通过随机化程序和设立4个不同处理的实验或对照组，保证了研究的内部效度。

统计结论效度，是检验研究结果的数据分析程序与方法有效性的指标，它研究的基本问题是研究误差、变异来源与如何恰当地运用统计显著性检验。统计结论效度主要取决于两个方面的条件：一是数据的质量，包括数据的量表特征、数据的分布特征、信度和效度等；二是统计检验的假设，数据分析中所采用的各种统计方法，都有其明确的统计检验假设，一旦

不明或违反，就会显著降低统计结论效度。影响因素有：(1)统计功效低，统计功效也称统计检验力，是当虚无假设不正确时拒绝虚无假设的能力，在统计学上定义为不犯Ⅱ类错误的概率，反映某个统计检验正确辨认真实差异的能力，其值等于1-β，β越小，检验力越大。

(2)违反统计检验的假设，在采用不同检验时，应了解统计检验的前提条件，如t检验必须在总体正态分布的条件下进行，若是独立样本，还要求两个总体方差齐性。(3)测量信度低，

提高测量信度的办法是运

用具有高相关项目的较长测验。Se=(4)实验处理实施的可靠性，如果实验处理不够标准化，因此应尽可能使实验处理实施标准化。还有研究背景中无关的随机因素和被试的随机异质性，对于后者可通过选择相对同质的被试和采用被试内设计的办法加以解决。

构思效度，涉及到研究方案和测量指标的理论指标及其操作化的问题，即理论构思及其转换的有效性。为了具有高的构思效度，一是要求研究的理论构思结构严谨、层次分明，形成某种“构思网络”，比如，研究儿童自我意识发展时，理论上将自我意识分为自我认识、对心理自我的认识和对社会自我的认识。二是对研究中的自变量与因变量作出严格的定义。三是针对研究构思的特点，给予明确的操作定义，并确定相应的测量指标。影响构思效度的因素有：(1)对研究构思的解释，研究需要对其理论构思有明确的说明，如果在对研究构思作出操作定义之前，对构思的基本特点缺乏明确的概念分析和解释，就会影响研究的构思效度。(2)单一方法和操作引起的偏差，对构思进行设计与测量时，如果采用单一方法或单一指标去代表、分析多维、多层次、多侧面的复杂心理、教育活动，就会产生单一方法和单一操作偏差，削弱研究的构思效度，目前，普遍主张用多种方法研究相同理论构思，比如分别用访谈法、问卷法和观察法研究群体心理结构，就容易取得比较理想的研究结果。(3)构思水平之间的混淆，当理论构思包含几种水平时，某指标在不同水平上会出现不同关系，这就会影响研究的构思效度。例如，当自变量只在中等强度时才对因变量发生效应，而在高、低强度时却关系很弱，因此，在操纵自变量时，应在其不同水平上，测量因变量的相应的不同结果，确定变量和构思在不同水平上的真正关系。(4)研究过程中实验者期望和被试猜测，会发生心理与行为的改变，不同实验处理之间的交互作用，都会影响研究的构思效度。

外部效度，指研究的结果能够一般化和普遍化到研究外情景的程度，即结果的普遍代表性和适用性，普遍性的维度有：(a)用其他的被试人群也能得到同样的结果吗？(b)用其他的实验材料也能得到同样的结果吗？(c)用其他不同类型的测验会出现同样的结果吗？(d)用不同的实验处理和不同的自变量操作方式也能出现同样的结果吗？如果能将实验当中得到的结果推广运用到实验以外的情景，该研究有较好的外部效度。一般认为，内部效度是外部效度的必要条件，但不是充分条件，内部效度低的研究结果就谈不上对其他情景的普遍意义；可是内部效度高的研究，其结果却不一定能够一般化到其他总体和背景中去。外部效度的条件是通过多个相互关联的实验，以不同的研究条件寻求具有普遍意义的结论，这种多重实验手段，是获得外部效度、提高研究结果可应用性的重要条件。影响因素有：(1)总体效度，研究样本的代表性决定了总体效度。(2)变量的定义和测试方式，对自变量和因变量作出严格的定义和描述，规定测试方式，注意测量的效度。(3)对测量的敏感性，事前测量和事后测量都可能对被试产生敏感，应尽可能地采用“不引人注目的测量”。(4)多重处理的干扰，多次接受处理之后，前一处理通常会对后一处理产生积极或消极的影响，产生练习或疲劳效应，如被试内设计，建立实验学校或基地。(5)实验者效应，实验者本身的个性、动机、情绪等影响被试，使得把实验目的、结果的期望无意中传递给被试，建议运用标准化的指导语和实验程序，并采用双盲实验。(6)测量工具的局限性，实验者对自变量和因变量的操作性定义往往是以所使用的特定测量工具的测量结果来加以考虑的，如人格的测量，所测量出的分数并不代表同一种人格特征，所以不太能推论到采用其他人格量有的情况中去。(7)研究与实际情景的相似性。(8)被试选择和实验处理的交互作用，指研究被试的各种特征如年龄、动机、对研究的态度等会使实验处理的效果具有特定的含义，从而影响研究结果的普遍性。