视觉工作记忆研究综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

视觉工作记忆研究综述
一、工作记忆概述
1.工作记忆的概念
1974年,Baddeley和Hitch在模拟短时记忆障碍的实验基础上,从两种记忆存储库理论中的短时记忆的概念出发,提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。

Baddeley认为工作记忆指的是一种系统,它为复杂的任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信息。

工作记忆系统能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。

认知心理学把工作记忆(Working memory,简称WM)定义为一种对信息进行暂时性加工和存储的能量有限的记忆系统(Baddeley,2000)。

它具有短暂性、可加工性等特点,区别于短时记忆和长时记忆的特性。

通过该系统,人类进行语言理解、阅读、运算和推理等高级认知活动,完成从短时记忆到长时记忆的转换。

工作记忆被形容为人类的认知中枢,目前已成为认知心理学和认知神经科学中最活跃的研究领域之一。

除了本身是研究热点,而且还渗透到了心理学研究的其他多种领域。

如前瞻性记忆、错误记忆和自传体记忆等领域也开始关心WM的中央执行功能的作用;有人开始用WM的观点重新解释一般智力和和液态智力;WM被新皮亚杰学派看作儿童认知发展的中心结构;在认知老化、神经分裂症、发展性注意缺陷多动障碍和孤独症的研究上也受到了特别的重视。

Baddeley和Hitch在其模型中把工作记忆分为三个子系统,分别为:语音回路(phonological loop)、视觉空间模板(visuo-spatial sketchpad)和中央执行系统(the centra lexecutive),见图1。

即把工作记忆分为一个负责加工协调计划以及监督管理的执行性控制系统一个分别储存不同信息的存储系统在Baddeley的工作记忆模型中注意主要与执行性控制有关而与存储无关存储被认为是一个自动起作用的过程。

图1 Baddeley的工作记忆三成分模型
①语音回路:亦称为语音环路或发音环路,主要负责以声音为基础的信息的储存与控制,包含语音储存和发音控制两个部分,一部分是语音储存,能保持语音信息1至1秒,其中的项目均由语音结构来表征;另一部分是发声控制,类似于内部语言,能通过默读重新激活趋于消退的语音表征,防止衰退。

发音控制加工还可以将书面语言转换为语音代码储存在“语音储存”中。

近期使用PET的研究也证实了该系统所包含的两个成分的观点。

语音回路系统是记忆广度的基础,一些刺激信息项目能够保持在记忆中,是一种联合功能所致,既是以一定的速率输入信息,然后形成记忆痕迹和通过默读背诵,最后再以一定的速率来刷新原有的记忆痕迹。

②视觉空间模板:主要处理视觉空间信息,它可能包含两个元素:一个视觉元素,与颜色形状有关;另一个是空间元素,与位置有关。

视觉空间模板子系统对空间任务的计划和在地理环境中的定向具有重要的意义。

研究表明,当前的听觉信息或口头的活动会干扰一个
系统,而视觉的或空间的活动则会干扰另一个系统。

来自神经心理学的研究显示,视觉的信息编码与空间的信息编码之间是分离的,两侧枕叶更多地参与了视觉的信息编码,而空间的信息表征则更多地依赖于顶叶的功能。

③中央执行系统:中央执行系统是工作记忆模型的核心,它是一个能量有限的系统,其功能类似于注意,主要负责各子系统之间以及它们与长时记忆的联系、注意资源的协调和策略的选择与计划等。

Baddeley的WM模型近年来最大的发展是:在传统模型的基础上,增加了一个新的子系即情境缓冲区(episodicbuffer,EB)。

情境缓冲区是为了克服传统模型的弱点而提出的。

如在随机的单词记忆任务中,被试只能即时系列回忆出5个单词左右,但如果根据散文内容进行记忆,则能够回忆出16个左右的单词。

显然传统的三成分模型无法解释这种结果。

Baddeley认为,关键在于传统的模型没有注意到不同类型的信息是怎样整合起来的,而且其整合结果是怎样保持的。

为此,他认为应该在其传统模型的基础上增加一个能包含这部分功能的新成分,即情境缓冲区。

情境缓冲区是一个能用多种维度代码储存信息的系统,为语音回路、视觉空间画板和长时记忆之间提供了一个暂时信息整合的平台,通过中央执行系统将不同来源的信息整合成完整连贯的情境。

情境缓冲区与语音回路、视觉空间画板并列,受中央执行系统控制。

虽然不同类型信息的整合本身由中央执行系统完成,但是情境缓冲区能保存其整合结果,并支持后续的整合操作。

该系统独立于长时记忆,但却是长时情境学习中的一个必经阶段。

情境缓冲区可用于解释系列回忆中的列表间位置干扰的问题、言语和视觉空间过程间的相互影响问题(如言语回忆中的视觉效应)、记忆组块问题、和统一的意识经验问题等。

新增情境缓冲区之后的四成分模型如图2所示。

图2 Baddeley(2000)修正后的工作记忆多成分模型
从图中可以看到,认知缓冲与视空初步加工、语音回路一样作为中枢执行系统的次级记忆被置于受中枢执行系统控制的信息保持系统的位置之上,认知缓冲的作用是在中枢执行系统的控制之下保持加工后的信息,支持后续的加工操作。

认知缓冲这一概念刚刚提出,因此支持其的实验、神经心理学证据还很少,由于它不像视空初步加工、语音回路那样是被大家所认可。

但是这种新的次级记忆系统在促进人们重视工作记忆中缺少的信息加工机制方面,
以及起到与长时记忆之间过渡过程的作用方面都有着重要的意义。

2.工作记忆的研究方法和研究进展
当今对于工作记忆的研究从各种不同的观点出发,其研究方法是千差万别的。

双重任务法(Dualtaskmethodology)是一种被广泛应用于探索工作记忆成分作用的实验方法,也称为双任务范式,它要求被试同时完成两项任务,其中一项是认知任务,简称为主任务,另一项是用于增加工作记忆成分负荷的任务,又称为次级任务(Secondarytask)。

双任务范式的基本假设是:如果两项任务同时应用工作记忆的某一成分或资源,那么次级任务将延长主任务的时间,或增加错误率。

反之,次级任务将不会干扰主任务。

在已有研究中,语音任务、手动任务、随机字母生成任务是常用的三种次级任务,它们分别用于探索语音环路、视空间模板和中央执行系统是否参与主任务的认知过程。

干扰语音回路采取的方法是要求被试不断地发音,例如“the,the……”或者按一定顺序数数,比如按“1,2,3,4,5,6”顺序数数等;对视觉空间模板的干扰任务是持续的空间活动,比如被试不看键盘,按一定顺序盲打。

干扰中央执行系统的活动是要求被试随机产生字母或数字,或者利用声音吸引被试的注意并做出相应行动。

所有的次级任务都要保证一定的速率和正确率,并且与言语推理任务同时进行。

早期的实验研究对语音任务的复述速度、手动任务的击键速度进行了严格控制(如每秒或两秒复述“the”一次或两次),这可能导致语音任务和手动任务含有注意控制成分。

近年来,研究者越来越关注次级任务所含工作记忆成分的单一性。

为此,De Rammelaere等人建议通过降低言语复述速度和击键速度的要求来保证次级任务中所含成分的单一性。

随机字母生成任务是被广泛应用的中央执行任务,但是该任务含有多种中央执行成分和语音环路信息保持成分。

近年来,Vandierendonck等人开发一种随机间隔决策任务(random interval decision task,RID)。

它不再要求被试作出随机性控制,而是由计算机随机间隔产生一个高低音,被试根据音调的高低作出反应。

在RID任务中,被试听到一个随机出现的音频后,要尽可能迅速准确地根据音频的高低做出相应的反应。

近三十年来,研究者采用双任务范式对参与数学运算的工作成分进行了较为广泛的探索,但是主要集中在算术运算领域。

如,一些研究表明:语音环路参与多位数加法运算,但不参与简单加法运算。

与语音环路的作用不同,视空间模板参与算术加法运算较少得到实验结果的支持。

尽管研究者采用了不同的中央执行负荷的次级任务,但是他们都获得了中央执行系统参与算术加法运算(无论是简单的还是复杂的算术加法)的实验证据。

虽然算术运算和代数运算之间存在密切的联系,但是它们之间也存在差异。

如,算术运算信息可能与自然语言具有相接近的加工过程或点,特别是阿拉伯数字可以用单个音素来表征。

而单个代数符号中所含的“音素”一般含有多个音素。

如,“3A”由数字“3”和“A”组成“,3A”可以较自然地读做“叁A”;而“A3”必须读作“A的立方”或“A的3次方”。

这意味着代数符号的音素特性将增加语音复述的难度,从而使得代数符号的储存和保持更多地依赖视空间记忆。

近年来一些研究表明代数符号具有更多的视觉空间特性以及代数运算或逻辑代数运算需要利用工作记忆资源。

双重任务法和相关分析法是两种相互补充的方法。

但是有几点是必须注意的。

比如,相关并不一定是表示因果关系。

广度的得分差并不一定是认知任务成绩的得分差的原因(比如说人与人之间的个别差异,随着年龄的增长,各种广度的差异变化,不相关的种种其他因素等等)。

所以通过这种方法得出“认知任务的成绩是由工作记忆的容量制约的”这种结论时,一定要慎重。

为了解决这个问题最近人们在使用一种潜在变量分析法(Latent variable analysis)的方法,这种方法可以消除掉与要证实的理论没有直接关联的因子。

Baddeley理论模型中有关次级记忆的研究最先进行理论化的就是语音回路这一概念。


们假定在这个次级记忆系统中包含着二个相关因素,即对语音信息进行接收、保存的语音存储系统和对语音存储系统中所保持的语音信息进行加工、保持的音节控制过程(articulatorycontrolprocess)。

这种说法被Smith&Jonides于1999年的有关脑成像机制的研究所证实。

在此仅列举公认的重要的理论进展:
(1)语音回路技能的发展。

包括语言性的短时记忆的研究在内,以前关于语音回路的研究大多都是采用数字列、词语列的按顺序再生方法,这就给人一种感觉,语音回路是一种为了短暂保持语言刺激和再认而存在的系统。

1998年Baddeley,Gathercole&Papagno等人提出“语音回路是一种为了短暂保持语言刺激和再认而存在的系统”,这些功能只不过是一些派生的功能,而语音回路的真正机能是“语言习得”,并且提出了有关语音回路结构的一些理论观点。

这部分之所以重要是因为他们不仅涉及了有关语音回路结构方面,还涉及到了有关语音回路与常时记忆之间关系,以及工作记忆与长时记忆关系的内容,所以在工作记忆的研究方面是有着重要作用的。

(2)视空初步加工系统的研究也有了很大的进展。

特别是根据视觉要素、空间要素等对视空初步加工系统进行区分的做法是非常重要的。

Logie(1995)通过试验得出在视空初步加工系统中存在着两种次级记忆,即参与被动视觉信息保持的视觉信息存储——视觉方面(静的)和参与存储信息的加工、保持——空间方面(动的),基于试验结果,Logie提出应在Baddeley的理论模型中加入有关视觉、空间要素的区分这一内容。

但是现阶段这种推论没有办法解决视空初步加工的应用范围,而且还存在着用“视觉方面——(静的)、空间方面——(动的)”这种图示很难说明的一些问题,这些都有待日后的研究。

(3)三种次级记忆系统中发展相对滞后的是中枢执行系统。

第一点变化:以前的理论将信息保持机能排除在中枢执行系统的概念之外,之所以这样做是因为担心如果中枢执行系统包括信息保持机能的话,那么中枢执行系统将成为一种无所不能的系统(大而全等于什么都没有)从而成为一种在理论上毫无用处的概念。

并且在此基础上将各领域所固有的信息处理机能也从中划分出去,把中枢执行系统摆在一种纯粹的信息控制机构的位置之上。

第二点变化:不将中枢执行系统假定成为一种单一的系统,而是提出可能还会有,选择性记忆,长时记忆信息激活等次级记忆系统的存在。

第三点变化:指出将中枢执行系统理解为神经认知科学的基础是必要的,但决不能将中枢执行系统的机能和前额叶皮层的功能相提并论。

因为中枢执行系统是一种纯粹的理论假设的概念。

因此从Baddeley(1998)的理论角度出发,中枢执行系统并不是认知系统中个别独立存在的,倒是不妨把它看作是一种特例(Emergent 突变)。

Baddeley的理论模型是基于双重任务实验和认知神经科学的数据得来的。

作为能够有效说明个人差异的3CAPS模型是由Just&Carpenter于1992年提出的,随后的几年中3CAPS与脑成像法相结合在研究人脑进行认知任务的过程中的各部分活动时,为了更好的模拟这一活动发展了4CAPS模型。

最近与3CAPS同样在认知活动中体现个人差异的模拟模型是ACT-R 模型。

ACT-R通过激活扩散系统保证相关信息的高水平活性化,这样不仅能够保证不丢失重要的信息,而且还能够迅速、准确地进行信息的处理。

在这个结构中工作记忆容量的个体差异是通过“源激活”的总量差来实现的。

在3CAPS 中信息的处理与保持所使用的系统内部激活总数是由个体差异因素所决定的,与之相对的是在ACT-R中作为支持边界信息活性的“源激活”的数量是由个体差异决定的。

ACT-R模型中的个体差可以为区分边缘信息的注意资源容量差赋予一种特征。

Lovett等(2001)研究认为,在这个结构中,仅通过改变源激活这一个变量成功模拟了工作记忆任务中的个体差异。

这里值得注意的是这里模拟的并不是像3CAPS那样上下级组群之间的成绩差,而是详细模拟每个被试之间的个人成绩差异,因此ACT-R模型被认为是3CAPS的进一步发展。

但是,在复杂的认知活动中仅依靠个体差异来说明某一个部分,既是它的优点,同时也是这种理论的一个弱点。

因为被试之间的个体差异不仅仅是由源激活的总量决定的,同时也决定于加工速度、方法、相关知识的掌握等各种各样其他的因素,因此,严格的实验条件是评价ACT-R模型的一个重要条件。

如前所述Baddeley的理论模型强调工作记忆的非单一性的构成,其构造是清楚地由一个个次级记忆系统构成的。

与此相对,ACT-R模型强调的是工作记忆中单一的结构,将详细地揭示“某一个部分”作为重要的课题。

因此这两个理论模型在研究的方向上、优缺点上和对工作记忆的不同侧面的研究上都有着很强的互补性。

当然还有很多有关工作记忆的模型,例如:短时记忆+注意控制机制=注意控制模型(Engle et al., 1999),工作记忆+长时记忆=长时记忆工作记忆,分散型模型(Barnard,1999)等等,在这里就不一一详细介绍了。

(三)工作记忆的神经生理机制
目前采用神经影像技术在研究人类工作记忆的脑机制时发现至少存在两种类型的工作记忆系统,即词语工作记忆(verbal working memory) 和空间工作记忆( spatial working memory),它们分别负责处理词语信息和空间信息。

Jonides和Smith 等人(1993,1996)以正常人为对象,利用PET 对工作记忆进行了一系列研究。

他们借用Sternberg于1966 年研究记忆扫描的项目再认范式(item - recognition paradigm)设计了不同类型的工作记忆任务(图1)。

首先,在视屏中央呈现“+”字500ms,然后在十字周围出现四个大写字母或三个黑点200ms (称为目标刺激),随后间隔延迟3000ms,最后出现一个探测刺激——小写字母或圆圈1500ms,要求被试判断该小写字母是否与前面呈现过的四个大写字母中的任何一个匹配,或者圆圈是否圈住了前面呈现过的三个黑点中的任何一个。

注意,在词语记忆任务中,让被试比较小写字母与大写字母是为了使被试必须对字母的语音进行表征,以免被试仅从字母形状作出判断。

图6-15 词语工作记忆和空间工作记忆任务及其相应的控制条件设计模式
上述任务除了需要工作记忆参与,还包括被试感知编码刺激(字母和黑点)以及作出反应等其它一般性的操作过程。

因此,PET扫描数据所反应的脑激活信号不仅包含工作记忆所激活的神经信号,而且还包含感知刺激以及作出反应等心理活动所激活的神经信号。

为了排除后者,实验还设计相应的控制任务(图6-15) 。

它与记忆任务类似,区别仅在于当目标刺激呈现完毕立即呈现探测刺激,不存在延迟,所以该任务只需要被试感知刺激以及作出反应等一般性的操作过程,没有记忆参与或对记忆资源的需求量极少。

这样,当从记忆任务条件下所获得的脑激活信号排除控制任务条件下所获得的脑激活信号后,得到的仅是工作记忆的脑激活信号。

这种实验设计可称为减法设计(subt ractive design) 。

分析表明,词语工作记忆主要激活了脑左半球一些脑区,包括左顶后皮层布洛德曼(Brodmann Area,BA) 40 区、Broca 区(BA 44) 、左前运动区(BA6)以及左辅助运动区(BA 6),而空间工作记忆主要激活了脑右半球一些脑区,包括右顶后皮层(BA40) 、右枕前皮层(BA 19) 、右前运动区(BA 6)以及右脑前额叶腹侧(BA 47) 。

词语工作记忆主要由左半球参与,空间工作记忆主要由右半球参与,两种记忆条件下所参与的脑区没有重叠,为词语工作记忆与空间工作记忆的双分离提供了明确的证据,且支持大脑两半球功能不对称性的观点。

为了进一步研究顶叶后部皮层和脑前部额叶在工作记忆中分工如何,Awh(1996)设计了新的实验进一步强调工作记忆的贮存和复述功能(图6-15)。

让被试浏览一系列依次呈现的字母,每个字母呈现500ms,间隔2500ms,然后要求被试决定每一个出现的字母是否与此前刚呈现过的前面第二个字母匹配(Awh 等称之为2 - back 任务) 。

显然,被试为了完成这一任务必须时刻在记忆中贮存并复述新出现的两个字母,以便与即将出现的一个新的字母匹配,且要不断更新字母信息。

图6-16词语记忆任务、搜寻任务以及复述任务的设计模式图
为了分离贮存和复述过程,并排除知觉编码和反应等活动,Awh 等还设计了两个控制任务,分别称为搜寻任务与复述任务(图6-16),两任务中字母呈现方式均与记忆任务相同。

在搜寻任务条件下,要求被试判断不断出现的一个新字母是否与该字母序列的第一个字母相同;在复述任务条件下,被试必须不断地默述每一个新出现的字母并作出按键反应,直到下一个字母出现。

Smith和Jonides(1998)研究发现,记忆负荷的增加导致与记忆有关的脑区激活强度增加,而不是有更多脑区的参与。

对于这一点,Jansma 等人(2000)此后给出了更明确的说明。

Jansma 等采用n - back 实验范式更明确分离出对工作记忆负荷敏感的脑区和不敏感的脑区,其中前者包括背外侧前额皮层、前扣带回、顶叶后部,后者包括初级感觉运动皮层等,与Jonides 等[10 ]的研究大体是一致的。

Cohen 等人(1997)的研究进一步揭示出不同记忆负荷条件下参与工作记忆的特异性脑区(BA 40 、BA 44 、BA 46) 与参与一般性心理过程的脑区(感觉运动区) 在信息维持期间的时间序列变化过程,除了对Jonides 等(1998)的研究给予支持外,Cohen 等还推测,前额皮层也可能与顶后区一起参与信息的维持(暂时贮存) 。

对视觉工作记忆的进一步研究发现,可能还存在一种特殊的视觉工作记忆,即客体工作记忆(object working memory) 。

所谓客体,指的是一些熟悉或不熟悉的物体图形,如几何图形、面孔等,其本质是一些不含词语信息和空间信息的视觉信息。

从现有文献进行分析,Smith 等人所说的客体工作记忆与Ungerleider 等人所说的视觉工作记忆( visual working memory) 含义是相同的。

目前,研究者一般采用变化检测范式(change detection paradigm)来研究客体的加工特性。

它是前后呈现两组刺激,然后让被试进行一致性判断,即先呈现初始刺激组,间隔一段时间之后,再呈现检验刺激组,要求被试对检测刺激组与初始刺激组的“异”或“同”的进行判断,并做出反应。

实验中要求被试重复说习惯化了的词语或数字,如“an,an,an”等,抑制干扰语音回路的影响,即发音抑制(articulatory suppression)。

研究者根据所关注的问题,结合被试判断的记忆绩效指标,从而对所研究问题作出推断。

Smith等(1995)以一些抽象的几何图形作为刺激项目研究客体工作记忆,观察到左半球颞叶、顶叶以及额叶的一些脑区参与(与参与词语工作记忆的脑区没有重叠),但Courtney 等(1997)观察到左右脑各区同等参与。

Ungerleider等(1998)据此认为左右脑各区参与客体工作记忆的程度依赖于被试对刺激项目的熟悉性以及对客体刺激采用何种形式的编码。

例如,当鼓励被试对不熟悉面孔采用词语编码时,所激活脑区的左脑一侧化更明显,当鼓励被试对不熟悉面孔采用图像编码时,所激活脑区的右脑一侧化更明显。

Jiang 等(2000)还采用事件相关fMRI (event - related fMRI) 进一步分析了面孔识别过程中熟悉性程度与相应各激活脑区神经信号强度的关系。

显然,客体工作记忆的脑活动机理是一个需要大力研究的领域。

现有的探讨空间工作记忆的脑结构基础的研究大多强调前额叶的作用,但在前额叶的具体脑区方面存在争论,或强调腹侧区、或强调前额背外侧区、或强调额上沟的作用。

产生这种不一致的原因十分复杂。

然而,参加空间工作记忆的脑区不太可能是一个单一的脑区,但到目前为止,明确将参与空间工作记忆贮存过程和复述过程的脑区分离的实验研究仍很少见。

有关工作记忆的执行加工的脑机理研究中常采用双任务范式模拟任务管理过程,可观察到背外侧前额皮层区(BA 9,46) 以及前扣带回(BA 24,32)明显激活。

例如,D’Esposito 等人(1995)在一项实验研究中设计了两个任务,一种任务是语义判断任务,要求被试判断他听到的那个词是否与他视野中同时呈现的蔬菜图片相符,另一任务是空间旋转任务,要求被试判断视野中呈现的两个三维物体是否不同。

整个实验过程包括让被试分别操作两个任务以及同时操作两个任务这两种情况,fMRI研究发现,任一单任务操作没有激活前额脑区,。

相关文档
最新文档