人机交互过程中认知负荷的综合测评方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

心理学报 2009,Vol 141,No 11,35-43 

A cta Psychologica S in ica

DO I :10.3724/SP .J.1041.2009.00035

35

收稿日期:2007-11-13

3全国教育科学“十一五”规划教育部重点课题(DCA080141)、浙江省自然科学基金资助项目(Y604275)、浙江省哲学社会科学规划后期资助项目(08HQZZ038)资助。

 通讯作者:许百华,E 2mail:bhxu305@zju .edu .cn

人机交互过程中认知负荷的综合测评方法

3

李金波 许百华

(浙江大学心理与行为科学学院,杭州310028)

摘 要 设计模拟网络引擎搜索和心算双任务实验,分析主观评定、绩效测量和生理测量三类评估指标对认知负荷变化的敏感性;采用因素分析、BP 神经网络和自组织神经网络三种建模方法,探索人机交互过程中认知负荷的综合评估建模方法。结果显示:心理努力、任务主观难度、注视时间、注视次数、主任务反应时、主任务正确率6个指标对认知负荷变化敏感;采用多维综合评估模型对双任务作业认知负荷进行测量总体上比采用单一评估指标的测量更为有效。BP 网络和自组织神经网络两种神经网络模型对认知负荷的测量结果优于传统的因素分析方法。关键词 人机交互;评估;认知负荷;神经网络;建模分类号 B841.2

1 前言

随着计算机和自动化技术的发展,人在人机系统中的职能发生了很大变化,从原先执行简单的手工操作转变为主要从事监测和调节、控制系统运行

状态的监控任务,人的认知负荷(Cognitive Load )大大加重。尤其是在军事、航空航天、核能等领域的复杂人机系统中,作业人员往往需要在短时间内处理大量的信息并快速作出反应与决策,容易出现认知负荷过高,甚至超负荷现象。过高的认知负荷将严重影响人的工作效率、操作可靠性和身心健康,进而影响整个人机系统的效率和可靠性。因此,认知负荷已成为人机系统评价的主要指标之一。 最早对认知负荷开展研究的是美国心理学家M iller (1956)。此后,国外一些学者对认知负荷的含义、结构和测评方法进行了大量的研究。Cooper (1990)将认知负荷定义为在特定的作业时间内施加于个体的工作记忆的心理活动总量。Paas 和van Merrienboer (1994)认为认知负荷由多维度构成,是执行一项具体任务时施加于个体认知系统的负荷。认知负荷目前尚不能直接进行测量,而只能用间接的方法对其进行评估。常用的评估技术有任务绩效测量、主观评定和生理测量等三大类(Paas &Mer 2rienboer,1994;B runken,Plass &Leutner,2003;

Faircl ough,Venables &Tattersall,2005;Chris,Dan 2

iel &A lan,2007;Ahlstr om &Friedman 2berg,2006)。

其中任务绩效测量又分为主任务测量和次任务测量两种。主任务测量是通过直接测定作业者完成指定作业的绩效来评价该作业的认知负荷要求。它的基本假设是,随着作业难度的提高,对人的信息加工资源的需求相应地增加,当认知负荷对个体的要求超出其可支配的资源总量时,作业绩效将出现不同程度的下降。主任务测量常用的指标有操作准确性、反应时、信号漏失率和虚报率等。次任务测量采用双任务作业情境,要求作业者除执行主作业外再完成一项额外的作业(次作业),通过考察双任务作业情境下次作业绩效受影响的程度(相对于单任务情境)来间接评价主作业的认知负荷。生理测量是通过测定作业者在进行指定作业过程中出现的生理反应来间接地评估认知负荷,常用的生理指标有瞳孔直径、心率和事件相关电位等(Chirs,Daniel &A lan,2007;Ahlstr om &Fried man 2berg,2006)。主

观评定技术是由作业者根据主观感受与体验来评估认知负荷,通常涉及个体知觉到的心理努力、任务难度和时间压力等方面。上世纪80年代以来,国外一些研究者相继开发出了多种认知负荷主观评定方法,如Paas 和Van Merrienboer (1994)使用九级评定量表测量被试在理解任务材料上投入心理努力的程

36

 心 理 学 报41卷

度,进而对认知负荷进行评估。Kalyuga,Chandler 和S weller(1997)使用由作业者自我报告任务难度的方法来测量认知负荷。此外,Sal omon(1983)、Tabbers(2004)、Paul(2006)等也分别提出了相类似的认知负荷主观评定方法。

已有的研究表明,上述3类测评技术各有优点和局限性。例如,主任务测量比较直接,对作业本身无干扰,但只在中等负荷水平时较敏感;次任务测量相对比较敏感,效度较高,但容易对主任务产生干扰。此外,任务绩效与认知负荷的关系不一定是简单的线性关系。例如,Meister(1976)将认知负荷等同于任务需求,发现任务需求与工作绩效之间是曲线的关系;而W aard(1996)则认为,任务需求与任务绩效之间呈“倒U”形的关系。主观评定无干扰,操作简便,但要求被试采用内省的方法来评定负荷水平,因而容易出现较大的偏差。此外,主观评定结果与个体特征、认知策略以及个体的心理和生理状况等多种因素有关,即使同一个人对同样的任务,在不同的作业时间段也有可能出现不同的评定结果。以Paas和Van Merrienboer(1994)提出的心理努力问卷为例,该问卷看起来能够测量投入努力的主观知觉,但是却无法知道这种心理努力与真实认知负荷的关联程度。如有研究表明,低努力投入可能是由于任务过难,个体减少心理努力的结果(Reed,Bur2 t on&Kelly,1985)。同样,Kalyuga,Chandler和S weller使用让个体自我报告任务难度差异方法所得出的结果也很可能是由于所需要完成的任务难度、个体个人能力水平等原因造成的。生理测量指标具有客观性和实时性,但是它们与认知负荷之间只是间接的联系,并且也可能会受到注意或情感等方面因素的影响(B runken,Steinbacher&Plass, 2002)。因此,由认知负荷引起的某一生理指标的变化可能会被其它因素放大或缩小;而且不同的任务可能会产生不同的生理反应,一项生理指标对某一类任务适用,而对另一类任务则可能不适用。一般认为,不同测评技术分别适用于不同的情境、不同的负荷水平范围。因此,利用多种技术对认知负荷作综合评估以替代基于单一方法或指标的评估是比较合理的选择;同时,认知负荷的多维度特性也决定了对其作综合评估的必要性。近年来,国外一些学者运用多指标综合评估方法在心理工作负荷(Men2 talWorkl oad)的测评中进行了一些探索性研究。这些研究以多个单一评估指标的测量结果作为依据,采用一定的建模技术对心理工作负荷进行多维度综合评估。目前在这一领域较常用的建模技术主要有因素分析、回归分析和人工神经网络建模等。例如, Kilseop和Myung(2005)运用主成分分析将三种生理指标(脑电、眼动和心率)和主观负荷组合成一个综合评估指数,发现综合指数较单项指标能更准确地区分不同难度任务中被试的负荷水平。此外,他们还通过回归分析来考察主观负荷与生理指标之间的关系,以生理指标的测量结果来预测被试的主观评定的负荷状况。人工神经网络简称神经网络,在国外有关的研究中,运用神经网络模型对负荷进行多维度综合评估主要有两种模式。一种模式是将主观负荷、作业绩效指标或生理指标的测量结果作为网络的输入项,通过建立不同的神经网络模型对负荷进行评估或等级划分。例如,Roger,Robecca和Gory(2003)在一项模拟多任务作业的实验中,收集了5个绩效指标作为输入项,建立起BP神经网络模型。经检验,该模型对预测不同任务条件下被试的负荷状况具有较高的准确率(在66.9%~96.0%之间)。Mazaeva和N tue(2001)在一项飞行作业的模拟实验中对被试进行了30个EEG指标的测量,然后运用主成分分析法将这些指标归并为少数的几个指标,以它们作为网络的输入项建立起自组织神经网络模型。结果显示,借助自组织神经网络模型能比较准确地预测信息加工要求不同的任务中负荷发生的变化。此外,其他的研究者利用相类拟的方法也得到了较理想的结果(Laine,Bauer&J r Tef2 frey,2002;Noel,Bauer&Lanning,2005;Gr ootjen, Neerincx&Velt m an,2006;Shayeghi,Shayanfar,2006; Shayne,Penel ope&Andre w,2007)。第二种模式是将影响负荷的主要因素作为输入项,通过建立神经网络模型,对不同任务难度条件下被试的负荷状况进行评估。例如,D ing和Sheue(1999)将影响监控作业的跨度(Span)、差异度(discri m inate)、可预测度(p redict)和注意转换(transfer attenti on)4个因素作为输入项建立BP神经网络对负荷进行评估,并将神经网络评估结果与负荷上限值进行比较,超过上限值就认为是超负荷,并据此对监控作业过程中的负荷状况进行实时分析和任务的动态分配。但从总体上来看,国外学者利用神经网络对负荷进行评估或等级划分还处于起步阶段,并且已有的研究中,任务条件各异,神经网络输入变量不同,因而所得的结果也难以进行比较。此外,有的研究者还运用多层次模糊综合评价方法对负荷进行综合评估研究(Currie,1997)。

相关文档
最新文档