情感机器人的研究思路

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

情感机器人的研究思路
一、情感机器人的理论缺陷
情感机器人就是赋予了人类式情感的机器人,使之具有表达、识别和理解喜乐哀怒的能力。

关于情感机器人的理论就是“人工情感”理论,它有几种不同的表述方式:情感计算(Affective Computing)、人工心理(Artificail Psychology)和感性工学(Kansei Engineering)等。

情感计算。

情感计算的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。

中国科学院自动化研究所的胡包刚等人也通过自己的研究,提出了对情感计算的定义:“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能”。

人工心理。

人工心理理论是由中国北京科技大学教授、中国人工智能学会人工心理与人工情感专业委员会主任王志良教授提出的。

他指出,人工心理就是利用信息科学的手段,对人的心理活动(着重是人的情感、意志、性格、创造)的更全面内容的再一次人工机器(计算机、模型算法等)模拟,其目的在于从心理学广义层次上研究人工情感、情绪与认知、动机与情绪的人工机器实现的问题。

感性工学。

日本从上世纪九十年代就开始了感性工学(Kansei Engineering)的研究。

所谓感性工学就是将感性与工程结合起来的技术,是在感性科学的基础上,通过分析人类的感性,把人的感性需要加入到商品设计、制造中去,它是一门从工程学的角度实现能给人类带来喜悦和满足的商品制造的技术科学。

情感机器人的这三种理论都是从心理学层面上理解情感,不了解情感的哲学本质,不了解情感的基本功能,不了解情感的内部逻辑程序,不了解情感的数学模型,正是上述的理论障碍,在根本上决定了情感机器人的发展局限性。

情感机器人的理论缺陷主要体现在四个方面:
1、认为人工情感的理论基础是心理学。

心理学把情感定义为:“人对于客观事物是否符合人的需要而产生的态度的体验”,这就在怎样理解“人的需要”、“态度”和“体验”等方面存在歧义;把人的情感分为五种基本类型:快乐、焦虑、悲伤、愤怒和厌恶,其它情感都是由此派生出来的,这种划分方法缺乏理论依据;对于情感的测量与计算,缺乏理论前提、逻辑法则、计算方法与计算尺度。

总之,心理学对于人工情感不能提供公理性、精确性和系统性的理论支持。

目前,国内外的研究者基本上都是从心理学角度来研究情感和情感机器人,其结果必然是只能进行非常简单的、机械的、零碎的情感表达与情感识别,根本不可能进行情感的思维;他们所提出的“情感计算”实际上就是对于情感所产生的某些生理变化指标的计算,而不是对于情感所表达的核心内容(即价值关系)的计算,更不是情感思维。

这样的情感机器不能进行独立的情感思维,没有独立的意志自主性,没有任何智能效率性、行为灵活性和思想创造性。

这样的情感系统不具有连续性、逻辑一致性和内在性。

2、认为情感计算的核心就是对情感生理指标的计算。

目前的情感计算主要包括对情感的感受强度(或情感维度)、表达强度(或表情)和生理唤醒指标等三个方面的计算。

情感的这种计算方法,主要存在如下几个问题:情感的基本类型究竟应该根据什么原则和标准来划分,有何理论根据?对于同一类型情感,无论是情感感受强度,还是情感表达强度和情感生理唤醒,究竟应该选用哪一个生理指标?不同的情感类型之间没有通约性,由此产生的不同生理指标之间也没有通约性,如何进行相互比较和统一度量?人的情感内容和感情方式是极为丰富的,各种情感之间相互渗透、相互作用、相互转化,往往有着相当复杂而且变化频
繁的关系,那么对于情感的计算就需要真正天文数字般的情感数据资源库,还需要海量的计算模型与计算工作量,而人脑为何并不需要?有些复杂而微妙的情感,如怀疑、犹豫、迷茫、怜悯、尴尬、自我表现等,其生理指标的变化极其微弱而且短暂,对于它们的计算和测量如何进行?有些情感(如“对敌人的仇恨”与“对亲人的生气”)往往具有相同或相近的生理指标,但两者所表达的价值内涵往往相差很大,如何进行区别?情感的感受强度和表达强度与各种生理指标的变化量度通常不是成线性函数关系,大部分都是呈非线性的、不连续的、模糊的、概率性的、波动的函数关系,因此采用生理指标的变化量来计算情感的感受强度和表达强度,如何消除其误差性和不确定性?
3、认为情感计算是狭义的,不包括意志计算以及知情意交互的计算。

目前的情感理
论不了解认知、情感与意志的客观本质,不了解情感认知、情感与意志的内在逻辑关系,只能实施狭义的情感计算,不能实施对意志的计算,更不能实施对知情意的交互计算,因
此不能解决人的心智活动的全部计算问题。

4、人工情感主要是为了创造和谐的人机环境。

目前,“人工情感”主要是基于两个现实目的:一是建立和谐的人机交互环境,使计算机或机器人具有良好的人机界面,以降低使用者的劳动强度,提高使用者的工作效率,解放人的双手;二是制作可穿戴式的计算机,以替代、补偿与增强人的辅助感知功能和行为功能,特别是帮助提高残疾人的感知功能和行为功能。

然而,广义的情感计算的科学价值与现实作用远非如此。

事实上,情感作为一特殊的人类意识,是以一种特殊事物——价值作为其反映对象,以价值为导向器和控制器,以最大限度地提高事物的价值率为根本目的,来规划、引导和约束人的智能活动和一切行为活动,以增强其目的性和有效性,使人类机体的内部有限资源(包括体力、脑力和生理力资源)和外部有限资源能够得到充分有效地利用。

显然,一旦解决了电脑的情感计算问题,赋予了电脑以人类式的情感,那么,从逻辑的角度来看,机器人就可以从事任何工作,包括社会管理与人际交往。

二、国内外研究现状和发展动态
1、国外情感机器人的发展状况。

日本已经形成举国研究“感性工学”的高潮。

1996年日本文部省就以国家重点基金的方式开始支持“情感信息的信息学、心理学研究”的重大研究课题,参加该项目的有十几个大学和研究单位,主要目的是把情感信息的研究从心理学角度过渡到心理学、信息科学等相关学科的交叉融合。

每年都有日本感性工学全国大会召开。

与此同时,一向注重经济利益的日本,在感性工学产业化方面取得了很大成功。

日本各大公司竞相开发、研究、生产了所谓的个人机器人(Personal Robot)产品系列。

其中,以SONY 公司的AIBO机器狗(已经生产6万只,获益近10亿美元)和QRIO型以及SDR-4X型情感机器人为典型代表。

日本新开发的情感机器人取名“小IF”,可从对方的声音中发现感情的微妙变化,然后通过自己表情的变化在对话时表达喜怒哀乐,还能通过对话模仿对方的性格和癖好。

美国MIT展开了对“情感计算”的研究,IBM公司开始实施“蓝眼计划”和开发“情感鼠标”;2008年4月美国麻省理工学院的科学家们展示了他们最新开发出的情感机器人“Nexi”,该机器人不仅能理解人的语言,还能够对不同语言做出相应的喜怒哀乐反应,还能够通过转动和睁闭眼睛、皱眉、张嘴、打手势等形式表达其丰富的情感。

这款机器人完全可以根据人面部表情的变化来做出相应的反应。

它的眼睛中装备有CCD(电荷耦合器件)摄像机,这使得机器人在看到与它交流的人之后就会立即确定房间的亮度并观察与其交流者的表情变化。

欧洲国家也在积极地对情感信息处理技术(表情识别、情感信息测量、可穿戴计算等)进行研究。

欧洲许多大学成立了情感与智能关系的研究小组。

其中比较著名的有:日内瓦大
学Klaus Soberer领导的情绪研究实验室。

布鲁塞尔自由大学的D. Canamero领导的情绪机器人研究小组以及英国伯明翰大学的A. Sloman领导的Cognition and Affect Project。

在市场应用方面,德国Mehrdad Jaladi-Soli等人在2001年提出了基于EMBASSI系统的多模型购物助手。

EMBASSI是由德国教育及研究部(BMBF)资助并由20多个大学和公司共同参与的,以考虑消费者心理和环境需求为研究目标的网络型电子商务系统。

英国科学家已研发出名为“灵犀机器人”(Heart Robot)的新型机器人,这是一种弹性塑胶玩偶,其左侧可以看到一个红色的“心”,而它的心脏跳动频率可以变化,通过程式设计的方式,让机器人可对声音、碰触与附近的移动产生反应。

2、我国情感机器人的发展状况。

我国机器人的研究始于20世纪70年代后期,863计划就将机器人技术作为一个重要的发展主题,国家投入几个亿的资金开始了机器人研究。

目前,中科院沈阳自动化所、原机械部的北京自动化所、哈尔滨工业大学、北京航空航天大学、清华大学、中科院北京自动化所、北京科学大学等单位都做了非常重要的研究工作,代表性产品有工业机器人、水下机器人、空间机器人、核工业机器人。

我国对人工情感和认知的理论和技术的研究始于20世纪90年代,大部分研究工作是针对人工情感单元理论与技术的实现。

哈尔滨工业大学研究多功能感知机,主要包括表情识别、人脸识别、人脸检测与跟踪、手语识别、手语会成、表情合成、唇读等内容,并与海尔公司合作研究服务机器人。

清华大学进行了基于人工情感的机器人控制体系结构的研究。

北京交通大学进行多功能感知机和情感计算的融合研究。

中国科学院自动比研究所主要研究基于生物特征的身份验证。

中科院心理学所、生物所主要注重情绪心理学与生理学关系的研究。

中国科技大学开展了基于内容的交互式感性图像检索的研究。

中国科学院软件所主要研究智能用户界面。

浙江大学研究虚拟人物及情绪系统构造等。

我国国内开展的研究项目主要有:“脸部运动编码系统”可应用于人脸表情的自动识别与合成;“MPEG-4 V2视觉标准”可以组合多种表情以模拟混合表情;针对人的肢体运动而设计的“运动和身体信息捕获设备”;基于生物特征的“身份验证系统”;“语调表情构造系统”根据语音的时间、振幅、基频和共振峰等,寻找不同情感信号特征的构造特点和分布规律;“可穿戴式计算机”可用于增强和补偿人的感知功能。

3、情感机器人的学术动态
当前国际人工智能领域对人工情感和认知领域的研究日趋活跃。

美国人工智能协会(AAAI)在1998、1999和2004年连续组织召开专业的学术会议对人工情感和认知进行研讨,我国国内的研究者也开展了许多的研究工作和学术活动。

2003年12月在北京召开了第一届中国情感计算及智能交互学术大会。

2005年10月在北京召开的第一届情感计算和智能交互国际学术会议,集合了世界一流的情感计算、人工情绪和人工心理研究的著名专家学者。

这说明我国的人工情感和人工心理的研究在逐步展开并向国际水平看齐。

三、情感机器人的发展历程
机器人的发展可分为四个基本阶段。

第一代机器人:示教再现型机器人。

1947年,为了搬运和处理核燃料,美国橡树岭国家实验室研发了世界上第一台遥控的机器人。

1962年美国又研制成功PUMA通用示教再现型机器人,这种机器人通过一个计算机,来控制一个多自由度的一个机械,通过示教存储程序和信息,工作时把信息读取出来,然后发出指令,这样的话机器人可以重复的根据人当时示教的结果,再现出这种动作。

比方说汽车的点焊机器人,它只要把这个点焊的过程示教完以后,它总是重复这样一种工作。

第二代机器人:感觉型机器人。

示教再现型机器人对于外界的环境没有感知,这个操作力的大小,这个工件存在不存在,焊接的好与坏,它并不知道,因此,在20世纪70年代
后期,人们开始研究第二代机器人,叫感觉型机器人,这种机器人拥有类似人在某种功能的感觉,如力觉、触觉、滑觉、视觉、听觉等,它能够通过感觉来感受和识别工件的形状、大小、颜色。

第三代机器人:情感识别与表达型机器人。

20世纪90年代各国纷纷提出了“情感计算”、“感性工学”、“人工情感”与“人工心理”等理论,为情感识别与表达型机器人的产生奠定了理论基础。

主要的技术成果有:基于图像或视频的人脸表情识别技术,基于情景的情感手势、动作识别与理解技术,表情合成和情感表达方法和理论,情感手势、动作生成算法和模型,基于概率图模型的情感状态理解技术,情感测量和表示技术,情感交互设计和模型等。

这种机器人能够比较逼真地模拟人的许多种情感表达方式,能够较为准确地识别几种基本的情感模式。

但是,这种机器人没有内在的情感逻辑系统,不能真正地进行情感思维与情感计算。

第四代机器人:情感理解型机器人。

经过二十多年的潜心研究,仇德辉创立了“统一价值论”与“数理情感学”,为情感理解型机器人的产生奠定了理论基础。

“数理情感学”建立在“统一价值论”的基础之上,揭示了情感的哲学本质就是“人脑对于事物价值特性的主观反映”,情感的客观目的在于引导人如何正确地识别价值、消费价值、创造价值和表达价值;首次提出了情感可以采用数学矩阵的方式来进行描述,推导出情感强度三大定律,并采用数学的方式来定义和计算情感的八大动力特性;“数理情感学”详细阐述了情感与意志运行的内在逻辑程序以及情感内部逻辑系统的基本结构;等等,基本上解决了情感机器人的主要理论问题,从而揭开了情感机器人真正登上历史舞台的序幕。

总之,情感机器人的基本趋势是情感的内在化、情感的拟人化、情感的系统化。

四、情感机器人的理论思路
实践的重大突破往往取决于理论上的重大突破,实现情感理论的重大突破是实现人工情感的重大突破的必要前提。

情感的产生与运行是一个非常复杂的过程,情感机器人的研发必须建立在科学的情感理论的基础之上,才是现实的,没有一个全新的科学的情感理论作指导,要研发真正意义上的情感机器人是不可能的。

情感机器人的情感系统是以科学的情感理论(即“数理情感学”)为指导,而这种情感理论又是建立在一种全新的价值理论(即“统一价值论”)基础之上,其突出特点是:具有高度的情感连续性、逻辑一致性和内在性。

情感机器人的理论思路如下:
1、揭示认知、情感与意志的辩证关系。

人们认识世界与改造世界的主观意识过程,通常可以分为三个阶段:认知阶段、评价阶段与意志阶段。

其中,认知阶段的目的在于解决“是什么”或“什么事实”的问题,人只有首先了解事物的外在特性(或外部联系)和内在规律(或内在本质),才能对它进行深入的了解;评价阶段的目的在于解决“有何用”或“有什么价值”的问题,人只有在了解事物“有何用”之后,才能知道如何对它采取正确的态度;意志(或决策)阶段的目的在于解决“怎么办”或“实施什么行为”的问题,人只有在知道“怎么办”以后,才能采取正确的行动,创造更多的财富。

知(即认知)、情(即情感)、意(即意志)是人类心理活动的三种基本形式,也是人类一般意识的“三步曲”,分别用以完成人的认知阶段、评价阶段与意志阶段。

其中,认知的本质就是人对于事物的事实关系的主观反映,以解决事物“是什么”的问题;情感的本质是人对于事物的价值关系的主观反映,以解决事物“有何用”的问题;意志的本质是人对于自身的行为关系的主观反映,以解决“怎么办”的问题。

由于价值关系是一种特殊的事实关系,因此情感是一种特殊的认知;由于行为关系是一种特殊的价值关系,因此意志是一种特殊情感,也是一种特殊的认知。

2、建立认知的数学模型。

任何客观事物都具有若干个特性参数,这些特性参数(如形
状、尺寸、颜色、味道、运动方式等)通过一定形式的刺激信号(声音、图像、温度、文字等)表达出来,并为人的感觉系统所识别,只要大体确定了这些特性参数,就可以基本上识别出相应的客观事物。

根据所有事物及其相应的特性参数,可以组成一个认知数据库。

同一事物可以有若干个特性参数,不同事物可以具有完全相同的特性参数,同一事物可以通过图像、文字(名称)、象征符号、声音等特性表现出来,某一事物的变化往往会导致其它相关事物发生相应的变化,而且认知数据库还包括对于不同个人之特性参数的认知,还包括对于同一个人在不同生存条件下、不同表情状态的认知。

此外,客观事物与其它客观事物之间的相互关系(时间关系、空间关系、隶属关系、逻辑关系及价值关系)本身也是一种客观事物,也可以为人的感觉系统所识别,因此认知数据库包括对于不同事物之间相互关系的认知,还包括对于他人的价值关系的认知,还包括对于他人与他人之间的价值关系的认知,因此认知数据库是一个非常复杂的、动态的、多层次的、网状式的程序系统。

认知数据库可以分解为两个组成部分,形象思维数据库与抽象思维数据库。

其中,由第一信号系统(如声、光、电、味等)为特性参数所组成的数据库就是形象数据库,由第二信号系统(即语言、文字、符号等)为特性参数所组成的数据库就是抽象数据库。

形象数据库与抽象数据库之间存在着一定的联系,其中,形象数据库所描述的事物在抽象数据库的表现或映像就是概念。

形象思维数据库与抽象思维数据库有着密切的联系,一个概念往往对应着若干个形象,一个形象又可能对应着若干个概念。

对于各个形象之间的相互关系的认识称为形象思维,对于各种概念之间相互关系的认识称为抽象思维。

思维可以分为归纳思维与分析思维两种基本形式,其中,归纳思维就是将若干个简单概念(或简单形象)按照一定的逻辑顺序有机地组合成一个新的、更高层次的、复杂的概念(或形象),分析思维就是将一个复杂的概念分解为若干个新的、较低层次的、简单的概念(或形象)。

众多的概念可以组成一个较为完整的理论观点;众多的理论观点组成一个较为完整的思想体系。

3、建立价值观的数学模型。

人对于事物的价值率的认知构成了人的价值观。

价值观是一种特殊的观念,人类主体通过价值观来认识世界各种事物之间的价值联系与价值作用,并掌握各种事物价值特性的运动与变化的客观规律,客观目的在于指导人类主体的实践活动,使之按照自己的客观需要而对不同的事物采取不同的选择倾向、原则立场和行为取向,以达到最大的价值效应。

事物的价值特性包括多方面的内容,对于人类主体来说,“价值率”是所有事物最基本的、最重要的价值特性,它是指“人与事物发生价值作用时在单位时间内该事物价值增量(即投入的价值量与产出的价值量之差)与投入的价值量之比”。

事物的价值率作为一种重要的客观存在,必然会反映到人的头脑中,从而形成了“主观价值率”,即:事物的客观价值率P在人的头脑中的主观反映就是主观价值率,用ω来表示。

由于价值率是事物最基本、最重要的价值特性,那么,主观价值率必然是价值观中最基本、最重要的内容,决定和制约着价值观中的其它要素,它是价值观中的基本构成要素。

价值观矢量:主体对于所有事物价值率的主观反映值(即主观价值率)所组成的数学矢量,称为该主体的价值观矢量,用W来表示,即:W={ω1,ω2,…,ωn},人对于单一事物的主观价值率可以看作是由一个元素所组成的价值观矢量。

由于价值形式是多层次的,因此价值观念体系是一个多层次的、复杂的观念体系,可用“价值观矩阵”来描述。

价值观矢量或价值观矢量矩阵统称为价值观。

人对于所有客观事物的价值率的认识值(主观反映值)可以组成一个复杂的价值观数据库。

价值观数据库是在认知数据库的基础之上,增加一个特性参数(即事物对于主体的价值率),就组成了价值观数据库。

由于各种客观事物之间的联系是复杂多变的,而且事物的价值率也是不断变化的特性参数,某一事物的价值率变化往往会导致其它相关事物价值率的变化,而且价值观数据库还包括对于不同个人之价值率的认知,还包括对于同一个人
在不同生存条件下、不同表情状态下价值率的认知,还包括对于自己的价值率的认知,此外,事物与其它事物之间的相互关系(时间关系、空间关系、隶属关系、逻辑关系)本身也是一种事物,价值观数据库还包括对于不同事物之间相互关系的价值率的认知,因此价值观数据库是一个非常复杂的、动态的、多层次的、网状式的程序系统。

4、建立情感的数学模型。

价值观的客观目的在于识别事物的价值率,它是事物价值率的主观反映值。

人在价值观的引导下,可以对不同的事物产生不同的选择倾向。

然而,仅仅认识事物的价值率是不够的,人仍然无法真正确定对事物的价值资源的投入原则(投入方向和投入规模)。

事实上,当事物的价值率较小时,人不仅不会对它投入价值资源,而且还会不断把以前投入的价值资源抽调出来,只有当事物的价值率大于某个确定值时,人才会不断追加对它的价值资源的投入规模。

这个确定值就是主体的“中值价值率”,即根据主体所有行为活动的价值率的加权平均价值率,用P o来表示。

“中值价值率”是主体一个最重要的价值特性,它反映了主体的价值创造能力或本质力量的最重要方面——价值增长速度,主体的情感将会以它为参考系,确定对于所有事物的基本态度:凡是价值率大于其中值价值率的事物,主体将会对它产生正向的情感;凡是价值率小于其中值价值率的事物,主体将会对它产生负向的情感。

即情感的客观目的在于以主体的中值价值率为基准,识别事物的价值率相对于主体的中值价值率的差值,从而为主体的行为和思维活动提供精确、有序和恰当的驱动力。

可以看出,主体的中值价值率是主体对于不同事物确定不同的价值资源投入原则的分界点,主体只要识别出事物的价值率与自己的中值价值率的差值,就可以确定对于不同事物的价值资源投入方向,以实现价值资源的最佳配置。

为此做出如下定义:
价值率高差:事物的价值率P与主体的中值价值率P o之差值,称为该事物的价值率高差,用△P来表示,即△P = P—P o。

根据这个定义,“中值价值率分界定理”又可理解为:当某事物的价值率高差大于零时,主体就会扩大其作用规模或增加其价值资源投入量;相反,当某事物的价值率高差小于零时,主体就会缩小其作用规模或增加其价值资源投入量。

由此可见,事物的价值率高差是一个非常重要的价值特性参量,它从根本上决定着人对该事物基本的“立场、态度、原则和行为取向”,决定着人对该事物的价值投入方式和投入规模,因而必然会反映了人的头脑中来,形成一种特定的主观意识——情感。

为此,对情感做出如下精确定义:情感就是人对事物的价值率高差△P所产生的主观反映值,定义为人对该事物的情感,用μ来表示。

情感发生的作用过程:当事物的价值率高差大于零时,人通常会产生正向情感(如满意、愉快、信任等),价值率高差的绝对值越大,正向情感的强度就越大,从而诱导、调节和控制人的各种活动不断趋向于该事物,以不断扩大其作用规模,其结果是事物的价值率高差将会随着作用规模的增长而下降,正向情感的强度也随之下降;当事物的价值率高差小于零时,人通常会产生负向情感(如失望、痛苦、顾虑等),价值率高差的绝对值越大,负向情感的强度就越大,从而诱导、调节和控制人的各种活动背离该事物,以不断缩小其作用规模,其结果是事物的价值率高差将会随着作用规模的缩小而上升,负向情感的强度也随之下降;当事物的价值率高差等于零时,人通常不会产生情感,从而维持了事物原有的作用规模。

人的活动内容是丰富多彩的,所涉及的事物也是复杂多样的,人对于所有事物所产生的情感可以组成一个复杂的情感系统,并可采用一定的数学表达式进行描述。

情感矢量:人对于所有事物的情感所组成的数学矢量,称为情感矢量,用M来表示,即M={μ1,μ2,…,μn},其中,μi是指人对于第i个事物所产生的情感。

有些抽象事物本身是由多个具体事物所组成,则抽象事物的情感可用多个具体事物的情感所组成的情感矢量来描述。

如果多个具体事物又是由若干更具体的事物所组成,即它相对于更具体的事物来说属于抽象事物,则多个具体事物的情感可分别用若干更具体事物的情感。

相关文档
最新文档