人机对话测评-理论、方法及其问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人机对话测评:理论、方法及其问题
人机对话测评:理论、方法及其问题人机对话测评:理论、方法及其问题一、人机对话:人才测评领域中的新变革
信息化是一场革命。它带来人与人之间交往方式的改变和人类思维方式的转换。因为“社会(不管其形式如何)究竟是什么呢?是人们交往的产物。”信息社会、网络社会、虚拟空间的兴起,加强了人们之间多方面的交往,促进了人们丰富的社会关系的形成,对于人的发展有极大的影响:信息化创造的“虚拟实在”环境为人们的角色实践提供了绝好场所,人们可以在其中进行“角色换位”,把自己假定成不同的角色,体会不同角色的需求和情感并按自己理解的角色规范进行角色实践,并通过网络社会的信息反馈验证自己的角色行为,把握自己在现实生活中扮演各种角色的尺度。概言之,信息化带来交往方式、生存方式、教育方式等多方面的变革,为人格、能力的提升提供了进一步发展的可能性,也带来人才测评理论与方法范式的重大转换。
信息化表现在人力资源管理领域,就是HR流程的“e”化。各类人才测评软件的开发与运用,是其中的一道道风景线。这些建构在人工智能、信息技术、高级程序语言、多媒体技术等基础之上的测评工具,不仅将一般的测评手段“e”化,更使之得以建筑在强大的技术平台之上,大大提升了一般人才测评方法的应用范围。直截地说,
人机对话就是一般人才测评的理论与方法在计算机和网络中的实现,这一再现,具有重大的现实意义:当信息技术取代人的操作时,它使测评任务或流程自动化;当信息技术拓展人的工作时,它使测评任务或流程信息化;当利用信息技术进行重组时,它使测评任务或流程发生根本变化。
一般的人才测评,需要在一种真实、身临其境的刺激-反应条件下实现。然而,在实际的人才测评中,这往往是可望而不可即。因为现实中的许多情景可遇而不可求。比如地震、山洪暴发等突发事件对个人应急能力的考验,就具有不可预料性。有些情景即使能够刻意制造,也代价甚高且会对测试双方构成威胁,比如针对飞行员的培训和测试。这些局限性在其他领域中同样存在,并促使人们发展现实模拟情景的新途径。计算机技术的发展,使得这一历程能够在虚拟空间大行其道。人机对话测评,正是对信息化对测评传统理论与方法挑战的响应。它不仅能够使得受测对象获得自我认知,还可以使之在对话过程中获得学习经验;它不仅仅是一个测评的过程,还是一个学习的过程。由于人机对话具备众多其它测评方式所难以具备的优点,故而获得了各方面的普遍认同。这从网络测评的风行可以窥出,它折射了大众对人机对话测评的认同和参与。近年来,人才测评界推出了众多针对不同测评对象的测评软件。测评技术中的心理测验、专业笔试、系统仿真及人工智能专家系统等,都在人机对话中得到初步实现。所有这些,都昭示着人机对话在测评中运用的广泛前景。
二、人机对话:对一般人才测评方法的提升
一个常有的误解是:人机对话不过是把人才测评的方法搬到计算机上罢了,看起来似乎和一般人才测评方法的运用(以人与人之间的互动为基础)没有什么不同。的确,以往人才测评各方法的运用,多以人与人之间的直接互动为基础,即使是纸笔测评等貌似间接互动的测评,也不过是借助一种或几种中介物来进行“刺激-反应”式测评。这种测评的直接互动基础从哲学的角度——尤其是马克思关于人类社会发展的广义划分类型看,是有其局限性的。因为传统社会的根本特征是以人与人之间的依赖关系为基础,在这种社会,通过直接的人——人互动的镜子,确实能够较准确地反映“镜中之我”。但在信息化时代的市场经济条件下,社会的本质特征转化为以人对物的依赖为基础。在这种社会,人与人之间的关系在某种程度上以物——人——物的互动为基础。从表面看它反映的是物与物之间的关系,但其实更深刻地折射出人——人之间的社会关系。这是一个否定之否定。在信息社会,这面镜子就是“虚拟实在”(钱学森称之为一面“灵镜”)。表现在测评手段的变化上,就是以网络化、信息化为基础的人机对话测评方式的崛起。不过在人机对话的背后,人机关系的背后,依然是人与人之间的社会关系在作祟,只是这种社会关系通过虚拟空间表现出来而已。
无论是从设计过程、运作程序,数据的收集和处理、测评结果解释、解释的话语系统等外在方面进行比较,或是从测评的理论依据与技术基础审视,不难看出:相对于一般的人才测评方法,“人机对话”方法并不是一种特定的测评方法,而是诸多人才测评方法在计算机上
的再现。它能够实现对一般人才测评方法的综合,并为之提供更广阔的施展舞台。这种再现凭籍的并非纯粹的技术,而是出于对新的社会互动基础趋势的把握,出于对一般测评方法的优点和缺点在信息时代应有的改造。一般的测评方法如面试、公文处理等,固然各有相对的优势和适用的领域,但也有着共同的缺点,而人机对话,则正好能够从各个方面对之予以提升:
其一,经济上的制约。有些测评方法之所以被认为是适用于“高级人才”测评,不仅仅在于它是多么科学、典雅、可靠,而常常出于一个很现实的考虑:经济原因。例如,评价中心技术集无小组讨论、公文处理、结构化面试等测评方法于一体,整个实施过程要耗费很多人力、物力和时间,且对施测方的要求很高。简言之,经济因素决定了许多人才测评方法实施的难度,制约了其适用的范围。而人机对话则在某种程度上能够化解类似的窘况。人机对话测评系统由于具有强大的数据处理和情景模拟能力,能够模拟现实中的诸多测评方法,使测评能够随时随地大规模进行。规模效应首先带来的是测评经济成本的节约和机会成本的降低。
其二,人为因素的干扰。人才测评的客观性、科学性,从某种程度上取决于测评方法的适当选择及正确运用。不过,有些人为因素的干扰和方法本身无关,却只和方法所运作的技术平台相关联。譬如,人才测评追求信度、效度的努力一直都在进行。如何在测评中最大限度地做到价值中立、过程客观、程序公平,往往令人头疼。一个典型的例子是高考录取。其间的制度措施不可谓不多,但往往难尽人意。
自实行网络远程录取和网上录取公示制度后,那些曾经伤心的故事就很少发生了。人机对话对许多测评方法的境界提升,就表现在这里。它能够在事先充分考虑人为因素的干扰,采取技术手段予以屏蔽和排除,并“逼迫”整个测评的理念与制度发生变革;而另一个关键好处是:它即使不能够完全排除人为因素的干扰,至少也能够明确测评的信度与效度究竟如何,该怎样不断改进。一句话,在不可避免的谬误面前,人机对话能够使我们比较容易地明白:错误的幅度有多大,犯错误的概率有多大,规避的关键措施在那里。而这些,都曾不同程度地困扰着一般人才测评方法。
其三,作坊式运作的尴尬。一般的人才测评,即使是对众多测评方法的组合运用,往往摆脱不了作坊气息。这是因为:从根本上说一般的人才测评方法无法不建立在经验、直觉的判断基础之上。经验和直觉是很重要的,但又是远远不够的。譬如,一个老农民通过嘴巴品尝出哪种玉米是土玉米哪种玉米是杂交玉米,和一个研究者通过基因测试对这两种玉米品种的鉴别,结果似乎是差不多,他们都鉴别出了玉米的品种,前者的过程或许还更快更直接。但其中科技含量是不一样的。因为这些测评基本上不能够获得准确而详尽的数据,更不用说建立测评研究的数据库了。这就决定了传统测评的实施不能够循序渐进,测评各方法之间的组合常常貌合神离,难以获得整体合力。表现在测评领域,就是测评各行业间各自为政,老死不相往来;各类人才测评的常模难以建立;种种测评获得的宝贵数据闲置而不能够共享;人才测评在各性别、各年龄、各地区、各行业之间缺乏定量比较……。