言语知觉的认知理论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
言语知觉的认知理论
80年代以来,随着人工智能学、心理语言学和认知心理学为3大支柱的认知科学,以及语言声学技术的迅速发展,不仅在理论上开阔了言语思维研究的视野,也为言语思维机制的神经科学研究提供了实验分析的新手段。从语言知觉的认知理论研究方法和理论形成中,可以看到言语思维问题的跨学科研究,对言语思维机制的认识给出一种新的启示。
人类言语与其他声学信号相比有许多特点。首先是任何一段口头语言中,都包含许多分离的音紊,每个词都是由音亲连续起来所构成的。所以,每个音素和词都对应一类声能的模式。这种声能模式具有双重性,即节段性和恒常性。节段性表现为在音素之间有一段段的分离,这种分离在言语声频谱图上可以直观地看到。恒常性表现为不依说话人不同而异,同一词不论什么人发音,频谱特征都大体相似。当然,发音人不同频谱可能相差较大,但对同一词发音,其频谱模式是相似的。这是由于同一音素是由相似发音器官的空间状态所制约的。这样在言语知觉形成中,不但靠听觉分辨音素和词的声学特征,还由视觉对讲话人发音器官的空间状态进行图像分析。因此,人类言语知觉实际是听觉和视觉协同工作的结果。不仅聋哑人的言语知觉是靠视觉分析完成的,对正常人的实验研究也发现了相似的规律。马萨诺(D.W.Massarno)和寇恩(M.M.Cohen,1983)以唇辅音“b”和齿龈辅音“d”为实验材料,由计算机合成音节“a”和“da”以及"ba”变为“da”的7个中间音节,让正常被试倾听等概率呈现的9个音,并判断呈现“ba”和“da”的次数。在3种条件下重复同样的音节识别测验。一种条件是只靠听觉判断,另两种条件是呈现音节时,总伴有发出“ba”音节或“da”音节的口唇运动的闭路电视,结果发现,从录像中得到的视觉信息显著提高了“ba”和“da”音节的正确判断率。这个实验有力地证明了言语知觉是视觉和听觉信息并行处理的结果。米勒(J.L.Miller 1990)总结出关于人类言语知觉机制的两种认知理论:运动理论和听觉理论。
运动理论(Motor theory of speech perception)是李波曼(A.M.Liberman)和马特因利(J. G. Mattingly,1985)提出的,基本理论观点可以归纳为以下3方面;(1)他们认为言语知觉系统和发音的言语运动系统之间是密切联结在一起的。因此,人在听音紊和词(元音和辅音音节)时,本身的发音运动系统也在不自觉地、默默地进行发音运动;(2)言语知觉是人类特有的,因为只有人类才具有出生以来经过长期学习所积累的语言知识;(3)言语知觉能力是人类先天所具备的,因为人类生来就具备言语发生和言语知觉相互联结在一起的机能系统。视觉信
息参与言语知觉的实验事实,对言语知觉运动理论提供了有力的支持,因为视觉信息可以帮助人们掌握发音时的口、唇、舌等运动状态,便于人们默默地重复这些发音动作,提高言语知觉的正确率。
言语知觉的听觉理论(The auditory theory of speech percep-tion)在上述3个方面与运动理论完全不同。首先,这种理论认为知觉并不是言语运动的产物,而是听觉系统对各种声音信号进行自动解码,对说话人有意发出音素的规则序列发生知觉的过程;其次,言语知觉并不是人类特有的现象,许多动物的听觉系统与人类听觉系统十分相似,动物也可能具有相似的言语听觉机制;最后,言语知觉不是先天的,虽然婴儿听觉系统就已经十分发达,但婴儿早期必须经过学习和作业之后,才获得言语知觉能力。
在b,p等辅音音紊研究中,将从辅音释放到声道出现振动之间的时差,称为噪声发声时(VOT),对于区别有声辅音与无声辅音具有重要价值。“ba”音的VOT为25毫秒以下,表明b是有声辅音,“pa”音的VOT为80毫秒,表明p是无声辅音。VOT为25毫秒以下时,知觉为有声辅音,VOT大于25毫秒时,知觉为无声辅音。所以,VOT25毫秒为两类辅音的分类边界。在“ba”和“pa”两音素VOT研究中发现许多事实,对两种言语知觉理论从不同方面提供了不同的支持。首先,关于言语知觉是否是人类特有的问题,VOT研究对言语知觉的听觉理论提供了有力的支持,而不利于运动理论。灰鼠(Chinchillas)的听觉系统的生理解剖特点与人类十分相似。库尔(P. K. Kurl)和米勒(J. D. Miller,1978)对灰鼠进行躲避电击的学习行为训练,信号分别是VOT为0的"ba”和VOT为80毫秒的“pa”音。不给灰鼠饮水,使其产生口渴感,然后放入实验笼内,笼一端有水管可以饮水。在饮水过程中,每隔lO-15秒随机发出一个音节"ba”或“pa”。对一部分鼠出现"ba”时必须停止饮水,跑向笼的另一端,否则遭到足底电击,出现“pa”时则可继续饮水,对另一部分鼠,“ba”和“pa”的意义相反。两群灰鼠分别对“ba”或“p8”建立了躲避学习行为模式。然后分别用VOT 从0-80毫秒之间的不同音素,观察两组灰鼠的鉴别反应与VOT的关系。
结果发现,对“ba”建立躲避反应鼠,肘VOT为30毫秒以下的几个音素给出同样的躲避反应,对VOT为40毫秒以上的音素给出与“pa”一样继续饮水的反应;另一组则出现相反的反应。这说明,灰鼠对"ba”和“pa”的鉴别反应与VOT的边界效应和人类完全一致。从而证明,音紊鉴别的言语知觉并不是人类所特有的。在新生婴儿的研究中,利用异常声音引起婴儿吸吮奶嘴的动作增强的现象,对比了VOT为-20毫秒和0毫秒的两个音索、VOT 为60毫秒和80毫秒的两个音素,以及VOT为20毫秒和40毫秒的两个音素对婴儿吸吮动
作的影响。结果表明,仅VOT为20毫秒和40毫秒的两个音索出现时吸吮反应增强。这说明新生儿与成年人一样对音索鉴别的VOT边界效应发生在20毫秒和40毫秒,言语知觉能力是生来就有的。这又有利于言语知觉的运动理论。由此可见,VOT的研究既有利于听觉
理论,又有利于运动理论。