基于信息技术的布依语泰国语应用对比研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于信息技术的布依语泰国语应用对比研究
本文综述分析了应用对比语言学的研究成果,探索了基于信息技术的布依语泰国语应用对比研究途径:平行语料库建设,在线双语词典的编纂及双语机器翻译系统的开发。
标签:布依语泰国语对比;平行语料库;在线双语词典;机器翻译
一、应用对比语言学相关理论及发展
对比语言学是对两种或多种语言进行系统比较的学科,旨在描述语言之间的近似与差异。对具体语言和语言结构的对比描写有助于更深刻地理解具体语言及其结构特性。应用对比语言学属于对比语言学的一个分支。应用对比语言学的目的是将理论对比语言学的研究成果应用到外语教学、翻译、词典编纂等相关活动中去,为应用服务,并探讨应用中的一些理论和方法。
语言对比研究最早可以追溯到十九世纪末,至今也有近百年的历史了,但这个领域是在近几十年内才真正受到重视,产出大量有益的研究成果。四十年代前受到业内肯定的成果有1892年罗曼语文学家格兰德琴特(CharlesH.Grandgent)出版的《德语和英语的语言》;还有1906年法国语音学家帕西(PaulPassy)的《简论欧洲主要语言的比较语音学》;以及1933年著名语言学家赵元任出版的《英语语调与汉语语调初探》。这个时期的对比研究领域主要集中在语音对比研究方面,而其他领域鲜有涉足。
我国的对比研究起步与发展有三个阶段。首先的起步阶段是以马建忠的《马氏文通》和严复的《英文汉诂》算起,到四十年代末。在这段时间内,不少研究人员都开展了非常有价值的汉外对比研究,主要集中在英汉对比研究领域。第二个阶段集中在1949-1976年这个时期,在这段时间内,中国的对比语言学相关研究走向沉寂,少有成果。第三个阶段是从1977年5月吕叔湘先生发表《通过对比研究语法》开始的。对比语言学开始受到关注和重视,大量有价值的研究成果不断涌现。如王克菲大型英汉双语平行语料库的建立。潘文国对比语言学的目标,研究范围和新发展进行的探索和研究。二语习得和翻译研究与教学得到长足发展,跨文化交际也有了飞跃式的进步。机器翻译和在线词典的出现使得不同文化之间的合作与交流日益频繁,为社会带来了巨大的变革和发展。
由此可见,应用对比语言学的研究已经成为语言学研究的重要领域和研究热点,如何开展有意义的应用对比语言学研究,是摆在相关研究人员面前的重要课题之一。
二、基于信息技术的布依语泰国语应用对比研究的重要性
以计算机多媒体和网络通信为基础的信息技术,已经深入到我们生活、教育、医疗和服务等各个领域,应用对比语言研究也同样面临着巨大的机遇和挑战,基
于信息技术的应用对比语言研究不仅是应用对比语言学的新发展,同样也为语言的研究、翻译和教学拓宽了新的研究领域,并产出了大量有价值的成果。这充分说明,基于信息技术的应用对比语言研究是值得深入探索的领域,它必将为应用对比语言研究的发展带来更多的有益的成果,并促进社会和时代的发展与变革。
泰语与中国布依语都同属于汉藏语系侗台语族的台语支,泰国人和布依族他们来源于古越人,虽然双方距离遥远,但在经济文化上至今仍有许多相同或相似之处。而中国布依语现在面临着城镇化和汉语及主流文化的冲击和影响,其生存和发展都遭受到了前所未有的危机和挑战。如何保护和传承布依语及其文化已经成为相关研究人员亟待解决的问题之一。结合信息技术对布依语和泰语进行应用对比研究,不仅会保护布依语及其文化,而且于对比语言学的发展、双语教学以及翻译研究与实践也都有着重大应用价值。
三、基于信息技术的布依语泰国语应用对比研究形式思考
笔者在CNKI上搜索了相关论文,进行整理分析后,总结了以下三种可行的也比较有价值的基于信息技术的布依语泰国语应用对比研究形式。
1、平行语料库建设
在非计算机状态下,语言数据,不仅数据资源少,而且还分散在各种印刷媒体上和非专业化的录像和电影中,这样的数据源对于相关数据需求者来说,使用很不方便,查找,摘抄一个信息往往要花费很长的时间,也不容易保管。而有了信息技術的支持,网络上搜寻相关数据,已经是非常方便快捷,也易于储存。但仍然存在一个问题,就是没有进行系统的管理,对于数据的初步整理分类都成为了相关数据需求者的难题。而语料库,即经科学取样和加工的大规模电子文本库,就恰恰解决了这个问题,因为语料库可以借助计算机分析软件,对语料库中的海量数据进行提取分析。
而双语平行语料库更是语料库突破性的发展,它是一种重要的语言资源,统计机器翻译系统可以借此研制翻译统计模型,基于实例的机器翻译系统和各类计算机辅助翻译系统能够以此作为翻译记忆库,翻译人员也能从中观察和选取鲜活的语言与翻译实例,与当前单语语料库的建造动辄上亿词的庞大库容相比,这类资源研制的数量要少得多。
平行语料库的研制历史并不长,从世界上第一个初步的平行语料库加拿大议会会议录英法平行语料库(TheCanadianHansardCorpus)建成到目前也只有20年左右。但是因为平行语料库在语言对比研究,翻译研究,翻译教学,双语词典编纂等领域都具有巨大的潜在应用价值,因而在世界范围内得到了迅速发展。克姆尼茨英-德翻译语料库(ChemnitzE-GTranslationCorpus)、德-英文学文本平行语料库(GEPCOLT)、英语-挪威语平行语料库(ENPC)、英语-意大利语双向平行语料库(CEXI)、葡-英双向平行语料库(Compara)相继建成。国内平行语料库的研究起步较晚,但也取得了一定的发展。北京外国语大学中国外语研究中心王克非主持和研制的北外“通用汉英对应语料库”是目前世界上最大的双语平行
语料库,目前容量为3000万字词,并在进一步建设中。
布依语泰国语平行语料库的建设,是布依语泰国语应用对比研究最有价值的呈现形式:第一,促进对比语言学的发展。建立一个双语平行语料库,不仅能为后续的语言对比研究提供最可靠的数据源,而且其还是应用对比研究最有价值和开发潜力的实践成果之一。第二,布依语及其文化的最原生态的记录。第三,为双语词典编纂和机器翻译提供可靠数据源。2、在线双语词典的编纂
双语词典使用领域非常广泛,例如机器翻译、交叉语言信息提取等,对语言的学习和教学也有着不可替代的重要作用。双语词典既能够进行语言翻译,还可以帮助使用者进行文化交流。传统双语词典编纂都是通过人工完成的。这种词典是在经济全球化的时代下应运而生的,能够满足当时的社会发展需要。但是自从第一台计算机问世至今,计算机科学与通信技术日新月异,更新速度快,数据信息存储大的在线,查询便捷,成本低的在线词典已经成为了新时代的宠儿。
建立布依语泰国语在线双语词典主要的问题在于,网络上布依语的语料数据量和泰国语的语料数据量肯定是不能匹配的,布依语作为一种地区性的民族语言,在汉语及其文化的影响下,以及城镇化的发展破坏了原来布依语使用的原生态母语环境,使得布依语的使用人群开始出现了严重的老龄化倾向,年轻人在生活中主要使用汉语作为日常生活中的社会交际语言。因而在网络上布依语的语料会相对泰国语的语料来说会少很多。所以,研制布依语泰国语在线双语词典可以有两个解决途径。第一,加大网络布依语料的上传。这个可以通过政府相关政策支持,建立一些布依语汉语双语网页,或者布依语英语双语网页,对布依族的生活文化教育风俗等方面进行文章的撰写和配图、配音,相关视频制作等。然后建立一个基于网络语料库的布依语泰国语在线双语词典。第二,可以先建立起布依语泰语双语平行语料库,然后研制一个基于这个平行语料库的布依语泰语在线双语词典,这种在线双语词典会促进布依语网络上语料的增加,当网络中的布依语语料自然累积到足够数量时再建一个基于网络语料库的在线双语词典。
辞书是一个国家、一个民族文化的集中体现。双语词典是辞书的重要组成部分。在线双语词典的出版有助于推广民族语言和文化,增强国家文化软实力,对我国的经济建设、科技发展、文化繁荣等都具有很强的实用价值。
3、双语机器翻译系统的开发
自然语言理解,是研究如何利用计算机来理解和生成自然语言的理论和方法。用以完成这一过程的软件叫做机器翻译系统。而不同语言之间的翻译成为文化交流过程中的关键所在。面对海量的语言信息,人工翻译已经远远无法满足需要,因此能够实现自动化的自然语言翻译的机器翻译技术在过去十几年中一直是人工智能研究领域的热点。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。
机器翻译的研究起源于20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼开始了用机器来进行翻译的理论探索。随后不久,信息论的先驱、