桂诗春等-2010-语料库语言学与中国外语教学
语料库相关源
语料库相关资源David Lee语料库研究书签Bookmarks for Corpus-based Linguists (David Lee).au/~dlee/CBLLinks.htm (/corpora)常用语料库资源链接汇集(语料天涯)/corpus/互动平台/forum/入门读物专著梁茂成、李文中、许家金,2010,《语料库应用教程》。
北京:外语教学与研究出版社。
Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)期刊论文中国期刊网EBSCO英文期刊数据库书店可以买到的语料库相关书籍Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进)Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St.Jerome Publishing. (外研社引进)Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999.Longman Grammar of Spoken and Written English. Longman Publications Group.(外研社引进)Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进)Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. & S. Petch-Tyson (Eds.). 2003. Extending the Scope of Corpus-based Research: New Applications, New Challenges. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. et al. (Eds.). 2003. Corpus-based Approaches to Contrastive Linguistics and Translation Studies《基于语料库的语言对比和翻译研究》. Amsterdam: Rodopi. (外研社引进)Gries, Stefan Thomas. 2004. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. Beijing: Peking University Press. (北大出版社引进)Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)Kettemann, B. & G. Marko. 2002. Teaching and Learning by Doing Corpus Analysis.Amsterdam: Rodopi. (世界图书出版社引进)Meyer, Charles. 2002. English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press. (外教社引进)Mukherjee, J. 2001. Form and Function of Parasyntactic Presentation Structures. A Corpus-based Study of Talk Units in Spoken English. Amsterdam: Rodopi. (世界图书出版社引进)Nattinger, James R. & Jeanette S. DeCarrico. 1992. Lexical Phrases and Language Teaching. Oxford: Oxford University Press. (外教社引进)Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.(外教社引进)Thomas, Jenny & Mick Short. 1996. Using Corpora for Language Education. London: Pearson Education. (外研社引进)Zanettin, F., et al. (eds.). 2003. Corpora in Translator Education《语料库与译者培养》.Manchester: St. Jerome Publishing. (外研社引进)蔡金亭,2003,《语言因素对英语过渡中使用——一般过去时的影响》。
36134402
第30卷 第5期 广东海洋大学学报V ol.30 No.52010年10月 Journal of Guangdong Ocean University Oct. 2010收稿日期:2010-05-12基金项目:广东海洋大学人文社会科学研究资助项目第一作者:庄 萍,女,1965年生,本科,硕士,高级讲师,研究方向:英语语言文学与应用语言学。
基于语料库的名词单复数失误研究庄 萍(广东海洋大学 外国语学院,外国语言与教学研究所,广东 湛江 524088)摘 要:利用中国学习者英语语料库,结合定量和定性研究方法,对中国英语学习者作文里英语名词单复数失误的现象进行了研究,发现:1)学习者的母语干扰是造成名词单复数失误的主要原因;2)中国学习者名词单复数失误最多的是名词复数形式使用不足;3)名词单复数失误与学习者英语水平相关主要表现在:低水平学习者使用失误的名词多数为常用的简单的名词,水平较高的学习者使用失误的名词多数是较复杂的抽象或物质名词。
并探讨了基于语料库的研究对英语教学所带来的启示。
关键词:语料库;名词的数;错误分析;语言迁移中图分类号:H319 文献标志码:A 文章编号:1673-9159(2010)05-0076-07A Corpus-based Study on the Errors of Number of English NounsZHUANG Ping(Faculty of Foreign Languages ,Foreign Language and Teaching Research Institute ,Guangdong Ocean University, Zhanjiang 524025,China )Abstract: This paper is a corpus-based study on the errors of number of English nouns committed by Chinese English learners in writing. It makes use of the Chinese Learner English Corpus (CLEC) and adopts both the qualitative and quantitative methods.Based on the results of the error analysis ,this study mainly finds out: 1) most errors of number of English nouns committed by Chinese learners are attributable to mother tongue interference; 2) most errors of noun number committed by Chinese learners are the errors of underuse of the plural markers due to L1 transfer; 3) the errors do have something to do with the English proficiency of the Chinese learners: the nouns with number errors used by ST2 and ST4 students are mostly simple nouns ; while the nouns with number errors used by ST6 students are difficult abstract or material nouns. In conclusion, some suggestions concerning the pedagogical implications of corpus-based study to English teaching in China are made. Key words : corpus; number of nouns; error analysis; language transfer很多研究者利用语料库对学习者的错误进行分析研究。
桂诗春,杨惠中-语料库
国家哲学社会科学“九五”规划项目中国学习者英语语料库桂诗春杨惠中广东外语外贸大学上海交通大学国外语言学及应用语言文字工程研究所语言学研究中心上海外语教育出版社目录前言I.中国学习者英语语料库一导言二CLEC的建立三CLEC的统计分析四中国学习者言语失误统计分析II.词频排列(按频数)表III.拼写失误表IV.词目表V.词频分布表VI.语法标注频数表(附Lob134个语法标注的说明与例子)VII.言语失误表I.中国学习者英语语料库一.导言中国学习者英语库(Chinese Learner English Corpus,CLEC)是国家社科基金95规划项目“基于语料库的中国学习者英语错误分析”(Corpus-based Analysis of Chinese Learner English,CBACLE)的一个重要组成部分。
本书所载的是CLEC的各种统计资料和列表;对中国学习者英语错误的各种分析另收集在《中国学习者英语错误分析》一书里。
两书为姐妹篇,供读者互相引证。
在某种意义上说,语料库语言学是一种研究方法; 而这种研究方法是借助计算机来实现的,故Leech(1998a)主张把语料库语言学(corpus Array linguistics)说成是计算机语料库语言学(computer corpuslinguistics)。
随着计算机的普及和现代技术(高速的中央处理器、精密的扫描仪和字母识别程序、大容量硬盘等等)的发展,这种研究方法在最近20~30年有了很大的发展。
McEnery & Wilson(1996)对使用语料库方法来进行语言学研究的发展归纳如表1.1。
根据英国Lancaster大学Taylor,Leech & Fligelstone等人在1989年的统计,英语的机读语料库当时已有36种,非英语的有18种。
Hofland等人(1999)更把18个大型的英语语料库制成ICAME (International Computer Archive of Modern English)英语语料库光盘(第二版),公诸于世。
中国英语学习者语料库CLEC(桂诗春杨惠中)
中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。
其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。
表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计1070602言语失误标注原则1.简单合理,易于系统操作。
参与标注的人比较多,分类表过于繁复,就难于掌握。
我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。
每一类里再用数目字细分。
如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。
2.分类表的类别要适中。
过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。
目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。
现在的分类表有61个失误码,是属于中等规模的分类表。
提供足够的失误信息(失误本身、失误类型和失误发生范围)。
例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示,放在失误之后。
[vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。
要联系这4个词,才能判断are这个词用错了。
开放性。
容许研究者根据需要对失误类型进行补充或进一步再分出细类。
例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。
英语教学中的错误分析
英语教学中的错误分析作者:王粉梅来源:《教育界·下旬》2013年第07期【摘要】错误分析理论以语言学习者为研究对象,通过分析他们的语言错误来揭示学习过程中的一些规律性。
教师应当客观认识学生所犯错误,并进行理性分析。
在纠正学生错误时更应该采取灵活有效的方法,既帮助学生改正错误,又培养学生发现错误,改正错误的学习能力。
【关键词】英语教学错误错误的分类错误分析英语学习在我国的普遍性和重要性有目共睹,从幼儿园到大学我国拥有众多的英语学习者,他们在学习过程中难免犯错。
可以说学习者是在不断改正错误的过程中逐步提高自己的英语水平;教师是在不断指出并纠正学生的错误过程中改进和促进英语教学。
错误分析理论为从事语言教学的教师提了崭新的视角。
它以语言学习者为研究对象,通过分析他们的语言错误来揭示学习过程中的一些规律性。
桂诗春教授在《心理语言学》指出:通过对学习者错误分析能使教师发现学习者语言错误的个性和共性。
王初明教授在他的《应用心理语言学》中也提到学习者的语言错误是“一扇心灵的窗户,透过它我们可以窥视学习心理过程的奥秘,了解学习者的学习策略,探索中介语的发展过程和规律”。
可见错误不仅需要发现和单纯的指出,教师更要合理分析错误的性质、原因和错误类型,提供有效的纠错策略,真正把错误分析引入英语教学,才能收到实效。
一、什么是错误分析理论及错误的分类1967 年英国语言学家Corder发表论文 The Significance of Learner's Errors 标志着错误分析理论的诞生。
Corder认为学习者的语言错误反映了学习者当前所掌握的语言体系,对我们了解学习者的语言学习具有积极意义。
有了错误分析法,教师对学生所犯的语言错误不再停留在排斥、抵制和彻底清除的层面上,而是要对学生的语言错误进行科学分析,以求掌握学习者已经学习到什么程度、学习者如学习语言和学习者为什么犯错误等信息。
语言学家们依据不同的标准把外语学习者在语言学习过程中出现的错误做了不同的分类。
国内语料库语言学研究述评
种新 的研 究方法 , 也代表着新 的思维方法 、 一种全新 的事
国 内语 料 库 语 言 学 的 建 设 与 发 展 在我 国, 2 纪2 代开始 , 从 O世 O年 有学 者 为 制 定 基 础 汉 字
次 。 1 9 广 州外 国 语 学 院 开 始 建 立 中 国学 生 交 际英 语 语 9 6年 料 库 。 外 由 广 东 外语 外 贸 大 学 桂诗 春教 授和 上海 交 通 大 学 此 杨 惠 中 教 授 牵 头 开 发 的 “ 国 学 习 者 语 料 库 ” C E 于 中 ( L C) 1 9 建 成 , 语 料 库 广 泛 收 集 了 包 括 我 国 中学 生 、 学 生 9 9年 该 大 在 内 的一 百 多 万词 的各 种 书 面语 资料 , 对 所 有 的 语料 进行 并 语 法 标 注 和 言 语 失 误 标 注 , 研 究 中 国学 习 者 的 英 语 特 点 具 对 有开创性意 义。 语 料 库 语 言 学 的研 究领 域 结 合 国 内研 究 实际 , 面 就 语 料 库 在 词 汇 、 义 韵 、 误 下 语 错
关键词 : 语料库 ; 语料 库语 言学; 究领域 研 中图分 类号 : H0 文献标识码 : A 文章编号 :O 4 3O 2 O ) 5 O 5 2 1O —4 1 (O 6O 一O 6 一O
词 典 是 使 用 中 的 语 言 的 纪 录 , 语 料 库 语 言 学 问 世 以 在
维普资讯
2 0 年 第 5期 06
N O. 2 6 5, 00
阜 阳师范 学院学 报 ( 会科 学版 ) 社
J u n l fFu a g Te c e sCo lg ( o il ce c ) o r a y n a h r l e S ca in e o e S
语料库在大学英语教育中的作用——以新升本科院校为例
语料库在大 学英语教育 中的作用
— —
以新升本科院校为例
陆 兮 婷
吴 立 溪
410) 121
( . 南第一师范学院 ,湖 南长 沙 4 0;2湖 南科技大学 ,湖南湘潭 1湖 125 . 0
摘
要 :文章针对 中国近年来新升本科院校英语教育的现实情况,探 索 了语 料库在 大学英语
教学 中的应用价值,多角度地研 究 了语料库在大学英语词汇、写作教学等方面的作用 。通过语料 库应用研 究来促进教学方 式多元化 ,进 一步推动英语教学的发展。 关键词:语料库;新升本科 院校;大学英语教 育
C— x) Ot t e 、语法、搭配和词语的不同用法( l ct nad hae l y 以及语用学等方面研 究了语料库 数据在 c l a o rso g ) oo i n p o 课堂 中的使用可行性 。【 l
我国的学习者语料库建设与研究始于 2 O世纪 8 0年代 中期 ,近三十年来发展迅速 ,一些研 究成果 已达
中出现 的错误进 行了深入分析 。 J 文秋芳教授主持建立 的中国学生英语 口笔语语料库可 以供英语教学研究 和学 习使用 ,也可作为教材编写 、教学测试 、网络课 程建设等 的重要参考依据 。 j 安平教授介绍和探讨 f 可 了语料库语言学应用于外语教育教学 的理论 与实践 ,并通 过解剖 大批研 究实例展示 了语料库研究 的方法和
中图分类号 :G 4 6 文献标识码:A 文章编号:1 0 - 1 5( 0 1 5 0 5— 3 0 9 8 2 1 )0— 研究
随着计算机科学的普及 ,语料库在语言教学中的应用发展得非常迅速。语料库指 的是 “ 大量文本材料
在计算机 中的输入的集合 ” 】 。【与计算机 融合的语料库 以容 量大 ,资料真 实,信 息提取快捷准确等独特优势 】 在现代语言教育 中发挥着越来越重要 的作用 。 些西方的语言学家们一直致力于语料库对语言教学的应用研究。 o rd认为语料语言 学的研究可 以 C na
语言学必读书目
语言学必读书目语言学必读书目有哪些呢?下面是店铺精心为您整理的语言学必读书目,希望您喜欢!语言学专业阅读书目1. 陈保亚《20世纪中国语言学方法论》,山东教育出版社,19992. 范晓《三个平面的语法观》,北京语言学院出版社,19963. 陆俭明《现代汉语语法研究教程》,北京大学出版社,20034. 陆俭明、马真《现代汉语虚词散论》,北京大学出版社,19855. 吕叔湘(1942)《中国文法要略》,商务印书馆,19826. 吕叔湘《汉语语法分析问题》,商务印书馆,19797. 吕叔湘《汉语语法论文集》(增订本),商务印书馆,19848. 马庆株《汉语动词和动词性结构》,北京语言学院出版社,19929. 马庆株《汉语语义语法范畴问题》,北京语言文化大学出版社,199810. 马庆株编《语法研究入门》,商务印书馆,199911. 沈家煊《不对称和标记论》,江西教育出版社,199912. 石毓智《语法的认知语义基础》,江西教育出版社,200013. 宋国明《句法理论概要》,中国社会科学出版社,199814. 游汝杰《汉语方言学导论》,上海教育出版社,199215. 袁家骅《汉语方言概要》(第二版),语文出版社,198316. 詹伯慧主编《汉语方言及方言调查》,湖北教育出版社,199117. 张伯江、方梅《汉语功能语法研究》,江西教育出版社,199618. 张敏《认知语言学与汉语的名词短语》,中国社会科学出版社,199819. 赵艳芳《认知语言学概论》,上海教育出版社,200120. 朱德熙《语法讲义》,商务印书馆,198221. 朱德熙《语法答问》,商务印书馆,198522. 赵金铭主编,对外汉语教学概论,商务印书馆,200423. 徐子亮、吴仁甫,实用对外汉语教学法,北京大学出版社,200624. 李泉主编,对外汉语教学理论研究,商务印书馆,200625. 王建勤主编,汉语作为第二语言的学习者语言系统研究,商务印书馆,200626. 王建勤主编,汉语作为第二语言的学习者习得过程研究,商务印书馆,200627. 孙德金主编,对外汉语词汇及词汇教学研究,商务印书馆,200628. 孙德金主编,对外汉语语法及语法教学研究,商务印书馆,200629. 李晓琪主编,对外汉语文化教学研究,商务印书馆,200630.陈昌来编,《应用语言学导论》,商务印书馆,200731.何自然,冉永平编著,《新编语用学概论》,北京大学出版社,200932.吴为善,《认知语言学与汉语研究》,复旦大学出版社,201133. Lappin, S. ed., 1998. The Handbook of Contemporary Semantic Theory(当代语义理论指南),487-507页,外语教学与研究出版社,布莱克韦尔出版社,200134. Levinson, S. 1983. Pragmatics(语用学),外语教学与研究出版社,剑桥大学出版社,200135. Saeed, John I. 1997. Semantics(语义学),外语教学与研究出版社,布莱克韦尔出版社,2000语言学必读书目《普通语言学教程》,索绪尔著,商务印书馆,1980《语言论》,布龙菲尔德著,商务印书馆,1990《现代语言学教程》,(上下)霍凯特著,北京大学出版社,1986、1987《句法结构》,乔姆斯基著,中国社会科学出版社,1979《句法理论的若干问题》,乔姆斯基著,中国社会科学出版社,1986《语言学说史》,康德拉绍夫著,武汉大学出版社,1985《现代语言学流派》,冯志伟编著,陕西人民出版社,1999《普通语音学纲要》,罗常培、王均编著,商务印书馆,1981《西方现代语言哲学》,周忠昌著,上海人民出版社1992《语义学》,利奇著,上海外语教育出版社,1987《语义学》,徐烈炯著,语文出版社,1995《生成语法理论》,徐烈炯著,上海外语教育出版社,1988《心理语言学》,桂诗春编著,上海外语教育出版社,1985《当代社会语言学》,徐大明等,中国社会科学出版社,1985《文化语言学》,(增订本)邢福义主编,湖北教育出版社,2000 《应用语言学》,刘涌泉、乔毅编著,上海外语教育出版社,1991《计算语言学概论》,俞士汶主编,商务印书馆,2003《语料库语言学》,黄昌宁、李涓子编著,商务印书馆,2002《对外汉语教学概论》,赵金铭主编,商务印书馆,2005《语言教学分析》,麦基著,北京语言学院出版社1991《语言学中的逻辑》,奥尔伍德等著,河北人民出版社,1984《语言逻辑分析(语言学家关注的一切逻辑问题)》,麦考莱著,杭州大学出版社1989 《20世纪中国语言学方法论》,陈保亚著,山东教育出版社,1999《语言学方法论》,桂诗春等著,外语教学与研究出版社,1997 《二十世纪的中国语言学》,刘坚主编,北京大学出版社,1998 《中国语法学史稿》,龚千炎著,语文出版社,1987《汉语和汉语研究十五讲》,陆俭明、沈阳,北京大学出版社,2003《语言学前沿与汉语研究》,刘丹青主编,上海教育出版社,2005《汉语语法学》,邢福义著,东北师范大学出版社1997《语法讲义》,朱德熙著,商务印书馆1982北大语言学及应用语言学专业研究生必读书目朱德熙(1982)《语法讲义》北京商务印书馆语法研究入门马庆株(编)吕叔湘(1984)《汉语语法论文集(增订本)》北京商务印书馆赵元任(1959)《语言问题》北京商务印书馆1995赵元任(1968)《汉语口语语法》北京商务印书馆1979丁声树等(1961)《现代汉语语法讲话》北京商务印书馆朱德熙(1980)《现代汉语语法研究》北京商务印书馆朱德熙(1985)《语法答问》北京商务印书馆朱德熙(1990)《语法丛稿》上海上海教育出版社林焘、王理嘉(1992)《语音学教程》北京北京大学出版社王理嘉(1991)《音系学基础》北京语文出版社王洪君(1999)《汉语非线性音系学》北京北京大学出版社符淮青(1996)《词义的分析与描写》北京语文出版社刘叔新(1990)《汉语描写词汇学》北京商务印书馆陆俭明(1993)《八十年代中国语法研究》北京商务印书馆陆俭明(1993)《现代汉语汉语句法论》北京商务印书馆陆俭明(1994)《陆俭明自选集》郑州河南教育出版社陆俭明(2003)《陆俭明选集》长春东北师范大学出版社陆俭明马真(1999)《现代汉语虚词散论(修订本)》北京语文出版社沈阳(1994)《现代汉语空语类研究》济南山东教育出版社沈阳(2000,主编)《配价理论与汉语语法研究》北京语文出版社沈阳郑定欧(1995,主编)《现代汉语配价语法研究》北京北京大学出版社沈阳何元建顾阳(2000)《生成语法理论与汉语语法研究》黑龙江出版社袁毓林(1998)《现代汉语动词的配价研究》南昌江西教育出版社袁毓林(1998)《语言的认知研究和计算分析》北京北京大学出版社袁毓林郭锐(1998,主编)《现代汉语配价语法研究(2)》北京大学出版社郭锐(2002)《现代汉语词类研究》北京商务印书馆詹卫东(2000)《面向中文信息处理方向的汉语短语结构规则研究》清华大学出版社张伯江方梅(1996)《汉语功能语法研究》南昌江西教育出版社张敏(1998)《认知语言学与汉语名词短语》北京中国社会科学出版社徐烈炯(1988)《生成语法理论》上海上海外语教育出版社徐烈炯(1990/1995)《语义学》北京语文出版社徐杰 (2001)《普遍语法原则与汉语语法现象》北京北京大学出版社邓思颖(2003)《汉语方言语法的参数理论》北京北京大学出版社石定栩(2002)《乔姆斯基的形式语法》北京北京语言文化大学出版社宋国明(1997)《句法理论概要》北京中国社会科学出版社龚千炎(1987)《中国语法学史稿》北京语文出版社邵敬敏(1990)《汉语语法学史稿》上海上海教育出版社陈保亚(1999)《20世纪中国语言学方法论》济南山东教育出版社古代汉语郭锡良商务印书馆古汉语词汇纲要蒋绍愚说文解字注段玉裁中华书局说文解字许慎中华书局汉语史稿王力中华书局音韵通讲耿振生河北教育出版社音韵学教程唐作藩北大出版社现代汉语北大中文系现代汉语教研室商务出版社八十年代中国语法研究陆俭明词汇的分析与描写符淮青语文出版社现代汉语词汇研究符淮青语言学概论(语音、词汇) 贺阳、沈阳语文出版社语言学纲要叶蜚声、徐通锵北京大学出版社20世纪中国语言学方法论陈保亚山东教育出版社现代语言学教程 [美]霍凯特北大出版社普通语言学教程[瑞士]索绪尔商务印书馆汉语方言概括袁家骅语文出版社汉语方言导论游汝杰上海教育出版社语音学教程林焘、王理嘉北京大学出版社音系学基础王理嘉文字学纲要苏培成简明汉语史向熹高等教育出版社汉语方言及方言调查詹伯慧湖北教育出版社。
语料库_语料库语言学及其应用
第24卷第4期 佛山科学技术学院学报(社会科学版) N o .4V o l .242006年7月Journal of Fo shan U niversity (Social Science Editi on )Jul .2006语料库、语料库语言学及其应用陈 潇(暨南大学外国语学院,广东广州510632)摘 要:语料库的发展随着计算机科学的发展经历了三个阶段;语料库语言学是基于借助计算机大规模对语料库的语料进行分析和标注的语言科学。
语料库语言学在语言教学和研究中所能发挥的作用越来越大,从语言研究,语言教学、语言测试、词典编撰到人工智能等领域都开始应用语料库语言学。
语料库语言学给以学生为中心的交际法语言教学提供理论和实践平台。
关键词:语料库;语料库语言学;语言研究中图分类号:H 0 文献标识码:A 文章编号:10082018X (2006)0420014206收稿日期:2006204216作者简介:陈 潇(19662),女,湖南长沙人,暨南大学讲师,文学硕士。
随着计算机科学的迅猛发展,人类语言学的发展不断加速,特别是过去语言学家在语言研究方面认为十分困难或几乎不可能的研究工作,今天凭借语料库和语料库语言学可以顺利进行。
本文拟就语料库发展、语料库语言学理论基础、研究方法及其应用进行研究。
一、语料库语料库,即所收集的全套语言材料,它是某种语言中自然出现的,可以是书面的,也可以是口头的,许多语言学家都把这种材料作为研究语言的素材。
过去,语料库中的材料由人工收集和整理;现在,由于使用计算机的先进技术建设语料库,效率和规模都有了很大提高。
语料库是由从有代表性的语言材料中随机抽样输入计算机并可由计算机处理的大量文本组成的。
语料库收入的文本(或词次)越多,其所覆盖的面越宽,则语料库提供的信息就越可靠。
语料库的发展经历了三代更替。
第一代以20世纪60年代的B row n Co rpu s 和LOB Co rp u s 为代表。
语料库与大学英语教学论文
语料库与大学英语教学【摘要】近年来,由于计算机及信息技术的飞速发展,语料库的发展进入了前所未有的阶段。
语料库被大量的应用到语言研究和语言教学,语料库对语言教学的地位逐渐成为了外语教学与研究的新课题。
本文通过探讨语料库对大学英语课堂教学的语音、语法和词汇教学的影响以及对大学英语学习者语言的输入与输出和自主学习能力培养方面的影响,强调语料库在大学英语教学中的积极作用。
【关键词】语料库;语料库语言学;大学英语教学1 引言以真实可靠的生活中使用的语言素材为基础的语料库对语言学的各个研究领域都有着非常明显的实用价值,已经成为语言研究的主流之一。
语料库不但提供了真实可靠的语料,还提供了科学的研究方法,推动语料库语言学快速发展。
语料库应用与外语教学也成为了一个备受语言研究者瞩目的大课题,基于语料库的外语教学对教学效果产生的积极影响是毋庸置疑的。
2 语料库与语料库语言学2.1 语料库与英语语料库语料库就是储存语言素材的仓库,这个仓库的语言素材是按照特定的目的与方式建立起来的。
这些语言素材都是某种语言中自然出现的,可以是书面的,也可以是口头的(谢应光,1996)。
语料库里储存的语料都是从有代表性的语言素材中通过随机抽样的方式选择输入电脑的。
“由于语料库收集了大量的人们实际使用的语言,而且可根据各种研究需要通过计算快速加以处理,故语料库为语言研究开辟了广阔的新研究领域”(郭杰克,1997:1)。
国际上知名的英语语料库的发展经历了三代:第一代的语料库以美国的布朗语料库(brown university standard corpus of present-day american english 简称brown)和英国的兰开斯特.奥斯陆.卑尔根语料库(lancaster-oslo-bergen corpus简称lob)为代表。
这两个语料库分别代表了当代美国和当代英语的语料库。
布朗语料库是第一个机器可读语料库,收集了500个英语书面语文本,每个文本2000词,整个语料库约计100万词。
语料库相关书籍推荐
Meyer, C. F. 2002. English Corpus Linguistics: An Introduction.《英语语料库语言学导论》. Cambridge: Cambridge University Press.(外教社2008年引进)Wolfgang, Teubert & Anna Cermakova. 2007. Corpus Linguistics: A Short Introduction.《语料库语言学简论》. London & New York: Continuum International Publishing Group Ltd. (世界图书出版公司2009年引进)曹竞,2012,《语料库语言学实用入门教程(Corpus Linguistics: A Practical Introduction)》。
北京:北京理工大学出版社。
桂诗春,2009,《基于语料库的英语语言学语体分析》。
北京:外语教学与研究出版社。
国防,2012,《基于语料库的英语话语标记语分析》。
合肥:安徽大学出版社。
何安平,2004,《语料库语言学与英语教学》。
北京:外语教学与研究出版社。
何安平,2010,《语料库辅助英语教学入门》。
北京:外语教学与研究出版社。
华南师范大学外国语学院编,2005,《语料库语言学的研究与应用》。
长春:东北师范大学出版社。
黄昌宁,李涓子,2002,《语料库语言学》。
北京:商务印书馆。
卢植,2012,《基于语料库的汉英语义基元的语义韵对比研究》。
北京:外语教学与研究出版社。
潘璠,2012,《基于语料库的语言研究与教学应用》。
北京:中国社会科学出版社。
王立非、梁茂成等,2007,《计算机辅助第二语言研究方法与实用》。
北京:外语教学与研究出版社。
王世杰、赵玉华、武永胜,2013,《基于语料库的医学英语词汇研究与学习》。
兰州:兰州大学出版社。
王永庆,2014,《计算机技术、语料库与语言测试》。
桂诗春著作列表
桂诗春著作列表 超星图书馆网站上找到 2010 年 9 月 13 日星期一搜索方式: 找到与 (作者 桂诗春 相关的中文图书 31 种,用时 0.006 秒 当前为第 1 页 作者=桂诗春 作者 桂诗春) 相关的中文图书 用时《基于语料库的英语语言学语体分析》作者:桂诗春著 页数:124 出版日期:2009.12 简介:著名应用语言学家桂诗春教授集多年语言学教学与研究之经验, 在本书中 以“使用语料库和语料库过程来发现那些帮助我们弄懂语言怎样建立语篇的方 式的语言型式”为主要目的,深入地分析了面向语言学和应用语言学教学的“英 语语言学语料库”。
研究通过 100 万词的语言学样本归纳出其语言特征, 供我国 英语教师和研究生阅读语言学著作和撰写语言学论文作参考。
并附有光盘,包 含词频排列表、词频... 分类: 分类 全部->语言、文字->常用外国语《桂诗春英语教育自选集》作者:桂诗春著 页数:462 出版日期:2007 主题词:英语-语言教学-文集 分类: 分类 全部->语言、文字->常用外国语《桂诗春自选集》作者:桂诗春著 页数:399 出版日期:2006 简介:本书为作家自选,将代表其应用语言学研究领域最高水平的、有代表性的 学术论文结集出版。
主题词:应用语言学-文集 分类: 分类 全部->语言、文字->语言学《实验心理语言学纲要:语言的感知、理解与产生》作者:桂诗春编著 页数:383 出版日期:2001.05 分类: 分类 全部->语言、文字->语言学《应用语言学研究》作者:桂诗春著 页数:353 出版日期:2000 简介:本书收入作者 1970 年~1980 年所写的论文 23 篇, 研究的内容分为三类: 应用语言学、心理语言学和语言测试。
主题词:应用语言学 应用语言学 分类: 分类 全部->语言、文字->语言学《新编心理语言学》作者:桂诗春编著 页数:679 出版日期:2000 简介:本书内容包括:绪论、语言的生物和生理基础、语言的心理机制、第一语 言习得、言语听辨、心理词汇、意义表征、句子理解、语篇理解、言语产生、 语言和思维、“认知”假设。
语料库语言学
• 1)2010 首届广外应用语言学论坛。由广东外语 外贸大学外国语言学及应用语言学研究中心于 2010 年9 月24-25日成功举办了备受瞩目的首届 广外应用语言学论坛。语料库语言学首次以独立 议题的形式提出。会议包括:1.语料库的资源共 享;2.双语语料库建设,我国单语语料库很多, 还没有高质量的英汉双语语料库;3.语料库促进 外语教学发展。外语学习者语料库等在外语教学 中的应用,推动外语教学的发展;4.语料库语言 学的现状和未来。桂诗春肯定了语料学对外语教 学的积极作用,并大力提倡资源共享,互助互利。
• 自 2010 年10 月29 日,首次中国外语教育研 究中心“语料库语言学沙龙”(Corpus Research Group)在北京外国语大学成功举 行之后,分别举行了2010 年秋季,2011 年春 季,2011 年秋季2012 年四期有关语料库语言 学研究的名家及学者的交流活动。沙龙由语言 学界的相关大家,许家金、文秋芳、冯志伟、 王克非,熊文新等参与讲座,对语料库语言学 的研究发展具有启发式的引导。 • 1.语料库建设。文秋芳的“学习者语料库的创 建与研究”。在介绍国内研究现状的同时,还 重点分析了语料库语言学研究方法的优势和局 限。
2.发展
• 语料语言学受行为主义的影响下,从60年代开始 发展,迄今已经有近五十年的历史。 • 语料库在发展的初期,只进行词的一般分析,如 词频统计等,后来增加了词的语法属性标注(如, 词性等),直到现在,人们越来越开始重视对语 料库作不同层次的标注,如:语音、构词、句法、 语义以及语用等层次的标注。 • 语料语言学在其发展的初期并没有引起太大的共 鸣,但是现代语料语言学已经得到越来越多人的 承认,其应用也越来越广泛,从语言分析、语言 教学、词典编撰到人工智能等领域都开始应用语 料库。
语料库在语言教学中的应用
语料库在语言教学中的应用王春艳【摘要】按照语料的来源划分,语料库可以分为母语语料库和学习者语料库。
母语语料库为语言教学提供了真实的语料,使学习者能够学习到真实的语言;学习者语料库能够准确详细地反馈学习者习得语言过程中所犯的错误。
语料库可以应用于语言教学的很多方面,主要包括:教学大纲的设计,教学内容的确立,教学方法的采用,语料库应用于课堂教学,学习者语料库及中间语研究和语言测试。
合理利用语料库对外语教学能起到巨大的推动作用% Corpora use contributes to language teaching in a number of ways: syllabus design,the content of learning, teaching methodology, data-driven learning, inter-language analysis and language testing, etc. Applying cor-pora properly is a great contribution to language teaching.【期刊名称】《湖南第一师范学院学报》【年(卷),期】2012(000)003【总页数】6页(P69-74)【关键词】语料库;语言教学;中间语【作者】王春艳【作者单位】上海交通大学外国语学院,上海200240【正文语种】中文【中图分类】H319按照科学的方法定义,语料库就是书写文本或口语转写的集合体;语料库可以用于语言的分析和描写(Kennedy:2000:1)。
语料库是“电子机读文本的有限集合,从最大程度上代表了某种语言或语言变体。
”(McEnery&Wilson:2001:197)。
1987年,第一本基于语料库编写的字典《柯林斯COBUILD英语词典》出版,这在语料库语言学界荡起了一股不小的涟漪。
它引起了众多语言教师的极大关注,也激起了基于语料库的语言教学研究,很多有影响的论文也相继发表。
语料库在英语教学中的应用
定量分析更为精确。
2 语料 库在语 言 研 究 中的应 用
语料库 的类 型可 以从 以下几个层面来 划分【 l I :
第 一类 ,从语言种类来划分 ,可分为单语语料库 、
来分 ,可分 为书面语料库 和 口语语料库 ;第 三类 ,
长 期 从 事语 料库 研 究 的新 西兰 语 言学 家 G .
维普资讯
瓶 拣 皤●— 繁静■■_ 站■■■ ■ - 母 豳
文 章编 号 :0 6 4 7 (0 6 0 — 0 10 10 — 87 2 0 )2 0 7 — 2
蘑 掷 霹 雹 纂 蘑 我 豢 砰 魔 屏f
杨 小平
摘 要: 就语 料库在教 学方面的发展 进行 了探讨 。 重点 阐述
性别、年龄 、阶层 、体裁等。当语料库具有代表性 时, 就可以对 口 语进行概括 ,同时也可 以对 口语中 过韵律和其他注解来增强 ,所以比未经加注的数据 . 更容易进行大规模的定量分析。在词汇研究方面 ,
养学生思维的一种方法 。
在进行英语词汇教学活动中 ,利用语料库的语
境共现设计词汇教学 ,可以从 以下几个步骤进行问 :
了人工操作 ,使一些 词典 的编著增加 了容量 和速
1 语 料库 语言 学的发 展
语料库的研究方法是基于语言学研究中的实证
主义的传统逐渐发展起来 的。从 2 0世纪 6 年代西 0
方语 言学 者就建 立 了许 多语 料库 , 最早 建立 的是 BO R WN语料库 ,称为布朗大学现代美 国英语标准 语料库 ,最初 的语料库是采用磁带的形式发行。随
度。其次 ,基本词汇表 的编制也进入了一个新 的阶 段 ,根据上海交通大学建立的科技英语语料库 ,我
[语料库,语言学,法律]论语料库在法律语言学研究中的构建设想
论语料库在法律语言学研究中的构建设想法律语言学成为独立的学科以来,由于其独特的学科交义性和司法实践性备受关注并发展迅速。
中国的法律语言学已经开始由理论研究转向应用研究,而仅仅依靠思辨和内省难以实现其应用于法律实践的目的,需要结合实证和量化的研究,即将理性主义和经验主义紧密地结合起来进行质量结合的研究。
因此,研究者们开始建立法律专用语料库研究法律语言,通过概率性的分析得到客观的数据支持相关的研究结论。
法律专用语料库以现实中的法律言语为研究对象,能够为法律语言学研究提供客观、系统而且时效性强的原始语言事实,从形式上反映法律语言的概率、特征和模式,揭示法律语言的一般规律和特殊性。
法律专用语料库的建设结合计算机语言学与语料库语言学,注重整体平衡性和代表性,呈现个性化、专业化和智能化的特点,涉及多语种并向多模态多维度转化,能够满足法律语言学应用研究的需要。
本文从语料库在法律语言学研究中构建的理论基础、方法、技术问题以及语料库分类构建四个主要方而展开讨论,展示法律语料库应用的前景。
一、构建的理论基础语料库之所以能够在法律语言学研究中得到广泛应用,这和法律语言的社会属性、法律语言学研究的应用属性和对研究结果的客观性和科学性需求有着直接的关系。
这三者决定了构建法律专用语料库进行法律语言学研究的理论基础。
1法律语言的社会属性。
作为专门领域的应用语言,法律语言属于在现实的法律实践领域中构建的语言。
法律现实是法律集体言语交际的结果,法律语言在建构、形成和改变法律世界或者现实。
语料库的研究方法是一种自下而上的方法,它把语言作为一种社会现象而不是心理现象来分析。
其通过研究社会实际发生的具体言语的集合来处理语言,具有社会性,这和法律语言的社会属性不谋而合。
二者都是将发生在社会情境中的言语输出总体作为研究对象,揭示语言的规律以及语言与社会的关系。
2法律语言学研究的应用属性。
二十一世纪的语言学研究已经走出学术的象牙塔,语言学家越来越关注如何用语言知识和语言研究的成果解决现实问题。
近十年国内语料库语言学研究综述
近十年国内语料库语言学研究综述一、本文概述近年来,随着信息技术的飞速发展和大数据时代的来临,语料库语言学在国内语言学界的影响力逐渐增强。
本文旨在全面梳理近十年国内语料库语言学研究的发展脉络,总结研究成果,分析存在的问题,并展望未来的发展趋势。
本文将从语料库的建设、语料库语言学理论、语料库在语言教学和研究中的应用等方面展开综述,以期为国内语料库语言学的研究者提供一个清晰的研究全景和参考框架。
通过对近十年国内语料库语言学研究的系统回顾,本文旨在推动语料库语言学在国内的深入发展,为语言学研究的创新提供新的视角和方法。
二、语料库建设与研究近十年,我国语料库语言学在语料库建设方面取得了显著进展。
语料库作为语言学研究的基础资源,其规模和质量直接影响到研究的深度和广度。
在这一时期,我国学者和机构积极投入语料库的建设工作,不仅扩充了语料库的种类和数量,还提高了语料的质量和标注精度。
在语料库种类方面,除了传统的通用语料库外,还出现了专门针对某一领域或语体的语料库,如法律语料库、医学语料库、社交媒体语料库等。
这些专业语料库为相关领域的研究提供了丰富的数据支持。
在语料库规模方面,随着大数据技术的发展,语料库的规模不断扩大。
大型语料库如“国家语委现代汉语语料库”“古代汉语语料库”等,为语言学研究提供了海量的语料资源。
在语料质量方面,我国语料库建设注重语料的真实性和代表性。
通过严格的语料采集和筛选流程,确保语料的质量和准确性。
同时,采用自动化和半自动化的方法对语料进行预处理和标注,提高了语料的处理效率和质量。
在语料库研究方面,我国学者充分利用语料库资源进行各种语言学研究。
通过语料库的统计分析,揭示语言现象的本质和规律。
还利用语料库进行语言对比研究、语言演变研究、语言教学研究等,推动了语言学研究的深入发展。
近十年我国语料库语言学在语料库建设与研究方面取得了显著成就。
语料库的规模和质量不断提升,为语言学研究提供了强大的数据支持。
语料库论文
语料库与英语教学摘要:语料库是由大量收集的书面语或口语构成,并通过计算机储存和处理,用于语言学研究的文本库。
它为英语教学和研究提供了自然出现的真实语料和科学的研究方法,在这些领域正发挥越来越大的作用。
本文讨论了国外将语料库应用于语言教学领域的研完成果和具体做法以及它对于英语教学所起的独到作用,并介绍了我国语料库发展的现状,探讨了在我国利用语料库进行英语教学的可行性。
关键词:语料库;学习;英语教学一、前言语料库语言学是20世纪中后期兴起的一门语言研究科学,它是出现在语言学、计算机语言学认知、语言学和应用语言学边缘上的一门新的交叉科学,它基于大量真实的语言资料,从调查语言信息的呈现频率入手来研究语言在现实使用中的规律和模式。
语料库是指按照一定的语言学原则,收集自然出现的连续的语言应用文本或话语片断而建成的具有一定容量的电子文库[1]。
随着信息技术的发展和普及,借助电脑技术建立起来的语料库以其容量大、语料真实、检索快捷准确等独特的优势在现代语言学研究和语言教育中发挥着越来越重要的作用[2]。
同时,经过对语料库的研究及实践可以了解到一些有关语料库在英语教学中的应用。
二、语料库的分类和作用按语言种类,语料库可以分为单语语料库,双语语料库和多语语料库。
按语料来源,语料库可分为口语语料库和书面语语料库。
按语言题材,分为普通语料库和专门用途语料库。
按语料库是否被标注,又分为生语料库或称原始语料库和熟语料库或称标注语料库。
熟语料库指在建立语料库时,对语料进行了语音、词性、句法、语义等标注的语料库,标注后的语料库可以方便检索。
[3]语料库为外语教学和研究提供了重要资源。
如何有效利用语料库资源,拓展教和学的空间,培养学生自主学习的意识,是外语教师应思考的问题。
语料库在外语教学中的作用:(一)可以帮助缩小课堂教学的语言与目标语言之间的差距。
(二)可以帮助更加清晰地认知不同语域变体的特点。
因为在不同语域中的语言所表现出来的特性是有差异的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010年11月November 2010第33卷第4期Vol.33No.4现代外语(季刊)Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成[编者按]为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。
期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。
以下是根据专家发言,整理后的主要内容。
[中图分类号]H319[文献标识码]A[文章编号]1003-6105(2010)04-0419-08语料库语言学的发展前景与资源共享广东外语外贸大学桂诗春1.语料库语言学的发展前景语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。
但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。
究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown.Flob ,BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。
在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。
我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。
首先是数学和统计学。
Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook ofMathematical Linguistics ),当时还是前计算机时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language inmass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。
某些语言学研究分支如果考虑到这两个方面,将会从中获益。
当时还没有真正的机读语料库,Brown 的语料库在1967年才面世,美国心理学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。
一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。
其次是计算机科学。
语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。
但是我们往往只注意到硬件部分,而不认识到软件的建设。
从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需语料库语言学与中国外语教学1.双语料库的建设我很赞同桂诗春教授的意见,积极推进语言资源的共享,语料库只有共享才能变成财富,如果把语料库的研究成果“藏诸名山,束之高阁”,只是一堆数据垃圾,必将自毁前程。
桂诗春教授刚才提到宾西法尼亚大学的Linguistic Data Consortium (我建议最好翻译为“语言数据联盟”,简称LDC ),是一个很好的供语料库语言学研究者进行交流互动的平台。
在语言数据联盟和其他相关机构的帮助下,研究者们可以获得口语和书面语的大规模的语料。
重要的是,在这些语料中还包括一些标注过的语料,如宾州树库(Penn Treebank ),布拉格依存树库(Prague Dependency Tree Bank ),命题库(PropBank ),宾州话语树库(PennDiscourse Treebank ),修辞结构库(RSTBank )和TimeBank (我不知道TimeBank 这个名称如何翻译为中文)。
这些语料库是带有句法、语义和语用等不同层次的标记的标准文本语言资源。
这些语言资源的存在大大地推动了人们使用“有监督的机器学习方法”(supervisedmachine learning )来处理那些在传统上非常复杂的自动句法剖析(automatic syntactic parsing )和自动语义分析(automatic semantic双语语料库的建设与用途国家教育部语言文字应用研究所冯志伟要,通过计算机自行编程来检验假设。
此外,要做语料库语言学研究,文本分类(又叫文本分析或内容分析)也必须具备雄厚的基础。
它的研究范围也很广,从信息的提取、组织、储存,文本(包括语体)的分析,社会舆论调查,著作归属到文本格式。
这也牵涉到许多统计学知识和计算机知识。
数理语言学和计算机语言学的研究对象是文本和语篇。
有志于研究这门科学的必需具有这些基础训练,否则不会走得很远的。
我觉得,当务之急是让我国语料库语言学的先行者们聚在一起,研究语料库语言学作为一门科学应该在什么层次上开设?它有什么基本内容?由哪些核心课程组成?只有规范语料库语言学专业的课程,按照这些课程设置来培养我国语料库语言学的学生,他们才能高瞻远瞩,取得真正的进展。
2.资源共享问题语料库语言学对资源有很大的依赖性,为了促进语料库语言学在我国的发展,应该提倡资源共享。
回顾语料库语言学在国外的迅猛发展,和资源共享有密切的关系。
共享的方法有多种:一是免费提供,最典型的例子是GeorgeMiller 领衔制作的英语大型词汇数据库Wordnet 受到各方面资助,前后参与制作的不下一千人,而且还在不断完善。
他们认为这不是一个商品,应该为公众所有。
二是提供网上服务,整个语料库不提供,但是在网上可以自由检索获得数据,像美国Brigham Young 大学的Mark Davies 在他的网页上检索美国现代英语语料库、美国历史英语语料库、英国国家语料库、《时代》杂志语料库、西班牙语语料库、葡萄牙语语料库以供检索。
三是成立语料库分配中心,收少量成本费提供语料库,像挪威的ICAME (International Computer Archive of Modern and Medieval English ),美国的LDC (The Linguistic Data Consortium ),等等。
一些语料库工具,如TACT 、LEXA ,Wordcruncher ,Wordsmith 、Antconc 也都很容易在网上获取。
资源共享的理念是,只要有更多的人使用,我们所开发的资源、工具才能完善,学科才能发展。
只有互通有无,才能共同协作,才能减少重复劳动,制作出更成熟的成品。
4201.语料库语言学的应用研究这次专题讨论的题目“语料库语言学与外语教学”我觉得很好,很及时。
语料库语言学本来就是实践性、应用性很强的一门学科,语料库语言学的应用研究与贡献上海交通大学杨惠中analysis )等问题。
这些语言资源也推动了有竞争性的评测机制的建立,评测的范围涉及到自动剖析(parsing )、信息抽取(informationextraction )、词义排歧(word sense disambiguation )、问答系统(question-answer system )、自动文摘(automatic summarization )等领域。
几年前由中国中文信息学会发起,在北京创建了“中文语言数据联盟”(ChineseLinguistic Data Consortium ,缩写为CLDC ),是一个自愿组成的学术性社会团体,其宗旨是团结中文语言资源建设领域的广大科技工作者,建成代表中文信息处理国际水平的、通用的中文语言和语音的资源库。
欢迎语言学界的同仁积极参与CLDC 的工作,促进语料库资源的共享。
目前单语语料库很多,已取得煌煌的成绩,但双语并行语料库(parallel corpus )不容易获得,它的构建和加工是很困难的工作。
我国还没有高质量的、大规模真实文本的英汉双语语料库,更没有成熟的、可共享的加工工具,最近公布的2010年国家社会科学基金重大项目中有一项就是“大规模英汉平行语料库的构建与加工研究”,资助强度大约是50万元左右,可见国家对于双语语料库建设的重视。
这个项目是我和王克非教授在今年的社科基金评审会议上建议提出的,已开始招标,希望大家积极投标,积极推进我国的双语语料库建设。
2.如何将语料库语言学运用到外语教学,如何从语料库中挖掘知识?我认为英汉双语语料库的最大用途就是推进英语教学,我们可以从双语语料库中抽取教材的原材料,帮助语言学习者提高对于真实语言材料的语感,从而编写出高质量的外语教材。
有的外语老师冥思苦想地根据自己的语感来编写教材,费时费力,其实,如果依靠英汉双语平行语料库,就可以减轻搜集素材之困难,大大提高编写教材的工作效率。
另外,语料库中蕴藏着无比丰富的知识等待我们去挖掘,如果我们使用“文本数据挖掘”(text data mining )的技术,从语料库中挖掘知识,既可以挖掘语言学的知识,也可以挖掘非语言学的知识,就像从矿石中挖掘出黄金一样,这些知识可以弥补传统语言学的不足,克服研究者的主观性和片面性。
我们在text data mining 这个术语中使用mining (挖掘)这个单词,而没有使用extraction (抽取)这个单词,正是为了强调在从语料库中获取知识的时候,要开动脑筋,要经过一番“去粗取精,去伪存真,由此及彼,由表及里”的深思熟虑的功夫来加工数据,而不要被海量的数据所迷惑。
数据就像矿石,我们的任务是从海量的数据中挖掘出隐藏在其中的有规律性的东西,把海量的、离散的“数据”(data )变为精炼的、系统化的“知识”(knowledge ),从而把经验主义方法和理性主义方法紧密地结合起来。
这种知识获取方法上的巨大变化,有可能引起整个语言学研究的“战略转移”(strategytransit );我们中国的语言学家应当敏锐地关注“战略转移”问题,做出我们的应有的贡献,千万不要错过这个在语言学历史上千载难逢的良机。
桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成421语料库语言学与中国外语教学脱离了应用,坐而论道,也就失去了发展的基础和动力,将变成无本之木、无源之水。
外语教学正是语料库语言学的重要应用领域,语料库语言学以实际使用中的语言事实作为研究对象是一种着眼于语言运用的研究方法(performance-based approach),因此跟语言教学有着直接的关系,对真实语言交际的各个方面,包括词汇的、句法的、语义的、语用的、语篇的,进行深入的探讨和全面的描写,其研究成果可以应用在教学大纲设计中,为确定教学内容、制定教学目标提供坚实可靠的决策依据。