语料库的介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 在词汇教学中的应用
• 语言学习者能发挥自己的主观能动性,自 行研究词汇,搭配,和同义词的使用特点。
• Original • Although economic improvement may be caused by tourism ,the investment and operational costs of tourism must also be considered.
• British National Corpus(英国国家语料库)
• http:// ftp.itri.bton.ac.uk/bnc
• International Corpus of English (国际英语 语料库) • Cambridge Language Survey (剑桥语言调 查) • Corpus of Contemporary American English (美国当代英语料 库)http://corpus.byu.edu/coca/单词比较.flv
Corpus Linguistics
• Definition and classfication of corpus • Corpus linguistics • Application of Corpus linguistics(main topic) • Conclusion
Definition of Corpus
• 语料库,顾名思义,就是存放语言材料的 电子库。
The Classfication of Corpus
用途:通用语料库 专用语料库 介质:文字语料库 声音语料库 时间:共时语料库 历时语料库 语体:书面语语料库 口语语料库 状态:动态语料库 静态语料库 语种:单语语料库 双语语料库 多语语料库 平行语语料库 非平行语语料库
• 口语语料库
• 研究口语特征的主要工具,如语音语调的 规律
• 平行语料库
• 用于机器翻译研究
Definition of corpus linguistics
• The study of language based on examples of “real life” language use . • 语料库语言学是以语料库为手段研究语言 学。
• 通用语料库
• BROWN 语料库 • LOB 语料库
• 专用语料库
• Leabharlann Baidu • • Helsinki Corpus of Historical English (研究古英语) JDEST学术英语语料库 (研究学术英语)
• 动态语料库
• 例如,基于北京语言大学的“动态流通语料库” 可以观察新流行语的产生。如英国兰卡斯特大学 的Geoffrey Leech等人通过对70年间英语书面语 语料的分析,发现了当代英语情态动词弱化的趋 势,其中较为突出的是must、should这类强势情 态动词使用越来越少,取而代之的是have to、 need to、be supposed to这些语气较缓和的情态 表达法,体现了英语书面语词语变化的口语化和 通俗化。
语料库语言学应用
• 词典编撰 • 语言研究(句法研究、语篇分析、会话分 析和语音研究) • 语言教学
语言教学
• 语料库作为大量真实语言资料的来源,在 教学中得到了广泛的应用
• 在写作教学中的应用
• 利用语料库中的现有词汇,便于学生更好 的掌握易混词汇及短语、习语的用法,使 作文读起来更顺畅、准确,富于文采性。 • 将学生作文放入写作语料库中检索,语料 库中统计分析软件对作文进行分析,提高 评阅的客观性,科学性。
• Revision • Although tourism may lead to economic improvement ,the investment and operational costs of tourism must also be considered.
不识好歹.doc 不识抬举-语料库搜 索.png
• 在语法教学中的应用
1.语料驱动学习 2.以学生为中心,鼓励学生发现问题,分析 问题,思考质疑
疑问 假设
语料库
回证 答实 推 翻
分布 搭配 频率
总结
• 语料库语言学的快速发展为语言学研究提 供了新平台,为语言学习者和教学者提供 更广阔的空间,使其能够自主学习、研究 及创新。
Some Famous Corpora
A collection of texts ,of the written or spoken word ,which is stored and processed on computers for the purposes of linguistic research (Renouf ,1987 ) • A collection of naturally occurring language text ,chosen to characterize a state or variety of a language (Sinclair,1991)