语料库辅助英语教学与研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

7.语料库辅助翻译研究
当代汉语翻译小说语料库 (http://www.fleric.org.cn/cctfc/)
测试页面 (http://score.crpp.nie.edu.sg/cctfc/mmax
.html)
例:检索 “好”, “好*”
7.语料库辅助翻译研究
翻译语料库(TEC Translational English
语料库辅助英语教学与研究
刘小燕
主要内容
1.语料库语言学的性质 2.几个常用术语 3.语料库研究的基本方法 4.国内语料库发展现状 5.语料库辅助教学与研究 6.语料库辅助二语习得研究 7.语料库辅助翻译研究 8.几个实用小工具 9.语料库研究的相关课题
1.语料库语言学的性质
Corpus linguistics is empirical(实证的) in nature
语料库语言学学习的好去处
语料库语言学在线 www.corpus4u.org
内容5 5
Thank you.
即便在语料库语言学阵营之中
☺ Corpus-driven: minimum theory-reliance. Exclusive reliance on corpus data for all theories
☺ Corpus-based: Reliance on corpus data for hypothesis-testing
可以回答下列问题:
阅读报纸需要的词汇量是多少? 某教材中的高频和低频词汇分别是什么? 同一学生在不同时期作文中措辞是否相似? …………….
5.语料库辅助教学与研究
Range 操作实例
1.发现试卷中有哪些低频词出现 2.对比两个文本中有多少重叠词汇和不同词汇
(如:对比两套四级真题)
3.某本教材中出现了哪些高频词汇和哪些些低频词汇 4.检查学生的词频广度 (如检查120个学生作文的词频)
To what extent does LL analysis affect the formative assessment of the learner achievement?
9.语料库研究的相关课题
Teaching in focus: RQs
What functions and effects does classroom concordancing have on the students’ learning?
为随后大学英语教学大纲的制定和词表的统计提 供了主要参考依据,对大学英语教学产生了重大影 响。
4.国内语料库发展
广东外语外贸大学桂诗春教授和上海交通大 学杨惠中教授主持编制的CLEC(中国英语学 习者语料库)
中学生和大学本科学生的书面语语料库
4.国内语料库发展
文秋芳教授在南京大学主持的SWECCL(中 国学生英语口笔语语料库)
例1. 搜索“women”
例2:搜索“red+名词”,输入:“red [n*]”
例3:输入lemma(即一个单词的单复数、时态等所有形式), 若要得到sing这个单词的所有形式 ,输入“[sing]”
5.语料库辅助教学与研究
Rang——词汇分布分析器
主要用途:分析比Fra Baidu bibliotek不同文本词汇量大小,措辞 的异同,可以同时处理多个不同文本
2.几个常用术语
Corpus Corpus linguistics
2.几个常用术语
Type(类符):不重复的单词 Token(形符):单词
e.g. The little boy looked at the other boys.
Type/token ratio(类/形符比)
测量词汇密度lexical density
语音(停顿、节奏、语调) 词汇 (总体特征、某类词) 语法 (过去时、冠词、NP, VP) 语篇 (语篇标记、提问、话轮转换)
4.国内语料库发展
80年代中期杨惠中教授带领他的团队主持编 制的JDEST(Jiao Da English for Science and Technology),交大科技英语语料库, 是我国最早的英语语料库。
中国外语教育研究中心王克非教授主持创建 的汉外双语平行语料库,就是目前国际上最 大的外汉平行语料库。
5.语料库辅助教学与研究
☻ 词汇教学与自主学习
☻ 同义词辨析 ☻ 写作 ☻ 更正学习者错误
☻ BNC(British National Corpus)(http://corpus.byu.edu/bnc/)
☻ COCA (http://www.americancorpus.org/)美国当代英语语料库 (Corpus of Contemporary American English)
5.语料库辅助教学与研究
BNC使用举例
1. 搜索words、phrases、lemmas、wildcards(通配符)和其他更 加复杂的字词
☺ Corpus-referenced/informed: Occasionally resorting to corpus data for illustrations
1.语料库语言学的性质
我们坚决反对不顾语言事实的任何论断
No introspection can claim credence without verification through real language data (Teubert 2005).
3.语料库语言学研究的基本方法
Types of comparison
Across genres Across users Across different times Across (varieties of) language(s)
3.语料库语言学研究的基本方法
Linguistic features in corpus comparison
What are the areas (of the learner language) under development in a given community?
9.语料库研究的相关课题(李文中)
Learning in focus: RQs
What differentiates one group of learners from another?
3.语料库语言学研究的基本方法
Both approaches almost always involve a comparion of some kind.
3.语料库语言学研究的基本方法
Sizes of corpora in comparison (Rayson 2003)
Small <=> big Equal sizes
3.语料库语言学研究的基本方法
Corpus-based approach: a hypothesistesting approach
Corpus-driven approach: with as “few preconceived ideas” as possible, “keeping the amount of theory-reliance to a minimum in order not to hinder the process of discovering new phenomena” (Römer 2005)
使用工具WordSmith或Antconc 例:检索 “because” 在学生作文中的频数和搭配情

6.语料库辅助二语习得研究
在附码后的语料(tagged corpus)中检 索
例:使用Antconc检索“do,does,did,doing,done” 等形式, 输入“VD*”
操作演示
5.语料库辅助教学与研究
教学材料难度的测试 (Readability_Analyzer_1.0.7)
—— “文章难不难,用它算算看”
6.语料库辅助二语习得研究
语料处理(tagged or raw)
使用附码工具CLAWS 操作示范
6.语料库辅助二语习得研究
在生语料(raw corpus)中检索
SECCL
1996-2002年英语专业4级考试录音
WECCL
议论文3059篇 记叙文529篇
4.国内语料库发展
SWECCL
SECCL
WECCL
4.国内语料库发展
杨惠中教授和卫乃兴教授在上海交大建立的 COLSEC(中国大学生口语语料库)
何安平教授在华南师范大学建立的中国学生 英语语料库
Corpus)
http://www.llc.manchester.ac.uk/ctis/research/e nglish-corpus/
80%以上都是小说文本
7.语料库辅助翻译研究
北外双语语料库
(http://202.204.128.82/CEO/)
参考:《双语对应语料库研制与应用》王克非等著 外语教学与研究出版社,2004
例:输入 “increase”
9.语料库研究的相关课题
Learning in focus: RQs
What characterizes the learner language in a given learning community?
How are the learner accomplishments formed on a progressive route?
What characterizes the teacher talk?
How does the use of corpus in the classroom contribute to the students’ metalanguage ability?
Explore the possibility of using the multimedia corpus.
2.几个常用术语
Collocation is defined as a sequence of words which co-occur more often than would be expected by chance.
a big smoker a strong smoker a hard smoker a heavy smoker a furious smoker 以测量搭配强度(MI值)
语言研究中的数据类型
内省数据(introspective data): rationalism 实验数据(experimental data): empiricism 真实数据(anthentic data): empricism
1.语料库语言学的性质
语料库语言学提倡真实数据,但是也并不排斥类型 数据
7.语料库辅助翻译研究
汉英平行语料汇集 (http://corpus.usx.edu.cn/lawcorpus4
/) 例:检索 “民生”
8.几个实用小工具
BFSU NewWords Marker 1.0 生词标记工具
8.几个实用小工具
BFSU Sentence Collector 1.0 基于语料库的 英语例句提取工具 (可以用于课堂教学)
相关文档
最新文档