CLEC中国英语学习者语料库0204192348
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一致性)
determiner or a word that refers to it
Baidu Nhomakorabea
np4 nn phr Case(格)
possessive case error: form or use
np5 nn phr Countability uncountable noun used as countable
determiners(其 wh- determiners, numerals, etc.
他限定词)
pr1 pron Reference(指称) incorrect/ambiguous pronoun
reference/anaphoric
pr2 pron anticipatory it improper or wrong use of anticipatory
few/little, some/any, either/neither,
etc
aj1 adj
Pattern(形容词 error in the combination with other
型式)
words/grammatical
aj2 adj
set phrase(固 error in the idiomatic use of an
形容词短语
码
类型
码
aj1
pattern
ad1
aj2
set phrase ad2
aj3
degree
ad3
aj4
-ed/-ing
confusion
aj5
predicative
/attributive
词语
码
类型
码
wd1
order
cc1
wd2
part of speech cc2
wd3
substitution cc3
定语)
ad1 adv
Order(词序) improper adverb placement/wrong
aj4 adj
-ed/-ing
-ed adjective for -ing adjective or
confusion
vice versa
(-ed/-ing 混淆)
aj5 adj
predicative/att predicative adjective used as
ributive(谓语/ attributive adjective
vp6 vb phr Tense(时态) error in tense use within a sentence/
the sequence of tenses between
sentences
vp7 vb phr voice (语态) error in the use of voice: active for
定词组)
adjectival phrase/ omission or
replacement of a fixed element that
goes after a certain adjective
aj3 adj
Degree(级) adjective degree error: form and use
句子
码
类型
sn1
run-on
sentence
sn2
sentence
fragment
sn3
dangling
modifier
sn4
illogical
comparison
sn5
topic
prominence
sn6
Coordination
sn7
Subordination
sn8
structural
deficiency
型式)
versa), transitive verb pattern/
grammatical(cf Oxford advanced
learner’s dictionary of current
English edited by A. S. Hornby)
vp2 vb phr set phrase(固 phrasal verb and verbal phrase: error
(情态)
form of modal verb(or auxiliary verb)
and verb combination (e.g tense form,
voice form, etc)
np1 nn phr Pattern(名词型 Error in combination with other
式)
confusion
np8 nn phr Quantifiers(数 misuse or confusion between many/much,
量词)
(a) few/(a) little, some/any, etc
np9 nn phr other
misuse or confusion of demonstratives,
words/grammatical
np2 nn phr set phrase(固 omission or replacement of a fixed
定词组)
element that goes after a certain noun
np3 nn phr Agreement(主谓 number agreement of a noun with its
2. 分类表的类别要适中。过粗容易统一,但信息太少,不利于分析学习者的 失误/过细难以统一,容易把同一种失误归到不同类别。目前我们采取的办法是 对常见的失误从细(如 vp 和 np 都有 9 小类),对少见的失误从粗(如 cj 只有 两小类)。现在的分类表有 61 个失误码,是属于中等规模的分类表。
言语失误分类表(总数:61)
词形
码
类型
fm1 Spelling
fm2 word building
动词短语
码
类型
vp1 pattern
vp2 set phrase
名词短语
码
类型
np1 pattern
np2 set phrase
fm3 capitalization
vp3
vp4
vp5
vp6
vp7
vp8
vp9
代词
码
类型
pr1 Reference
pr2 anticipatory
it
pr3 Agreement
pr4 Case
pr5 wh-
pr6 Indefinite
连词
码
类型
cj1 pattern
cj2 set phrase
sn9
Punctuation
标注说明
码 分类
类别
说
明
fm1 word Spelling(拼写) spelling, coinage, abbreviation,
wd4
absence
cc4
wd5
redundancy cc5
wd6
repetition
cc6
wd7
ambiguity
agreement finite/non-finite non-finite tense voice mood modal/auxiliary
副词 类型
order modification degree
CLEC 收集了包括中学生、大学英语 4 级和 6 级、专业英语低年级和高年级在内 的 5 种学生的语料一百多万词,并对言语失误进行标注。其目的就是观察各类学 生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语 作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。
表1 类型
np3 agreement
np4 case
np5 countability
np6 number
np7 article
np8 quantifiers
np9 other
determiners
介词短语
码
类型
pp1 pattern
pp2 set phrase
搭配 类型
noun/noun noun/verb verb/noun adj/noun verb/adv adv/adj
apostrophe
fm2 word word building derivation, inflection, compounding,
(构词)
plurality (noun), irregularity(verb),
3rd person singular form(verb),
syllabification, hyphenation, word
te(定式)
versa
vp5 vb phr non-finite(不 infinitive error: form and use/
定式)
infinitive for participle or vice
versa/ -ed participle for -ing
participle or vice versa
ST2 ST3 ST4 ST5
ST6
总计
CLEC 语料分布 词次 208088 209043 212855 214510 226106 1070602
言语失误标注 原则
1. 简单合理,易于系统操作。参与标注的人比较多,分类表过于繁复,就难 于掌握。我们采取两级分类,第一级有 11 类:词形(fm)、动词短语(vp)、 名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、 连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。每一类里再用数目字细分。 如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的 搭配,[cc3]表示动词和名词的搭配,等等。
提供足够的失误信息(失误本身、失误类型和失误发生范围)。例如 In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示,放在失 误之后。 [vp6]为 vp(动词)第 6 种(时态)失误,4-为失误发生的范围,-表 示失误的位置,4 表示失误前有 4 个词。要联系这 4 个词,才能判断 are 这个词 用错了。
division or fusion
fm3 word Capitalization lower initial letter for upper initial
(大小写)
letter or vice versa
vp1 vb phr Pattern(及物性 error in transitivity(vi as vt or vice
(先行 it)
it / it replaced by a demonstrative,
etc
pr3 pron Agreement(主谓 number agreement with a noun it refers
一致性)
to
pr4 pron Case(格)
case error of any personal pronoun
(可数性)
noun
np6 nn phr Number(数) countable noun used with no determiner
or -s/ a or -s with plural noun
np7 nn phr Article(冠词) a/an confusion or definite/indefinite
定词组)
in form or use
vp3 vb phr Agreement(主谓 number agreement with its subject
一致性)
(noun or pronoun)
vp4 vb phr finite/non-fini finite verb for non-finite verb or vice
开放性。容许研究者根据需要对失误类型进行补充或进一步再分出细类。例如 [sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。这需 要把 sn8 的失误全部检索出来,然后定出第三级的分类范畴,如 sn81,sn82, 等等。
5. 对语体或失误的来由暂不作标注,因为这需要标注者较多的主观判断,更 难以统一。
pr5 pron wh-(wh-代词) misuse or confusion of interrogative,
relative and conjunctive pronouns
pr6 pron Indefinite(不 misuse or confusion of indefinite
定式)
pronouns such as all/both,
passive or vice versa
vp8 vb phr Mood(语气) error in the use of mood: imperative,
subjunctive/ improper structure of
conditional sentences
vp9 vb phr modal/auxiliary misuse of modal/auxiliary verbs/ wrong