BCC语料库使用指南
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 、字处理(包括标点符号)
[C]:错字标记,用于标示考生写的不成字的字。用[C]代表错字,在[C]前填写正确的字。
例如:地球[C](“球”是错字)、这[C]。
[B]:别字标记,用于标示把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至[B]中B的后面,并在[B]前填写正确的字。
例如:提[B题]高、考虑[B虎]。
[L]:漏字标记,用于标示作文中应有而没有的字。用[L]表示漏掉的字,并在[L]前填写所漏掉的字。
例如:
后悔[L],表示“悔”在原文中是漏掉的字。
农[L]药,表示“农”在原文中是漏掉的字。
[D]:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至[D]中D的后面。例如:我的[D的],表示括号中的“的”是多余的字(原文中写了两个“的”)。[F]:繁体字标记,用于标示繁体字。把繁体字移至[F]中F的后面,并在[F]前填写简体字。
例如:记忆[F憶]、单{F單}纯、养{F養}分{F份}。
注意:
1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记。
例如:俭朴[F樸[B僕]]。
2)繁体字写错了,标为:后[F後[C]]。
[Y]:异体字标记,用于标示异体字。把异体字移至[Y]中Y的后面,并在[Y]前填写简体字。
例如:偏[Y徧]、沉[Y沈]。
[P]:拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至[P]中P的后面,并在[P]前填写简体字。
例如:缘[Pyúan]分、保护[Phù]。
[#]:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个[#]表示。
例如:更[#][#]保存自己的生命,……
[BC]:错误标点标记,用于标示使用错误的标点符号。把错误标点移至[BC]中BC的后面,并在[BC]前填写正确的标点符号。
例如:勤奋、[BC,]刻苦的精神。
[BQ]:空缺标点标记,用于标示应用标点符号而未用的情况。把[BQ]插入空缺标点之处,并在[BQ]中BQ的后面填写所缺的标点符号。
例如:周围的环境很安静[BQ,]生活也非常平凡。
[BD]:多余标点标记,用于标示不应用标点符号而用了的情况。把多余的标点移至[BD]中BD的后面。
例如:我家周围的[BD,]美丽风景。
2、词处理:(包括成语)
{CC}:错词标记,用于标示错误的词和成语。包括4种情况:
1)把词的构成成分写错顺序的。
把写错的词移至{CC}中CC的后面,并在{CC}前填写正确的词。
例如:首先{CC先首}、众所周知{CC众所知周}。
2)该用甲词而用乙词的。这种情况类似别字,但属于用词层面上的错误。
标示方法同上。
例如:
虽然现在还没有实现{CC实践},……
它在{CC对}价格方面有点贵,所以没得到广大消费者的支持{CC持支}。
3)生造词。指考生自造的、或某些外语中可能有而汉语中不存在的词。
例如:
农作物{CC农产物/农物}、农产品{CC农作品}
……但长期来看造成环境污染,破坏自然生态{CC目态},……
绿色食品的好处在于吃这些食品后在身体里没有农药的残留量{CC潜留量}。
4)词语搭配错误。包括词性、音节等方面的搭配错误。
例如:
最好的办法是两个都保持{CC走去}平衡。
我也回{CC1回去}沈阳。
吃这种东西会{CC1可以}得{CC1得到}病{CC1疾病}。
{CLH}:离合词错误标记,用于标示各种和离合词相关的错误。标在有错误的离合词的后边,表示前边的离合词用法有误。
例如:
……我快要毕业{CLH}大学{CQ了}。
虽然这么[L]多年都没见面{CLH}过,……
……我对哈尔滨{CJ-zy很}感兴趣。有观光{CLH}哈尔滨的宿愿。
{W}:外文词标记,用于标示以外文词代替汉语词的情况。把外文词移至{W}中W的后面,并在{W}前填写相应的汉语词。在W和外文词之间填写汉语词的字数。
例如:
非洲{W2Africa}、爵士乐{W3jazz}。
……教我工作的方法{W2ABC}。
{CQ}:缺词标记,用于标示作文中应有而没有的词。在缺词之处加此标记,并在{CQ}中CQ的后面填写所缺的词。
例如:
这就{CQ要}由有关部门和政策管理制度来控制。
……有的农民{CQ在}不使用化肥和农药的情[B精]况下[BD,]养农作物,……{CD}:多词标记,用于标示作文中不应有而有的词。把多余的词移至{CD}中CD的后面。例如:
……然后肯德基的收入有所增加{CD了}。
中国政府应该采取良好的措施来管理农业{CD方面},……
但我觉得{CD按照}上面所写的方法是现在很多人或国家用的方法。
句子错误类型代码:
{CJba} :把字句错误
{CJbei} :被字句错误
{CJbi} :比字句错误
{CJl} :连字句错误
{CJy} :有字句错误
{CJs} :是字句错误
{CJsd} :“是……的”句错误
{CJcx} :存现句错误
{CJjy} :兼语句错误
{CJld} :连动句错误
{CJshb} :双宾语句错误
{CJxw} :形容词谓语句错误
{CJ-} :句子成分残缺错误标记,用于标示由于成分残缺造成的病句。在短横后边标明所缺成分的名称,该名称用小写代码表示;在小写代码之后填写所缺的具体词语。标在成分残缺之处。
例如:
为了增加{CC满足}粮食,{CJ-zhuy人们}使用了化肥和农药,这样产量就会大大提高。这样的活动{CJ-sy开展}以来,肯德基的垃[B拉]圾[C]总量大大降低。
……那两种{CC个}东西就容易伤害人类的{CJ-dy健康}系统。
从具体{CJ-zxy情况}来看,……
{CJ+} :句子成分多余错误标记,用于标示由于成分多余(赘余)造成的病句。后边用小写代码标明多余成分的名称,并把所多余的具体词语移至该名称的后面。标在成分多余之处。
例如:
这是我们{CJ+dy做人}的责任。
而且研究{CJ+buy下去}产量能提高的办法。
而且{CJ+zy正在}还死去好多人。
句子成分采用层次分析法的观点,共8种:
{CJ-/+zhuy} :主语残缺或多余
{CJ-/+wy} :谓语残缺或多余
{CJ-/+sy} :述语残缺或多余
{CJ-/+by} :宾语残缺或多余
{CJ-/+buy} :补语残缺或多余
{CJ-/+dy} :定语残缺或多余
{CJ-/+zy} :状语残缺或多余
{CJ-/+zxy} :中心语残缺或多余
{CJX} :语序错误标记,用于标示由于语序错误造成的病句。标在语序错误的词语的后边。如果是相邻的两个成分语序错误,按照自然顺序,把{CJX}标在前一个成分的后边。例如:
大多数{CJX}这些人生活{CC2活}在很不好的地方,……
可是这两个问题同时{CJX}要解决非常不容易,……
现在每个人很重视健康,受欢迎{CJX}绿色食品。
{CJZR} :句式杂糅错误标记,用于标示把两种不同句式、两种不同说法混在一起的病句。标在句子末尾,标点之前。
例如:
这个问题不可能一两年解决的问题{CJZR}。
现在,全世界流行是绿色食品{CJZR}。
每次吃对身体有害于健康的东西{CJZR}。
因为,人们的必生存之一中最重要的是饮食{CJZR},……