项目介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通用规范汉字机写信息速查项目介绍
自汉字搭上信息快车以来,越来越多的人由手写汉字转为机写汉字,用电脑、手机、iPad等电子产品“写”汉字,日益普及。不会机写汉字的人,被视为信息时代的“新文盲”。另一方面,汉字机写,也推动了汉语国际教育。外国人学习汉语,最难的是手写汉字。但机写汉字,使外国人更容易“写”汉字了。学习汉语的外国人,如果能机写汉字,他们就能平衡发展汉语听、说、读、写四项基本技能。另一方面,为了实现汉字机写,就必须继续开发或升级规范、易学、高效的汉字输入法。所以无论是中国人,还是外国的汉语学习者,以及汉字输入法的开发者,为了实现汉字机写的大目标,都需要了解汉字机写的相关信息。
本手册由二大篇组成:通用规范汉字篇、现代常用字部件篇。
一、通用规范汉字篇
基本信息
汉字总量早已超过八万。限于本手册篇幅有限,也考虑到绝大多数人汉字书写的实际需要,编者仅选1998年国家语委、新闻出版署公布的《现代汉语通用汉字表》(以下简
称“7000字表”),和2013年教育部、国家语委公布的《通用规范汉字表》(以下简称“8105字表”)来进行信息解读。“7000字表”和“8105字表”合并,除去重复汉字,实际共8173个汉字。本手册提供了这8173个汉字在普通汉字字典均有的信息项目:拼音及声调、汉字结构(部件之间的形态关系)、笔画数等。关于汉字基本信息,本手册与其他汉字字典不同的特点有3个:1是提供了汉字频率信息;2是以数字代替了汉字拼音声调符号;3是以“查字部件”取代了传统意义上的“部首”。
“8105字表”给收入表内的每个汉字都编了号,本手册把该编号作为汉字的“ID”号(“身份证号”)来使用。各表不论查询的内容是什么,汉字的编号都紧随其后,以便读者好循号跨表查询。
关于汉字使用频率级别的问题。为了满足汉字教学的需要,首次向读者全面展现了国内有关汉字使用频度的研究成果或官方分类。本手册标识出了每个汉字的使用频度级别,学习者可以有重点地、分步骤地进行汉字学习。
各使用频度级别的汉字范围和认定依据分别是:
1.“A级汉字”——包含500个“基本字”(以下简称“500基本字”)。这是中科院和新华社等单位共同参与完成的《汉字频率统计》筛选出来的。《汉字频率统计》介绍,“这500个‘基本字’达到了人们日常使用率和认读率的77%以上。
不仅如此,从宏观上看,成千上万的汉字基本上都是由这500个‘基本字’所构成的。”
2.“B级汉字”——包含国家汉语水平考试委员会办公室考试中心制定的《汉语水平词汇与汉字等级大纲》的2905个汉字(以下简称“HSK汉字”)中除去归入A级“500基本字”后的2405个字。
3.“C级汉字”——包含2013年6月国务院正式发布的《通用规范汉字表》一级字表3500个汉字除去已归入A、B 级汉字后的595个字。
4.“D级汉字”——包含《通用规范汉字表》中二级字表中的3000字。
5.“E级汉字”——包含《通用规范汉字表》中三级字表中的1605字。
6.“F级汉字”——包含《通用规范汉字表》没有收录但“7000字表”收录了的79个字。
“A级汉字”内细分了5个级别:
A1为“HSK汉字”的“甲级字”;
A2为“HSK汉字”的“乙级字”;
A3为“HSK汉字”的“丙级字”;
A4为“HSK汉字”的“丁级字”;
A5为不属于“HSK汉字”的基本字。
“B级汉字”内细分了4个级别:
B1 表示为“HSK汉字”的“甲级字”;
B2为“HSK汉字”的“乙级字”;
B3为“HSK汉字”的“丙级字”;
B4为“HSK汉字”的“丁级字”。
关于用数字取代声调符号的问题。汉语拼音方案制定于上个世纪50年代。方案的制定者们不可能考虑到计算机输入拼音的需求。60多年后的今天,汉字实现数字化,该方案急需做一些微调,比如,把拼音方案里的声调符号“数字化”。现在使用拼音输入法最大的问题是重码。为了解决这一问题,微软拼音输入法率先开发了“带调输入法”。此方法用数字1、2、3、4、5分别代表阴平、阳平、上声、去声、轻声。独字词带调输入可以使重码率减少到1/4,两字词可以减少重码率到1/16,三字词可以减少重码率到1/64。带调输入是拼音输入法解决重码问题的有效途径。但是,带调输入不能用原始的声调符号,而要用数字代替,也可说是把拼音方案里图形式的声调符号“数字化”,实际操作起来就方便多了。所以本手册把每个汉字的声调符号全部变成了数字,这样既不妨碍学习者对声调的掌握,也方便了拼音输入法辅助码使用者和编码者的学习和工作,也便于汉字声调信息的统计和排序等操作。
关于“查字部件”取代“部首”的问题。部件的概念更能适应汉字数字化和汉字机写的需求。因为部首往往不是
汉字的起始笔画或部件。而汉字机写的形码编码只会从字的起始笔画或部件开始。另一方面,学习者,尤其是初学者,特别是学汉语的外国人,他们对部首常常不在字“首”而感到困惑。他们也对部首、部件、偏旁等多概念搞得糊里糊涂。
本手册的“查字部件”一律是每个字被书写时的起始部件(包括单笔部件或笔画)。一般来说,“查字部件”要么是一个字最上边的部件(如“率”中的“亠”部件),或者是最左边的部件(如“街”中的“彳”部件),或者说左上角的部件(如“疑”中的“匕”部件)。极少数在字的中间,如“丞”中的“了”。为减少查字部件的数量(也可以说是减少记忆量),当单笔部件、基础部件、合成部件同时可作查字部件时,单笔部件优先于基础部件,基础部件又优先于合成部件。
本手册为方便初学者了解独体字的起始笔画,独体字的“查字部件”一般是该字的起始笔画(如“凹”中的“丨”笔画)。在使用英文标准键盘的情况下,任何一种形码汉字输入法都不能让所有独体字成为一级简码。因此,在机写汉字时,对独体字突破了“交重不拆”的原则。为了适应汉字数字化的需求,也为了更有利于保证笔顺正确,本手册在确定独体字的“查字部件”时,也把在独体字中可作部件的笔画组合定为“查字部件”。在传统字典里,“中”、“申”、“串”的部首都是“丨”,但起始笔画是左边的短“丨”还是正中