分析我国公民姓名用字中的生僻字

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分析我国公民姓名用字中的生僻字

摘要:在社会信息化进程不断深入的今天,信息处理过程对文字系统的标准化程度要求日益凸现。为了充分发挥汉字的交际作用,必须实现对其规范化。建国以来公布的通用字表及后来制订的GB信息交换用汉字编码字符集为汉字的规范化提供了标准和依据,但对于人名用字范围却没有做出相应的规定。长期的规范缺失致使这一方面的汉字应用逐渐混乱无序,显著特征之一就是取名频繁使用生僻字。已经制订完成的公安部《姓名登记条例(初稿)》和由国家语委主持制订的《规范汉字表》对人名用字的范围做出了明确划定,施行之后将会逐渐减少取名无序的现象。从列举实际姓名中生僻字用例开始,对此种现象进行了分析并为户籍管理工作人员提出了建议。

关键词:姓名用字;生僻字;规范汉字表;户籍管理

1 中国人姓名中冷僻字的使用情况

中国是一个人口大国,同时也是一个姓氏大国。我国历史上记载过的姓氏共有5652个,其中单音姓氏3438个,双音姓氏2030个,目前使用的大约有2800多个。在这两千多个姓氏中,大姓张、王、李、赵、陈、杨、吴、刘、黄、周姓公民就占全国人口总量的40%。大姓与惯常普遍的人名用字组合便形成重复率极高的姓名形式,一个名为“中国姓氏权威”的博客于2007年公布的《中国重名最多的50个姓名列表》显示“张伟”、“王伟”、“王芳”、“李伟”、“王秀英”居于列表前五位,是当今中国最大众化、最“流行的”名字。该博客称其数据来源是公安部全国公民身份证号码查询服务中心。数据显示全国有“张伟”290607人,“王伟”281568人,二伟数量庞大,甚至超过了冰岛和马尔代夫两国人口数量之和。随着人口的不断增长,社会内部人员信息流动性增强,姓名相同的人在生活诸方面遇到了意想不到的身份证明问题――升学就业,户籍管理,储蓄信贷,社会保障……跟随自己多年的名字居然会带来如此多的烦恼与不便,这在以前是未曾预料的。

“赐子千金不如授子一艺,授子一艺不如赐子好名”,在中国传统文化中,姓名早已超越了本身的符号性,传承着人的情、意、志,蕴含了人的精、气、神。父母授子以好名,将自己对后代的希冀与祝福包蕴在名中,给姓名的同时希望文字中的好运能伴随子女一生。于是为孩子取个寓意好、读音好、字形好的“三好”名字是家长们要考虑的大事。如今孩子越来越多,好名字也层出不穷,无论选什么样的字做名字似乎都会和别人重名。年轻的父母自然不愿意自己的宝宝与别人家的宝宝“撞名”,于是就找到了一种省时省力的办法――求助于“起名公司”,希望能从姓名专家处求得美名。但所谓的“专业人士”并未意识到人之姓名是别人用的多,换言之姓名的本质属性是社会性,应当“在考虑个人使用方便的同时兼顾社会使用方便”(苏培成,2003),许多起名公司夸大了姓名的个性特征,只要不与他人重名,怎样的形式都可以。笔者早些年曾在一家起名公司的宣传手册上了解到这样几条取名方法论,虽不是原文,但经归纳后仍不失要义:一,取两个字以上的名;二,自造复姓(父姓+母姓);三,使用符号、数字及自造汉字(自造的汉字多来源于公司首席周易大师);四,使用不常见的汉字(冷僻字)。在理论指导下,一个个新颖、新奇、奇怪、怪异的名字不断涌现,现举例若干:马啸中原(1990年生),这属于第一类;夏曲佳硕(2003年生)、李冠清华(1999年生)、吴唐亦多(1991年生),这是第二类,自创的复姓;张一A、赵C,属于第三类,由数字、符号或字母构成的名字;李垚辰、李龑,姓名中包含不常用的冷僻字,为第四类。

2005年公安部在全国范围内开始进行第二代居民身份证的换发工作。在此过程中由于

名字中的冷僻字计算机字库中并未完全收入,许多姓名中含有冷僻字的公民无法按时领取证件。就此问题公安部组织全国各级公安机关,收集涉及姓名、地名方面的冷僻字3万多个,将其与北大方正字库已收字相比对,最后确定字库未收入而实际使用的冷僻字4600个。对于新增的4600个字,公安部门联合相关机构对其逐一进行编码、造字并制成新的字符软件,安装到各制证中心。如此一番努力让身份证被暂缓发放的居民最终拿到了自己的身份证明,可其间花费了个人及社会组织、机关单位的大量时间、精力和财力,造成了很多不必要的资源浪费。

2 生僻字及人名用字中的生僻字

2.1 生僻字的概念

即将出台的《规范汉字表》依据社会通用度将汉字分为四级:一级字,约3500字,略相当于原《现代汉语常用字表》;二级字,约4500字,略相当于原《现代汉语通用字表》中除常用字以外的通用字;三级字,约4000字,为除通用字以外的专业用字,包括地名、姓氏、人名、科技等专用字;四级字,约18000字,罕用的古字、方言字等。(《规范汉字表》课题组)。其中的三级字与四级字使用频率远低于前两级用字,在日常语文生活中显得少见,按苏培成的建议,

可将三级字与四级字合并,建立《罕用字表》(苏培成,2004),与通用字使用高、分布广、构词能力强等特点相对,罕用字的使用频率低,学科分布不广泛,构词能力不强,广大民众在日常文化生活和沟通交往中很少使用,与报章杂志,街头巷尾处处可见的常用字相比,这两类字显得

古奥生疏,难于识记。根据周有光先生提出的汉字效用递减律,将汉字按降频排列,在6600号以后的字,不管有多少,它的总覆盖率不超过0.001%,也就是十万分之一。划分生僻字要依据社会用字的实际情况,即字频统计的结果,但通用字和三级、四级字的区分是相对的,无法找到一个绝对的划分界线(苏培成,2004)。根据国家语委和国家教委1988年发布的《现代汉语常用字表》,首先将生僻字的范围界定在2500个常用字和1000个次常用字之外。目前,汉字学称四类字为生僻字:第一类是音义不全的字,字典上有形,但有音无义或有义无音,这些字多半是在字典收字时横向合并或历史传承时整理不彻底及转抄错讹造成的;第二类是指已经被现代楷书取代了的古文字隶定字形或过渡字形;第三类是不通行的异构或异体字;第四类是适

应某一种方言的方音而制造的方言字,例如粤语中的“乜”,武汉方言中曾经使用过的木与六组合而成的新形声字代替“楼”字。

2.2 人名用字中的生僻字带来的不便

自1985年GB2312-80信息交换用汉字编码字符集基本集发布以来,为了适应社会信息交换的数字化进程,我国不断研发颁布了一系列信息用的汉字编码字符集,如:信息交换用汉字

编码字符集的几个辅助集,1993年12月公布的GB13000信息技术用通用八位编码字符

集,2000年3月发布的GB18030-2000信息交换用汉字编码字符集基本集的扩充,最新的扩充集收字27484个,总编码空间超过了150万个码位,为解决人名、地名用字的计算机输入问题提供了方案。尽管汉字字库不断扩充,现实信息处理过程中依然会遇到人名用字中极生僻的字未被收录的情况。例如在南宁一所小学,有个学生的名字是“契”下面的“大”换成“女”,读音是jiē,这个字即使在收字达7万的CJK中日韩统一汉字字符集里也找不到,该字集包含来自中文、韩文、越南文意义相同、形态相近的表意汉字。这样使用频率极低的“死字”硬被送到现代社会生活里来,除了增加使用困难,没有多少实际意义。

3 当前户籍管理中姓名生僻字问题

为了应对我国姓名用字范围不断扩大的趋势,特别是不断“回归”的生僻字,公安部与相关职能部门研发了GB13000新字库,建立辅助字集以及创制生僻字应用

相关文档
最新文档