汉语拼音:读、学、写性能兼优,携手汉语信步世界

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

汉语拼音:读、学、写性能兼优,携手汉语信步世界
本文提出的汉字拼音,含两级矢量编码,含两级高频简化,是一种读、学、写性能兼优的汉字形式。

标签:汉字拼音形声化拼音化高频简化
本篇提出的汉字拼音,可为那些既想了解中国,却又不愿承受学习汉字之苦的外国人,包括华裔后代等,提供一种学习时间成本十分低廉的汉字形式。

以国外的华裔儿童为例,如果学习汉字拼音,应该做到,要不了一年,就能把会说的汉语写出来。

外国人学会了汉字拼音,除了与我们口语交谈之外,还可在网上与我们交流文字信息。

此时,对各方计算机的要求是,己方屏幕上看到的,是己方输入的汉字信息,传与对方的,是计算机平行给出的,字数对等,音义对等,唯汉字形式不同的另版信息。

笔者相信,只要数据准确,措施得当,汉字拼音的优良性能是可以“订制”的。

以下是笔者的几个主要设想。

一、形声化,拼音化
形声化是单字内的第一级矢量编码。

(单字,即汉字拼音中的一个字,是临时称谓)
效益:形声化的效益表现在两个方面。

一方面,形声化可为音节补足信息量,把含义不清的音节升级,变为字义清晰,形音义具备的单字。

另一方面,在已知单音节汉语名称的基础上,形声化能够把数千个单字的学习,减少为400多个声旁,和少量形旁的学习。

拼音化是单字内的第二级矢量编码。

效益:在学会了汉语音节及拼音技能的基础上,拼音化能够把400多个声旁,和少量形旁的学习,进一步减少为30多个声韵母的学习。

声旁的拼音化是容易实现的,汉语拼音和注音字母中的音节,都是汉字音节成分的拼音化,而且形(书面音节)音之间均是一一对应的。

形旁的拼音化也是容易实现的,因为大类事物往往有多个名称。

如“niɑo (鸟)、qin(禽)”,“shu(树)、mu(木)”等。

根据需要,取其一二,用拼写声旁的声韵母拼写这些名称,就可一并完成声
旁和形旁两种部件的拼音化改造工作。

汉字拼音依靠单字内的两级矢量编码,既可再现现有汉字形音义具备的优良性能,又可彻底摆脱现有汉字学习难的缺点。

【一个比较】
与英文相比,汉字拼音是更加容易学习的拼音文字。

理由是,由于历史等原因,英文中形音之间有大量的多一对应,即同一字母组合(形),因单词的不同会有多种读音。

反之,同一读音,又因单词的不同会有多种字母组合。

这种多一对应会大量增加单词的补充记忆。

二、两级高频简化
高频简化参考的是信息论中介绍的几种编码法[1] (日藤田広一,1982年,页55—59),这些编码法的高频码简短些,低频码冗长些,可在实际使用过程中,有效减少编码的平均码长。

第一级高频简化,在频率最高的1000个单字范围内,每个音节选出频率最高的一个单字作为简化单字,规定该单字只留声旁,简去形旁。

依据《汉字信息字典》中的频率数据[2](上海交通大学汉字编码组等,1988年,页729—989),选出的简化单字317个,合计频率达53.3%。

效益:书写或打字时,可省去过半的形旁。

代价:317个简化单字是需要专门记忆的。

好在数量少,只有317个,容易记住。

另外,某个音节中,哪个单字最常用,人们多少有些模糊印象。

这对于记忆该音节中,哪个单字是简化单字,多少有些帮助。

第二级高频简化,高频声韵母简单些,低频声韵母复杂些,可提高书写速度。

——在汉字拼音中,每个声母、介母、韵母,均是一个字母。

三、左形右声,上声下韵
左形右声,指的是单字的组合,即左形旁,右声旁,且形旁窄一些,仿照的是现有汉字的一种构字倾向。

依笔者观察,现有汉字中的同一部件,有“在左小,在右大”的倾向,如“朋、林、部、陪、加、叻”等。

而在左右排列的形声字中,确有更多的是把数量多、信息量大的声旁放在了右侧。

上声下韵,指的是声旁的组合,即上声母,下韵母。

上下排列是巨大的位置
差异,这对阅读有利。

即便与单个注音字母或拉丁字母相比,上下排列仍允许声韵母有大幅简化,这对书写有利。

关于声韵母,详略。

四、形旁之下,调号填空
作为矢量码的两个分量,声旁的取值范围为400多个音节,形旁如果不用韵母,其取值范围为20多个声母。

此时声旁、形旁的信息量之和,估计与现有汉字的信息量大体相当(这一数据是可以统计和计算验证的)。

如上所说,右侧的声旁是上声母,下韵母。

左侧的形旁如果只有上声母,而下空缺,则左右失衡。

若以调号填补这一空缺,既可左右平衡,又可辅助声调的学习。

——声调是外国人学汉语的另一难点。

印刷品、屏幕上的调号,不是输进去的,而是输入了声旁和形旁之后,有了充足的信息量,由电脑自动加上去的。

手写时,加不加调号任便。

现代的“写”,多是机写,也就是计算机输入。

在键盘上,输入声旁在先,以声韵并击为宜,输入形旁在后,单击声母即可。

由于信息量充足,无需选字,不看键盘,不看屏幕,将有很快的输入速度。

【频率范围的界定】
具备上述书面形体的形声单字,加上简化单字,二者合计三千多,与知识界人均会写的现有汉字的频率范围大体相当。

至于其余的冷僻字,根据高频简化、低频繁化的原理,允许增加一些复杂程度。

由于这部分单字的频率极低,对打字速度,书写速度的负面影响甚微。

结语
汉字拼音能够继承汉字合成词的高比例,加之单字的形声化,拼音化,汉字拼音作为一个文字系统,便有了三级高质量的矢量编码。

与英文过多的多音节单纯词相比(见笔者之前的文章),与英文形音之间过多的多一对应相比,汉字拼音是更加容易学習的拼音文字。

汉字拼音的读、学、写性能兼优,汉语走向世界便会一路顺风。

参考文献
[1] (日)藤田広一.基础信息论[M].魏鸿骏等译.北京:国防工业出版社,1982.
[2]上海交通大学汉字编码组,上海汉语拼音文字研究组编著.汉字信息字典
[Z],北京:科学出版社,1988.
作者简介:高其海,男,山东青岛人,1946年生。

所学专业:工业企业电气化自动化专业。

相关文档
最新文档