九笔特征汉字编码的制作技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本技术属于汉字编码,它将汉字拆分成若干个“块”(即“字梁”),并用分类码与识别码分别表示每一个字梁,这样,分类码(为主)和识别码(为辅)就构成了汉字的编码。
技术要求
1、九笔特征汉字编码(下简称九笔特征码)与现有的五
笔字型等多种汉字编码一样,都是将汉字拆分成若干个“块”
(五笔字型称为“字根”,九笔特征码称为“字梁”),然后
按一定的方法将这些“块”进行分类,一般分为26类,并分别
用26个英文字母表示(一般编码方案没有将其定名,九笔特征
码将其定为分类码)。
对于“块”数较多的汉字,这些英文字
母(分类码)就足够组成编码,对于“块”数较少的汉字,不
同的编码方案采用了不同的处理方法。
九笔特征码的特点在于
另将每一个“块”的读音(指拼音)的首字母(无读音的用其
他相关字母)定为识别码(具体内容见下页字梁表),对于单、
双字梁字,识别码是组成编码的后半部分。
2、权利要求1所述的编码方法中,汉字拆分成“块”的
方法(规则),不同的编码方案具有不同的构思,它们一般仅
限于常规拆分,九笔特征码的特点在于在拆分的三原则(书写
原则、直观原则、最小原则)的指导下总结出的三原理(相似
相随原理、交不攀连、连不攀散原理、顺序优先原理)和常规
拆分以外的非常规拆分(对称拆分、嵌入拆分、插入拆分)使
汉字(含繁、简体)的拆分趋于规范、直观、简明、具有唯一
性。
3、权利要求1所述的编码方法中,汉字拆分成“块”的
数目较多,它们的归类,不同的编码方案采用了不同的方法,九笔特征码的特点在于,将字梁按其方向、形状、笔顺的综合特征以及字梁搭配的互补利用原则归为26类,分别用相关的26个英文字母表示,称为分类码(具体内容见下页字梁表)。
(未完,见下页)
四、(一)九笔特征汉字编码字梁表(续)
4、权利要求1所述的编码方法中,识别码还可改为用整
个汉字的读音的首字母。
5、根据权利要求1所述的编码方法,权利要求2所述的
拆分方法,权利要求3所述的分类码,权利要求1所述的识别码,可以:①编制字典、词典或其它书刊目录,用于查字(含繁、简体)。
②利用现有的电脑技术制成汉字(含繁、简体)
输入软件,用于在计算机键盘上对汉字进行输入和文字处理。
说明书
九笔特征汉字编码
本技术属于汉字编码(下简称九笔特征码),以下第一、
二两点较系统地评述了目前汉字编码的技术状况和本技术的目的,第三、四、五、六点是本技术的要点和实现方法,第七点列举了本技术的优越性。
一、目前汉字编码所存在的问题及技术九笔特征码的目的
汉字编码指的是对每个汉字按一定的规则用若干个数字、
字母等进行表示。
例如电报码就是利用四位十进制数表示的,新华字典是按拼音字符编排的,属于拼音编码。
随着“中文电脑化”的日益普及,社会对汉字编码提出了
更高更新的要求,汉字编码不只是用于查字,更主要的是用于在计算机键盘上对汉字进行输入,这就要求汉字编码必须是一种记忆量少、规律性强、操作简便、好学易记的汉字的另一种表示型式。
近十多年来,人们孜孜以求,然而提出的五百余种编码方
案,虽经多次优选,仍然和人们理想中的编码方案相差一段较大的距离。
例如:
拼音码:重码多,输入速度慢,不适于全汉字。
自然双拼码:记忆量大,思维不顺畅(用f、h、u等字母分
别代替en、ang、sh等字母串,是一种思维扭曲,记忆十分别扭,有害正常思维,容易产生疲劳、烦燥),不适于全汉字。
五笔字型:汉字拆分不规范,记忆量太大,末笔字型识别
码造成的不定记忆(例如同样是末笔的一点,要视左右、上下、混和三种字型而分别安排在Y、U、I三个键上)延长了思维时间,造成了思维不顺畅,极难形成快速的反射记忆。
表型码:损害了数字键利益,增大了手动距离,象形特征
利用得不生动,很多并不合乎人们的口味与习惯,基本构字单位大小相差悬殊,无规律。
表音码:利用汉字和汉字部件的读音的首字母作为编码要
素,较好地克服了部分记忆难的问题,但对一些无音部件勉强定音,感觉不太自然,对汉字的拆分尺度把握得不好(例如鼠、鼻、鹿等字,使用频率较低,作为基本单位不拆分,显然是不合适的),不适于全汉字。
以上所列的几种编码,目前具有一定的代表性,他们的缺
点都是显而易见的。
那么人们理想中的编码,应该是怎样的呢?以下列出七点,供参考。
(1)编码符号最好用标准英文键盘上的26个英文字母。
(2)能对全汉字(含繁、简体)进行编码。
(3)不依赖汉字的读音,适合任何人群。
(4)汉字拆分规范、直观、简明。
(5)记忆量小、学习难度低、操作方便。
(6)感觉自然,无别扭记忆。
(7)编码长度短,分布均匀,重码少。
以上七点,正是本技术一九笔特征码全部能解决的问题,
也是本技术的目的。
九笔特征码称得上是一种真正易学好用、便于推广的汉字
编码:无论是专职打字员还是作家、记者、编辑、教师和学生,学习九笔特征码,都会感到轻松愉快、毫不费力。
可以预见,九笔特征码将会加快计算机在我国的应用普及。
二、九笔特征码的研究过程
众所周知,汉字形体构造甚为复杂,有单部件的,有多部
件的,有拼合而成的,有嵌插而成的,有的字只有1笔,有的
字多达30多笔,要把这么复杂的文字用3-4个字母表示,并要
达到人们企盼已久的要求,其难度之大,是可想而知的。
因此,本人在研究汉字编码时,首先并不急于实施某一具体构思,而
是着眼于从总体上进行研究,把握正确的研究方向。
毋庸置疑,汉字的发展,是随着社会的发展而一步一步发
展的,那些与人们生存斗争密不可分最初形成的“第一批”文
字一像形文字,随着岁月的流逝,不断地构成新的文字,形成
复杂的像形。
这个发展过程,连同像形文字本身,就说明了早
期的人们在观察和记载事物时,得益于像形化表示的简单、明了。
虽说这是最初的思维形式,然而却是最受欢迎、最直观、
最易于记忆的表达方式。
今天高度发达的电脑时代,能否再利
用这种像形表达方式对汉字进行编码呢?
利用像形表达方式对汉字进行编码已有过偿试,如表形码
(中国专利,专利号:8510556.7)、全仿形键盘形符汉字编码方
法(中国专利,专利号:88108632.0)、电脑汉字象形编码法及
其键盘(中国专利,申请号:92100557,公告号:1067753)、英
文/东方文字根象形输入法(中国专利,申请号:93103790,公告号:1077548)、一种简易汉字编码方案及其键盘(中国专利,
申请号:94102450,公告号:1092536)。
但它们并不十分受欢迎,为什么?
回顾一下汉字的演变过程,可以说汉字是经历了真正的像
形到大致像形到规范的书写之形,人们观察文字时也已从原来的视物像形对比观察逐渐转移到文字本身的构形(方向、笔顺、形状)观察,汉字再也不是“画”出来的“像形文字”,而是
“写”出来的“规范文字”,这些规范文字,是由许多规范的
固定结构组合而成的,这些固定结构一般都比较简单、紧凑,许多结构的方向性和顺序性对视觉产生较大的影响。
这说明单纯利用视物像形对比方式对汉字进行编码是不够的,必须综合考虑构成汉字的固定结构的方向、笔顺、和形状即综合特征对汉字进行编码才合符人们的习惯
再看一看编码符号,26个英文字母,任意取3个,有17576种
组合型式,任意取4个,有456976种组合型式。
汉字虽然不是26 种基本结构组成的,但近似地把特征相似的结构归为一类,共分为26种类型,则是可以做到的。
而26个英文字母本身,都有其各自的特征,这些特征,又是由简单的1-3笔构成的,这就为其特征覆盖面提供了保证,也就是说,汉字基本结构的26种类型,与26个英文字母形成相关的对应关系是可能的。
因此,关键的问题是,汉字的基本结构,能否按特征相似
关系归类呢?分析汉字基本结构的构字规律,发现相似的结构出现在汉字的不同位置,反过来,正因为出现在不同位置,受构型的影响,才不会完全相同,正因为特征相似不相同,才会有不同的搭配,这样,特征相似的结构,用一个字母表示,这个字母就被充分利用了(称为字梁搭配的互补利用原则)。
也
就是说,汉字的基本结构,按特征相似关系归类,是理想的归类方法。
实际研究过程中,九笔特征码在这方面做得相当成功。
这是九笔特征码好于其他各种编码的第一个关键。
以上从理论上探讨了汉字特征化编码的可能性,那么,前
面提到,有的汉字由1笔组成,有的汉字多达30多笔,按基本
结构来分,有由1-2个基本结构组成的,有由多达7-8个基本结
构组成的。
由1-2个基本结构组成的汉字,用1-2个英文字母表
示,因字多,位置少,必然出现重码。
对此,许多编码方案因
此而废弃了一些基本结构,或采用了其他一些不直观的处理方法,结果造成了整个汉字拆分的不直观。
九笔特征码遵重人们的直观习惯,进一步利用组成这些汉
字的特征相似结构的细微差异,引入分类码与识别码两个概念,有效地解决了这个问题,避免了拆分的不直观,保证了基本结
构的完美、规范。
这是九笔特征码好于其他各种汉字编码的第
二个关键。
以上探讨了汉字编码的研究方向,但在实际研究过程中发
现,各种特征相似的结构的分布是很不均匀的,且“特征”本
身,也存在着一定的过度性,因此,本人在研究过程中,并不
拘泥于局部特征,不先定框框,而是着眼于全局,对各类结构
的分布情况进行统计和分析,依据协调互补的原理进行组合,
然后再统计、再分析、再拆分、再组合,反反复复,最后根据
全局的需要,确定对应的特征相关字母。
这是九笔特征码取得
成功的第三个关键。
总之,九笔特征码取得成功的关键在于正确的研究方向和
循序渐进的研究过程。
另外,之所以称为“九笔”,是因为按特征分类,汉字的笔
画,刚好分为九种类型,并可用相关的英文字母表示,具体如下:三、九笔特征码基本概念
九笔特征码编码方案(下简称九笔特征码)把汉字比作房
子,正如房子是由砖、梁、瓦构成的一样,汉字也是由一些固定结构的“砖、梁、瓦”构造而成的,九笔特征码将构成汉字的“砖、梁、瓦”统称为汉字的“字梁”。
(注意“字梁”是
九笔特征码的概念,与汉字部件、偏旁部首不能完全类同)
由于字梁数目较多,形状各异,为了用26个英文字母表示
特征不同的字梁,九笔特征码将字梁按一定的构形特征和直观效果即方向、形状、笔顺以及字梁搭配的互补利用原则,将其分为26类,分别与相关的26个英文字母相对应,这些相对应的字母,就称为该字梁的分类码,可见,分类码相同的字梁具有相同或相似的直观特征。
为了表示分类码相同的不同字梁,九笔特征码将每个字梁的读音(指拼音)或特征读音的首字母(无特征读音的用1或其他相关字母表示)称为该字梁的识别码,这样,每个字梁都可以用26个英文字母表示了。
例如字梁“人、大、天”的分类码都是“A”,而识别码分别是“R、D、T”,即它们可分别表示为“AR、AD、AT”。
引入分类码和识别码是九笔特征码编码方案取得成功的重
要因素,也是九笔特征码研究者开拓性思维的一个标志,此为其他编码方案所不及。
继续阅读下文,您会感到研究者用心之良苦,考虑问题之周密、细致、全面,实属罕见。
而作为研究者本人,早已把研究质量与规范汉字的拆分、减轻广大用户的学习负担联系起来了。
(来完,见下页)
四、(一)九笔特征汉字编码字梁表(续)
(二)帮您阅读字梁表
1. 26类特征及其对应的分类码的简要说明
“A”类:以“人”字对称为引导特征。
对称之形在人们
的审美观念中处于重要地位,将对称之形收集到一起,顺其自然,合乎人们的习惯。
26个英文字母,不乏对称之形,但“A” 与“人”最相像,记忆十分自然。
“B”类:以“阝”和“尸”为引导特征。
可看
着小写的“b”、“尸”可看成未完成的“B”。
“C”类:以“月”和“耳”为引导特征,因月亮和耳朵
在人们的记忆中常常是个半圆,这样就与“C”联系起来了。
“D”类:以“点横”开头为其特征,而“点”读音(ding)
以“D”开头,另外还可以把“D”看成一个大点,这样,“D”
与“点”就联系起来了。
“E”类:以“山”和“十”为引导特征。
“山”特征性
强,与“E”相似,且不受方向影响;“十”是医院的标志,
与英文字母“E”同音,有助于记忆。
“F”类:以“横下一撇”为引导特征,与“F”有一定的
相似之处。
“G”类:以“横下口”和“口中竖”为特征,英文字母
“G”“中”有“横“有“竖”,可以起一定的暗示记忆作用。
“H”类:以各种型式的“竖型”结构为其特征,与“H”
有直观联系
“I”类:以“两横一竖”为特征,与“I”有直观联系。
“J”类:以“竖钩”为其特征,与“J”有同向协调的直
观联系。
“K”类:以“ ”和“曰”为特征,可看成“K”
的倾斜型,“曰”可通过“笪”字与“K”联系。
“L”类:该类字梁的“竖提、竖弯钩”均较显眼,与“L”
同向协调,“已”、“巳”与手写体相似。
“M”类:以“宀”和“皿”为引导特征,该类字梁都给人
扁平的感觉,在日常生活中,扁平的东西常用以盖物遮灰,正好“M”具有这种意味。
“N”类:以“艹”和“几”为引导特征,将“艹”中的一
横顺时针倾斜,则变成“N”,“几”与“n”相似。
“O”类:以“口”为引导特征,与“O”相似。
“P”类:该类字梁的“横折”与“P”上的“半圆”同向
相似,两类结构彼此较为协调。
“Q”类:以“撇上横”和“口中十”为其特征,“甲”与
“Q”有相似之处,其它的可通过“钾、钿、铀、每”与“Q”
联系。
“R”类:以“木”和“戈”为引导特征,该类字梁的方向
性容易让人想到“R”中的最后一捺。
“S”类:该类字梁以“撇”起笔为特征,可将“S”看成
“撇”的变型。
“T”类:以“亻”和“七”为引导特征,“亻”可看成
“T”上的一横向左倾斜,“七”与“t”相似。
“U”类:以“匚”、“门”、“王”为引导特征,“匚”、
“门”与“U”相似不受方向影响,“王”可通过“闰、匡”与
“U”联系。
“V”类:“两点”的延伸即可形成“V”字母,“疒、豕、
水”上都有“V”的标志。
“W”类:三点水旁的水的英文Water以“W”开头,“也、心、凶、”都有类似于“W”的向上合抱之形。
“X”类:以“女”和“又”为引导特征,它们的交叉或延
伸线交叉特征最容易让人想起“X”的交叉之型。
“Y”类:以“禾、米、小”为引导特征,可以把“Y”中
的一竖向上延伸,然后与该类字梁进行比较。
“Z”类:以“纟、厶、之”为引导特征,它们与“Z”有
协调的同向相似。
以上不可能面面俱到,望读者在阅读时仔细比较和分析,充分发挥自已的想像能力。
2.识别码确定的简要说明
(1)有音字梁,利用该字梁拼音的首字母作为识别码。
例如:
人 ren (R) 大da(D) 弋yi(Y) 于yu(U)
豕 shi (S) 厶si(S) 豸zhi(Z) 雨yu(U)
注意“yu”的“y”不发音
(2)个别有音字梁,利用其特征作为识别码,避免重码。
例如:
工gong(I) 几ji(N)
干gan(G) 九jiu(J)
(3)部首字梁,以部首特征音作为识别码。
例如:
刂立刀旁(D) 冖平宝盖(P)
虎字头(H) 攵反文旁(F)
(4)变型字梁,利用演化原字音作为识别码。
例如:
爿pan(P) 巳si(S) 己ji(J)
丬 (P) (S) (J)
(5)特征字梁,利用特征字音作为识别码。
例如:
北(B) 亥(H) 皮(P)
看(K) 鸟(N) 曹(C)
(6)利用特征形状作为识别码。
例如:
(L) (L) (E)匚(C)
(7)无音无专一特征字的字梁,用“I”作为识别码。
例如:
(I) 春 chun 泰 tai 奉 fan 秦 qin
(I) 先 xian 告 gao
不用相关字音作为识别码,是为了避免不自然的感觉,并可减少记忆。
四码字“I”类字梁较少重叠出现在字首和字尾,“I”以右手中指击键,结束时感觉自然、平稳,易于过度,这是选择“I”的理由。
(8)有些偏旁如“扌”、“亻”,组字较多,识别能力较
差,它们拒绝识别,用表示,个别字梁,也用表示,目
的是避免重码。
例如:
刁(PGTT)
司(PGII)
总之,识别码的确定,最大限度地考虑到了避免混淆、减
少记忆、减少重码等多方面。
3.字梁取舍的简要说明
九笔特征码字梁的取舍是十分讲究的,因限于篇幅,以下
只举几个例子,加以说明。
(1)规律性强、结构紧凑的部件,一般具有较好的直观性,
并有助于记忆,宜全部收为字梁。
例如:
“戋、戈、弋、这九个字梁
都属于“R”类,它们的构型,容易让人想起“R”的捺笔。
虽然它们中有些构字频率较低,但如不收入,记忆量反而会增加,有时记多比记少更容易。
同样的情况还有“U”类的“凵、 、冂、匚、”、“E”类的“山、巾、、彐、
”、“Q”类的“甲、田、由、申、母、毋”等等。
26
类字梁,几乎都有这种类似的情况。
这正是九笔特征码记忆量小的关键之一。
(2)结构紧凑、具有较好的直观性,构字频率虽不高,但
再拆分就不直观的,也收为字梁。
例如:
“S”类的“豸、身”、“Y”类的“不、”、“H”
类的“片,”等。
(3)具有两种特征,不便于归类,但常因出现在字首,构
字频率较高,只好收为字梁。
例如:
“A”类的“贝”、“L”类的“ ”、“M”类的“穴”等。
(4)构字频率不高,但可缩短码长,减少重码,且便于分
类的,亦收为字梁。
例如:
“E”类的“右”、“T”类的等。
总之,字梁表中的每一个字梁,都是经过反复考究后确定
下来的。
决不多收一个字梁,也决不漏收一个字梁是字梁取舍的总原则。
4.九笔特征码字梁搭配的简要说明
前面提过,从26个字母中任意取3个字母,有17576种组合
型式,如何高效地利用这些位置,是需要费一番脑筋的。
九笔特征码字梁的搭配,采用了协调、互补的原则,较好地解决了这个问题。
例如“ 、爫”与“曰、日、”的搭配,前者几乎
全部出现在字首,后者即多半出现在字中、字尾,前者构成的字,高频字较少,后者构成的字,高频字较多,前者构成的字,笔画较多,即四码字多,后者构成的字,笔画较少即相对来说三码字较多,一前一后,一多一少,一高频一低频,数量上合起来恰到好处,无重码形成之忧,这样,将“K”这个字母充分
地用活了(这就是字梁搭配的互补利用原则)。
再例如“M”类字梁的上中下搭配,扁平形状的协调;“P”
类字梁的上中下搭配,方向的协调;“N”类字梁的上下搭配,
竖形结构的协调;“U”类字梁数量上的搭配,“无方向”的协
调等等。
又如“扌、氵、艹”是出现在字首频率较高的三个偏旁,
与它们搭配的,几乎是不出现在字首的字梁;“一”与“虫”
的搭配,由于两者形状不同,出现的位置就不一样,搭配起来,正好互相弥补不足,使字母得到充分利用。
五、九笔特征码的汉字拆分
九笔特征码的汉字拆分,是在遵重人们的直观习惯的基础
上,进行研究整理出来的,它把拆汉字比作拆房子,从上至下、从左至右、从外至内按书写顺序拆分。
现将拆分规律总结如下:
总原则:书写原则、直观原则、最小原则。
“书写原则”就是总体上必须按书写顺序拆分。
“直观原则”就是在拆分时要注意直观、自然。
“最小原则”就是每个汉字拆出的字梁的个数必须最小。
1.拆分规则
为了保证总原则的实施,以下列出拆分规则:
(1)“相似相随”原理
相似相随原理指的是同一方向彼此协调的结构(笔画)不
宜拆散;边缘连接的结构(如“彐、ユ、曰”等)不宜拆散;
双双相似的结构不宜拆散;重心平衡结构不宜拆散。
例如:
匆:勹丶 (对,符合同向协调)勹丿乂 (错)
丑:ユ十 (对,符合边缘连接) 土 (错)
史:口乂 (对,符合重心平衡) (错)
更:一曰乂 (对,符合重心平衡)一 (错)
耕:三井 (对,符合双双相似)丰八井 (错)
州:川 (对,符合双双相似) (错)
(2)“交不攀连、连不攀散”原理
交不攀连指的是相交结构的笔画不得拆散参与相连或离散
笔画组成字梁,连不攀散指的是相连结构的笔画不得拆散参与离散笔画组成字梁。
例如:
矢: 大 (对,符合交不攀连) 人 (错)
失:丿夫 (对,符合交不攀连) 大 (错)
脑:亠凶 (对,符合交不攀连)月凵 (错)
及:丿廴 (对,符合交不攀连)乃 (错)
着:丷目 (对,符合连不攀散) 目 (错)
南:
十冂丷干 (对,符合连不攀散)十冂 十(错)
余:人 (对,符合连不攀散) (错)
“注”这里的相交,指的是顺序性笔画,不包括隔笔相交,
除非合乎最小原则。
例如:
载:十戈车(错,违反了顺序拆分原则) (错)
式:弋(对,符合最小原则)
(3)“顺序优先”原理
顺序优先指的是依据书写顺序,先出现的笔画优先组合成
字梁。
例如:
矢: 大 (对,符合顺序优先)丿天 (错)
合:口 (对,符合顺序优先) (错)
说明:以上三条原理,都是在总原则的指导下总结出来的,在实际拆分过程中发生冲突时,应该是(3)服从(2),(2)服从(1),各项均不得捏造失去平衡、美观的字梁。
例如:
武:二止(对)一(错,失去平衡)
2.拆分举例:
(1)常规拆分(按书写顺序拆分)
数:米女攵良、彐拆:扌斤丶
(2)非常规拆分(按书写顺序拆分不能满足最小原则时,可
按非常规拆分)
①对称拆分:恒:忄二亚:
②嵌入拆分:夹:夫丷屯:七凵
歌:于口口人重:日
③插入拆分:妻:十彐女
说明:按常规拆分能满足最小原则时,则不按非常规拆分。
例如:
束:囊:丨冖口口
六、九笔特征码输入方法
1.单字梁字
先输入分类码,再重叠输入识别码,然后补加空格键。
例如:
“人”的输入码为:ARR “心”的输入码为:WXX
2.双字梁字
先依次输入分类码,再重叠输入首字梁的识别码,如首字
梁属于,即应输入尾字梁的识别码,首尾字梁都是,即以“00”结束。
例如:
“这”的输入码为DZWW “仆”的输入码为THBB
“香”的输入码为YKOO “圭”的输入码为IIOO
3.多字梁字
依次输入第一、二、三和末位字梁的分类码即可。
“轻”拆分:工输入码:EXI
“哗”拆分:口亻十输入码:OTTE
“藏”拆分:艹厂输入码:NFLR
“嗅”拆分:口丿目丶输入码:OSCD
4.词组输入
双字词组,每字取前二码;三字词组,前二字各取一码,
后一字取二码;多字词组,取前三位和末位字各一码。
例如:“人民”ARLR“形势”GNJN“解放军”PIME
“脍炙人口”CPAO “中华人民共和国”GTAO
5.标点符号及特殊字符的输入
九笔特征码打算利用26个英文字母键加键,产生18278 (17576+676+26)个位置,用于输入标点符号和特殊字符。
例如:
?问(W)号输入码为:W
“前(Q)双(S)引号输入码为:QS
另外,日语的平假名、片假名也可采用此输入法。
6.学习键的设置
九笔特征码把?键作为学习用键。
例如:
“健”的编码是TEIX,个别地方不清楚时,可以输入T?IX 或??IX或T??X进行检索。
7.特殊汉字的编码
九笔特征码把无论用什么方式拆分都不直观的字进行了特
殊处理。
例如:
“凸”可看成:拆分成:丨一编码为:HGTT
“凹”可看成:拆分成:凵凵编码为:UUAA
8.繁体字与简体字编码方法一样,但应注意偏旁对应与
字梁对应。
偏旁对应:讠—言饣—飠钅—金衤—示糸—纟
字梁对应:门—門马—馬贝—貝之—辶鱼—魚
车—車吕—
食:彐AER 读:讠大LIVA
饍:飠丷丷口LVUO 讀言士罒貝LIMA
9.重码字的处理
九笔特征码码长短是其优点之一,正因为码长短,出现少
量重码(占3.5%)是难免的,我们不能因为这3.5%的重码而为其他每个字再加上一识别码,因此只对重码字再设置补充码。
该:讠人 LDA LDAH(补)(方法:补加第一个识别码)。