一般汉字的编码规则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般汉字的编码规则
一般汉字就是除了上述两类汉字之外的所有汉字,这部分汉字也称合体汉字,这是五笔字型需要处理的绝大部分汉字。
为了能正常对这些汉字进行编码,五笔字型同时规定了字根码和识别码。
1、字根码:
五笔字型的每一个字根都位于某一个键上,这个键的编码就是字根码。任何字根,只要位于同一个键上,则它们的字根码都相同。
2、识别码:
一个汉字的识别码就是这个汉字的最后一笔的代码与
该汉字的字型结构代码相组合而成。
⑴、汉字的最后一笔代码:
汉字的最后一笔可分为五种笔画,其为横、竖、撇、捺、折,分别用代码1、2、3、4、5来表示。
⑵、汉字的字型结构代码:
五笔字型把汉字分为三种字型结构,即左右结构、上下结构和混合结构,分别用代码1、2和3来表示。
如从汉字的组成明显能分成左右两部分,则这类汉字就为左右结构型。如从汉字的组成明显能分成上下两部分,则这类汉字就为上下结构型。除左右结构和上下结构包括汉字
的其余汉字均为混合结构型。
例如:陈、汉、江、语、码为左右结构代码为1
字、笔、定、案、要为上下结构代码为2
虎、运、未、图、包为混合结构代码为3
⑶、汉字的识别码:
汉字识别码=汉字最后一笔代码+汉字字型结构码。
汉字识别码的示例见下表4-6。
表4-6 汉字识别码示例表
例字最后一笔代码字型结构代码识别码
陈捺 4 左右 1 41
识捺 4 左右 1 41
最捺 4 上下 2 42
数捺 4 左右 1 41
字横 1 上下 2 12
案捺 4 上下 2 42
问横 1 混合 3 13
包折 5 混合 3 53
虎折 5 混合 3 53
未捺 4 混合 3 43
回横 1 混合 3 13
3、一般汉字总的取码原则:
⑴、按书写顺序从左到右、从上到下、从外到内的原则。
例如:
"陈"字取码顺序是"阝"(52)、"七"(15)和"小"(43)。
"字"字取码顺序是"宀"(45)和"子"(52)。
⑵、取大优先的原则。即尽量用笔画较多的五笔字型的基本字根来取码,而不是把其分成更小的单元来取码。
例如:
"页"字取码顺序是"丆"(13)和"贝"(25),而不是"丆"(13)、"冂"(25)和"人"(34)。
⑶、兼顾直观的原则。为了以五笔字型基本字根来取码,有时就不一定按书写顺序来取码。
例如:
"固"字取码顺序是"囗"和"古",而不是"冂"、"古"和"一"。
为了便于理解和记忆,传统的五笔字型把取码原则编成了一首编码口诀,在这里给出该口诀以方便学习理解和记忆:
五笔字型最直观,依照笔顺把码编;
键名汉字打四下,基本字根请照搬;
一二三末取四码,顺序拆分大优先;
不足四码要注意,交叉识别补后边。
4、一般汉字的编码规则为:
(1)、第一字根+第二字根+第三字根+最后一个字根;
(2)、如果不足四个字根,则字根取完后再加该字的识别码;
(3)、如果加识别码后还不足四码,则以空格键结束。
表4-7给出了达到四字根及以上汉字编码示例。
表4-8给出了三字根汉字编码示例。
表4-9给出了二字根汉字编码示例。
表4-7 达到四字根及以上汉字编码示例表例字第一字根编码第二字根编码第三字根编码
最后字根编码键码
智31 13 23
22 TDKJ
键35 53 12
45 QVFP
握32 51 11
12 RNGF
编55 41 51
15 XYNA
搬32 31 33
54 RTEC
围24 12 51
21 LFNH
歌14 23 14
34 SKSW
照22 53 23
44 JVKO
表4-8 三字根汉字编码示例表
例字第一字根编码第二字根编码第三字根编码识别码键码
等31 12 12
42 TFFU
保34 23 14
41 WKSY
定45 11 21
42 PGHU
顺23 13 25
41 KDMY
虎21 15 25
53 HAMV
别23 24 22
21 KLJH
那53 12 52
21 VFBH
炮44 35 51
51 OQNN
表4-9 二字根汉字编码示例表
例字第一字根编码第二字根编码识别码键码
汉43 54 41 ICY
字45 52 12 PBF
伐34 15 31 WAT
位34 42 11 WUG
包35 51 53 QNV
回24 23 13 LKD
冈25 35 43 MQI
汇43 15 51 IAN
注:由于二字根汉字编码不足四码,因此最后必须以空格键结束。