五笔字型的编码规则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
汉字的五种笔画和五笔字型字根类型
1、汉字的五种笔画
五笔字型把汉字的笔画分为五种,分别为横、竖、撇、捺、折。为了便于记忆,规定它们分别用代码1、2、3、4、5来表示。五笔字型五种笔画与代码对应见下表4-2。
表4-2 五笔字型五种笔画与代码对应表
笔画名称横竖撇捺折
代码 1 2 3 4 5
2、五笔字型的字根类型
汉字是由字根组成的,五笔字型的编码思想就是利用字根来组字,就像堆积木一样。
汉字字根较多,并且较复杂。五笔字型规定了130个字根,所有汉字均是通过这130个字根来进行组合。
学习五笔字型最大的难点就是对这些字根的记忆。为了便于记忆,五笔字型把字根分为四种类型,并对其进行编码。
五笔字型键盘
要达到以字根组字的目的,必须把五笔字型字根编码对应到计算机键盘上。为了便于记忆和操作,根据标准键盘的结构,五笔字型将其分为五个区,每区五个键,共计25个键,来对应于25个五笔字型编码代码。
位于键盘中行左边的"GFDSA"键为一区,分别对应于编码11、12、13、14、15;位于键盘中行右边的"HJKL"和位于下行右边的"M"键为二区,分别对应于编码21、22、23、24、25;位于键盘上行左边的"TREWQ"键为三区,分别对应于编码31、32、33、34、35;位于键盘上行右边的"YUIOP"键为四区,分别对应于编码41、42、43、44、45;位于键盘下行右边的"N"和左边的"BVCX"为五区,分别对应于编码51、52、53、54、55。
键盘字母键与五笔字型编码对应见下图4-6。
主字根汉字的编码规则
主字根汉字也称键名汉字,它是每个键所包含的字根中最主要的一个,或者说,它是每个键的五笔字型中文键名。
主字根汉字的编码规则为:连击四下主字根汉字所在的键。
例如:“王”的编码为 11 11 11 11 (GGGG)
“日”的编码为 22 22 22 22 (JJJJ)
“金”的编码为 35 35 35 35 (QQQQ)
主字根汉字共计25个,25个主字根汉为:金、人、月、白、禾、言、立、水、火、之、工、木、大、土、王、目、日、口、田、纟、又、女、子、已、山。25个主字根汉字与编码键对应见下图4-8。
成字字根的编码规则
在五笔字型键盘上的每一个编码键上,除了主字根外,还有许多其他字根。在这些字根中,有一部分本身就是一个汉字,这些汉字即为字根汉字(也称成字字根汉字)。
字根汉字的编码规则为:
1、键位代码+第一笔代码+第二笔代码+最后一笔代码;
2、如果所输汉字只有二笔,则以空格键结束;
3、如果所输汉字只有一笔,则再打两个24(L)键。
即第一码输入字根汉字的键位代码,键位代表是指字根汉字所处键的代码,因此第一码也称"报户口"。第二码输入字根汉字的第一笔笔画代码,第三码输入字根汉字的第二笔笔画代码,第四码输入字根汉字的最后一笔笔画代码。
笔画代码:横、竖、撇、捺、折五种笔画的笔画代码分别为11、21、31、41、51。
例如:
雨:12 11 21 41 (FGHY)
西:14 11 21 11 (SGHG)
十:12 11 21 (FGH)
八:34 31 41 (WTY)
一:11 11 24 24 (GGLL)
乙:51 51 24 24 (NNLL)
羽:51 51 41 11 (NNYG)
方:41 41 11 51 (YYGN)
一般汉字的编码规则
一般汉字就是除了上述两类汉字之外的所有汉字,这部分汉字也称合体汉字,这是五笔字型需要处理的绝大部分汉字。
为了能正常对这些汉字进行编码,五笔字型同时规定了字根码和识别码。
1、字根码:
五笔字型的每一个字根都位于某一个键上,这个键的编码就是字根码。任何字根,只要位于同一个键上,则它们的字根码都相同。
2、识别码:
一个汉字的识别码就是这个汉字的最后一笔的代码与该汉字的字型结构代码相组合而成。
⑴、汉字的最后一笔代码:
汉字的最后一笔可分为五种笔画,其为横、竖、撇、捺、折,分别用代码1、2、3、4、5来表示。
⑵、汉字的字型结构代码:
五笔字型把汉字分为三种字型结构,即左右结构、上下结构和混合结构,分别用代码1、2和3来表示。
如从汉字的组成明显能分成左右两部分,则这类汉字就为左右结构型。如从汉字的组成明显能分成上下两部分,则这类汉字就为上下结构型。除左右结构和上下结构包括汉字的其余汉字均为混合结构型。
例如:陈、汉、江、语、码为左右结构代码为1
字、笔、定、案、要为上下结构代码为2
虎、运、未、图、包为混合结构代码为3
⑶、汉字的识别码:
汉字识别码=汉字最后一笔代码+汉字字型结构码。
汉字识别码的示例见下表4-6。
表4-6 汉字识别码示例表
例字最后一笔代码字型结构代码识别码
陈捺 4 左右 1 41
识捺 4 左右 1 41
最捺 4 上下 2 42
数捺 4 左右 1 41
字横 1 上下 2 12
案捺 4 上下 2 42
问横 1 混合 3 13
包折 5 混合 3 53
虎折 5 混合 3 53
未捺 4 混合 3 43
回横 1 混合 3 13
一般汉字总的取码原则:
⑴、按书写顺序从左到右、从上到下、从外到内的原则。
例如:
"陈"字取码顺序是"阝"(52)、"七"(15)和"小"(43)。
"字"字取码顺序是"宀"(45)和"子"(52)。
⑵、取大优先的原则。即尽量用笔画较多的五笔字型的基本字根来取码,而不是把其分成更小的单元来取码。
例如:
"页"字取码顺序是"丆"(13)和"贝"(25),而不是"丆"(13)、"冂"(25)和"人"(34)。
⑶、兼顾直观的原则。为了以五笔字型基本字根来取码,有时就不一定按书写顺序来取码。
例如:
"固"字取码顺序是"囗"和"古",而不是"冂"、"古"和"一"。
为了便于理解和记忆,传统的五笔字型把取码原则编成了一首编码口诀,在这里给出该口诀以方便学习理解和记忆:
五笔字型最直观,依照笔顺把码编;
键名汉字打四下,基本字根请照搬;
一二三末取四码,顺序拆分大优先;
不足四码要注意,交叉识别补后边。
4、一般汉字的编码规则为:
(1)、第一字根+第二字根+第三字根+最后一个字根;
(2)、如果不足四个字根,则字根取完后再加该字的识别码;
(3)、如果加识别码后还不足四码,则以空格键结束。