《最新五笔字型速成培训教程》第5章:汉字的编码规则与输入

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5.4.1 汉字的拆分原则
2. 取大优先 对一个汉字在按书写顺序进行拆分时,不能无限制地将其拆分,结果都变成了单笔画,这
显然是不行的。我们的目的是要将一个汉字拆分成一个个字根,且是尽可能笔画多的字根, 要达到再添一个笔画就不能构成一个字根的限度。下面举例说明: “世”字的第1种拆分方法:一、凵、乙;第2种拆分方法:廿、乙。 第1种拆分方法显然是错误的,因为第2个字根“凵”完全可以并到前一个字根上,构成 一个更多笔画的字根“廿”。再如: “革”字的第1种拆分方法:廿、口、十;第2种拆分方法:廿、µ 。 同样,第1种拆分方法是错误的,因为第2个字根“口”和第3个字根“十”可以合并成一 个更大的字根“µ ”。 3. 兼顾直观 汉字在拆分时,为了考虑汉字字根的完整性,有时可以不遵循“书写顺序”和“取大优先” 的原则,形成一些例外的拆分方法。 如“国”字按照书写顺序应拆分成“冂、王、丶、一”,但这种拆分方法既违背了该字的 字源,也影响了该字的直观性。所以,将它拆分为“囗、王、丶”。 再如,“自”字按照取大优先应拆分成“亻、冂、三”,但这种拆分方法同样违背了字源, 影响了该字的直观性。所以,将它拆分为“丿,目”。
若汉字的字根超过4码,则用第一、二、三、末4个字根组成编码。如
“戆”字可拆分为“立(42 U)、早(22 J)、夂(31 T)、贝(25 M)、
心(51 N)”5个字根,取其第一、二、三、末共4个字根,即“立(42
U)、早(22 J)、夂(31 T)、
心(51 N)”;
若汉字的字根刚好是4码,则取其4码即可。如“潮”字可拆分为“氵 (43 I)、十(12 F)、早(22 J)、月(33 E)”正好4个字根,就取其4 个字根;
三及最末一个字根,即彳(T)、山(M)、一(G)和攵(T)。 单体字拆分,取大优先。 例:“末”应拆成二、小而不能拆成一、木。 字根数不满4个时,再取末笔字型交叉识别码。 例:“村”由木(S)、寸(F)两个字根组成,其信息量不够,需加末笔交叉识别码51(Y)。
5.1 汉字编码的一般原则
一个汉字要输入到计算机中,首先应该先把这个汉字拆分,拆分成几个 字根,如将“修”字拆分成“亻、丨、夂、彡”,将“照”字拆分成 “日、刀、口、灬”,拆分时必须以基本字根为单位,按取大优先的原 则,且在拆分字时,尽可能拆分出笔画最多的字根,拆分出的字根数量 要尽量少。在可能的多种拆分中,以拆分出字根数量少的那种为优先。 拆分好后,即可由键盘输入字母(即键码),如从键盘上输入“WHTE” 就输入了“修”字。
5. 能散不连
笔画与字根之间,字根与字根之间的关系,可以是“散”的关系,“连”的关系和“交” 的关系。如,“明”的字根“日、月”之间是“散”的关系,“自”的字根“丿、目”之 间是“连”的关系,“末”的字根“一、木”之间是“交”的关系。
汉字的字型取决于字根与字根之间的关系。根据字根的关系,字型可以分为左右型、上下 型和杂合型。如,“占”可拆分成“卜、口”两个字根,若按照连的原则,则可将其视为 杂合型,若按照散的原则,则可将其归为上下型。“严”可拆分为“一、、厂”3个字根, 若按照连的原则,则可将其视为杂合型,若按照散的原则,则可将其归为上下型。像这种 模棱两可的情形,规定,一律按“能散不连”来判别(不包含单笔画),所以,“占”和 “严”两字都视为上下型。
第5章 汉字的编码规则与输入
5.1 汉字编码的一般原则 5.2 键名字根的编码规则与输入 5.3 成字字根的编码规则与输入 5.4 合体字的编码规则与输入 5.5 不易拆分汉字的拆分 5.6 上机实战——在写字板中练习单字输入 5.7 综合训练与自我检测
5.1 汉字编码的一般原则
在输入文字之前,先介绍汉字的编码原则。五笔字型汉字输入法是一种拼形输入法,当看 到一个汉字时,很快地就能根据汉字的各部分字根写出一个汉字编码,如,“树”字的编 码为木(S)、又(C)和寸(F),再如,“会”字的编码为人(W)、二(F)和厶(C)。由此可以 看出,汉字的编码规则首先是根据书写汉字的原则制定出来的,其次,这些规则还必须遵 循一定的原则,这些原则是:
在汉字五笔字型输入法中,根据汉字的结构特点、使用频率和字根结构, 把汉字分为键面字(包括键名字根和成字字根)和键外字(又称为合体字), 其编码方案有所不同。
5.2 键名字根的编码规则与输

五笔字型编码方案中,利用标准键盘上的A~Y共二十五个 键上的每一个键位,设置一个中文键名字,即各个键上的第 1个字根,也就是“助记口诀”中开头的字根,称之为键名 字根,简称为“键名字”。其特征是组字频度较高,而形体 上又有一定代表性的字根;除X键位的“纟”以外,它们本 身就是一个汉字。键名汉字的位置如图5.1所示。要输入这 个作为键名的汉字编码规则是:在所在的键上连续击键4下。
1. 书写顺序 汉字的分解要遵从的顺序是先左后右,先上后下,先横后竖,先撇后捺,
先内后外,先中间后两边等。 合体字拆分字根,也要遵从这一书写顺序,下面举例说明: “剥”字拆分成“彐、水、刂”是正确的,若拆分成“彐、刂、水”是
错误的。 “申”字拆分成“日、丨”是正确的,若拆分成“丨、日”是错误的。 “囡”字拆分成“囗、女”是正确的,若拆分成“女、囗”是错误的。
5.4.1 汉字的拆分原则
4. 能连不交
请看下面几个例子:
“天”拆分成“一、大”(两者是相连的)是正确的,若拆分成“二、人”(两者是相交的) 是错误的。
“于”拆分成“一、十”(两者是相连的)是正确的,若拆分成“ 二、丨”(两者是相交 的)是错误的。
是错误的。
(两者是相连的)是正确的,若拆分成“ 、丨”(两者是相交的)
若汉字的字根不足4码,则先打完字根码,再补加一个末笔字型交叉识 别码。如“扯”字可拆分为“扌(32 R)、止(21 H)”2个字根,就先 取这两个字根码,再追加一个末笔字型识别码(11 G)。关于识别码的内 容,详见5.4.2节。
5.4.1 汉字的拆分原则
汉字要拆分成一个个字根,并且依次在键盘上敲击其相应的键码,最终 录入一个汉字。这对于刚开始学习五笔字型输入法的人来说,不是一件 很容易的事,往往会出现不知从何处下手的情形。拆分时,如果一个汉 字不按正确的书写顺序来拆分,或者将其无限制地拆分,都是不行的, 且拆分的同时还要碰到一些特殊情况。汉字的拆分必须遵循一定的原则, 主要有5点:书写顺序、取大优先、兼顾直观、能连不交、能散不连。
1. 末笔画的一些说明
关于末笔画有如下规定,这些规定可以使对识别码的取码变得简单、明确;
末字根为“力、刀、九、匕”时,一律将其认为是折。如:
男:田、力; 分:八、刀;
仇:人、九;
化:人、匕
以上4字的末笔画为“乙”。
“运、远、进”等字,不以“走之”的末笔为末笔画,约定以去掉“走之”后的整个字的 末笔作为末笔画来构造识别码。辅助说明一点,这里不将“走之”的末笔作为末笔画,主 要是因为,带“走之”的汉字实在太多,如果都作考虑,那好多字的识别码都是一样的, 减少了许多识别码的信息量。
5.3 成字字根的编码规则与输 入
5.3 成字字根的编码规则与输 入
5.3 成字字根的编码规则与输 入
5.4 合体字的编码规则与输入
5.4.1 汉字的拆分原则 5.4.2 如何使用识别码 5.4.3 五笔字型汉字编码流程
5.4 合体字的编码规则与输入
除了键名字根汉字和成字字根汉字以外的汉字统称为合体字或者键外字, 而汉字的输入法编码主要是针对这些合体字的。与键名字的编码不同, 合体字以字根来编码,而不是以单笔画来编码,下面具体介绍其编码方 式。
“团、图、国”等字,不以“囗”的末笔为末笔画,约定以去掉“囗”后的整个字的末笔 作为末笔画来构造识别码。
“我、戋、成、戈”等字的末笔画为“丿”。
5.4.2 如何使用识别码
5.4.2 如何使用识别码
2. 关于字型的说明 关于字型有如下规定: 凡单笔画与字根相连或带点结构都视为杂合型。单笔画与字根相连的汉字,如,“自、产、
按书写顺序从左到右,从上到下,从外到内取码。 例:“树”的取码顺序为木(S)、又(C)、寸(F)。 以基本字根为单位取码。 例:“社”的取码为、丶、土,而不是礻、土,因为礻不是基本字根。 按一、二、三、末4个字根,最多只取4码; 例:“徽”由彳(T)、山(M)、一(G)、幺(X)、小(I)和攵(T)6个字根组成,只取第一、二、
表5.1所示为25个键名字根的编码和输入方法。
5.2 键名字根的编码规则与输 入
5.2 键名字根的编码规则与输 入
5.2 键名字根的编码规则与输 入
5.2 键名字根的编码规则与输 入
5.3 成字字根的编码规则与输 入
在五笔字型字根键盘的每个键面字中,除了一个键名字根以外,还有数量不等的一些其它 字根,我们把这部分字根称之为成字字根。成字字根中的一部分字根其本身也是一个汉字, 例如五、用、石等,也有一些包括在国标字符集中被视为汉字的字根,例如“氵、亻、勹、 刂”等。成字字根大约有100个,如表5.2所示。
5.4.2 如何使用识别码
输入一个不足4码的合体字时,依次键入该汉字的字根码后,最后补加一个识别码(末笔字 型识别码),若补加识别码后仍不足4码,则敲击空格键。识别码实际包含有两部分信息, 即“末笔”和“字型”,因此,可以将识别码规定为由两位数组成,十位数为末笔画代码 编号(横1、竖2、撇3、捺4、折5),个位数是字型代码编号(左右型1、上下型2、杂合型 3)。表5.4所示为末笔字型交叉识别码。
成字字根的编码规则与输入方法如下: 键名代码+首笔代码+次笔代码+末笔代码 具体地说,就是先打一下该字所在的键(通俗地称之为“报户口”),接着依次打该字的第
一单笔画,第二单笔画,以及该字的最后一个单笔画;若字根总数不足4码,则只需再加 打一个空格键即可(但成字字根不用加识别码)。下面举例说明成字字根的输入方法,如表 5.3所示。 特别地,在王码五笔字型输入法中,存在这样几个单笔画,即“一、丨、丿、、乙”,若 按照成字字根的输入法的规定,打入所在的键后,再打一下单笔画所在的键即可,结果造 成了它们的编码只有2码,汉字成千上万,如果让这5个不常用的“汉字”占用2码,那岂 不是可惜,于是想出一个更好的方法,将这5个单笔画享用的2码让位给其他一些更常用 的汉字,而人为地在这两个正常码之后再加两个L,加L是因为L键除了用于方便操作外, 作为竖笔画结尾的单体型字识别键码,是极不常用的;而要加两个L而不是一个L是为了 避免引起重码的现象。这5种单笔画的编码为:
人、主、且、千、不、尺”等字,它们是杂合型。在末笔代码中,它们的字型代码是3。 而“矢、卡、严”等字是字根(不是单笔画)与字根相连,它们是上下型,在末笔代码中, 它们的字型代码是2。另外,单笔画与字根之间有明显间距的汉字,如,“个、少、鱼、 孔、旧、幻、旦”等字,不认为是相连的,因此,它们不属于杂合型。 带点结构在五笔字型中也规定为相连。如,“勺、术、太、主、义、头、斗“等字,它们 是杂合型,字型代码为3。 字型区分时,用能散不连的原则。 内外型字属于杂合型。内外型字即全包围或半包围的字,如“囡、图、困”等字都是杂合 型。“世、刁、叵”等字也都是杂合型,但“见”字比较特殊,它是上下型。 含两字根且相交者属杂合型。“里、电、无、东、本、农”等字是杂合型。 下含“走之”字为杂合型,如,“过、运、进、逞”等字是杂合型。 以下字为杂合型,如“司、床、厅、龙、尼、式、后、反、处、办、皮、习、死、疗、 压”。而相似的下列字则是上下型,如“左、右、有、看、布、包、友、冬、灰”等。
第5章 汉字的编码规则与输入
(时间:2次课,4学时)
/webnew/
第5章 汉字的编码规则与输入
教学提示:在了解了五笔字型编码基础、字根在键盘上 的布局和分区拆字的一些基础知识
ห้องสมุดไป่ตู้ 教学目标:本章介绍汉字编码的一般原则、键名字根的 编码规则与输入、成字字根的编码规则与输入、合体字 的编码规则与输入以及不易拆分汉字的拆分方法,让用 户掌握如何真正在计算机中输入汉字。
相关文档
最新文档