五笔输入法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
五笔输入法
五笔字型汉字输入技术是由著名发明家王永民主持研究开发的,是一种普及面很广泛的电脑通用汉字输入技术,在国内大部分的汉字系统都挂接有五笔字型输入软件。这种方法的主要特点是:用精选的130个字根组字,编码合理,重码少;键盘布局经过精心设计,输入速度甚至超过了英文的输入速度。
一、汉字的五种基本笔画
每个汉字都由基本的字根组成,而字根又是由若干笔画构成的。因此,笔画、字根、整字是汉字结构的三个层次。
1、笔画
按照汉字的书写规则,在汉字的书写过程中,能够不间断地一次写成的线条叫做笔画。根据这个定义,汉字里能称为笔画的线条形状是很复杂的。在汉字中影响汉字笔画形状的因素主要有三点:一是笔画在书写时的运行方向;二是笔画在书写时的长短;三是笔画在书写时的轻重。比如笔画中的“点”与“捺”,就其书写方向而言是一致的,都是从左上到右下,它们的主要区别在于“捺”比“点”长,而
且“点”是先轻后重,而“捺”是先重后轻。在五笔字型方案中,若不考虑笔画的长短和轻重,则基本笔画只有五种。并用代号加以区别。
2、字根
汉字的最基本单位是笔画。但是若把汉字全部分解为笔画输入计算机,则会使编码过于复杂而不利于掌握。在五笔字型输入法里,把一些由若干笔画组成的结构相对不变的部件称之为字根。它是由笔画组成的。我们可以这样认为:先由笔画组成字根,再用字根组合出汉字。经过精心筛选,有五笔字型方案中确定了130个字根。
为把130个字根安排到标准键盘上,先对字根进行分组。首先按字根的首笔笔画把字根分为五个区:首笔是横的作为第一区,首笔是竖的作为第二区,首笔是撇的作为第三区,首笔是捺的作为第四区,首笔是折的作为第五区。每区再分为五个位,共有25位。每一位可以用一个两位数表示,十位数表示区位,个位数表示位号。
字根的分布规律:
规律1、字根的第一笔画决定字所在的区号,第二笔画决定它所在的位号。如“匚”这个字根,它的第一笔画“横”,第二笔画是“折”,于是它所在键的区位号是“15”。
规律2、把一些形状相似的字根放在同一键上。如“大”所在键
的区号13,而“犬”则与之相似,所以“犬”所在键的区号也是13。
规律3、考虑到使用方便,把一些有字源关系的字根放在同一键位上。
如:“氵”的所在键的区位号是43,凡是用“氵”组成的汉字大都与水有关,于是“水”所在键的区位号也是43。
这几条规律,可以用来解释绝大多数字根的分布情况。当然也有一些例外。如区位号为24上的“力”和“车”,这些极少数的字根需要记忆。
二、汉字的结构(根据构成汉字的字根与字根之间的位置关系,可以把汉字分为三种字型,并分别用代号1、2、3表示)
●1.左右型汉字
在左右型汉字中,包括两种情况:
1)在双合字中,两个部分分列左右,整个汉字中有着明显的界线,如:肚、胡、理、胆、咽、拥等。
咽和枫的右边也由两个字根构成,虽然这两个字根之间是外内型关系,但整个汉字却属于左右字型。
2)三合字中,整字的三个部分从左到右并列:或者单独占据一边的一部分与另外的两个部分呈左右排列,如:侧、别、谈等,都应属于左右型。
●2.上下型汉字
上下型汉字也包括两种情况:
1)双合字中,两个部分分列上下,其间有一定距离,如:字、节、看等。
2)三合字中,三个部分上下排列,或者单占一层的部分与另外两部分作上下排列,如:意、想、花等。
●3.杂合型---内外型汉字和单体型汉字
三型指组合成整字的各部分之间没有简单明确的左右上下型关系进。如:团、同、这、半、头等。
汉字的图型特征,是每一个有文化的中国人从上小学起就熟知的。这里,可以用作为识别汉字的一个重要的依据。如:“口”、“八”上下排列为“只”,左右排列即为“叭”等。因此,我们还可以把三种字型叫做字根的三种排列方式。在我们向计算机中输入汉字时,除了键入组成汉字的字根外,有时还有必要告诉机器那些键入的字根是以什么方式排列的,即补充键入一个字型信息。
各型的划分中,还有以下约定:
凡属字根相连(指单笔与字根相连或带点结构)一律视为三型,即杂合型。
凡键面字(本身是单个基本字根),有单独编码方法,不必利用字型信息。
主要对属于散、交、两类字根结合关系,要区分字型。
三、五笔字型单个汉字的输入编码规则
五笔字型将单字主要分为三类:键名字,成字根及键外字。
三类汉字的五笔编码各不相同,输入时请注意。
另外单笔画的成字字根,五笔字型特别规定了五个笔画的编码。
A、键名字根(25个):字根表上每个键上的第一个字根。
输入方法:连击四下所对应的键名
B、成字字根:字根表上除键名字根以外的汉字叫成字字根。
输入方法:报户口,然后按第一、二、末笔画所在的键
末笔取值应注意:
1、凡是带“囗”的汉字末笔一律取被包围部分的末笔。如“国”取“丶”。
2、凡是带“辶”的汉字末笔取里面的一部分末笔。如“连”取“丨”
3、对于“七、刀、九、力、匕、乃”作字根时,一律以“折”为末笔
4、对于“我、戋、万、戈”等作字根时,以“丿”为末笔。
另外笔画的输入方法是:
一:GGLL 丨:HHLL 丿:TTLL 丶:YYLL 乙:NNLL
1、表外字:除键名和成字字根以外的汉字
上述键名字及成字字根中的键面字总共有一百多个。键面字以外的汉字都是键外字,键外字是大量的。我们遵循以下原则将汉字进行拆分成基本字根,再按要求选取合适的基本字根即得到所需的汉字。
◆1、顺序拆分。依照汉字的书写顺序拆分。例如:
新:“立”“木”“斤”正确
新:“立”“斤”“木”错误
◆2、取大优先。它指的是在各种可能的拆法中,保证按书写顺序每次都拆出尽可能大的字根。例如:
果:“日”“木”正确
果:“日”“一”“小”错误
◆3、兼顾直观。前面的取大优先也不是绝对的,为了照顾直观性,在可能的几种拆法中,拆出的字根数越少,越直观。
◆4、能连不交。这名话指的是:如果一个结构可以视为几个基本字根能按连的关系拆分,就不要按相交的关系。例如:
天:“一”“大”正确
天:“二”“人”错误
键外字按以上规则拆分成字根后,在编码选字根时,还要遵循以下原则:
①超过四码:取该字的1、2、3、末字根码。例如:
慧:三丨三心DHDN
续:纟十乙大SFND
②刚好四码:依次全部选取。例:照:日刀口灬。
容:宀八八口PWWK
③不足四码:在字根键入完后由于信息量不够,需要另外加打“末笔字型交叉识别码”,仍不足四码,补空格键。
有些汉字,如:“如、召”只输入它们的字根所对应的键是不能区分的,但这两个汉字的字形不同,因此必须采用字型信息才能区分。以如“洒、汀、沐”等字,只输入它们的字根所对应的键也是不能区分的,又由于这三个字的字型都是一样,故采用字型住处也无法区分,