五笔字型编码基础
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
五笔字型编码基础
1.汉字的五种笔画
一个笔画就是在书写汉字时,不间断地一次连续写成的一个线条。在五笔字型中,通过对大量汉字的分析,只考虑笔画的运笔方向,而不管其轻重长短,将汉字笔画公为五种,即横、竖、撇、捺、折,代码分别为1、2、3、4、5。
汉字的其它笔画按其运笔方向并入以上五区。
①竖代左钩的笔画并入竖:如丁、小中的竖钩都作为竖。
②提笔因是由左向右视为横:如地、扣、刁的提笔都作横。
③点视为捺:如六、立、注、兴中的点都和捺一样看待。
④竖笔向右钩和其它只要代拐笔画均为折:如氏、匕、以中的折笔。
五笔字型把那些组字能力强、使用频率高的字根作为基本字根,共选出了130个。这130个字根中,有些是汉语词典中传统的偏旁部首,有些是根据五笔型编码的需要硬性规定的。另外,五种单笔画横、竖、撇、点、捺也是作为基本字根来看待的。
2.五笔字型字根键位
五笔字型根据字根首笔画的类型,同时又考虑到键位设计的需要,将130个字根分为五大类,安排在键盘的五区中。这五个区在键盘中部三排25个键上,每区五个键,每个键称为位,位号由中间向两边排列。这样,每个键都对应一个区位号,如1区的5个键gfdsa 其位号分别为1、2、3、4、5,把每个键的区号和位号合起来,其区位号分别为11、12、13、14、15;第2区hjklm其对应区位号分别为21、22、23、24、25;第3区trewq区位号为31、32、33、34、35;第4区yuiop区位号为41、42、43、44、45;第5区nbvcx 区号为51、52、53、54、55。
五笔字型字根在键盘上的分布大部分按以下原则:
①按第一笔的笔画分区:
根据前面所说的五种笔画的代码,按字根第一笔的代码确定该字根在那一区。也就是说把按首笔是横、竖、撇、捺、折的分别分到12345区。
②第二笔的笔画定位:
按第二笔笔画代码号安排该字根在几号位。如“王”字,第一笔为横,可知区代码为1,第二笔仍为横,位码也是1,于是,安排在11键上;如“土”字,首笔为横,第二笔为竖,区码1,位码2,就在12键上;如“七”字,首笔为横,第二笔为折,就在15键上;如“之”字,首笔点,第二笔折,在45键上。
③按笔划数定位号:
如横笔一横、二横、三横,分别在11、12、13键;一竖、二竖、三竖、四竖分别在21、22、23、24键;一撇、二撇、三撇分别在31、32、33键;一点、二点、三点、四点分别在41、42、43、44键;一折、二折、三折分别在51、52、53键。
④按以上规则分配,有些位上分配字根较少的,将字根分布过于集中的键上的字根调剂进去。如汉字书写笔画中没有首笔为横或竖,第二笔为捺的字根,于是在14和24键上分别安排了…木、丁、西‟和…田、甲、车‟,这都是从其它键位调剂过来的。
⑤按汉字传统偏旁部首有相应关系的,虽笔画走向不同,为便于记忆,也安排在一起,如水、耳等。
总之,五笔字型的键位排列,既考虑了各个键的使用频率,又做到了使字根代号从键盘中央向两侧依大小顺序排列。这样便于记忆键位,提高击键效率。
五笔字形字根表
一看这个表,唉呀!这么多东西就是不好记。不过你看,下面有个助记口诀,念着挺顺口的。
第一区G、F、D、S、A五个键:
王旁青头戋五一,土士二干十寸雨,大犬三羊古石厂,木丁西,工戈草头右框七。
第二区H、J、K、L、M五个键:
目具上止卜虎皮,日早两竖与虫依,口与川、字根稀,田甲方框四车力,山由贝、下框几。
第三区T、R、E、W、Q五个键:
禾竹一撇双人立、反文条头共三一,白手看头三二斤,月衫乃用家衣底,人和八、三四里,金勺缺点无尾鱼、犬旁留叉儿一点夕、氏无七。
第四区Y、U、I、O、P五个键:
言文方广在四一、高头一捺谁人去,立辛两点六门病,水旁兴头小倒立,火业头、四点米,之宝盖、摘示衣。
第五区N、B、V、C、X五个键盘:
已半巳满不出己、左框折尸心和羽,子耳了也框向上,女刀九臼山朝西,又巴马、丢矢矣,慈母无心弓和匕、幼无力。
五笔字型编码规则
1.键名汉字的编码
五笔字型规定每个键上的第一个字,也就是助记口诀中每个区位中的第一个字为键名,除了五区第五位的X键以外,每个键名都是一个完整的汉字。要输入键名字,在该键上连击四次就可以了。如输入“金”字,按“Q”键四次。
2.成字字根的编码
在五笔字型130多个字根中,除了键名字以外,一部分字根也是汉字,这样的字称为成字字根,如“五、戋、寸、雨、石、古、西、丁、七、止、卜、早、虫、车、力、由、贝、几、竹、手、斤、乃、用、八、儿、广、辛、六、门、小、米、己、巳、尸、心、羽、耳、也、臼、弓、匕”等。成字字根的编码规则为:
键名码+第一笔码+第二笔码+末笔码
当键名字只有两笔时,按了第二笔码后补空格。
如“西”字在S键上,先击S键(键名码)又称报户口,就是先报出“西”字所在的键位,然后再按书写顺序打第一笔一横(G),再打第二笔一竖(H),最后一笔一横(G),这“西”字的编码就是SGHG。注意:凡是成字字根就不能再拆成其它字根,报了户口以后,只能一笔画一笔画的打。
3.拆码原则
除以上介绍键名字、成字字根和一级简码字以外,其余的汉字在向计算机输入时都要把它拆成字根。
⑴依照笔顺
取码顺序依照从左到右,从上到下,从内到外这种传统的汉字书写顺序来拆分。但也有少数汉字,为了“兼顾直观”,没有按书写顺序,如:乘:禾、丬、匕,(TUX)酉:西、一,(SGD)
⑵每字四码
一个汉字拆分的字根数如果是四个或大于四个,那就取第一、第二、第三和最末一码。超过四码的,中间的笔画就不用管它了。都。
⑶取大优先
取大优先就是能大不小,也就是每次尽可能拆出笔画最多的字根,使拆出来的字根个数最少。
⑷能散不连
“散”是指基本字根的笔画之间可以有一定距离。
“连”基本字根笔画间无距离的结构,这种结构一般有以下两种:一是单笔画与基本字根相连。另一种是带点结构的汉字视为相连。
如“亥”,拆分为“亠レ丿人”,因为一撇与“人”字之间有距离,是散,若拆成两撇与一捺则为连,所以后者错误。
带点结构的字,孤立的点不管与基本字根有无距离均视为相连。如:勺、术、太、义、头、斗。
⑸能连不交
两个或多个基本字根交叉嵌套组成的汉字称为“交”。拆分汉字时,能拆成相连结构的就不要拆成相交的。如“天”字,视作“一”和“大”为相连,视作“二”和“人”为相交,按此原则应取“一大”。而对于“夫”字来讲,不论取“一大”或“二人”都是相交结构,根据“取大优先”的原则应取“二人”。
⑹兼顾直观
有些汉字完全按照前面的规则拆分,破坏了字的完整性,不符合人对汉字识别的传统习惯,报以也有例外的。如“自”字,按取大优先应先取一撇一竖的单立人旁字根,可没有看作