纵横码教程(全)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纵横码教程
编:上海大学纵横计算机教育中心
译:黄健威
概述
汉字是中华民族灿烂文化的结晶,在世界范围内,汉字的使用上下五千年,纵横数万里,构成了一个庞大的汉字文化圈。
面对计算机和信息科技的飞跃发展以及在各行各业的广泛应用,汉字输入法成了汉字信息处理中最重要的问题之一。
汉字不同于英文字,字形笔划远比英文字复杂,字数繁多,读音各异。
如何应用现时的英文键盘方便准确地输入汉字,难度很大。
无数的中外学者,仁人志士为合理解决这一棘手的『樽颈』问题,艰苦奋斗,付出了大量的劳动力,也取得了可喜可贺的成绩。
汉字输入法的发展如雨后春笋,似百花齐放。
据统计,国内外已有一千多种汉字输入法脱颖而出,为汉字信息处理作出了重大贡献。
然而能为广大用户接受而实际使用的汉字输入法还不多。
纵横汉字输入码简称『纵横码』,是香港苏浙同乡会名誉会长周忠继先生发明的一种用数字作码元的字形码。
它继承与发展了传统四角号码检字法。
组码科学、规律性强、易学、易用、重码少。
它使用小键盘操作,操作简便、输入速度快、便于盲打。
由于『纵横码』以笔形作为取码根据,因而它不仅适用于简体字,还特别适用于繁体字及各种异体字,香港汉字,适应一国两制对汉字输入的需求。
纵横码以不带部首的汉字(即字身)的取码为基础。
当汉字带有部首时,汉字的取码为部前缀加字身码。
部首又分为主部首与副部首两类。
字身是汉字的主体。
无部首字的本身即为字身。
带部首的汉字去掉部首后剩下的部分也就是字身。
字身按其四角笔形取码。
字身码最多取4位。
经统计分析,纵横码确定了55个主部首。
每个主部首取码1到2位。
副部首是针对左右形结构与L形结构的汉字设置的。
当无主部首可取时,左右形结构汉字的左部或L形结构汉字的L形,作为副部首。
副部前缀仅取1位,即其第一笔形码。
由于纵横码不是按整个汉字的四角进行编码,而是由部前缀与字身码组合编码,大大减少了诸多汉字同取一组码的现象,即重码现象,这对使用者带来很大的方便。
针对现代汉语较多使用多字词的特点,纵横码对二字词、三字词、四字词及
五字以上的多字词的取码,规定了简易的办法,如对二字词中的每个字仅取前3码,对三字词中的每个字仅取前2码,这样,不管词有多长,编码不超过6位。
对于常用的高频字和高频词,纵横码还设置了长度仅为1到2位的简码。
以上的措施,使纵横码具备重码少、打码快的特点,成为一种优秀的汉字输入法。
第一章:笔形与部首
一、笔形码
在纵横码中,笔形分为十类,笔形码分别用0 – 9 十个数字表示。
笔形码与笔形的关系可用下列口诀记忆:
一横二竖三点捺,叉四插五方块六,
七角八八九是小,撇与左勾都是零。
笔形码所对应的笔形详见下表:
代码笔名笔形笔形说明
1 横横划,横剔或斜剔皆为1
2 竖直竖与斜竖皆为2
3 点、捺点、捺及『』皆为3
4 叉二笔交叉不论直交与斜交都是4
5 插二横一竖不论直交与斜交都是5
6 方块口形为6
7 角、右勾角形或二个角形相连或右勾都是7
8 八『八』及其变形都是8
9 小『小』及其变形都是9
0 撇与左勾撇及左勾或带撇的勾皆为0
二、主部首
纵横码设主部首55个,主部首及其代码如下:
为了方便记忆,可将主部首作如下分类:
人事人手()口耳()目心女王言走()
衣食住行衣()帽()禾米屋()门舟车
五行天象日月金木水火土雨气
动物草石犬()马鱼鸟虫竹()草()石山
其它贝页皿隹刀()戈殳力欠一文()
主部首的取码有一定的规律性:
●11个主部首仅取1码,均取自该部首的第一个笔形码。
●44个其余主部首取2码,取自该部首的上下或左右之笔形码。
●只有主部首『』与『』较特殊。
主部首字例见下表:
主部前缀主部首
字例
部首在上部首在左部首在下部首在右
0 位
1 一丙
2 山嵌峰岳
3 守立
4 花
5 扣
6 口呈叫咨知
7 月肝胃胡
8 人今
9 火炎炒灸耿00 鸟鸵鸢鸭02 行
03 鱼鲁鲍鳖
隹售雠瞿维
07 舟般
08 欠欢
09 禾秀移秦酥11 王弄现望
14 雨霜
16 石泵砍盘
18 页项22 到
30 床
31 江
32 祝衫
33 心急
35 这
36 言话
38 空
39 疾
40 狗
41 土志堆型壮44 女好娶妆47 力加努劲49 木杏相柔貅53 戈划战
55 车轰轻辈
56 虫蚊蛋触
61 日星时昏
62 目眼省缃68 贝财贺
70 尸居
马骑驾冯
71
历
皿盟
72 队邓
74 癹毁
77 门问
81 金鑫针鉴
84 变攻
87 氧
88 笑
99 米麊料粱
主部首选取时遵循以下原则:
1. 主部首『』、『』、『尸』、『』、『』必须占有汉字的三个角。
♦例:邝:『』只占有汉字的两个角,不能作主部首,故主部首为『』。
2. 其余主部首必须占有汉字的两角。
3. 主部首『一』只能在汉字的上面。
♦例:韭:『一』在汉字的下部,不能作主部首,故此为无部首汉字。
4. 主部首『口』不能是汉字的外围。
♦例:国:『口』是汉字外围,不能作主部首,故此为无部首汉字。
5. 部首最多只有一个,当一个汉字有两个或以上主部首可选时,取上不取下,
取左不取右,取大不取小。
♦例:忑:主部首为『一』,不为『心』(取上不取下)。
♦例:炊:主部首为『火』,不为『欠』(取左不取右)。
♦例:泵:主部首为『石』,不为『一』(取大不取小)。
三、副部首
副部首是针对左右形结构与L形结构的汉字设置的。
当无主部首可取时,左右形结构汉字的左部或L形结构汉字的L形,作为副部首。
副部前缀仅取1码,即其第一笔形码。
例:彩:左右形结构,无主部首可选,取『采』为副部首,0为其第一笔形码,故副部前缀为0。
彪:L形结构,无主部首可选,取『虎』为副部首,2为其第一笔形码,故副部前缀为2。
带副部首的字例见下表:
注意:对一个左右形结构的汉字,当既有主部首又有副部首可选时,应优先选主部首作为该字的部首。
例:『准』的部首为『隹』;『动』部首为『力』;『胡』部首为『月』。
当副部首的第一笔形码有两种选择可能时,遵循取大不取小的原则。
这一原则同样适用于字身的四角取码。
例:『影』的第一笔形码可以是6或7,但6对应的笔形较7对应的笔形为大,因此取6不取7。
练习(第一章:笔形与部首)
一、写出下列各字的部前缀(无部首时用 代表)1
2
3
4
5
6
7
8
9
二、写出下列成语中各字的部前缀(无部首时用 代表)1
2
3
4
5
6
7
8
9
第二章字身取码
字身取码的典型情况是取字身的四角笔形码作为字身码,共四位。
但有些字身在字形结构上具有一定的特殊性。
有的字身取不到四个笔形码,字身码少于四位,这使重码机会增加。
有的字身虽然能取到四个笔形码,但同样具有这四个笔形码的字身有好几个,这也会带来一些重码。
为了减少重码,对于这些字身的取码另外增加一些规定。
下面从典型的情况出发,逐步引出各种具体规定。
一、取字身四角笔形码作为字身码的典型情况
取码法则:在一般情况下,当字身四角均有笔形可取时,按左上、右上、左下、右下的顺序,取四角笔形码构成字身码。
无部首字例:
有部首字例:
二、字身仅由一个或两个笔形组成的情况
取码法则:字身码仅取一码或两码。
字身码取一码的字例:(有部首字的部前缀用粗体)
字身码取两码的字例:(有部首字的部前缀用粗体)
三、字身左部或右部被单一笔形独占的情况
取码法则:左部被独占,左部只得一码作为左上码,无左下码。
右部被独占,右部只取一码作为右上码,无右下码。
无部首字例:
有部首字例:
528
四、字身上部或下部被单一笔形独占,无需补码的情况
独占字身上部或下部的笔形有很多。
有的笔形仅需取本身一码,基本上无重码现象,故无需另外补码。
有的笔形如只取本身一码,就有重码现象,故除取本身一码外,还需补加一码,即带补码。
本节介绍无需补码的笔形,带补码的笔形见下节。
无需补码的取码法则:上部被独占,上部只取一码。
下部被独占,下部只取一码。
独占字身上部的无需补码笔形有:
(无其它笔形相交者)(仍取补码)
口
八火
(口中无笔形者)
上部无需补码字例:(有部首字的部前缀用粗体)
汞(129),良(373),希(420),表(573),无(833)。
独占字身下部的无需补码笔形有:
(无其它笔形相交者)
火水下部无需补码字例:(有部首字的部前缀用粗体)
斤(702),冬(003),叟(774),捀(5005),参(230)。
上、下部均无需补码字例:(有部首字的部前缀用粗体)
爹(80),复(84),永(39),令(833),凄(354)。
五、字身上部或下部被单一笔形独占,带补码的情况
有些独占字身上部的笔形除取本身一码外,还需补加一码,称为上补码。
上补码所对应的笔形紧靠上部笔形之下。
有些独占字身下部的笔形除取本身一码外,还需补加一码,称为下补码。
下补码所对应的笔形紧靠下部笔形之上。
补码选取规则:当上笔形的下部,或下笔形的上部有几个笔形可供选择
时,按以下规律确定补码笔形:
1. 已经使用过的笔形不能重复使用。
2. 『与上笔形或下笔形相连的笔形』较『不相连的笔形』
优先使用。
3. 同样与上笔形或下笔形相连的笔形中,或同样不相连
的笔形中,位于右边的笔形优先使用。
A. 上补码
独占字身上部的带上补码笔形有:『』、『一』、『』、『』、
『十』、『』、『人』、『』、
『』、『小』、『』
带上补码的字例:
上笔形
字例
(上笔形码及上补码用粗体)
系
0293
乏
033
乖
0417
毛
057
帛
0620
舟
0740
爵
0970
一1
琢
111003
阮
721107
何
01260
汪
31141
便
0155
逼
351664
评
36194
3
液
313024
泫
313273
济
313002
注
31341
壕
413603
抗
537
磅
163800
3
佗
0307
缩
23126
割
223564
碗
163707
谊
363712
崆
23812
十4
支
404
待
024130
拷
54470
克
4607
矗
4711
垮
414870
漆
31499
4
谎
364307
诺
36446
灌
314621
敬
844760
搭
54861
人8
珍
11800
栓
498114
价
0820
玲
11833
噙
68323
茶
4849
枪
498306
8
煎
8233
羡
8418
尊
8430
兼
8503
兑
8607
竟
38607
弟
8700
小9
雀
9021
光
9107
尖
948
隙
729096
尚
976
B. 下补码
独占字身下部的带下补码笔形有:『』、『一』、『』、『十』、
『口』、『』、『』、『凵』、『八』、
『人』、『小』
带下补码的字例:
下笔形
字例
(下笔形码及下补码用粗体)
一1
些
2011
止
2112
坐
8814
堇
4415
暨
7116
竖
7018
3
腿
73733
摓
53035
谴
363537
挞
53435
谜
363939
十4
榫
490341
辑
55642
摔
53243
卑
0645
卓
2146
口6
借
04161
循
027062
留
7764
啬
4866
卣
2167
卤
2163诏
361760
膳
78561
唇
711163
略
60064
糖
993065
溶
313868
人八8
其
4481
楚
4482
癸
1084
汉
314485
演
313186
侠
04888
小9
禁
4491
紧
7093
保
0694
来
4898
巢
2295
颢
186196
六、几种特定笔形取补码的要点
A. 『口』、『』处于字身上部,『凵』、『』、『』处于字身下部时,
只能取其内部笔形或与其相交的笔形的笔形码作为补码。
如内部无
笔形并且没有与其相交的笔形,则不取补码。
例:促:『口』处于字身上部,内部无笔形,故不取补码,该
字的字码为0682。
提:『口』处于字身上部,内部有笔形『一』,取1为上补
码,该字的字码为56182。
民:『』处于字身上部,内部无笔形,故不取补码,该
字的字码为777。
艮:『』处于字身上部,内部有笔形『一』,取1为上补
码,该字的字码为7173。
凸:『凵』处于字身下部,内部无笔形,故不取补码,该
字的字码为77。
凹:『凵』处于字身下部,内部有笔形『凵』,取7为下补
码,该字的字码为7777。
己:『』处于字身下部,内部无笔形,故不取补码,该字
的字码为177。
已:『』处于字身下部,内部有笔形『』,取7为下补
码,该字的字码为1777。
毫:『』处于字身下部,有相交笔形『十』,取5为下补
码,该字的字码为3675。
奄:『』处于字身下部,有相交笔形『口』,取6为下补
码,该字的字码为4876。
亡:『』处于字身下部,内部无笔形,故不取补码,该
字的字码为327。
甚:『』处于字身下部,内部有笔形『八』,取8为下补
码,该字的字码为4478。
B. 『』处于字身下部时,若『』上部不与其它笔形相交,不需下
补码,若『』上部与其它笔形相交,则以相交笔形的笔形码作为下补码。
无下补码字例:亨360、了100、亭360、予100。
带下补码字例:享3604、子1004、拳905、掣0205。
C. 『人』处于『火』下部时,不需下补码。
其它情况下需要下补码。
无下补码字例:『灰』408。
带下补码字例:『其』4481、『楚』4482、『演』313186。
D. 『小』处于『水』、『』下部时,不需下补码。
在其它情况下需要
下补码。
无下补码字例:『泉』069、『汞』129、『膝』7499、『泰』589。
E. 『小』处于『火』、『』、『米』上部时,不需上补码。
在其它情
况下需要上补码。
无上补码字例:『淡』3198、『卷』970、『拳』905、『豢』903、
『鳞』03905。
七、字身为框形结构时的取码规定
在汉字中,有些字身外部为框形结构。
例如:『国』:字身外部是『口』形结构,
『周』:字身外部是『』形结构,
『幽』:字身外部是『凵』形结构,
『句』:字身外部是『』形结构。
这些字身如按常规取码,会出现很多重码字。
为减少重码,纵横码对这些字身的取码作了特殊规定。
规定如下:
1. 对『口』、『』、『几』三种外框,将外框上部笔形码取作字身左上角笔
形码,将框内右上角笔形码取作字身右上角笔形码、将框内下部笔形码
取作字身下部笔形码。
字例如下表:
框形及字身左上角码
字例
(字身左上角码用粗体)
口
6 6107
圜
6673
囫
6700
四
6201
图
6666
7
周
7461
同
716
网
744
罔
787
用
75
几7
凰
7614
夙
710
凡
73
几
7
风
7013
特例一:『目』:『目』内部的二横取码『2』。
凡『目』为字身或独占字身上、下部时,取码『62』。
特例二:『月』:『月』内部的二横取码『2』。
凡『月』为字身或独占字身上部时,取码『72』;
『月』独占字身下部时,取码『22』。
2. 对『凵』、『』、『』、『』、『』等十六种外框,将外框上部笔形码取
作字身上部笔形码,将框内下部笔形码取作字身下部笔形码。
十六种外框的上码选取及字例见下表:
框形及字身上部码
字例
(字身上部码用粗体)
06
囟
064
窗
38064
怕
9061
息
33062
皇
11061
07
勿
0700
匀
0713
匍
0725
勺
073
句
076
勾
0773
17
刀
170
刁
171
刃
1730
司
1761
伺
01761
凵22
山
222
凶
224
幽
2273 12264
豳
2203
户3
房
300
扉
311
扇
310
户
3
* 30
濂
313003
渡
31304
遮
353033
躔
63014
缠
23014
掂
53062
* 39
嫉
443984
蒺
43984
43
忒
4333
式
4312
贰
4386
试
364312
戊戈* 53
或
5316
成
530
戌
531
戍
533
戊
53
威
534
尸* 70
刷
227020
榍
497022
崛
27074
骣
707000
樨
49705
娓
447075
70
斤
702
瓜
7073
反
704
后
7061
盾
7062
* 71
岸
27141
褥
327130
涯
317114
呃
67170
励
477123
蕨
47148
71
匹
7107
匪
7111
巨
7117
臣
712
匝
7120
匮
7186
72
眉
7262
嵋
27262
门* 77
润
317714
蔺
47721
焖
97733
娴
447794
悯
9774
例:『』作字身时,『糖』993065;作主部首时,『唐』305765。
例:『』作字身时,『嫉』443984;作主部首时,『疾』39884。
例:『尸』作字身时,『泥』317070;作主部首时,『尼』70207。
例:『』作字身时,『沥』317112;作主部首时,『历』710012。
例:『门』作字身时,『搁』57764;作主部首时,『阁』770064。
3. 对于以上两大类形框形结构,若框内无任何笔形,只取外框上部码作为
字身码。
例:几(7),饥(87);
户(3),妒(443);
戊(53),茂(453);
幻(217);
八、字身下部为框形结构时的取码规定
当框形结构『』、『几』处于字身下部时,字身上部按常规取码。
字身下部框形的上部笔形码7有时已经被字身上部取作上补码,有时未被取作上补码。
对于这两种情况有不同的取码规定如下:
1. 框形的上笔形码7未被字身上部用作上补码。
这时,将框形左下角笔
形码取作字身左下角笔形码,将框内右下角笔形码取作字身右下角笔
形码。
字例:角0005,谓366422,扁324,甬1025,高3626,梵4403。
若字身下部框内无任何笔形,字身下部码只取框内左下角笔形码。
2. 框形的上笔形码7已被字身上部用作上补码。
这时,将框内下部笔形
码取作字身下部笔形码。
字例:消31972,南4741,向076,尚976,商38768,内478,
肉4788。
若字身下部框内无任何笔形,无字身下补码。
字例:抗537,伉037。
九、含『口』的字身取码特点
在字身取码时,每一笔形原则上只可使用一次。
但对笔形『口』,允许既使用笔形『口』,又重复使用其上下横笔形『一』;或者单独使用笔形『口』的上下横笔形『一』。
重复使用笔形『口』与其上下横笔形『一』的字例:
中56,由56,申562,束596,柬596,
西14461,酉14461,鬼0657,卑0645。
单独使用笔形『口』的上下横笔形『一』的字例:
重0515,惠33513,事505,禹0523,票14491,串565,巢2295。
当笔形『口』处于字身下部并且本身被字身上部取作上补码笔形时,将『口』内下部笔形码取作字身下部笔形码。
字例:
面10622,曾61869。
十、字身上部固定结构的取码规定
字身上部固定结构除了前面提到的框形结构外,还有一些非框形结构,它们具有固定的编码,取作字身上部码。
字身下部码按常规选取。
这些固定结构及其编码,以及相应的字例见下表:
固定结构及其编码
字例
(固定结构编码用粗体)
40
灰
408
友
404
布
4020
左
4012
侑
04022
雄
034073
50
吏
505
邦
72504
使
0505
夷
5085
姨
445085
58
奉
585
泰
589
蠢
5813
奏
5884
舂
5871
春
6158
9
券
900
豢
903
拳
905
腾
7930
卷
970
倦
0970
练习(第二章:字身取码)
一、根据四角均有码可取的取码法则,写出下列各字的纵
横编码
二、根据字身仅有一码或二码可取的取码法则,写出下列
各字的纵横编码
三、根据字身左或字身右被单一笔形独占时的取码法则,
写出下列各字的纵横编码
四、根据字身上或字身下被单一笔形独占,无需补码的取
码法则,写出下列各字的纵横编码
五、根据字身上或字身下被单一笔形独占,需带补码的取
码法则,写出下列各字的纵横编码
六、根据几种特定笔形的取码规定,写出下列各字的纵横
编码
七、根据字身为框形结构时的取码规定,写出下列各字的
纵横编码
八、根据字身下部为框形结构时的取码规定,写出下列各
字的纵横编码
九、根据含「口」字身的取码规定,写出下列各字的纵横
编码
十、根据字身上部为固定结构时的取码规定,写出下列各
字的纵横编码
第三章词组、高频字和高频词
一、词组的取码
为了减轻汉字输入工作量,规定词组的取码不超过6位。
具体规定如下:
二字词组:第一字的前3位码+ 第二位字的前3位码,即『33』规则。
当一个字不足3位时,取其全码。
字例:我们030077,森林494494,大众49628,
人民8777。
三字词组:第一字的前2位码+ 第二字的前2位码+ 第三字的前2位码,即『222』规则。
当一个字的码不足2位时,取其全码。
字例:为甚么344430,现代化110404,一部分17280,
电视机143249。
四字词组:第一字的前2位码+ 第二字的前1位码+ 第三字的前1位码+ 第四位字的前2位码,即『2112』规则。
当首、末字的
码不足2位时,取其全码。
字例:实事求是365461,中华民族564738,
一举两得17102,施政报告388460。
多字词组:第一字的前2位码+ 后四字的前1位码,即『21111』规则,当首字的码不足2位时,取其全码。
字例:香港特别行政区093020,中华人民共和国564874。
二、高频字的简码
高频字指使用频率高的汉字,纵横码规定了36个高频字的简码。
其中9个高频字取一键简码如下:
『的0』、『要1』、『到2』、『这3』、『是4』、
『我5』、『国6』、『有7』、『会8』。
另外27个高频字中,取二键简码如下:
『你00』、『得02』、『他04』、『向07』、『作08』、
『为09』、『而10』、『取11』、『可16』、『将20』、
『经21』、『能22』、『应30』、『对34』、『道35』、
『请36』、『新37』、『在40』、『去41』、『来48』、
『把57』、『时61』、『都72』、『学77』、『全81』、
『前82』、『等88』
二、高频词的简码
高频字指使用频率高的汉字,纵横码规定了66个高频字的简码。