“音调形”汉字编码输入方法与相关技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、根据权利要求1所述的输入方法,其特征在于“点”属于捺范围,折包括除
横、竖、撇、捺以外的其他基本笔划。
3、根据权利要求1所述的输入方法,其特征在于同音异形字按使用频率层次分 类,使用频率最高的为一类,依次有二类、三类……;各类的频次由大量录入统计值
作为预设值,其具体分类表如下:
字类
音码+调码
一类 二类 三 类 四类 五类
码复杂、难记。
本技术目的在于使具有汉语知识和熟悉国际标准键盘指法的人,能在电脑键盘上
进行快速击打的“音调形”汉字编码输入方法。
本技术的目的是这样实现的:
一种“音调形”汉字编码输入方法,其特征在于该编码由音码和调码组成;
调码是每个汉字的特征笔划横、竖、撇、捺、折的列与每个汉字发音的四声阴平、 阳平、上声、去声的行组成矩阵的矩阵元,该矩阵元由国际标准键盘快速指法击打的
中 国 物 产 丰 富,比 如 说
yog go 凵 uy van fegbd fuw,bi ru wo
鳆 鱼 就 很 有 名, 父 亲 的
fuywz 凵 uukp jiu hen 凵 iu mig,fuyv qin de
师傅 曾背 着 官府们
wid fuyq ceg beiL yee gonj fux meen
馥fuyx 菔fupj 鲋 8005 6142 fuywr 鳆fuywz 8654 8691
畸义字调码用v代替,以示音码与调码的区别,例如,岂(qin)中的n是调码,而
亲(qin)中的n是音码一部分,故畸义字岂编码为qiv。
特殊处理:
轻声字(包括感叹字,像声字)加元音a,e,i,o,u(或v)来标识调码。
这些指位与国际标准键盘快速击的的习惯相一致,并且图中用TYGHB用一条线表 示,RFVJN用一条线表示,WDCKM用三条线表示以及,QSXPL用四条线表示。
图中调码矩阵用连接线条表示,单线表示矩阵行的阴平,双线表示阳平,三线表
示上声,四线表示去声;左手指停放位GFDS为矩阵列的横(一),左手下移位BVCX为竖 (丨),左手上移位TRWQ为撇(丿);右手指停放位HJKL为( ),右手下移位及上移 位Y-NM-P为折(フ)。
三类
肌
音码+v+尾笔
调
特殊处 呵
理
轻声
上述“积”产生畸义,用“v”代替首笔调 上述“肌”产生畸义,用“v”代
备注 替首笔调
实施例3
考虑键盘操作手法快,调码放于手指灵活且使用频率高的字符键位上。调码矩阵 可调整如下方式:
字形(列)
横(一)
竖(丨)
撇(丿)
捺( )
折(フ)等
阴平 阳平 上声 去 声
gfd s
“音调形”汉字编码输入方法属于电脑输入汉字编码键盘类。目的在于创建一种符合汉字读写规律和
实际应用规律的汉字键入方案,使有汉语知识的人不必再额外记忆其他东西,即可使用。本技术 的汉字编码由音码和调码组成。音码是长码需压缩的汉语拼音,调码的标志符是由汉字书写笔划
的横(—)、竖(丨)、撇(丿)、捺( )、折(フ)的列和汉语发音四声的阴平(—)、阳平( )、上声(し)、去 声( )的行组成矩阵的矩阵元。矩阵元是键盘上的20个英文字母。“音调形”汉字编码无重码,可盲
阵元,另外,用余下的一个英文字母作特定标志符来取代畸义字的调码,以区别与其
重码的汉字音码。矩阵元因具有字调、字形二特征,故称作“调形码”,简称“调码” 。这里需要注意二点,一、“点”属于捺范围,二、“折”的含义是除“横、竖、撇、 捺”以外的其他基本笔划。调码取自下述调码矩阵。
另外,附加标志符“v”来代替畸义字的调码(详见下文)。
国标GB2312-80的6763个汉字按读(字音及字调)写(字形)规律分成“同音异形字” (包括单音字),“轻声字”(包括感叹字,像声字)和“同形异音字”(包括一形多音 字);采用无特殊标记的国际标准化键盘;编码由“音码”和“调码”组成,音码是 长码需压缩的汉语拼音,调码的标志符是由汉字书写的横(一)、竖(丨)、撇(丿)、 捺( )、折(フ)笔划的列和发音四声阴平(一)、阳平( )、上声( )、去声( )的 行组成矩阵的并由标准键盘上除元音a、e、i、o、u、以外的20个英文字母标识的矩
不知 道 背着 一 袋 鳆
bu yig daow beidb yee 凵 i daiyv fuywz
鱼跑 了
uukp paon Le 输入上述37个字,击键动作(包括空格而不包括标点符号)是124次,平均击键动 作是3.33次/字,其编码情况如下:
分类
汉字
编码
中,国,产,比,如,说,
一类
就,很,有,名,亲,的, 音码(无字调码)
一(二笔下一调)的矩阵元。同音异形字的编码详见下表。
同形异
音字汉
GB2312- 类
字编码
举例
80
别
(包括单
音字)
国标汉字 区位码
一类
2420 2426
一级
音码(汉语拼音,无调
(常用字)
复fu 负fuv 肤fug 2384 2386
字
二类 码) 音码+首笔调 音码 扶fup 府fux 付 2413 2422
例如:汉字(拼音)
编码
呵(a)
aa
们(men)
meen
唉(ài)
aia
嗖(sōu)
souu
吗(ma)
maa
么(ma)
maav
同形异音字(包括,一形多音字),按不同字处理。
例如:伯(bó)
bokv
伯(bǎi)
baihm
背(bēi)
beidb
背(bèi)
beiL
综上所述,“音调形码”完成GB2312-80国标的6763个汉字的全部编 码,只有个别字做了特殊处理,如轻声字(包括感叹字,像声字)和同形异音字(包括 一形多音字);而且用“音码+首笔调+尾笔调”的筒码完成了使用频率高达99.9% 的3755个一级字中98%的编码。全部6763个汉字的平均码长3.95,总重码率为“O”。 参见统计表1。汉字偏傍部首的调码表见表2,长码拼音压缩表见表3。
结合实施例附图,进一步说明本技术的内容。
图1是本技术实施例3调码矩阵调整后在国际标准键盘上的对应关系及其指法。
调码矩阵与键盘对应关系如下:
其中g、f、d、s是左手的食指(f、g)、中指(d)和无名指(s)的常驻指位;b、 v、c、x是相应手指的下滑指位;t、r、w、q是相应手指的上滑指位;
而h、j、k、l是右手的食指(j、h)、中指(k)和无名指(l)的常驻指位;n、m是食 指和中指的下滑指位,Y、P是食指和无名指的上滑指位。
呵! 他 积 劳 成 疾, 肌 体 受
a.a ta jiv Laop veg jiq jivz tih wouy
到 伤害
dao wagg hai 以上共12字,击键动作39次(包括空格而不包括标点)平均每字击键动作3.25次。
分类
汉字
编码
一类
他,成,到,害
音码(无调码)
二类
劳,疾,体,受,伤 积
音码+首笔调 音码+v
打,听打和想打。
技术要求
1、一种“音调形”汉字编码输入方法,其特征在于该编码由音码和调码组成;
调码是每个汉字的特征笔划横、竖、撇、捺、折的列与每个汉字发音的四声阴平、 阳平、上声、去声的行组成矩阵的矩阵元,该矩阵元由国际标准键盘快速指法击打的
常用20个字母组成,其调码矩阵如下:
字形,即列 字调,即行 横
六类 七类 八 类 九类
音码(汉语拼音,无调码) 音码+首笔调 音码+首笔调+尾笔调 音码+首笔调+v 音码+首笔调+尾下一 音码+首笔调+尾下二 音 码+首笔调+尾下三 音码+首笔调+尾笔调+二笔调 音码+首笔调+尾 笔调+二下一
说明书
“音调形”汉字编码输入方法
本技术属于电脑输入汉字wenku.baidu.com码键盘类。
目前,我国出现数百种汉字键入方案,大体分为形码(按字形编码)、音码(按汉 语拼音编码)、形音码(按字形、字音二素编码)和序列码(按阿拉伯数字序列编码,即 电报码)。序列码不属于专利法保护范围,而前三者都不同程度存在难记、重码率高 和不适合“听打”“想打”之缺陷。
本技术具有科学、快速、易学、难忘的明显优点:
1、无重码。 2、编码短。 3、所有以辅音+元音开头的汉字,汉字间不必击打空格键,击键动作=码长; 少数以元音开头的汉字,击键动作=码长+1。 4、采用国际标准化键盘,键盘上调码矩阵元不必额外标注,有利于汉字及汉字
信息走向世界。
5、沿用汉语基本拼音规则和书写笔划常规习惯,不必记忆额外规则。 实施例1 输入的汉字与“音调形码”对照
输入的汉字与“音调形码”对照。
中 国 物 产 丰 富,比 如 说 鳆
yog go 凵 uq van feggb fuL bi ru wo fuqLy
鱼 就 很 有名 ,父 亲 的 师 傅
uurf jiu hen 凵 iu mig fuqv qin de wib fuqj
曾,不,一,了
物,富,师,官,府,
二类
音码+首笔调
知,道,跑,
三类
丰,鱼,
四类
父,袋
六类
傅
九类
鳆
特殊处理 们 着
音码+首笔调+尾笔调 音码+首笔调+v 音码+首笔调+尾下二 音码+首笔调+尾笔调+二下一
轻声
背 beiL(在三类) 按不同字处理 背 beidb(在四类) 实施例2 输入的汉字与“音调形码”对照
常用20个字母组成,其调码矩阵如下:
字形,即列 字调,
横
竖
撇
即行
阴平 阳平 上声 去 声
bpm f
dtn L
gkh y
捺
jqx w
折
zcs r
因字形和发音的特异性,调码的标志符分为首笔调,尾笔调,二笔调,尾下调以 及二下一,二下二等,依次类推;首笔调是书写第一笔和声调的结合在矩阵中找到的 矩阵元,尾笔调是书写最后一笔和声调的结合在矩阵中找到的矩阵元,二笔调是书写 第二笔和声调的结合在矩阵中找到的矩阵元,尾下调是最后一笔与声调的下一声调, 或下二声调,或下三声调的结合在矩阵中找到的矩阵元,于是有尾下一,尾下二,尾 下三等矩阵元;同理,也可得到二下一,二下二的矩阵元;阴平的下一声调是阳平, 阳平的下一声调是上声,上声的下一声调是去声,去声的下一声调是阴平,下二声调 及下三声调依次序类推。
6763
3755
三类
+首笔调+尾笔调 音码
fuyw 芙fupq 父 6029 2424
二级 四类 +首笔调+v 音码+首笔调 fuyv 芾fupv 腹 6032 2425
字
+尾下一 音码+首笔调
五类
fuyj 苻fupx 傅
6062 2421
3008
+尾下二
六类
fuyq 茯fupw
6082
七类 八 音码+首笔调+尾下三 音码+首笔调+尾笔调 类 九类 +二笔调 音码+首笔调+尾笔调+二下一
竖
撇
捺
折
阴平 阳平 上声 去声 b p m f d t n L g k h y j q x w z c s r
因字形和发音的特异性,调码的标志符分为首笔调,尾笔调,二笔调,尾下调以 及二下一,二下二等,依次类推;首笔调是书写第一笔和声调的结合在矩阵中找到的 矩阵元,尾笔调是书写最后一笔和声调的结合在矩阵中找到的矩阵元,二笔调是书写 第二笔和声调的结合在矩阵中找到的矩阵元,尾下调是最后一笔与声调的下一声调, 或下二声调,或下三声调的结合在矩阵中找到的矩阵元,于是有尾下一,尾下二,尾 下三等矩阵元;同理,也可得到二下一,二下二的矩阵元;阴平的下一声调是阳平, 阳平的下一声调是上声,上声的下一声调是去声,去声的下一声调是阴平,下二声调 及下三声调依次序类推。
同音异形字按应用频率层次分类取调码。应用频率最高的为一类,依次有二类,
三类……按照汉字书写的笔顺不同,调码又分首笔调、尾笔调、二笔调和尾下调以及
尾下二笔调,依次类推。首笔调是书写第一笔在矩阵中找到的矩阵元,尾笔调是书写 最后一笔在矩阵中找到的矩阵元,二笔调是书写第二笔在矩阵中找到的矩阵元,尾下 调是最后一笔相应于该字字调向下高低升降转折的下一声或下二声调,或下三声在矩 阵中找到的矩阵元,于是有尾下一,尾下二,尾下三等矩阵元。同理,也可得到二下
bvc x
trw q
hjk L
ynm p
Z为特定标志符。调码矩阵元在键盘上对应关系见图1。
图中调码矩阵用连接线条表示,单线表示矩阵行的阴平,双线表示阳平,三线表
示上声,四线表示去声;左手指停放位GFDS为矩阵列的横(一),左手下移位BVCX为竖 (丨),左手上移位TRWQ为撇(丿);右手指停放位HJKL为( ),右手下移位及上移 位Y-NM-P为折(フ)。
形码:以“五笔字型”为代表,它违反汉语和汉字的使用规律,需额外记忆的成 份过多,编码复杂,重码率高,只适合于“看打”。
音码:即汉语拼音码,将汉字转换成英文字母的汉语拼音再键人,分简拼、双拼 和全拼,没解决声调问题,重码率高,只得边看监视器边键入。
形音码:以自然码为代表,字形部分类似于“五笔字型”,字音部分用简拼,编