《统一的中日韩汉字编码字符集》(CJK)字根系统研究

合集下载

《统一的中日韩汉字编码字符集》(CJK)字根系统研究

《统一的中日韩汉字编码字符集》(CJK)字根系统研究

《统一的中日韩汉字编码字符集》(CJK)字根系统研究《统一的中日韩汉字编码字符集》(CJK)作为新的汉字信息处理国际标准,使汉字信息处理向国际化方向迈出了重要的一步,对汉字字形的定量定性研究也提出了更高的要求。

在此基础上,依靠计算机字形技术的支持,采用字根分解与合成的方法,有可能表示出CJK的全部字符从而实现其无字库化处理。

因此,研究CJK字根系2统,对于CJK的工程应用具有重要作用。

中日韩汉字字形有别而音义互异,但都是可分析的文字,其基本构形单位都是笔画或字根,因此,字根分析法对其同样适用。

本文认为,要得出一个较为科学的CJK字根系统,在理论和实践上必须着重解决两个问题,一个是笔画与字根的分野即单笔字根的问题,另一个就是字根变体的问题。

本文主要分析了CJK的单笔字根和字根变体,并对统计得出的CJK676个字根的有关数据进行了系统的分析,希望能为CJK的相关研究提供参考。

一、CJK的单笔字根(一)为什么要提出"单笔字根"字根是汉字字符的直接构形成分,是可以独立运用的最小构形单位。

一般说来,字根包含两个以上笔画,但当单一笔画与字根直接参与汉字字符构形时,这一笔画由于具备了字根的价值和功能而上升到字根层级,称为"单笔字根"。

提出这一概念主要基于以下考虑:1、汉字字符的构形成分中确实存在许多相对独立的单一笔画,归入邻近的任一字根都不合适,CJK中就有400多个字符包含这种笔画。

如果说汉字字符都是由作为笔画组合体的字根构成的,显然不符合事实;如果说汉字字符是由字根与笔画组成的,固然也未尝不可,但这样就难以清晰地体现字符构形的层级性,故"单笔字根"的提出有其现实的必要性。

2、CJK字符集收入了"一丨丶丿乀乁乙乚乛亅"十个单笔画的字符,如果不引入"单笔字根"的概念,则这十个字符无法进行字根分析。

3、适当拆出字符中的单笔字根,可以大大简化字根系统。

我国公民姓名用字中的生僻字分析

我国公民姓名用字中的生僻字分析

我国公民姓名用字中的生僻字分析在社会信息化进程不断深入的今天,信息处理过程对文字系统的标准化程度要求日益凸现。

为了充分发挥汉字的交际作用,必须实现对其规范化。

建国以来公布的通用字表及后来制订的GB信息交换用汉字编码字符集为汉字的规范化提供了标准和依据,但对于人名用字范围却没有做出相应的规定。

长期的规范缺失致使这一方面的汉字应用逐渐混乱无序,显著特征之一就是取名频繁使用生僻字。

已经制订完成的公安部《姓名登记条例(初稿)》和由国家语委主持制订的《规范汉字表》对人名用字的范围做出了明确划定,施行之后将会逐渐减少取名无序的现象。

从列举实际姓名中生僻字用例开始,对此种现象进行了分析并为户籍管理工作人员提出了建议。

标签:姓名用字;生僻字;规范汉字表;户籍管理1 中国人姓名中冷僻字的使用情况中国是一个人口大国,同时也是一个姓氏大国。

我国历史上记载过的姓氏共有5652个,其中单音姓氏3438个,双音姓氏2030个,目前使用的大约有2800多个。

在这两千多个姓氏中,大姓张、王、李、赵、陈、杨、吴、刘、黄、周姓公民就占全国人口总量的40%。

大姓与惯常普遍的人名用字组合便形成重复率极高的姓名形式,一个名为“中国姓氏权威”的博客于2007年公布的《中国重名最多的50个姓名列表》显示“张伟”、“王伟”、“王芳”、“李伟”、“王秀英”居于列表前五位,是当今中国最大众化、最“流行的”名字。

该博客称其数据来源是公安部全国公民身份证号码查询服务中心。

数据显示全国有“张伟”290607人,“王伟”281568人,二伟数量庞大,甚至超过了冰岛和马尔代夫两国人口数量之和。

随着人口的不断增长,社会内部人员信息流动性增强,姓名相同的人在生活诸方面遇到了意想不到的身份证明问题――升学就业,户籍管理,储蓄信贷,社会保障……跟随自己多年的名字居然会带来如此多的烦恼与不便,这在以前是未曾预料的。

“赐子千金不如授子一艺,授子一艺不如赐子好名”,在中国传统文化中,姓名早已超越了本身的符号性,传承着人的情、意、志,蕴含了人的精、气、神。

《多媒体技术》复习试题与答案

《多媒体技术》复习试题与答案

多媒体技术复习思考题及参考答案第1章引论1.ITU定义了哪五类媒体?通常所说的媒体是指此中的什么媒体?答:感觉(Perception)、暗示(Representation)、展现(Presentation)、存储(Storage) 和传输(Transmission)媒体;感觉。

2.目前多媒体所能处置的有哪些具体媒体对象?它们被分为哪两类?答:文本、图形、图像、声音、动画、视频等;静态媒体〔文本、图形、图像〕、流式媒体〔声音、动画、视频〕。

3.多媒体技术的特点有哪些?为什么传统电视不是多媒体?举出几种常见的多媒体设备。

答:多样性、集成性、交互性、[实时性];不交互;DVD、计算机、、数字电视。

4.多媒体的核心技术是什么?答:数据压缩第2章文字1.计算机对文字的处置,包罗哪三个局部?答:文字输入、字符编码、文字输出。

2.文字录入计算机的方法主要有哪几类?答:键盘输入、手写输入、语音输入、扫描输入。

3.汉字有哪三个要素,各对应于什么键盘输入法?答:形、音、义,对应形码〔如五笔字形〕、音码〔如全拼〕、基于词汇与整句的智能化输入法〔如微软拼音〕。

4.语音识别系统可以如何分类?语音识此外目标是开发什么样的语音识别系统?答:小/中/大词汇量、孤立词/连接词/持续语音、特定人(1人)/限定人(n人)/非特定人(任意人);大词汇量、非特定人的持续语音识别系统。

5.ASCII的英文原文和中文译文是什么?ASCII是由什么组织在什么时候制定的?答:American Standard Code for Information Interchange,美国信息交换尺度码;ANSI于1963年制定。

6.ASCII所对应的ISO尺度号是多少?该ISO尺度是什么时候制定的?答:646;1972年。

7.给出尺度化组织ANSI、ISO和IEC的含义。

答:ANSI = American National Standards Institute,美国国家尺度协会;ISO = International Organization for Standardization,国际尺度化组织——是由各国的尺度协会联合组成的一个非当局国际组织;IEC = International Electrotechnical Commission,国际电工技术委员会——国际尺度化权威组织,属于联合国的甲级咨询机构,负责制定关于电工电子各方面的尺度。

同本共源海峡两岸语文词典编纂概览——以“不”字头词条为例

同本共源海峡两岸语文词典编纂概览——以“不”字头词条为例

2021年1月鲁东大学学报(哲学社会科学版)Jan.2021第38卷第1期LudongUniversityJournal(PhilosophyandSocialSciencesEdition)Vol.38,No.1 收稿日期:2020-08-18 基金项目:国家语委语言文字科研优秀成果后期资助计划项目“从语文辞书比照与词汇实地调查看两岸词汇整合”(HQ135-29)、江苏省博士后科研资助计划项目“中古汉语词缀多维研究”(2020Z365) 作者简介:赵越(1979—),男,吉林松原人,文学博士,南京师范大学国际文化教育学院副教授、硕士生导师;南京师范大学中国语言文学博士后流动站研究人员。

同本共源:海峡两岸语文词典编纂概览———以“不”字头词条为例赵 越1,2(1.南京师范大学 国际文化教育学院,南京210097;2.南京师范大学 文学院,南京210097) 摘 要:两岸汉语同本共源。

在语文词典编纂方面,总体来说,从释文的简明原则、通俗原则看,大陆出版的《现代汉语词典》诸版及《现代汉语规范词典》表现略优于《国语辞典》等台湾地区出版的语文词典;从释文的概括原则、准确原则看,两岸语文词典则各擅胜场;推普并服务于民众,发挥对日常言语的引领和示范作用,是两岸规范性语文词典编纂出版的不变目标。

关键词:同本共源;海峡两岸;词典编纂;“不” 中图分类号:H061 文献标志码:A 文章编号:1673-8039(2021)01-0001-07 一、1949年后的台湾地区语文词典 本文以《重编国语辞典》等台湾地区词典为考察起点,比较两岸汉语分袂后各自所编纂的语文词典之异同。

《重编国语辞典》纸质版于1981年11月由台湾商务印书馆发行初版,1982年1月由台湾商务印书馆发行第四版。

其以1947年中国大辞典编纂处重版的《国语辞典》(1937年3月初版)为底本。

1962年台湾地区对《国语辞典》(汪怡主编/赵元任校订,全四册)进行首次修订,并于1971年进行二次修订,《国语辞典》第三版由台湾商务印书馆出版发行。

GBK字库介绍

GBK字库介绍

GBK字库介绍【基本概念】GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会1995 年12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995 年12 月15 日联合以技监标函[1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。

这一版的GBK 规范为 1.0 版。

GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。

GBK 向下与GB 2312 编码兼容,向上支持ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。

ISO 10646 是国际标准化组织ISO 公布的一个编码标准,即Universal Multilpe-Octet Coded Character Set(简称UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与Unicode 组织的Unicode 编码完全兼容。

ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。

我国1993 年以GB 13000.1 国家标准的形式予以认可(即GB 13000.1 等同于ISO 10646.1)。

GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。

GBK编码方案于1995年10月制定,1995年12月正式发布,目前中文版的WIN95、WIN98、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK编码方案。

CJK统一汉字表(笔画数排序)

CJK统一汉字表(笔画数排序)

CJK统一‎汉字表(2‎0902字‎,笔画序)‎排序要求‎:字体以《‎G B 14‎245.1‎-2008‎信息技术‎汉字编码‎字符集(基‎本集) 6‎4点阵字型‎第1部分‎:宋体》(‎接近于“宋‎体-方正超‎大字符集”‎)为准,“‎羐”、“蘷‎”等字字形‎上部为“艹‎”而非“卝‎”排序规‎则:《GB‎13000‎.1字符集‎汉字字序(‎笔画序)规‎范》,部分‎排序错误的‎字进行了修‎改1.按‎字的笔画数‎排序,少的‎在前多的在‎后;2.‎同笔画数的‎,按主笔形‎“横竖撇点‎折(一丨丿‎丶乛)”排‎序,前一笔‎相同则比后‎一笔;3‎.主笔形相‎同的,按“‎横→提,竖‎→竖钩,点‎→捺”排序‎,折笔按折‎点数排序,‎同折点数按‎折笔每段的‎笔形(横竖‎撇点)排序‎;4.笔‎形相同的,‎按笔画组合‎方式“相离‎→相接→相‎交”排序;‎相离的按离‎开位置“左‎边→右边→‎上边→下边‎”排序,相‎接的按“笔‎画端相接→‎笔画身相接‎”排序,笔‎形有长短差‎别时先短后‎长;5.‎组合方式相‎同的,则按‎字的结构“‎上下→左右‎→包围”结‎构来排序。

‎【一画‎】(一)‎一(丨)‎丨亅(丿‎)丿(丶‎)丶乁乀‎(乛)乛乚‎乙【二画‎】(一)‎二丅十丁厂‎丆匚匸七丂‎(丨)丄‎刂卜冂(‎丿)亻八人‎入乂勹儿匕‎几九(丶‎)亠冫丷冖‎讠(乛)‎刁了凵丩卩‎阝刀力乃又‎厶乄廴巜乜‎【三画】‎(一)三‎干亍于亏亐‎工土士扌艹‎卄才下寸丌‎廾大丈兀尢‎与万弋夨‎(丨)上小‎凣口囗山巾‎(丿)千‎乇乞川亿彳‎彡凢亼个乊‎亽亾兦亇犭‎夕久夂夊么‎勺凡丸及饣‎(丶)丬‎广亡门丫义‎氵忄宀辶之‎(乛)彐‎卂尸己已巳‎弓孒子孑卫‎屮孓卪也女‎乆刃刄飞劜‎习叉马彑纟‎乡幺巛【‎四画】(‎一)亖丰王‎亓开井天夫‎元无韦云弌‎专耂圡丐圠‎扎廿艺木朩‎乤五帀巿邒‎支丏厅卅不‎冇仄犬太区‎历歹友厷尤‎厄匹辷车戸‎巨牙屯戈旡‎兂比互切瓦‎(丨)卝‎止攴少尐曰‎日冃冄中円‎乢贝罓冈内‎內水见禸‎(丿)午牛‎手气毛壬牜‎升夭攵长仁‎什仃片仆仈‎化仉仇屲币‎仂仍仅仏斤‎爪丯戶反仐‎兮刈介父从‎仌爻尣乥仑‎爫仒今凶分‎乏公仓月勻‎卆厃氏勿欠‎勽匁风匂勼‎丹匀乌卬殳‎勾凤厹(‎丶)卞亣六‎文亢方闩火‎兯为斗忆灬‎计订户礻讣‎认冘冗讥心‎(乛)肀‎丮尹卐尺夬‎弖引弔丑卍‎爿巴孔队阞‎収丒刅办夃‎以允予邓劝‎双厸毌书毋‎幻乣【五‎画】(一‎)弍玊玉匞‎玌刊未末示‎击邗邘丼戋‎圢打巧正圤‎扑卉圦扒扖‎圥扏凷壭卭‎邛功扐扔去‎払甘艼世丗‎卌艾芁艽古‎节芀艻艿本‎术札朰朮刌‎辻可叵匝丙‎厈圧左厉丕‎石右布厇夳‎夲夰冭夯厺‎戊龙犮匛平‎灭巪乬轧东‎匜劢戉(‎丨)卡仧北‎占凸歺卢业‎旧帅归氺旦‎目且叶曱甲‎申叮电号田‎由卟只叭叺‎史央叱兄叽‎叼叫叩叨叧‎叻另叹甴亗‎冉帄屵罒皿‎冊凹冋邖屶‎屴屷囚四囙‎囘冎囜(‎丿)钅玍生‎矢失氕乍禾‎尓刋叐刉仨‎仠丘仜仕付‎仗代仩仦仙‎仟仛仡仫仢‎伋们仪白仔‎他仞仭斥卮‎瓜仝仺尒仚‎屳乎丛込令‎用甩肊印氐‎尔乐句叴凧‎匆犰匃册卯‎匇犯匄外处‎処冬鸟夘邜‎务夗刍饤包‎饥(丶)‎主冮市庁庂‎庀疒邝広立‎冯邙玄闪氷‎兰半汁汀汇‎汅乧头汃汄‎氿汈氻汉氾‎忊忉忇宁穴‎它宂宄讦讧‎讨戹写让衤‎礼冚讪讬讫‎训议必讯记‎永讱(乛‎)司叏尼凥‎尻民弗邔弘‎疋阢叾出阡‎阣辽阠阤氶‎氹奵邚奶奴‎丱尕召加皮‎辺边辸孕发‎圣对弁厼台‎癶矛纠驭母‎幼丝廵【‎六画】(‎一)弎弐匡‎耒邦玎兲玐‎玑玏丟式迀‎迂幵刑邢邞‎刓戎邧忈动‎迃圩扞扜圬‎扝圭扛扗寺‎圷扙扤圵卋‎吉扣圸圲扦‎考圫圪托扥‎扢圳老圴巩‎圾扚执扱圹‎扩扪赱扫扟‎圮圯地扡场‎扬扨扠耳芉‎芋芌芏芐共‎芖芅芇芊芕‎芍芃芄芨芒‎亚芝芑芎芓‎芆芗朾朽朴‎朳朲杁朼机‎朹朻朷朸权‎过亘臣吏再‎襾覀朿両协‎西亙攰压厌‎厍厊戌在百‎有乭存而页‎匠夸圶夺夶‎夵夻夼灰达‎戍匢尥列死‎成匟夹夷轨‎邪邨攷尧划‎迈毕至瓧邷‎(丨)尗‎丠此乩贞虍‎师尘尖劣光‎当旪早吁叿‎吐吓吋旯曳‎旫虫曲团団‎吅吕同吊吀‎吒吃因吸吖‎吇吔吗吆屽‎屸屼屿屾岀‎屹岁岋岌帆‎辿回屺岂屻‎岃则刚网肉‎氼凼囝囡‎(丿)钆钇‎年朱缶劧刏‎氘気氖先牝‎牞丢廷舌竹‎迁圱乔迄毎‎仹仼伕伟伝‎传乒乓休伍‎伂伎伓伏伛‎伖优伌臼伡‎佢伢伅伐仳‎仾延佤仯仲‎伣仵件任仸‎伤伥伒乑仮‎价伦仱份伀‎伧仴华伜伆‎伨仰伇伩伉‎仿伙伪伫伔‎伈自伊癿甶‎伬伄血向囟‎似伃后邤劤‎行彴彶彵甪‎舟全会杀合‎兆企氽汆乯‎众爷伞兇邠‎兊创刖肌肍‎肋凨朵凩杂‎夙危氒凪旬‎旨旮旭负犴‎犲犵刎犳犱‎犷匈乮犸刐‎舛夅名各灳‎多奿凫争邬‎色饦饧(‎丶)冴冱壮‎冲妆冰庄庆‎亦庅刘齐交‎衣次邟劥产‎决吂巟亥邡‎充妄闫闬闭‎问闯羊并关‎米屰灯灲灮‎邩灱州弚汗‎汙污汚江汢‎汏汕汘汑汔‎汌汐汣汷汋‎汍汎汲汒汛‎汜汓池汝汤‎汊忓忖忕忏‎忔忛忣忙忋‎忚兴宇守宅‎穵宆字安讲‎讳讴军讵讶‎祁礽肎讷许‎讹论讻讼农‎讽邥设访诀‎(乛)聿‎寻帇那夛艮‎厾迅刔尽迉‎弙导异弜弛‎妀阱阮孙阫‎阨阵孖阰阯‎阳阥阩收阪‎阶阴艸阬防‎阦阧乪丞阭‎迆奸妅朶如‎奾奷奼奺妁‎妇妃好她奻‎妈乫刕劦戏‎羽乨贠观牟‎欢买叒厽纡‎红纣驮纤纥‎驯约纨级纩‎纪驰纫糸糹‎巡【七画‎】(一)‎匤寿玕玗玒‎弄玙玔麦玖‎玓迋玘玚玛‎攼坓形进戒‎吞迗坖远违‎韧刬运抂扶‎坃抏抚镸坛‎抎抟技坏抔‎抠坜抜扰扼‎拒坉扽找批‎坘瓨址扯走‎抄抇贡汞坝‎抐抙抍攻坆‎扷扸赤圻折‎抓坂扳圿扴‎抡扵坅扲坋‎扮抸抢抈坁‎扺孝圽坎扻‎坍均抣坞抑‎抛坄投抅抃‎坟抆坑抗坊‎灻抖护売壱‎壳坈抌志抋‎块択抉扭声‎把报刦拟抁‎却抒刧劫毐‎抝耴茾芙芫‎芜苇邯芸芾‎芰芣苈苃苊‎苉苣芽芚芘‎苆芷芮苋芞‎芼芺苌芢花‎芿芹苅芥苁‎芲芩芬苍芪‎芴芡芟芶苄‎芠苀芳严苂‎苎芦芯劳芛‎芵克芭芤苏‎苡芧杆杅杇‎杠杜杢材村‎杕杖杌杤杙‎杏杣杄杔杚‎杊杉巫杦杓‎杋极杧杞杛‎杍李杝杨杒‎杈杩求忑孛‎車甫匣更亜‎束吾叓豆戓‎迊两邴酉丽‎医辰厐励兏‎丣奀邳否还‎矴矵厑矶劯‎厏厎夽奁奆‎夾迖迏夿尫‎尪豕尨尬歼‎来亊忒连欤‎轩轪轫迓迍‎坒匥瓩巠坙‎(丨)邶‎忐芈步卤卣‎邺児坚盀肖‎旰旱旴盯呈‎圼刞时咞貝‎吴呋旲呒見‎助呍县囯里‎呓呆旵吱囲‎吥吠呔呕园‎呖吰旳昅呃‎旷围呀吨妟‎旸曵吡囩咓‎町甼甹足虬‎邮男廸困吵‎迚肙串呗员‎呐呙吶吘吽‎呏呚吪囨呂‎听吤吟吩呛‎別吻吹呁呜‎吺呅吭吙呌‎吣吚呎吷呉‎吳吲吜吧邑‎吼囤别吮岍‎岏帏岐岖岠‎岈囬刪岗汖‎岘岆帐岓岅‎岕岒岑岎帉‎岄岉岚岇帎‎兕岜帊囦囮‎坔财囧冏呇‎囵囫觃囥図‎(丿)针‎钉钊钋钌吿‎迕劮毜氙氚‎毝牡告牤牠‎牣我乱利秂‎禿秃秀私忎‎呑岙每佅佞‎佂兵邱佉佄‎伳估体何佐‎伾佦佑佈伻‎佧佔攸但伹‎伸佃伷伿佒‎佀伵佚作伯‎伱佡伶佣低‎你佝佟佨住‎位伭伴佇佗‎佖皁身皂臫‎皀皃劰廹伺‎伲兎佛伮佋‎伽佊囪囱佁‎乕近巵彺彻‎彸役坕彷辵‎返佘余希佥‎兌釆坐谷尦‎寽孚妥豸含‎刢邻坌弅岔‎肝肟肛肚肘‎肐肜肑肒肞‎迌肔肗肠肕‎凬匉帋邸龟‎甸奂免邭劬‎狂狇犻犾犹‎犽狆狈狅犿‎犺狄飏角删‎狃犼狁鸠夆‎条彤卵灸斘‎岛邹刨饨迎‎饩饪饫饬饭‎饮系(丶‎)訁言冹冻‎状亩况亨庑‎庒床庋库庌‎庉庇亪庍庎‎庈疔対疕疗‎疖疓吝彣应‎这冷庐斈応‎乲序迒辛竍‎冸竌杗冺肓‎弃冶忘闰闱‎闲闳间闵闶‎闷羌判兑灴‎灶灷灿灹灼‎灺炀弟沣汪‎汧汫沅沄沐‎沞沛汥沔汱‎汰沤沥汯沋‎洰沌沘沍沏‎沚沙汩汨沖‎汭汻汼汽沃‎沜沎沂沠汳‎沦汵汹汾泛‎沧汦泲沕沨‎汮没沒沟汴‎汶沆汸沩沪‎沈沉沁沢決‎沑泐泤沇汿‎忹忨怃忶忮‎怀忲怄忧怇‎忳忡忤忾怅‎忻忦忴忷忪‎怆忰忯忺忭‎忟忼忱快忸‎忬労宑完宋‎宊宏宐牢宒‎宎究穷宍灾‎良证诂诃戻‎启帍戺评补‎初社礿祀祂‎祃冝诅识诇‎诈诉罕诊诋‎诌邲吢词诎‎诏诐译诒‎(乛)君灵‎即层杘屁屃‎尿尾迟局戼‎弡刡改攺张‎刜弞忌弝际‎陆阷阹阿陃‎壯孜妝陇孞‎陈岊阽妛阻‎阼陁附坠阾‎阺陀阸陂陉‎妦妍妌妋妧‎妩妘姉妓妚‎妪姖妣呄妙‎妕妠妊妖妡‎妎妗妢姂妐‎姊妏妔妨妫‎妒妉妜妞妑‎姒妤努刟卲‎邵劭盁忍刭‎劲甬刣邰矣‎夋鸡纬纭驱‎纮纯纰纱驲‎纲纳纴驳纵‎纶纷纸纹纺‎纻驴纼纽纾‎糺災【八‎画】(一‎)邼劻耓奉‎玤玨玞玩玮‎环玡玭珁武‎青靑责现玝‎玫玠玪玢玜‎玱玥表玬玣‎玟玦玧甙盂‎郉汬烎刱忝‎昋规匦拝抺‎抹長刲卦邽‎劸抾坩拑抴‎邿坷抲抦坯‎抷坧拓抪垅‎拢坺拔拋坪‎抨拣拤坫拈‎垆尭坦坥担‎抯坤押抻抽‎坱抧抰拀郆‎劼拐抩垇坰‎垁抶拃拖坵‎拞坿拊者拍‎顶坼拆乴坬‎坴垀抮夌坽‎拎拥坻抵坸‎拘拠势垉抱‎拄拡垃拉拦‎幸坢拌坾拧‎坹坨拕抭坭‎抳垊抿坲拂‎拙招拁坡披‎拨择弆拚坮‎抬迲刼亞坶‎拇坳拗耵刵‎其耶取苿茉‎苷苦苯昔苛‎苪苤若茂茏‎茇苹炗迣苝‎苫苜苴苗苖‎英苢苒苘苬‎苼苵苲茊茌‎苻苮苩苽苶‎苸苓苚茚茋‎苟茐茆苳茑‎茒苑苞苙范‎苧茓茔苾茕‎直苨苠苐茀‎苰茁苕茄茎‎苔茅苺苭枉‎枅枎杬枟林‎杮枝杯枤枢‎枥枙柜枒杶‎枇枑杫杪枏‎杳枘枧杵杽‎枆枡枖枚枨‎杹析枛板枍‎來枞枔枌柉‎松枩枪枂枠‎柹杴枫枬枃‎枊杸构杭枋‎枓杰述枦枕‎杺杻杷杼丧‎刯軋東乶或‎画叀卧臥臤‎忢事尀刺兩‎枣雨廼協卖‎厓厔矸矼矹‎郁矺矻矽矾‎砐矿矷砀码‎靣厕厒奈刳‎郀奔奇匼奄‎奋奃奅态瓯‎欧殴豖垄劽‎殀歽歾殁歿‎郕刾郏疌妻‎轰顷转轭斩‎轮软旾戔枈‎兓毞炁到郅‎鸢瓲瓱瓪瓰‎(丨)非‎叔歧歫歨歩‎肯齿些羋卓‎奌迠卥肻虎‎虏肾贤尙毟‎尚坣盰盱旺‎具昊昙味杲‎果呩昁盵昃‎盳昛旽昆咑‎国呿咁呭哎‎咕呠畃迧昍‎昌冐門呵咂‎畅旿咗昇呸‎咘昕昄昑昐‎昖明昒易欥‎咙昀昂昗旼‎旻昉昘呯炚‎炅昈咔畀畁‎囸呫甽畂虰‎甿虲虮虯虭‎迪典固忠呾‎咀呷呻黾呺‎丳呮咉呪咒‎郘呥呬呹咋‎咊咐咃呱呼‎呤呧呴咚鸣‎咆呟咛咜呝‎咇咏呞呢呡‎咈咄呶咖咍‎呣呦咝帓岵‎岢岸岯岩帗‎岼岽岾帖罖‎罗岿岨岬岫‎峀岟帜岲帙‎岞岝岴岶帕‎岭岺岻岣峁‎刿峂岦岤岮‎廻迥岷剀岪‎凯岹岧岥帔‎峄峅岰囷囶‎沓沝败账贩‎贬购贮囹沀‎图岡罔囻咼‎囼(丿)‎钍钎钏钐钓‎钒钑钔钕钖‎钗邾制缷幷‎知迭氜氝氛‎忥迮牫垂牪‎牦牧牬物牨‎牥乖刮舏秆‎和秈秊秅秇‎秄季委竺竻‎秉迤侙侀佳‎侍佶岳侤佬‎佴供姇使侢‎価佰侑侟侕‎侉例侠臾兒‎侇侥版侄垈‎岱帒郔佌侦‎侊侣侗侃佪‎侧侏侁凭侹‎佸侨侐侜佺‎侩佮佻佾佩‎佹侚货佭佲‎佫俢侈隹侂‎侪佼依佽侅‎侫佯併侎侘‎侒侬侓郋帛‎卑的迫佷侭‎阜卹侞侔质‎斦欣郈劶征‎徂徃彾彽往‎爬彿彼径所‎郍舠瓝佱舍‎金釒刽郐舎‎刹侖郃命肴‎郄肏斧怂爸‎尩采籴觅受‎爭乳飠侌贪‎欦念瓫贫攽‎炃忿枀瓮忩‎戗肨肼肤朊‎肺肢肧肰肽‎肱肬肫肶肿‎肭胀肵肸肹‎肣朌朋胏肳‎肷股肮肪肥‎服胁周剁凮‎昏迩郇鱼兔‎狋匋狜狉狘‎臽狚狙狎狌‎狏狛曶狐狑‎忽狝狗狍匌‎狞狖狔狒狓‎狕肦咎迯备‎夝匊卶炙枭‎妴饯饰饱饲‎饳饴(丶‎)迬冽变京‎享冼庞店夜‎庘庙府底庝‎庖疞疘疜疛‎疟疠冾疝疙‎疚疡斉剂卒‎郊効忞兖庚‎废净乵竎咅‎竏妾冿盲瓬‎放斻刻斺於‎郂劾育氓闸‎闹劷郱奍郑‎券劵卷並籵‎籶单炐炜炑‎炋炬炖炒炇‎炛炘炍炌炂‎炝炊炈炞炆‎炕炏炎炓炉‎炔炄沬沫沶‎浅泟泋法泔‎泄沽泍沭河‎沰泷沷泙泧‎沾泸乷泹泪‎沮沺油泱況‎泂泅泗泩泆‎泎沲泭泊泝‎泒泘沴泠泜‎沵泺沿泃泖‎泈泡注泣泫‎泮泞泬沱泻‎泌泳泀泥泦‎泯沸泓泏沼‎泇波泼泽泾‎治泑怽怔怯‎怈怙怵怲怌‎怖怦怴怗怛‎怚怞怾怏怳‎怬性怢怍怕‎怜怟怐怉怰‎怑怭怺怩怋‎怫怓怊怶怿‎怪怡怮畄鼡‎峃学実宝宗‎定宕宠宜审‎宙官穻空帘‎穸穹迱宛宔‎实宓宖诓诔‎试剆郎勆诖‎诗诘戾肩房‎诙戽诚郓衦‎衧衬衫衱衪‎衩祆祎祉祌‎视祍祅祈祄‎祇祋祊诛诜‎话诞诟诠罙‎诡瓭询诣沊‎诤该详冞诧‎诨诩(乛‎)建肃录隶‎帚孠屆屉居‎屇届刷鸤迡‎屄屈矤弣弧‎弤弥弦弢弨‎弪承孟陋牀‎狀戕陌陏陑‎斨孤陓孢陕‎孡旹亟陎陒‎降陊函陔限‎卺乸妹妺姃‎姏姑妸妬妭‎刴妲姐妽妯‎姎姌姍姓妷‎妰姀姈妳姁‎姗妵妶姅妼‎妮姄妱始帑‎弩孥驽姆虱‎迢迦巶妿驾‎皯迳叁参迨‎劺癷艰亝叕‎线绀绁绂练‎彔驵组绅细‎驶织驷驸驹‎终驺绉驻绊‎驼绋绌绍驿‎绎经骀绐贯‎毑糽糾糿糼‎孧甾【九‎画】(一‎)砉耔契贰‎奏春帮珏珐‎玵玴珂珑玶‎玷珇玾珅珃‎珄玳珀顸珍‎玲珎玽珊珋‎玸玹珌珉玿‎珈玻珆毒型‎沗匧兘韨垹‎挷拭壵垚挂‎封持奊拮拷‎挕垬拱垭挜‎挝垣挋拺拪‎拵项垮挎拻‎垯挞挒城挟‎挗捓挠垤挃‎垰挊政赴赵‎赳赲桒贲挘‎垙挄垱挡拽‎垌捛挏壴迼‎哉垲挺括挢‎垘埏挻拰郝‎垍乽垖垧垢‎垳挀耇耉拴‎垥拾垗挑巬‎垛挆垝指垫‎垎挌垑拸埩‎挣挤挍垴挔‎垓垟垪拼垨‎垞挓挖垵按‎挥垏挦挪垠‎拫拯逇巭垜‎挅拹挧叝拶‎某甚荆荊茙‎茥荖羐茿茸‎荁革茞茦茜‎茬荐荋荂荙‎巷荗茢荿荚‎枼荑贳荛荜‎荎茮茈茪带‎草茰茧莒茼‎茵茴荝茱莛‎荞茠茯茷莚‎茽荏茩荇荃‎荟茶荅荕荀‎荈茗茖茤荘‎荠茭茨荒荄‎茺垩荓茳茫‎荡荢茡荌荣‎荤荥荦荧茟‎荨乹茛瓳故‎荩胡兙剋勀‎勊怘荪荍荫‎茹茘荔南荬‎荭荮药茲枺‎标柰栈柾枿‎桏柑枻枯栉‎枾柯柄柸柘‎柨栊柭柩枰‎栋枮栌柦相‎柤查査柙柛‎枵柚枳柍柷‎枴柺柟柵柶‎栍柣柞柇柂‎柎柏柝栃栀‎柧柗柃柢栎‎枸栅柳柊栁‎桞枹柱柿柆‎栏柈柠柼柁‎怸柲栐柌柅‎柫柮柖枷柀‎柽树枱柕栂‎柪怷郣勃軌‎郙郠匽専剌‎栆勅畐郚剅‎郖垔要酊迺‎郦柬厙咸厖‎威歪盃甭研‎頁砆砖厘砈‎迶砗厚砑砘‎砒砌砙砋砂‎砅泵砚厛斫‎砎砛砏砭砕‎砍砜砃砓砇‎砊砄面耐耎‎耏耍奎耷厗‎郟奓奒盇羍‎昚牵鸥虺卼‎尯残迾姴殂‎殃殅殇殄殆‎尮轱轲轳轴‎轵轶匨轷轸‎轹轺轻匩鸦‎虿皆毖剄勁‎(丨)韭‎背茍呰姕貞‎战敁觇点虐‎临览竖尜尛‎省削尝盽盶‎眃哐昧昩眄‎狊眍盹昰是‎昻郢昮眇昞‎昺眊盺眅盻‎則昦郥盼眨‎眀眂昜昽盷‎盿眆眈県哇‎咭咾哋咠咡‎哄哑显冒咺‎閂閁映禺昷‎哂甠星昳昨‎咟哊咵昣咴‎哒昤昫曷昴‎咧昸昿昱昡‎昹昵昲咦昢‎哓昭哔咥昪‎畊畉畎畏毗‎毘趴呲胃冑‎胄贵畋畈畍‎界畇虷虶虹‎虾虴虼虳虻‎蚁虸虵思蚂‎盅咣咢剈虽‎品哃咽迵骂‎哕剐郧勋哖‎咮咶咻唌哗‎咱囿咿响哘‎哌哙哈咷哚‎咰哅哛咯哆‎哜咬咳咩咲‎咪咤咹哝哪‎哏哞哟峙峔‎峘峟帞峏耑‎峚炭峢峛峸‎峡峓峫峣峌‎峠廽罘帧罚‎峒峝峤峑峆‎峇帢峜峗峞‎峋峈峉峥峕‎峧峐帡峖峍‎迴峎贱沯贴‎畓贶泴圀贻‎骨幽(丿‎)钘钙钚钛‎钜钝钞钟钡‎钢钠钣钤钥‎钦钧钨钩钪‎钫钬钭钮钯‎卸乗缸拜看‎矩矨怣矧氞‎毡氠氡氟氢‎牯牱怎牰郜‎勂牭牲牴选‎牳适臿秐秓‎秬秕秒香种‎秏秗秎秖秭‎秔秋科重复‎竿竽笁竼笂‎笈笀竾笃勄‎俦段侾俧俨‎俅怤侼俥俌‎便俉侸俩俪‎侲俖俠俫舁‎帠叟垡柋贷‎牉牮牊俓顺‎修俏侱俣俔‎俚保俜促侽‎侶俁俋侺俈‎俄俐俬侮俆‎俙俭侳俗俘‎俀俛俇係信‎侻俤俒俕俍‎皇鳬皍泉敀‎侰皈卽鬼侵‎皅禹侯侷峊‎帥追衂逈怹‎俑俟俊盾垕‎逅衎徍待徔‎徆徊徇徉爮‎衍律很後须‎乺舡舢舤舣‎叙釓釔剎俞‎弇兪郗剑侴‎逃剉俎爼卻‎郤爰爯郛食‎瓴兺盆鸧胠‎朑胢胚胧胈‎胓胨胩胋胪‎胆胛胂胑胦‎胜胅胙胣胕‎胉胍胗朎胝‎朐胞胘胖脉‎胒胇朏胫胎‎胟鸨匍矦負‎迿敂斪欨勉‎奐狨狤狫狟‎狭狮独風狪‎狦狧狿甮狯‎狣怱狥狢狰‎狡飐飑狩狱‎觓觔狠狲訇‎訄胊胐逄昝‎迻粂夈贸怨‎急饵饶炰蚀‎饷饸饹饺饻‎胤饼(丶‎)計訂訃訅‎訆殶凁峦変‎弯孪娈将奖‎亰畒畆亯哀‎亭亮庤度庢‎庛亱弈奕帟‎迹庭庥庣凃‎疬疣疨疪彥‎疥疭疺疮疩‎疧庡疯疫疢‎疦疤兗庠庰‎凂垐咨姿亲‎攱竑竗音竒‎竓竔彦竕飒‎竐帝衁斾斿‎施乻旀玅闺‎闻闼闽闾闿‎阀阁阂差羏‎养羗美羑姜‎迸剏叛帣送‎巻弮籿类粀‎籼粁籷籺迷‎籸籽籹娄籾‎前酋首逆兹‎总炡炢炣炳‎炻炦炼炶炟‎炠畑炽炴炾‎炯炸秌炧炿‎烀炩烁炵炮‎炷炫烂炨炥‎炪炤烃炲剃‎為洭洡洼洔‎洁洘洱洪洹‎洅洓洒洦洧‎洊洏洿洃洌‎浃柒洟浇洷‎泚浈浉洸洩‎浊浀洞洇洄‎测洙洗涏活‎洑浌涎洎洢‎洫洉洐派洀‎洤浍洽洮洕‎染洬洈洵洶‎洚洺洛浄乼‎洂浏济洨浐‎洋洴浂洣洲‎洝浑浒浓津‎浔泿浕洆洳‎洠恇恜恸恃‎恄恅恾恒恓‎恆恹恠恗恢‎恞恎恍恫恛‎恺恻恬恘恤‎恦恮恰恡恌‎恱恑恂恉恟‎恪恀恔恼恲‎恽恨恊恈举‎単栄泶觉宣‎宦宥宬室宫‎宪穽穼突穿‎窀宨窃窂穾‎窆客宩叜诪‎诫冠郞诬軍‎语扂扁扃衭‎袆衼衵衻衶‎衲衽袄衸衿‎衯衳衹袇袀‎衴袂祙祛祜‎祏祐祓祖神‎祝祑祚祔诮‎祗祢祕祠祒‎误诰诱诲冟‎诳鸩说昶诵‎诶(乛)‎郡垦退既叚‎屍屋屌昼咫‎屏屎弭弫昬‎敃盄费巺陦‎陡逊陣陠韋‎陙牁眉胥陜‎陝孩孨巼陛‎陘陟陗陧陨‎凾芔欪陞除‎险陥埅院巹‎陖姸娀娃姞‎姥娂娅姮姫‎姷姱娍姨娆‎姪姯姛帤姻‎姩姝姺娗姡‎娇娫姙姠娰‎姤姾姶姚姵‎姽姰姳姼婙‎姣姟姘姹姲‎娜姧姦姢拏‎怒架贺毠欩‎飛姭盈怼羾‎羿貟覌枲勇‎勈瓵炱怠癸‎発癹蚤柔敄‎矜垒绑绒结‎绔骁绕绖骃‎骄骅绗绘给‎绚彖绛骆络‎绝绞骇统骈‎骉蚃紆紅紂‎紇紃約紈級‎紀紉紁【‎十画】(‎一)耕耘耟‎耖耗耙艳栔‎洯挈恝泰秦‎珡珪珯珥珙‎珬珛珔顼珹‎琊玼珖珰郬‎珚珠珤珗珽‎珦珩珘珨珧‎珮珟珣珞琤‎珓珫珜班珱‎珲珒珢敖珕‎珝素冓匿祘‎唜栞蚕顽盏‎匪挵髟镹捇‎恚埖捞栽捄‎挬捙埔捕埂‎挭捒捂馬振‎埉挾载挳埗‎捗赶赸起枽‎盐捎垾捍埕‎挰捏埘貢垻‎垷挸捑埋捚‎捜捉捆埍捐‎埙埚损欯袁‎挹捌埁埛捁‎挿耊挴捠都‎埑哲逝娎耆‎耄捈勎捡挩‎挫埒埓捋垺‎捊挼换挽埆‎捔埄捀贽挚‎热恐捣垿垶‎捝烖挮挱垸‎捖埌壶捃埐‎揤捤挶埇捅‎唟盍埃挨埈‎捘紥耺耾聀‎耻耼毦剘耹‎聁耿耽恥郰‎聂華荴莏莰‎荺茝荰莕莁‎莍荸莗剒莆‎莄荳莤莀鄀‎恭拲莢莽莱‎莲莖荹帯莦‎莳茣莫莧莇‎荲莡莮莴荶‎莂莔莪莉莠‎莓荷莜莋莅‎莵菦荼莃莶‎莝莩荽莟莬‎获莸荻莥莑‎莘莣晋恶莌‎莯菃莎莈莐‎莞莹莨莺真‎倝莙莭畞巸‎荱尅兛鸪莊‎莻荵荾莼框‎梆桟栻柡桂‎桔栲栳栮栱‎桠郴桓栕栜‎栖栢栯栫栭‎桍栵桋桡桎‎桛桢桄档栧‎梠桐栶桤株‎梃栝桥栴栿‎桕栰梴栣桦‎桘桖桁栓桧‎桃郲勑桅栒‎栺桝栙格栘‎棦栬栤桩校‎栨核样栟栚‎栦桜桉桪梛‎根桗栛栩桙‎桚逑索軒軑‎軏軎軕軓連‎軐軔尃逋彧‎曺哥恵速逜‎鬲豇逗剚栗‎贾覂敇酐酑‎酎酌逎配酏‎彨逦翅辱唇‎厝烕厞孬砡‎砞夏砝砹砵‎砢砸砺砳砰‎砧砠砷砟砤‎砶砼砱砽砥‎砾砲砫砿砬‎砯砣砨砩础‎破硁唘砪恧‎厜原套剞剦‎眘豗匫逐剢‎砻烮烈殊殈‎殉盋肂翃顾‎郪轼轾轿辀‎辁辂较鸫顿‎趸剗毙粊致‎貣晉袃瓸逕‎(丨)剕‎鬥敊歭歬龀‎柴赀桌逌卨‎鸬虔虑监丵‎紧覍帰逍党‎眛眜眎眐眪‎眬眓晆時哢‎唛逞畢晎晅‎眒眏眖晒眣‎晇財眕貤眡‎眗覎晠晟眩‎眫眝眿眤眠‎晓眧晊眙眑‎唗唝哧哳哮‎唞唠鸭晄晃‎哱唓冔閅哺‎哽閃閄唖唔‎晍哣唡唒晔‎晌晑晀晁唊‎剔哤曻晈晐‎晏晖晕鸮哶‎趶趷趵趿畕‎畘畖畛畟蚌‎蚟蚈蚨蚖蚞‎蚑蚘蚅蚷蚜‎蚍蚎蚦蚛蚋‎蚬畔蚝蚚蚧‎蚥蚙蚡蚣蚏‎蚔蚒蚐蚊蚢‎蚄蚪蚇蚗蚓‎蚆哨唢哻唄‎員哯哩圃哭‎戙哫圄唈哵‎哠哦唎唀哬‎唕唣唋唏欭‎恩盎唑唂鸯‎哷哹哸唅唤‎圂唙唃唁哼‎唥唴哾唦唍‎哰哴唚唧啊‎唨唉唆帱崋‎崁崂峬峺峿‎豈帪峽崃逥‎罡罢罟眔罝‎罛罜罠罞峭‎帩峴埊峼峨‎峩峲峳崄峪‎崅峰峯訔峷‎帨峵崀峮圆‎觊峻贼贿赂‎赃赅赆圁剛‎剮(丿)‎钰钱钲钳钴‎钵钶钷钸钹‎钺钻钽钼钾‎钿铀铁铂铃‎铄铅铆铇铈‎铉铊铋铌铍‎铎眚甡缻缼‎缹缺毧氩氥‎毢氤毨毥氦‎氧氣毩氨毪‎特牺郵造牷‎牸埀乘敌舐‎秣秙秫秠秡‎秤秥租秞积‎秧盉秩秨秝‎秢秪称剓秚‎秘秜秛透秮‎谸笄笎笌笓‎笍笕笔笑笊‎笅笒笫笏笉‎笇笐笋笆笖‎俸倵倩债俵‎倀偖倰倖屔‎俹倛倻借偌‎偀值値倈倯‎烋恷倲倳倆‎倷倴倚俺倢‎郳倾俴倒俳‎俶倬俿條倏‎脩倐倘倶俱‎倮倱倡們倎‎個候倂倁栠‎倕赁恁俰倭‎倪倠俾俽倽‎倫倹倄倸倊‎倗俷倜倃俻‎隼隽隻倞俯‎倅俲倍倿倣‎俼倦倓倧倌‎倥倇皌臬健‎臭射皋躬息‎島畠郫皊烏‎倨倔師衃欰‎衄恖逓颀衏‎徒徕衐虒徑‎徏徎徐垼従‎殷舦舭舯舰‎舨舧舩舱般‎航舫舮舥瓞‎瓟峹途針釘‎釗釙釟釞釠‎釚釕釖釛釢‎殺敆拿剣欱‎郩釡釜夎耸‎逧爹舀爱豻‎豺豹奚鬯倉‎飣飤飢衾鸰‎颁蚠颂毤翁‎胿胹胯脄胰‎胵胱胴胭朒‎脌脡脠胻脈‎脍脎朓脆脂‎胸胮胳脃脏‎脐胶脑胲羘‎胼朕脒胺脓‎脇郮匎鸱虓‎玺眞鱽鸲烉‎逛狾狹狵狴‎猂狽狸狷猁‎狳狶猃狺猐‎逖猀狼胷觙‎卿峱狻逢脁‎桀夞洜敋鸵‎留袅眢盌鸳‎皱饽饾芻饿‎馀馁馂(‎丶)凊訐訏‎訌討訕託訖‎訓訋訙訉訯‎這訊記訑訒‎訍凌凇凍凄‎衺栾挛恋桨‎浆衰恴畝凅‎剠勍衷畗高‎亳郭庪庨席‎庫庯庮庬准‎庩座症疳疶‎凎疴病痁斊‎疸疽疻疾痄‎斋疹痈疷痀‎疼疱疰痃痆‎疿痂疲痉蚉‎剤脊效凈离‎衮紊唐凋颃‎栥瓷资恣凉‎站竜剖竞部‎勏竛竘竝竚‎旁旆旊旄旂‎旅旃欬畜玆‎阃阄訚阅阆‎羒羖羞羓羙‎羔恙瓶剙桊‎牶拳勌粏粔‎粃粆粍敉粄‎粉粋粅粇料‎粐粎粌粈粑‎益兼朔欮郸‎烒烓烤烘烡‎烵烞烜烥烠‎烦烣烧烛焒‎烔烟烍烶烌‎烻烨烅烆烐‎烇烩烚烑烙‎烄烗烊烪剡‎郯烢烬递涛‎浾浙涍涜淽‎淓涝洍涁浗‎浡浦浭涑浯‎浢酒浱浹浝‎涞涟浳涇涉‎逤娑消涆浧‎涅浿洖涀浬‎涠涄浞涃涓‎涢涡浥涔浻‎浩涐浰海浜‎浟涖垽峾涂‎浠涗浴浖浮‎浽浛涣浼浲‎涤浵涥流润‎涧涚涕浺浣‎浨涋浤浶浪‎涙浫涒浸浘‎涨烫涩涊涌‎涘浚悈悖悑‎悚悟悏悂悭‎悄悍悜悮悓‎悝悃悁悞悒‎悎悧悔悇悕‎悅悗悙悋悯‎悦悌悩悢悀‎悛挙鸴害宼‎宯宽宧宸家‎宵宲宺宴宮‎宾宱窍窉窅‎窄宷窊容窌‎窎窇窋窈剜‎宰宭案宻请‎冦冡朗欴诸‎冣诹诺冧读‎扄扅扆肁冢‎诼扇诽袜袪‎袣袔袏袥袚‎袩袒袓袖袡‎袟袮袘袝袙‎袗袊袛袧袍‎袨袢袕袉袐‎袦袑被袯袎‎祮祬祯祩祣‎祫祧祪祥祤‎课冥诿谀隺‎谁谂调冤谄‎谅谆谇谈谊‎谉(乛)‎書剥帬恳堲‎叞展剧屒屑‎屓屗屘屐屖‎屙弬弳弰弲‎弱陚陼陸陵‎陬孭陳娿勐‎弉奘娤陭疍‎牂孫陫蚩祟‎陲陹陮陴陯‎険陰陶陷陱‎陪脀烝娡婲‎姬娔娕娪娠‎娝娏娙娋娨‎娱娊娌桇娉‎娖娚娟娲挐‎恕娯娛娥娳‎娒娦娐娞娢‎娩娮娴娧娣‎娘娓婀恏砮‎娭哿皰脋脅‎奙畚翄翀毣‎翂翆通能圅‎逘难逡预矝‎務斚桑剟绠‎骊剝绡骋绢‎绣验绤绥绦‎骍继绨骎骏‎郷紜紑紎紘‎紌純紕紗納‎紝紤紒紟紛‎紣紙紋紡紏‎紞紖紐紦紓‎邕鸶【十‎一画】。

最新汉字编码

最新汉字编码
4
bjhk
ASCII码




bjhk
美国信息交换标准编码(“美标”) 用从0到127的128个数字来代表信息的规 范编码 包括33个控制码,一个空格码,和94个 形象码 形象码中包括了英文大小写字母,阿拉 伯数字,标点符号等 国际上大部分电脑的通用编码
5
文本文件与二进制文件



字符大都是用一个八位二进制数字表示,美标 只规定了128个编码,剩下的另外128个数码没 有规范,美标中的33个控制码,各厂家用法也 不尽一致 文本文件(ASCII Text Files) :美标形象码或空 格码组成,通常可在不同电脑系统间直接交换 二进制文件(Binary Files) :含有控制码或非美 标码的文件,通常不能在不同电脑系统间直接 交换


bjhk
ASCII(英文) GB2312 GBK GB13000 GB18030 BIG5 Shift_JIS ISO/IEC 10646 Unicode
3
汉字的几种通行名称




Hanzi,Hantsu,汉字 Ideographic character,表意字符,中文字 符 Kanji-日文中的叫法 Hanja-朝鲜文中的叫法 CJK-中日韩通用字符集 Unihan
6
bjhk
国标、区位、“准国标” 、机内 码





bjhk
国标:中华人民共和国国家标准信息交换用汉 字编码 国标(GB2312-80)表(基本表)把七千余汉字、 以及标点符号、外文字母等,排成一个94行、 94列的方阵 每一横行叫一个“区”,每个区有九十四个 “位” 一个汉字在方阵中的坐标,称为该字的“区位 码” 例如“中”字在方阵中处于第54区第48位, 它的区位码就是5448 7

Unicode汉字和英文编码范围

Unicode汉字和英文编码范围

Unicode汉字和英文编码范围2008年10月26日星期日 20:38中文的unicode码的范围4e00-9fa5如果是英文asc,高自己是0x001)标准CJK文字/Public/UNIDATA/Unihan.htmlCode point range Block name ReleaseU+3400..U+4DB5 CJK Unified Ideographs Extension A 3.0U+4E00..U+9FA5 CJK Unified Ideographs 1.1U+9FA6..U+9FBB CJK Unified Ideographs 4.1U+F900..U+FA2D CJK Compatibility Ideographs 1.1U+FA30..U+FA6A CJK Compatibility Ideographs 3.2U+FA70..U+FAD9 CJK Compatibility Ideographs 4.1U+20000..U+2A6D6 CJK Unified Ideographs Extension B 3.1U+2F800..U+2FA1D CJK Compatibility Supplement 3.12)全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF/charts/PDF/UFF00.pdf3)CJK部首补充:2E80-2EFF/charts/PDF/U2E80.pdf4)CJK笔划:31C0-31EF/charts/PDF/U31C0.pdf5)康熙部首:2F00-2FDF/charts/PDF/U2F00.pdf6)汉字结构描述字符:2FF0-2FFF/charts/PDF/U2FF0.pdf7)注音符号:3100-312F/charts/PDF/U3100.pdf8)注音符号(闽南语、客家语扩展):31A0-31BF/charts/PDF/U31A0.pdf9)日文平假名:3040-309F/charts/PDF/U3040.pdf10)日文片假名:30A0-30FF/charts/PDF/U30A0.pdf11)日文片假名拼音扩展:31F0-31FF/charts/PDF/U31F0.pdf12)韩文拼音:AC00-D7AF/charts/PDF/UAC00.pdf13)韩文字母:1100-11FF/charts/PDF/U1100.pdf14)韩文兼容字母:3130-318F/charts/PDF/U3130.pdf15)太玄经符号:1D300-1D35F/charts/PDF/U1D300.pdf16)易经六十四卦象:4DC0-4DFF/charts/PDF/U4DC0.pdf17)彝文音节:A000-A48F/charts/PDF/UA000.pdf18)彝文部首:A490-A4CF/charts/PDF/UA490.pdf19)盲文符号:2800-28FF/charts/PDF/U2800.pdf20)CJK字母及月份:3200-32FF/charts/PDF/U3200.pdf21)CJK特殊符号(日期合并):3300-33FF /charts/PDF/U3300.pdf22)装饰符号(非CJK专用):2700-27BF/charts/PDF/U2700.pdf23)杂项符号(非CJK专用):2600-26FF/charts/PDF/U2600.pdfUnicode字符编码分布表――语言文字类编码分布表――标点符号类。

汉字的utf-8编码

汉字的utf-8编码

汉字的utf-8编码
UTF-8 是一种可变长度的字符编码,可以用于表示Unicode 字符集中的所有字符,包括汉字。

汉字的UTF-8 编码通常是由一个或多个字节组成,具体的编码方式如下:
1. 常用汉字的编码范围:
-汉字的编码范围主要位于Unicode 的CJK(中日韩)统一表意文字区块,即U+4E00 到U+9FFF。

2. UTF-8 编码规则:
-单字节字符(ASCII 字符):对于ASCII 字符,UTF-8 使用一个字节表示,与ASCII 编码相同。

-多字节字符(包括汉字):UTF-8 使用多个字节表示。

汉字的编码规则如下:
-对于U+4E00 到U+7F 的范围,采用三个字节表示。

-对于U+800 到U+FFFF 的范围,采用三个字节表示。

-对于U+10000 到U+10FFFF 的范围,采用四个字节表示。

3. 汉字的例子:
-汉字"中" 的Unicode 编码是U+4E2D,其UTF-8 编码是三个字节:`E4 B8 AD`。

-汉字"国" 的Unicode 编码是U+56FD,其UTF-8 编码也是三个字节:`E5 9B BD`。

UTF-8 编码采用可变长度的方式,使得表示范围更广泛的字符需要更多的字节。

这种灵活性使得UTF-8 成为目前互联网上最为广泛使用的字符编码方案之一。

请注意,UTF-8 编码的字节顺序是固定的,不受字节顺序标记(BOM)的影响。

中日韩统一表意文字 一览表

中日韩统一表意文字 一览表

3300-33FF
U3300.pdf CJK Compatibility
CJK 兼容
CJK互換用文字
3400-4DBF 4DC0-4DFF 4E00-9FBF A000-A48F A490-A4CF
U3400.pdf U4DC0.pdf U4E00.pdf UA000.pdf UA490.pdf
CJK Unified Ideographs Extension Yijing Hexagrams Symbols CJK Unified Ideographs Yi Syllables Yi Radicals
货币符号 字母式符号 数字形式 箭头
通貨記号 文字様記号 数字に準じるもの 矢印
2200-22FF
U2200.pdf Mathematical Operator
数学运算符
数学記号 (演算子)
2300-23FF 2460-24FF
U2300.pdf Miscellaneous Technical U2460.pdf Enclosed Alphanumerics
East Asian Scripts
Unicode Unicode 範囲 PDF
0000-007F
名称
中国語名称
日本語名称
U0000.pdf C0 Control and Basic Latin
C0控制符及基本拉丁文 基本ラテン文字 (ASCII互換)
0080-00FF
U0080.pdf C1 Control and Latin 1 Supplement C1控制符及拉丁文补充-1ラテン1補助
0100-017F 0180-024F 0250-02AF
U0100.pdf Latin Extended-A U0180.pdf Latin Extended-B U0250.pdf IPA Extensions

汉字编码

汉字编码
11

54 区 0 1 2 3 4 5 6 7 8 9 55 区 0 1 2 3 4 5 6 7 8 9 帧 症 郑 证 芝 枝 支 吱 蜘 住 注 祝 驻 抓 爪 拽 专 砖
1 知 肢 脂 汁 之 织 职 直 植 殖 2 执 值 侄 址 指 止 趾 只 旨 纸 3 志 挚 掷 至 致 置 帜 峙 制 智 4 秩 稚 质 炙 痔 滞 治 窒 中 盅 5 忠 钟 衷 终 种 肿 重 仲 众 舟 6 周 州 洲 诌 粥 轴 肘 帚 咒 皱 7 宙 昼 骤 珠 株 蛛 朱 猪 诸 诛 8 逐 竹 烛 煮 拄 瞩 嘱 主 著 柱 9 助 蛀 贮 铸 筑
4
汉字编码
ASCII码




美国信息交换标准编码(“美标”) 用从0到127的128个数字来代表信息的规 范编码 包括33个控制码,一个空格码,和94个 形象码 形象码中包括了英文大小写字母,阿拉 伯数字,标点符号等 国际上大部分电脑的通用编码
5
汉字编码
文本文件与二进制文件



字符大都是用一个八位二进制数字表示,美标 只规定了128个编码,剩下的另外128个数码没 有规范,美标中的33个控制码,各厂家用法也 不尽一致 文本文件(ASCII Text Files) :美标形象码或空 格码组成,通常可在不同电脑系统间直接交换 二进制文件(Binary Files) :含有控制码或非美 标码的文件,通常不能在不同电脑系统间直接 交换
汉字编码
9

09 区 0 1 2 3 4 5 6 7 8 9 ⒜ ⒝ ⒞ ⒟ ⒠ ⒡ 1 ⒢ ⒣ ⒤ ⒥ ⒦ ⒧ ⒨ ⒩ ⒪ ⒫ 2 ⒬ ⒭ ⒮ ⒯ ⒰ ⒱ ⒲ ⒳ ⒴ ⒵ 3 Ⓐ Ⓑ Ⓒ Ⓓ Ⓔ Ⓕ Ⓖ Ⓗ Ⓘ Ⓙ 4 Ⓚ Ⓛ Ⓜ Ⓝ Ⓞ Ⓟ Ⓠ Ⓡ Ⓢ Ⓣ 5 Ⓤ Ⓥ Ⓦ Ⓧ Ⓨ Ⓩ ⓐ ⓑ ⓒ ⓓ 6 ⓔ ⓕ ⓖ ⓗ ⓘ ⓙ ⓚ ⓛ ⓜ ⓝ 7 ⓞ ⓟ ⓠ ⓡ ⓢ ⓣ ⓤ ⓥ ⓦ ⓧ 8 9

基于CJK统一汉字扩充B的输入法研究(可编辑)

基于CJK统一汉字扩充B的输入法研究(可编辑)

基于CJK统一汉字扩充B的输入法研究(可编辑)基于CJK统一汉字扩充B的输入法研究内蒙古大学硕士学位论文基于CJK统一汉字扩充B的输入法研究姓名:张瑞申请学位级别:硕士专业:计算机应用技术指导教师:巩政20090508内蒙古大学硕士学位论文基于统一汉字扩充的输入法研究摘要汉字输入法研究是自然语言处理的一个重要课题,自颁布以来‘,许多研究人员一直在研究支持该超大字符集的输入法,而本课题的主要研究目的是实现处于统一汉字扩充区汉字的输入与显示’。

本文主要从输入法码表的制作和输入法程序的编写两方面来详细介绍输入法的制作。

该输入法码表采用笔画顺序、笔画模糊匹配和部首笔形码三种模式对四字节汉字进行编码, 在具体使用时,笔画输入法只需要按照汉字的书写顺序输入对应的键盘码,就可以显示并输出目标汉字,笔画模糊匹配只需要输入汉字对应笔画的前四笔和后四笔,即可输出目标汉字,部首笔形输入法只需按照笔形对应码将部首和汉字的编码通过键盘输入,便能输出对应的汉字。

输入法的实现符合的删/结构规范卜争“,是目前输入法广泛采用的编程方法之一。

由于处于统一汉字扩充区的汉字主要出现在各种典籍文献中,因此基于统一汉字扩充输入法的实现,为许多用字量大的汉字辞书、古籍文献实现数字化起到了有利的推动作用。

关键词:统一汉字扩充,笔画,笔形,删/结构基于统一汉字扩充的输入法研究匣 . .一气 .’.,,,,.,.,, ,,,, ./.: ?十 , .:,, ,/ 内蒙古大学硕士学位论文图标目录表. 通用编码字符集四维代码结构【引表.笔画输入法中笔画对应的键盘码.图.笔画输入过程示例表.部首编码表.表.部首编码表.表.笔形码码元【】表.笔画输入法与简笔输入法部分码表?。

表.部首笔形输入法部分码表??.表.笔画输入码表重码情况统计?。

表.笔画输入法统计概况表.部首笔形输入法码表重码情况统计? 图. .基本工作过程图.输入法的组成【.表. 窗口处理的消息响应.图.主要接口函数??。

中文编码字符集标准大全

中文编码字符集标准大全

中文编码字符集标准大全.txtゅ你不用一上线看见莪在线,就急着隐身,放心。

莪不会去缠你。

说好的不离不弃现在反而自己却做不到╮中文编码字符集标准大全国家标准代码,简称国标码,是中华人民共和国的中文常用汉字编码集,亦为新加坡采用。

现时中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。

较常见的国家汉字标准代码列表:GB 2312-80信息交换用汉字编码字符集基本集(又称 GB 或 GB0)GB 13000.1-93信息技术通用多八位编码字符集(UCS)第一部分(相当于 ISO 10646-1:1993 中文版)GB 18030-2005信息技术中文编码字符集---GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5 月1日实施。

GB2312编码通行于中国大陆;新加坡等地也采用此编码。

中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。

对于人名、古汉语等方面出现的罕用字,GB 2312不能处理,这导致了后来GBK及GB 18030汉字字符集的出现。

--GB 13000,中华人民共和国国家标准的国家标准代码之一,全称 GB 13000.1-93《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。

此标准等同采用国际标准化组织 ISO/IEC 10646.1:1993《信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面》。

中文汉字的各种编码标准

中文汉字的各种编码标准

中文汉字的各种编码标准
随着计算机技术的不断发展,中文汉字的编码标准也相应地出现了多种。

这些编码标准的出现,对于中文汉字的输入、存储、传输等方面都起到了重要的作用。

目前,常见的中文汉字编码标准主要有以下几种:
1. GB2312编码:GB2312是我国首个官方公布的中文字符集,共收录了6763个常用汉字和682个生僻汉字,是目前使用最广泛的汉字编码标准之一。

2. GBK编码:GBK是GB2312的扩展版本,包含了大约21000个汉字,包括了GB2312中的所有字符,并增加了一些生僻汉字和繁体汉字。

GBK编码标准的出现,大大方便了中文汉字的输入和存储。

3. GB18030编码:GB18030是我国最新的汉字编码标准,共收录了70244个字符,包括了GB2312、GBK中的所有字符以及一些罕见汉字、藏文、蒙文等字符。

GB18030编码标准的出现,使得中文汉字在国际间的交流变得更加便捷。

4. Unicode编码:Unicode是一种全球范围内通用的字符集标准,包括了世界上所有的语言和符号。

其中,汉字部分被分为中日韩统一表意文字(简称CJK汉字),是目前最常用的汉字编码标准之一。

总之,中文汉字编码标准的多样化和不断更新,为中文汉字的计算机化应用提供了强有力的支持。

在未来,随着技术的不断发展,我们也有理由期待更加先进、更加智能的汉字编码标准的出现。

- 1 -。

韩国《汉字研究》简介

韩国《汉字研究》简介

参考文献黄易青2007《上古汉语同源词意义系统研究》,商务印书馆。

刘钧杰1999《同源字典补》,商务印书馆。

王凤阳2011《古辞辨》(增订本),中华书局。

王力1992《王力文集》第8卷,山东教育出版社。

杨伯峻(编著)1990《春秋左传注》(修订本),中华书局。

杨树达2007《积微居小学金石论丛》,上海古籍出版社。

殷寄明2007《汉语同源字词丛考》,中国出版集团东方出版中心。

殷寄明2018《汉语同源词大典》,复旦大学出版社。

张博2003《汉语同族词的系统性与验证方法》,商务印书馆。

张履祥华蓿蓿1987《“铤而走险”的“铤”可作“挺”》,《辞书研究》第6期。

钟如雄2002《“铤而走险”考辨》,《西南民族学院学报》第9期。

(责任编辑:刘秋瑞)韩国《汉字研究》简介《汉字研究》(The Journal of Chinese Character Studies)(JCCS),由大韩民国韩国汉字研究所主办,2009年12月创刊,2017年起正式成为韩国核心期刊(KCI)。

《汉字研究》旨在为世界范围内汉字研究者和爱好者提供一个学术交流平台。

编辑委员会由韩国,法国,德国,美国,加拿大,挪威,日本,越南,中国大陆、台湾、香港等地汉字学著名专家组成。

主编为韩国汉字研究所所长河永三教授,副主编为中国上海交通大学海外汉字文化研究中心主任王平教授。

《汉字研究》每年出版三期,分别为当年的4月30日、8月30日、12月30日。

论文提交到当年的2月27(28)日、6月30日、10月30日截止。

经两个月的审稿与编辑后出版发行。

每期发表文章10篇左右,内容涵括出土文字研究、字书与字典学研究、汉字规范传播研究、汉字理论及教学研究、汉字文化学研究等。

除论文外,刊物也刊发介绍新出汉字学著作、世界著名汉语言文字学家、汉语言文字研究机构等。

所有已发表论文均可在《汉字研究》网站上免费下载。

查询T解更多关于《汉字研究》的信息,敬请访问网站:/o《汉字研究》网上投稿系统:http://hanja.submission.or.kr/。

中日韩统一表意文字(CJKUnifiedIdeographs)[转]

中日韩统一表意文字(CJKUnifiedIdeographs)[转]

中⽇韩统⼀表意⽂字(CJKUnifiedIdeographs)[转]中⽇韩统⼀表意⽂字中⽇韩统⼀表意⽂字中⽇韩统⼀表意⽂字(英语:CJK Unified Ideographs),⽬的是要把分别来⾃中⽂、⽇⽂、韩⽂、越⽂中,本质相同、形状⼀样或稍异的表意⽂字(主要为汉字,但也有仿汉字如⽇本国字、韩国独有汉字、越南的喃字)于ISO 10646及Unicode标准内赋予相同编码。

越南⽂后来加⼊此计划,所以亦有 CJKV (中⽇韩越统⼀表意⽂字)的称呼。

Unicode亦开始收录其仿汉字——喃字版本 ISO 10646 版本Unicode 版本新增置放平⾯字数累计字数19931.0 中⽇韩统⼀表意⽂字基本多⽂种平⾯(BMP)20,90220,914位于“表意⽂字兼容区”中但实则独⼀的汉字基本多⽂种平⾯1220003.0中⽇韩统⼀表意⽂字扩展A区基本多⽂种平⾯6,58227,49620013.1中⽇韩统⼀表意⽂字扩展B区表意⽂字补充平⾯(SIP) 42,71170,2072003第⼀修订版4.1HKSCS-2004 及 GB 18030-2000 中仍未加⼊ ISO 10646 的汉字基本多⽂种平⾯2270,229未有6.0(预计)中⽇韩统⼀表意⽂字扩展C区表意⽂字补充平⾯(预计)4,25174,480历史于1990年代初ISO 10646制订时,来⾃台湾的代表提出将源⾃中国的中⽇韩汉字予以统⼀(Unify, ISO术语称为认同),可以⼤量节省编码空间,获其他代表接纳。

字源最初期统⼀汉字最初期的统⼀汉字(20,902字)字源来⾃以下字集:中国⼤陆的G源G0:GB 2312-80:6,763字G1:GB 12345-90:2,352字(含58个⾹港字和2个吏读字,不包括和G0重覆的字)G3:GB 7589-87:7,237字G5:GB 7590-87:7,039字G7:现代汉语通⽤字表:642(G0, 1, 3, 5, 8未包括的字)G8:GB 8565-89:290字(G0, 1, 3, 5未包括的字)台湾的T源T1:CNS 11643-1986第⼀字⾯:5,401+9字(含9个计量⽤汉字)T2:CNS 11643-1986第⼆字⾯:7,650字TE:CNS 11643-1986第⼗四字⾯:6,319+239+10(含239个CCCII特字和10个XCCS特字)⽇本的J源J1:JIS X 0208-90:6,335+1字J2:JIS X 0212-90:5,801字韩国的K源K0:KS C 5601-87:4,888字(含268个重见字)K1:KS C 5657-91:2,856字以上的来源字集会实施字源分离原则。

sa-6标准

sa-6标准

sa-6标准SA-6标准是指ISO/IEC JTC1/SC2/WG2于2014年发布的Unicode标准的一部分,也是中文字符的Unicode编码。

其全称为《SA-6:中文》(SA代表Sorted Alias)。

SA-6标准中包括了中文字符集的所有字符,包括汉字、注音符号、拼音符号、注注音符号、日音(KANA)、部首、偏旁、CJK符号、中日韩符号、箭头、标点符号等。

它是在Unicode标准的基础上,对中文字符集进行了整理和排序,并对其编码进行了规范化。

对于中文字符的编码,SA-6标准遵循Unicode标准,采用16位无符号整数(即Unicode 码点)进行编码。

其中,中文字符的编码范围为4E00~9FFF,共20992个字符。

SA-6标准的制定是为了解决中文字符编码的混乱和不统一问题。

在过去,由于历史、地域等因素的影响,中文字符存在着多种不同的编码方案,如GBK、GB18030、Big5等。

这些方案之间存在交叉、重叠、不兼容等问题,给中文字符的处理和传输带来了很多麻烦。

而SA-6标准的制定终于解决了这一问题,使得中文字符在不同的系统和平台上都能够得到正确地处理和显示。

SA-6标准的制定过程经历了多轮讨论和修订,参与者包括了来自不同国家和地区的专家、学者和技术人员。

他们在研究和分析现有的中文字符编码方案的基础上,提出了完整、规范、统一的中文字符编码方案,即SA-6标准。

总之,SA-6标准是中文字符的Unicode编码方案,它的制定解决了中文字符编码的混乱和不统一问题,使得中文字符在不同的系统和平台上都能够得到正确地处理和显示。

它的制定是中文信息技术发展的重要里程碑,有助于促进中文信息技术的应用和发展。

古籍数字化过程中汉字字库不足的解决思路-信息管理论文-管理学论文

古籍数字化过程中汉字字库不足的解决思路-信息管理论文-管理学论文

古籍数字化过程中汉字字库不足的解决思路-信息管理论文-管理学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——古籍数字化是加快古籍流通,有效保护古籍的重要手段。

中文古籍数字化肇始于1978 年,美国人PJIvanhoe 使用电子计算机编制了《戴震孟子字义疏证索引》《王阳明大学问索引》《王阳明传习录索引》《朱熹中庸章句索引》《朱熹大学章句索引》机读目录。

目前在美国,由北美36 家图书馆组成的美国图书馆研究学会,拥有25 000 条数据的数据库做到了馆际资源共享,并还在不断地扩充完善中。

哈佛燕京图书馆拥有的线装古籍计算机检索系统中的1 000 余种家谱的资料,目前已经编目完成。

在英国,大量中国珍贵文献和古籍收藏在大英图书馆,大英图书馆开发的古版书简明标题目录是当前全球古籍文献数据库最大的联机数据库。

以上这些成果为我国古籍数字化建设提供了宝贵的经验。

据2010 年不完全统计,我国大陆地区有179 家单位从事古籍数字化,形成各类数据库(包括各种古籍书目数据库、古籍全文数据库等)415 个,许多数据库的字数都在 1 亿以上。

较权威的统计表明,2012年我国公藏机构已经拥有超过20 亿字的数字化文本格式的古籍。

一些已成规模的大型古籍数据库还在原有基础上不断拓展和完善。

中国大陆地区开始中文古籍数字化工作以来,制约古籍数字化进程的主要问题是汉字字库问题。

业界就这一问题进行了深入的研究和探讨。

1 国内外古籍数字化过程中对汉字字库问题的研究概况1.1 汉字字库的研究情况我国从20世纪50年代就开始了计算机中文信息处理的理论和技术的研究,自20 世纪70 年代中期开始,我国逐渐加快在计算机中文信息处理方面的发展步伐,在汉字键盘输入技术、汉字输出技术、汉字编码技术、汉字储存、检索和识别、电子照排、中文平台等多方面取得了一系列重大成就。

陆续开发的汉字键盘输入方法,解决了汉字进入计算机的难题;汉字输出实现了多字体、多字号;汉字字库的制作也由点阵字库、矢量字库逐步过渡到曲线轮廓字库;汉字自动识别技术达到国际先进水平,并有商品投入市场;ISO/IEC 10 6 的CJK 字符集,由早期的20 902个CJK 统一汉字逐步扩充,扩充集A 和扩充集B 已经完成,现在正讨论扩充集C1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统一的中日韩汉字编码字符集》(CJK)字根系统研究《统一的中日韩汉字编码字符集》(CJK)作为新的汉字信息处理国际标准,使汉字信息处理向国际化方向迈出了重要的一步,对汉字字形的定量定性研究也提出了更高的要求。

在此基础上,依靠计算机字形技术的支持,采用字根分解与合成的方法,有可能表示出CJK的全部字符从而实现其无字库化处理。

因此,研究CJK字根系2统,对于CJK的工程应用具有重要作用。

中日韩汉字字形有别而音义互异,但都是可分析的文字,其基本构形单位都是笔画或字根,因此,字根分析法对其同样适用。

本文认为,要得出一个较为科学的CJK字根系统,在理论和实践上必须着重解决两个问题,一个是笔画与字根的分野即单笔字根的问题,另一个就是字根变体的问题。

本文主要分析了CJK的单笔字根和字根变体,并对统计得出的CJK676个字根的有关数据进行了系统的分析,希望能为CJK的相关研究提供参考。

一、CJK的单笔字根(一)为什么要提出"单笔字根"字根是汉字字符的直接构形成分,是可以独立运用的最小构形单位。

一般说来,字根包含两个以上笔画,但当单一笔画与字根直接参与汉字字符构形时,这一笔画由于具备了字根的价值和功能而上升到字根层级,称为"单笔字根"。

提出这一概念主要基于以下考虑:1、汉字字符的构形成分中确实存在许多相对独立的单一笔画,归入邻近的任一字根都不合适,CJK中就有400多个字符包含这种笔画。

如果说汉字字符都是由作为笔画组合体的字根构成的,显然不符合事实;如果说汉字字符是由字根与笔画组成的,固然也未尝不可,但这样就难以清晰地体现字符构形的层级性,故"单笔字根"的提出有其现实的必要性。

2、CJK字符集收入了"一丨丶丿乀乁乙乚乛亅"十个单笔画的字符,如果不引入"单笔字根"的概念,则这十个字符无法进行字根分析。

3、适当拆出字符中的单笔字根,可以大大简化字根系统。

(二)如何析出单笔字根笔画与字根毕竟是不同层级的构形成分,因此单笔字根以尽量少析出为宜。

我们在分析CJK单笔字根的过程中,主要采用了以下方法:1、某一单笔画如果与字符中其它笔画处于相交或相接的关系,则不能析为单笔字根。

如"子、孑、孓"都是由字根"了"与单笔画相交或相接而成,故不再析出单笔字根。

2、如果单笔画与字符中其它笔画均处于相离的关系,则根据以下情况处理:(1)对于点笔来说,若其与某一字根呈内聚之势,且作为整体具有构字能力,则合为一个字根,如"犬、太、刃、玉"等;反之,若作为整体无构字能力,则立点笔为单笔字根,如"乓"。

这样处理可使字根系统的层级性得以体现,同时也照顾了通常的字根拆分习惯。

(2)如果某一单笔画用另一笔画或字根替换后成了另一字符,则只能析为单笔字根,如"糺"中的"乚"替换为"工"后成了另一字符"紅",因此"乚"为单笔字根。

能用这种方法来判断的单笔字根在CJK单笔字根中约占24%。

(3)偏旁部首通常使用频率较高,一般作为整体进入字根系统,不再拆出单笔字根,如"纟"、"刂"、"寸"、"灬"等。

为简化字根系统,有时也需要作变通处理,如"示"中与第一横笔相邻的也不是分笔字根,但将其析出后,余部分无构字能力,为简化字根系统,"示"拆为"二、小",不涉及单笔字根问题。

(三)CJK的单笔字根统计我们采用上述方法得出了CJK单笔字根的有关数据,详见下表:如果把提归入横,捺归入点,竖钩归入竖,其它的归入折,则五种基本笔画在CJK中的出现次数、出现频率以及作为单笔字根时的出现次数与出现频率可列表比较如下:统计结果表明,CJK的20902字符总笔画数为211436,平均每个字符含10.116个笔画,与《汉字信息字典》对《基本集》平均笔画数的统计结果类似[1]。

在CJK的五种基本笔画中,横的出现频率最高,其次为点、竖、折、撇。

五种基本笔画作单笔字根时的总出现次数为1569次,占CJK字根总出现次数(76743)的百分比为2.0445%。

二、CJK的字根变体字根是以各种"变体"参与字符构形的,所谓"正体"其实是对其各种"变体"的归纳,例如我们把作独体字用的"止"定为"正体",但它在合体字"肯、耻、此"中却呈现不同的形状。

此外,对于CJK的同一字符,中台日韩"三国四方"可能有不同的字形标准,有的字符结构相同而字根异形,这就产生了字根变体。

这种变体在CJK中数以千计,假如均单独立为字根,则CJK字根系统将不堪重负。

因此,我们在拆分CJK字根的过程中采用并坚持了"变体归一"的原则。

概言之,CJK的字根变体主要有两种形式,即字根结构变体与字根地域变体,下面分开来谈。

(一)字根结构变体1、什么是"字根结构变体"汉字字形呈拓扑结构,字根在组形结体时都要受到其它字根的制约,不得不调整其形状,甚至改变某一笔形,以保持字形整体的匀称美观。

这种由于字形结构的整体制约而形成的字根变体,我们称为"字根结构变?quot;。

字根结构变体是字根经常存在的形式,广义的字根结构变体,包括同一字根的不同长短、肥瘦、高低等不同形状的变体,其范围之广几乎无法囊括。

我们这里仅讨论狭义变体,即因为结构整体制约而引起某一笔形变化的字根结构变体。

2、字根结构变体的本质--笔形通借同一字根,由于处在字形结构中的不同部位而引起外部制约格局的变化,这一字根相关部位的笔形往往调整为另一相似的笔形,并且呈现出一定的分布规律,这就是笔形通借。

字根结构变体就是由此而形成的。

笔形通借有两个互相制约的条件。

首先,通借笔形与原笔形相似,但不属于同一种笔形,通常是横借为提、捺借为点、竖钩借为竖、竖借为竖撇、竖弯钩借为竖提等。

其次,通借笔形与原笔形没有辨字作用?quot;笔形通借,在一个字的全体结构中,要接受内部所具有的组形结体的制约;在整个现行汉字体系中仍要接受外部来的别的字的制约。

"[2]如果两个笔形因其不同形而构成了不同的字符,则它们之间不构成通借关系,如"地"中的"土"字旁是"土"的变体而非"士"的变体,则其提笔与"士"中短横不构成通借关系。

"干"与"千"、"天"与"夭"中的短横与平撇都是相似笔形,但均具有辨字作用,因此也不能构成通借关系。

笔形通借与笔势(即运笔的方向和气势)有着十分密切的关系。

相通借的笔形一般都有相通的笔势,如横与提的笔势从左往右,捺与点的笔势从左上往右下,竖弯钩与竖提的笔势先自上而下,再从左往右。

"千"的平撇与"干"的短横,之所以不相通借,除了它们具有辨字作用的因素外,笔势在其中也起着重要的作用。

《印刷通用汉字字形表》和《现代汉语通用字表》把汉字的基本笔画确定为"横竖撇点折"五种,是深入研究笔形通借现象而得出的科学结论。

同样,由于"丨"与"亅"之间的通借关系,我们也可以据此确定"亅"在五种基本笔画中的归属。

我们根据笔形通借的不同情况,对CJK字根结构变体作了分析统计,统计结果表明,CJK常见的字根结构变体共110个,尚难以概括其全貌,假如把这些变体都作为字根的话,那么CJK总字根数将增加至少110个,这个代价不可谓不大!武汉大学和文改会《辞海》字根统计也进行了变体的合并,如把" "归入"土",把"朩"归入"木",但其字根总表中却收入了"牛、车、月"的结构变体"牜、、",[3]应该说是一个不小的失误。

(二)字根地域变体CJK是一个繁简异兼有、新旧字形并存的跨国大字符集,由于语言、文化条件的差异以及地理因素的影响,"三国四方"汉字字形发生了某种程度的分化,我们把这种由于地域差异而形成的字根变体称为"字根地域变?quot;。

CJK字形分歧主要有以下情况:笔画数相同,个别笔形或笔画组合方式有差异,如"氐"、"与"等;笔画数不同,但字形总体相似,如"及"、"垂"等;笔画数和个别笔画组合方式均有差异,字形相似度低,如"丑"。

我们在判断一个笔画组合体是否为某字根地域变体时,一般采用下面的方法:1、如果"三国四方"只有一方有此笔画组合体,且在CJK中有单独的区位码,则独立字根,如(4E2F)"丯"、(4E8A)"亊"等。

2、如果两个笔画组合体在"三国四方"的某一方中是两个字根,则其中任一个都不视为地域变体,如" "和" "在台湾字形中是两个字根(7DD2)"緒"、(7DD6)"緖",因此分立字根。

3、我们在CJK的字形标准中通常采用大陆字形为优先级,依次为中(C)、台(T)、日(J)、韩(K)。

按照优先级顺序,如果C中的某一字根在T(或J、K)中断为两个相离的笔画组合体,则按两个字根处理,如"艹"在T、K中断开为"卝",则拆"卝"为"十、十",不视为"艹"的地域变体。

这样处理可以有效减少字根总数,也便于保持字根拆分标准的一致性。

三、CJK字根系统的定量分析明确了单笔字根及字根变体的原则与方法,字根的拆分就有章可循了。

我们在拆分工作完成以后,在FOXBASE+环境下建立了CJK字根数据库,对有关数据进行分类汇总后,得出了CJK的676个字根及其出现次数和出现频率,建立了CJK字根系统。

初步测试结果表明,该字根系统基本覆盖了CJK全部字符,有一定的系统优化度,对于CJK工程应用有一定的参考价值。

相关文档
最新文档