中文输入代码转化

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中文输入

1. 键盘-输入码

输入法记录是键盘输入的字母顺序,是为输入码,这时候的输入码没有转变为机器可读的数字。(不同的输入法的转换方式不同,但结果是一样的)

2.输入码-区域码

接着,通过汉字编码国家标准GB2312-80,输入码被转换为了区域码(1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。)此时的区位码是2位的10进制数,仍然不能被机器识别。

3.区位码-国际码

输入法通过《信息交换用汉字编码字符集》区位码被转变为国际码,国际码是4位16进制数,可以被机器读取,但是不能被机器采用。(国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”?字,国标码为31H和23H,而西文字符“1”和“#”的ASCII也为31H和23H,现假如内存中有两个字节为31H和23H,这到底是一个汉字?,还是两个西文字符“1”;和“#”于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,)

4.国际码-机内码

机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码。输入法任务完成。和国际码一样,一个机内码是4位16进制数,即2个字节。

相关文档
最新文档