考点3文字编码知识梳理典型例题及训练解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考点三文字编码
基础再现
1、ASCII码
ASCII码全称为“美国国家信息交换标准代码”,通常用来对英文字符进行编码。该编码使用7位二进制数,共可以表示128个字符。一个ASCII码存储时占用1字节,存储ASCII时在最高位加“0”。ASCII码中的数字、字母按顺序依次排列。
2、汉字编码
汉字在计算机内采用二进制编码,我国最早采用的汉字编码是GB2312。每个汉字用2个字节进行编码,每个字节的最高位用“1”填充。
汉字的输入码(外码):是利用汉字相关特征对指定汉字进行编制的输入代码,包括:音码、形码、音形结合码、自然码、流水码等。
汉字的输出码(字形码):用来存储汉字的字体形状
汉字的交换码:计算机系统间交换汉字通常采用GB2312标准。
处理码又称内码,用UltraEdit或WinHex工具软件观察内码时,ASCII码只占1个字节,汉字占2个字节。
典例3.
(2008.10月高考)小王用“UltraEdit”软件观察“春眠不觉晓’,这几个字.显示的十六进制内码如第4题图(见附图页)所示,从中可以看出字符”眠”的内码是
A.C3DFH B.B4BAH C.B4H D.C3H
解析:在计算机内部一个汉字占两个字节,一个ASCII占一个字节。选A。
即时训练3
1、(考试说明)用WinHex软件观察“IT行业”四个字符,显示的十六进制内码如图所示,则字符“T”的内码用二进制数表示应该是
第5题图
(A)(10011000)2(B)(1010100)
2
(C)(110110)
2
(D)(1101)
2
解析:在计算机内部一个汉字占两个字节,一个ASCII占一个字节。字符T对应十六进制54,再转化为二进制为1010100。故选B。
2.(2008年10月浙江省高考)制订ASCII码、汉字国标码、商品条形码等标准化
编码主要是为了信息表达的
A.自由化 B.规范化 C.形象化 D.通俗化
解析:考查信息标准化编码的意义,故选B。
3.(2009年3月浙江省高考)汉字点阵是一种用黑白两色点阵来表示汉字字形的编码,一个16×16点阵字模的存储容量为
A.1字节
B.16字节
C.32字节
D.64字节
解析:一个点阵对应二进制1位(比特,bit或b),16×16÷8=32字节。选C
1.上述概念只适用于GB2312-80,现代已不大适用;
2.机内码:实际存储在内、外存上的2进制信息,由国家制定的汉字编码;
区位码:与机内码有一一对应关系,当年也许是为了输入方便。可当作一种输入法。
3.机内码与区位码有简单的轮换关系。两字节的机内码,(高字节-A0)->区号,(低字节-A0)->位号。举例如下:
…码‟的机内码是C2EB,C2-A0->34(区号),EB-A0->75(位号).前者是16进制,后者是10进制.
4.在现在操作系统中,若用区位输入法输入汉字…码‟,即可输入3475(区位码),也可输入C2EB(机内码).
计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
国标码=区位码+2020H
机内码=国标码+8080H
机内码=区位码+A0A0H
区位码、国标码与机内码的转换关系方法:
(1)区位码先转换成十六进制数表示
(2)(区位码的十六进制表示)+2020H=国标码;
(3)国标码+8080H=机内码
举例:以汉字“大”为例,“大”字的区内码为2083
解:1、区号为20,位号为83
2、将区位号2083转换为十六进制表示为1453H
3、1453H+2020H=3473H,得到国标码3473H
4、3473H+8080H=B4F3H,得到机内码为B4F3H
小结:
字符编码的两种表示方式:ASCII(字符的表示);GB2312(国标码,汉字编码)