西文字符编码与汉字编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国于1980年颁布了《信息交换用汉字编码字符
集·基本集》,简称GB2312-80码 (国标码)。
汉字编码表
非汉字图形字符 682个
7445个
一级 3755个——汉语拼音排序
汉字 6763个
二级 3008个——偏旁部首排序 课堂提问:可以用一个字节来存放汉字编码吗?
ξ1.2西文字符编码与汉字编码 二、汉字编码
优点:无重码 缺点:难以记忆
ξ1.2西文字符编码与汉字编码 二、汉字编码
区位码:4位十进制数,编码范围从0101~ 国94标94码:国标GB2312-80中规定,所有汉字和字
符的每个字节的编码范围与ASCII码表中的94个字 符编码相一致(即从33~126),所以,其编码范 围是:2121H~7E7EH。国标码是十六进制数。 所以:
ξ1.2西文字符编码与汉字编码 一、ASCII
ASCII的大小规则:控制字符<数字<大写字母<小写字母
同个字母大写+32 →小写字母
课堂练习:指出A,3,y,Y,空格的ASCⅡ码值大小顺序? 答:空格<3<A<Y<y
空格:32
0:48 → 3:51
A:65
Z:90 → Y:89
↓ +32 y:121
ξ1.2西文字符编码与汉字编码 二、汉字编码
汉字编码种类:
1、国标码
2、区位码
3、机内码
音码:全拼、双拼、微软拼音 形码:如五笔字型、郑码
4、汉字输入码(外码) 音形码:如智能ABC、自然码
5、汉字地址码
数字码:如区位码、电报码
6、字型码
外码(输入)→内码→字型码(输出)
ξ1.2西文字符编码与汉字编码 二、汉字编码
国标码、机内码、区位码的相互转换: 第一步:将区位码转换成十六进制数 第二步:根据公式转换:
国标码=区位码+2020H 机内码=国标码+8080H
机内码=区位码+A0A0H
课堂练习:以汉字“大”为例,在区位码表中查询 其
解:1、区其位区码位,码然为后2求08其3,国即标区码号和为机2内0码,。位号为83 2、将区位号2083转换为十六进制表示为1453H 3、国标码=1453H+2020H=3473H 4、机内码=3473H+8080H=B4F3H
128个字符包括: (一)、 94个可显示打印字符。 码值范围:33~126 数字0~9:(48~57)——————— 10个 大写英文字母A~Z:(65~90)————26个 小写英文字母a~z:(97~122)———26个 标点符号和运算符号———————— 32个 (二)、34个不可显示字符。 码值范围:0~32,127 控制字符:空格:32 DEL:127 课堂提问:ASCII的大小顺序是怎样的?
2、F的ASCII码是46H,则f的ASCII是? 3、无论采用拼音输入法,还是五笔字型输入法
输入汉字,存储到计算机内部的一律是汉字 的? 4、已知“江苏”两字的区位码是“2913”和 “4353”, 求其国标码和机内码。
全称:美国标准信息交换代码(American Standard Code for Information Interchange)
版本:7位版本(使用了一个字节中的7位,最高位置0, 数值范围从0000000~1111111,即0~127,共计 128个字符。
ASCII码对照表:
ξ1.2西文字符编码与汉字编码 一、ASCII
2、进制转换:20H= 80H= A0H (10000000)B= (1111111)B= 126=( )H
3、计算机的特点之一:采用哪种进制表示数据?
ξ1.2西文字符编码与汉字编码
编码 定义:用二进制数0、1的不同组合
来表示特定的信息。
ξ1.2西文字符编码与汉字编码 一、ASCII(西文字符编码)
区位码:使用了两个字节,最高位均置0
128×128=
94×94=8836
16384 区位码是把7445个国标码放置在一个94行×94
列的阵列中。阵列的每一行称为一个汉字的“区”,
用区号表示;每一列称为一个汉字的“位”,用位
号表示。显然,区号范围是1~94,位号的范围也是
1~94。这样,一个汉字在表中的位置可用它所在的
区号与位号来确定。一个汉字的区号与位号的组合
就是该Biblioteka Baidu字的“区位码”。区位码的形式是:高两
位为区号,低两位为位号。
ξ1.2西文字符编码与汉字编码 二、汉字编码
区位码:实际上也是一种汉字输入码。
实际上只用了87×94=8178个编码。其中682个 图形符号,分布在1~15区;一级汉字分布在16~55 区;二级汉字(不常用汉字) 分布在56~87区;88区 以后为空白区,以待扩展。
ξ1.2西文字符编码与汉字编码
课堂小1结、:ASCII 2、区位码 3、国标码 4、机内码
:是计算机系统内部对汉字进 行存储、处理、传输统一使 用的代码。
重点:两种题型——1、比较ASCII码值大小 2、三种汉字编码的转换
ξ1.2西文字符编码与汉字编码
作业:
1、已知大写字母D的ASCII码为68,那么小写字 母d的ASCII码为?
授课内容:西文字符编码与汉字编码 (第一章 P10)
授课班级:0603
课前复习:
1、各种进位计数制的相互转换方法分别是什么? ①非十进制数→十进制数:逐位按位权展开求和 ②十进制数→非十进制数:除N取余,乘N取整 ③八进制→二进制:一位拆三位 ④二进制→八进制:三位并一位 ⑤十六进制→二进制:一位拆四位 ⑥ 二进制→十六进制:四位并一位 ⑦八进制←→十六进制:先转换成二进制
机内国码标:码以=上区两位种码编+码20均2与0HASCII冲突。机内码将 国标码两个字节的最高位均置1,从而避免了与 ASCII的冲突。其每个字节从161~254。它也是 十六进制数。所以,其编码范围是:A1A1H~ FEFEH。
机内码=国标码+8080H
ξ1.2西文字符编码与汉字编码 二、汉字编码