西文字符编码与汉字编码18页PPT
ASCII码和汉字编码 - 打印版
一.西文字符编码目前计算机中使用最广泛的西文字符集及其编码是ASCII字符集和ASCII 码,即美国国际信息交换码。
1.标准ASCII字符集共收录了96个可打印字符,32个控制字符,共128个。
其编码规则是:用7位二进制数对每一个字符进行编码,在计算机内部则用字符的ASCII码存储和表示该字符。
而计算机中一般是用1个字节来存储的,每个字节中多出来的最高位一般保持为0。
0 000 0000 ------0……………0 111 1111 ------127常见的ASCII字符要知道:数字字符的ASCII 大写字符的ASCII小写字符的ASCII“0”...48 “A”...65 “a” (97)“1”...49 “B”...66 “b” (98)…………“9”...57 “Z”...90“z” (122)空格字符的ASCII是 32。
2.扩展ASCII码;将标准ASCII最高位置1,得到十进制代码128-255,称为扩展ASCII,可代表扩展的另128个字符。
扩展的ASCII=标准的ASCII+扩展字符集。
二.汉字的编码汉字的特点是数量大、字形复杂、同音字多。
国家标准有一下几个:GB2312:1981年颁布的第一个国家标准,所有字符在计算机内部都采用2个字节来表示,每个字节的最高位规定为1,不支持繁体字。
GBK:1995年版本的,除了收录有GB2312中的所有汉字和符号外,还收录了繁体字在内的大量汉字和符号。
与GB2312向下兼容,即与GB2312相同的字符,其编码也相同。
UCS/Unicode:是国际标准GB18030:与GB2312、GBK保持向下兼容,还扩充了UCS/Unicode中的其它字符Big5:主要在台湾地区使用,支持繁体字。
以下讲解的是GB2312-80汉字编码字汇组成第一部分:字母、数字和各种符号共682个(包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等,统称为GB2312图形符号), 01-09区。
西文字符的编码
约有6800种语言和文字在使用,需要建立一个多文种(Multilingual)处理环境
在ISO2022基础上,使用代码页号切换不同字符集的方法过于繁琐,且与其他系统不兼容
目标与途径:实现所有字符在同一字符集中统一编码
UCS/Unicode与GB18030汉字编码标准
3)汉字的编码(一)
GB2312-80汉字编码
A.第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)
B.第二部分:一级常用汉字,共3755个,按汉语拼音排列
C.第三部分:二级常用字,共3008个,按偏旁部首排列
区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示{如:“大”字的区号20,位号83,区位码是20 83
用2个字节表示为:00010100 01010011}
4)国标交换码:
问题:信息通信中,汉字的区位码与通信使用的控制码(00H~1FH)发生冲突。解决方案:为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(20H)得到国标交换码。
5)机内码:
问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。解决方法:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。(如:“大”字的内码是:10110100 11110011(B4F3))
ASCII码和汉字编码
(1)汉字输入
汉字输入 方法 自动识别 汉字输入码
Байду номын сангаас
如手写、语音识别
音码:全拼、双拼、智能ABC等
形码:五笔字型法、郑码输入法
(2)汉字编码
汉字编码(GB2312-80)采用区位码表示汉字。区位码分94个区,每 区94个位,构成94*94个单元的表格。“区号”和“位号”各占一字节(第 一个字节标记区号,第二个字节标记位号),所以一个汉字占2个字节。
字符 ASCII码字符 汉字 二进制编码 8位 16位 查看到的内码 2个十六进制数 4个十六进制数 存储 占1B 占2B
例1. 用UltraEdit软件观察字符内码,结果如下图所示:
则其中内码“32 30”表示的字符为( B ) (A)2010 (B)20 (C)10 (D)假 例2.用UltraEdit软件观察字符内码,结果如下图所示:
通过内码观察器查看字符内码
Thank you!
ASCII码表由128个代码组成,表示了128个 西文字符,十进制代码从0-127
一个ASCII码字符占一个字节
例如: 字母“t”的ASCII码为116,也就是 0 1110100B, 最高位用“0”填充。
2.汉字编码
汉字与西文字符一样,也是一种字符,在计算机内同样 是以二进制代码表示的。用计算机处理汉字需要解决以下几 个问题: 怎样将汉字输入计算机? 在计算机内部怎样处理汉字? 计算机怎样实现汉字信息的输出(显示)?
为了汉字的输出显示和打印,需要描述汉字的字形, 对汉字字形的编码称为汉字的字形码。
归纳——汉字在计算机中的表示
输入法输入 查找对应的区位码 区位码加2020H 转为国际码 国际码加8080H转为 十六进制机内码
字符编码
23
GB码区位示例
01区
78位
24
GB码区位示例(续)
16 区 1 2 3 4 5 6 7 8 9 0 啊 阿 埃 挨 哎 唉 哀 皑 癌 1 蔼 矮 艾 碍 爱 隘 鞍 氨 安 俺 2 按 暗 岸 胺 案 肮 昂 盎 凹 敖 3 熬 翱 袄 傲 奥 懊 澳 芭 捌 扒 4 叭 吧 笆 八 疤 巴 拔 跋 靶 把 5 耙 坝 霸 罢 爸 白 柏 百 摆 佰 6 败 拜 稗 斑 班 搬 扳 般 颁 板 7 版 扮 拌 伴 瓣 半 办 绊 邦 帮 8 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 9 苞 胞 包 褒 剥 17 区 1 2 3 4 5 6 7 8 9 0 薄 雹 保 堡 饱 宝 抱 报 暴 1 豹 鲍 爆 杯 碑 悲 卑 北 辈 背 2 贝 钡 倍 狈 备 惫 焙 被 奔 苯 3 本 笨 崩 绷 甭 泵 蹦 迸 逼 鼻 4 比 鄙 笔 彼 碧 蓖 蔽 毕 毙 毖 5 币 庇 痹 闭 敝 弊 必 辟 壁 臂 6 避 陛 鞭 边 编 贬 扁 便 变 卞 7 辨 辩 辫 遍 标 彪 膘 表 鳖 憋 8 别 瘪 彬 斌 濒 滨 宾 摈 兵 冰 9 柄 丙 秉 饼 炳
19
二、计算机中中文字符的表示 汉字交换码
国家标准将每个汉字和图形符号的两个字节分 别用两位的十进制编码(不足补0),前字节的编 码称为区码,后字节的编码称为位码,排列在一个 94行94列的二维代码表中,形成区位码表。 如“保”字在二维代码表中处于17区第03位 ,区位码即为1703D 。 把区位码按一定的规则转换成的二进制代码叫 做信息交换码(简称国标码)。
字 符 编 码
1
提
纲
一 计算机中字符的表示(ASCII码) 二 计算机中中文字符的表示
2
概 述
汉字编码PPT课件
3
第3页/共24页
1.2.5 字符的编码
❖ 1.西文字符的编码 ASCII码对128个字符进行了编码,这其中包括大小写英文 字母、阿拉伯数字、标点符号以及控制字符等特殊字符。 ASCII码中共有34个非图形字符(控制字符),94个可打印 字符(图形字符)。 读表1-6可知,每个符号的ASCII编码为:高3位+低4位。
22
第22页/共24页
1.2.5 字符的编码
作业
P38 选择题 14、15、16
23
第23页/共24页
谢谢您的观看!
第24页/共24页
4
第4页/共24页
1.2.5 字符的编码
❖ 1.西文字符的编码 “a”字符加
“A”字符编码为1000001(65),BCDE…依次增加 “0”数字字符编码为0110000(48),1234依次增加 ■计 算 机 内 部 用 一 个 字 节 ( 8 个 二 进 制 位 ) 存 放 一 个 7 位 ASCII码,最高位置为0。
1.2.5 字符的编码
重点:汉字编码类型及编码方式 难点:ASCII码
1
第1页/共24页
1.2.5 字符的编码
字符
西文字符 中文字符
字母、数字、 各种符号
2
第2页/共24页
1.2.5 字符的编码
❖ 1.西文字符的编码 ■ 计算机中的数据都是用二进制编码表示的,用以表示 字符的二进制编码称为字符编码。 ■ 而,计算机最常用的就是ASCII。 ■ 美国信息交换标准码ASCII,7位码(128个字符) 扩展码ASCII,8位码(256个字符)
12
第12页/共24页
1.2.5 字符的编码
❖ 3.汉字的处理过程 ■ 汉字内码:是为在计算机内部对汉字进行存储、处理 的汉字编码。 ■ 不同汉字系统使用的机内码可能不同。汉字内码的形 式有多种。 ■ 对应国标码,一个汉字的内码用2个字节存储,每个汉 字的最高位置“1”作为汉字内码的标识。
汉字编码课件.ppt
范围重合,称为该字的“国标码”,与其相对应 的两个美标符号,为该字的“国标符” 如何区分国标符与美标符:国标码的两个数字 各加上128,称“准国标”或“机内码” 机内码=(区位码)H + 8080H +2020H
..
15
BIG5码
针对繁体汉字的编码,在台湾、香港的 电脑系统中得到普遍应用
非汉字
一级汉字 二级汉字
第一字节 A1~A2 A3 C6 C7~C8 A4~C5 C6 C9~F8 81~A0
第二字节 40~7E/A1~FE 40~7E/A1~E0
A1~FE 40~7E/A1~FE 40~7E/A1~FE
每一组包含256个平面(plane),每一个平面包 含256行(row),每一行包含256个字位(cell), 又称为“列”,plane、row、cell的值范围都 是从00到FF全编码
整个编码字符集的每个字符都是由4个八位序 列表示,(按照组八位、面八位、行八位、列八 位的顺序)
可编码空间为:128X256X256X256=32KX64K
..
27
UTF-8
为满足面向字节、基于ASCII码系统的需要而 制定(主要用于数据传输、互联网)
用最多达4个字节的序列来表示每个字符,为 有效分析字符串,用第一个字节指明某个多字 节序列中的字节数
通常用于数据交换
Unicode 范围
Unicode 编码点和 UTF-8 编码字符之间的关系 UTF-8 编码的字节
的变形显现形式、特殊字符等均放在此区
..
23
ISO/IEC 10646空间分配现状
信息的编码PPT课件
学情分析
本节是信息技术必修部分的第二课,刚从初中升入的高一新生,他们的信息技术基础不一、对信息技术的理解程度也不同。所以,必须增加学生感兴趣的、具有可操作性的、易接受的实例,让学生尽可能多地参与实例分析,从而提高学生学习这一门学科的兴趣。
教学目标
过程与方法
知识与能力
情感态度价值观
教学目标
知识目标
教师说明此实验的目的;再简单介绍并演示UltraEdit工具软件的基本使用方法。
1
2
3
4
给学生时间,让学生自己编辑修改字符,以观察内码的变化。(提示学生:相互之间可以讨论,可以输入自己喜欢的一句名言警句或最喜欢的一首歌曲中的某句歌词。)
教师指导学生启动记事本(新建文本文档),输入“科普知识ABC”,并保存这个文件,文件名为“lx.txt”。
重新认识十进制,并能进行知识迁移,对二进制与十六进 制能进行初步的理解;
了解ASCII字符编码和汉字编码 ;
能力目标
培养学生用计算机处理信息的能力 ;
பைடு நூலகம்
培养学生的探究能力、合作能力;
培养学生的已有知识的应用能力及知识的转化能力。
情感目标
培养学生逻辑思维能力、动手操作能力 ;
培养学生合作学习和主动获取信息的愿望及意识 ;
字符编码:ASCII码 ; 目前常见的几种汉字编码;
初步了解信息编码中的二进制代码的特征 ;
二进制、十六进制相关内容的理解。
教学重点
教学难点
教学重点与难点
教师教法
讲解法
指导法
评价法
教学策略与手段
自主学习
讨论法
学生学法
合作探究法
1、教师的教学准备: UltraEdit工具软件、Excel工程函数 一张机读卡 2、教学环境 多媒体网络教室、极域教学控制系统 3、学生的教学准备 打开资源管理器、浏览教学网站
字符、编码、Unicode杂谈PPT课件
.
15
0840..085F 1BC0..1BFF AB00..AB2F 11000..1107F 16800..16A3F 1B000..1B0FF 1F0A0..1F0FF
1F300..1F5FF
.
12
主要日文编码标准
ShiftJIS
Shift_JIS是一个日本电脑系统常用的编码表。它能容纳 全角及半角拉丁字母、平假名、片假名、符号及日语汉 字。
它被命名为Shift_JIS的原因,是它在放置全角字符时, 要避开原本在0xA1-0xDF放置的半角假名字符。
在微软及IBM的日语电脑系统中,即使用了这个编码表。 这个编码表称为CP932。
.
11
主要的中文编码标准
GB 13000.1-93
等同于Unicode 1.1标准 GBK收录了GB13000.1-93全部字符但是编码方式不同。
GB 18030-2005
目前最新的字符集 全面兼容GBK 和UTF-8相同采用多字节编码。 更新至 Unicode 4.1标准(2000年标准兼容Unicode3.0)
JIS-X0201 & JIS-X 0208
.
13
Unicode
志在一统全球语言文字编码 官网 最新标准Unicode
现行6.2 准备中
标准目的在于为每一个可用的字符设置一个唯一编号, 没有涉及任何编码方式,字长等。
.
14
Unicode 6.x
早在5.x 版本,Unicode已经开始使用超过 0xFFFF的值 为字符进行编码
.
19
IVS
http://xawiki:8080/display/IMWIN7X/SRS_NewFormatKeywor d_IVS_Knowledge
字符的表示——编码标准 2
编码标准.字符的表示——字符是人与计算机交互过程中不可缺少的重要信息。
要使计算机能处理、存储字符信息,首先也必须用二进制“0”和“1”代码对字符进行编码。
下面以西文字符和汉字字符为例,介绍常用的编码标准。
(1)ASCII编码ASCII 编码是由美国国家标准委员会制定的一种包括数字、字母、通用符号和控制符号在内的字符编码集,全称叫美国国家信息交换标准代码(American Standard Code for Information Interchange)。
ASCII 码是一种7位二进制编码,能表示2 7=128种国际上最通用的西文字符,是目前计算机中,特别是微型计算机中使用最普遍的字符编码集。
ASCII编码包括4类最常用的字符。
①数字“0”~“9”。
ASCII编码的值分别为0110000B~0111001B,对应十六进制数为30H~39H。
②26个英文字母。
大写字母“A”~“Z”的ASCII编码值为41H~5AH,小写字母“a”~“z”的ASCII编码值为61H~7AH。
③用字符。
如“+”、“-”、“=”、“*”和“/”等共32个。
④制符号。
如空格符和车符等共34个。
ASCII码是一种7位编码,它存时必须占全一个字节,也即占用8位:b 7b 6b 5b 4b 3b 2b 1b 0,其中b 7恒为0,其余几位为ASCII码值。
(2)汉字编码1981年颁行的《信息交换用汉字编码字符集·基本集》(代号为GB2312-80)是交换码的国家标准,所以交换码也称为国标码。
GB2312-80共收集和定义了 7445个基本汉字。
其中,使用频度较高的 3755个汉字定义为一级汉字。
使用频率较低的 3008个汉字定义为二级汉字,共有 6763个汉字。
另外还定义了拉丁字母、俄文字母、汉语拼音字母、数字和常用符号等 682个。
GB2312- 80规定每个汉字用 2个字节的二进制编码,每个字节最高位为 0,其余 7位用于表示汉字信息。
西文字符编码与汉字编码.
ξ 1.2西文字符编码与汉字编码 编码 定义:用二进制数0、1的不同组合 来表示特定的信息。
全称:美国标准信息交换代码(American
Standard Code for Information Interchange)
ξ 1.2西文字符编码与汉字编码 一、ASCII(西文字符编码)
一、填空题: 1、ASCII码是____位二进制字符编码,是___ _______的缩写,共有__个不同的字符编码,其 中包括10个阿拉伯数字、___个英文大小写字母、__ _个符号和运算符以及___个控制符,____符是不 能显示的,其余95个是可显示(打印)的ASCII码。 2、GB2312,简称______,共收纳___个汉字, 其中一级汉字有___个,二级汉字有____个,并且 一级汉字按_______顺序排列,二级汉字按___ ____排列。根据GB2312的编码方法,把该码分成__ _个区,每个区分成___个码位。 3、比较以下两个ASCII值的大小: “0”___“S” “3”___“8” “A”___“C” “A”___“a” 4、每一个点在存储器中用____个二进制位(bit) 存储,所以一个16×16点阵汉字需要____个字节存储 空间。 二、计算题: 1、“啊”汉字的区位码为1601,求这汉字的国标码和 机内码。 2、已知某汉字区号34,位号56,求某汉字的国标码和 机内码。
汉字的输入码:是为用户能利用西文键盘 输入汉字而设计的编码。主要有以下四种: ①数字编码:如电报码、区位码。 ②字音编码:如双拼、全拼输入方案。 ③字形编码:如五笔字形码、表形码。 ④音形编码:根据语音和字形双重因素确 定的输入码。
国标码
西文字符的编码
缺点:4字节的字符编码使存储空间浪费严重
5.文字与文本
1)文本(text):文字信息在计算机中的表示形式,组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。
2)文本处理过程
文本在计算机中的处理过程:文本的准备(例如汉字的输入),文本编辑,文本处理,文本存储与传输、文本展现等,根据应用的不同,各个处理环节的内容和要求可能有很大的差别。
汉字编码例
国标码=区位码+2020H
机内码=国标码+8080H
机内码=区位码+A0A0H
例如:“啊”
区位码:16 01 => 10 01H 0001 0000 0000 0001
国标码:30 21H <= 10 01H
+20 20H 0011 0000 0010 0001
机内码:B0 A1H <= 30 21H
B.第二部分:一级常用汉字,共3755个,按汉语拼音排列
C.第三部分:二级常用字,共3008个,按偏旁部首排列
区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示{如:“大”字的区号20,位号83,区位码是20 83
D.像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目
3)图像的压缩编码
一幅图像的数据量可按下面的公式进行计算(以字节为单位):图像数据量=图像水平分辨率×图像垂直分辨率×像素深度/8
数据压缩类型
A.无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同
第三章 汉字和西文字符存储与显示原理
主要内容:
3.1 英文字符在计算机中表示
3.2 汉字在计算机中表示和显示
3.1 英文字符在计算机中表示
3.1.1 ASCII码 英文字符、数字和计算机中用的控制符号在计算 机中是用ASCII码来表示的。ASCII码(American Standard Code for Interchange)是美国国家信息 交换标准码,现已成为国际通用的信息交换标准代码。 ASCII码共有128个元素,其中通用字符32个、 十进制数字10个、52个英文大小写字母和34个专用 符号。这128个元素用一个字节二进制数表示,因为 7位二进制数就可表示128个元素,该字节多余的最 高位取0。
第三章习题:
8.什么是点阵字模?16×16、24×24点阵字模中, 字节数据如何排列? 9.除英文字符外,其它西文字符在计算机中如何表 示?如何显示? 10.使用CRT、LCD做显示设备,如何在屏上“打 点”? 11.为什么要从大字库中提取字模,建立自己的小 字库?
0x30,0x78,0xCC,0xCC,0xFC,0xCC,0xCC,0x00
图3-1 大写“A”8×8点阵
8×8点阵共有8行,每行8个点;每行的8个点组成 二进制的一个字节,字节的最高位D7在最左,最低位 D0在最右。字节中打点的位(bit)值等于1,没有点的 位bit值等于0。这样,每行的一个字节都有一个16进制 数的值,例如第一行的值是0x30,第二行的值是0x78, 8行8个字节数据是: 0x30,0x78,0xCC,0xCC,0xFC,0xCC,0xCC,0x00。 我们把这8个字节数据叫字符“A”的8×8点阵字模。 存储全部英文字符8×8点阵字模的存储单元叫英文字符 8×8点阵字库。字库是按ASCII码顺序存放,显示时, 按存放规律将要显示的字符的字模取出,按图3-1所示 顺序把字节数据输出到屏上即可,bit值等于1的点显示 时在屏上该bit 位置“打”点,bit值等于0的点显示时 在屏上该bit 位置“打”空白。
汉字编码表示与显示
汉字编码表示与显示一、汉字的编码1981年5月,我国国家标准总局颁布了《信息交换用汉字编码字符集》(GB2312-80),简称国家标准汉字编码,也叫国标码。
国标码共收进标准字符7445个。
其中一级汉字3755个,二级汉字3008个,共计6763个汉字。
由于汉字的字符多,一个字节即8位二进制代码不足以表示所有的常用汉字。
同时为了不与西文的ASCII码混淆,汉字国标码的每个汉字或符号都使用2个字节(16位二进制)代码来表示。
西文字符采用一个字节表示,即ASCII码,一般只用七位来表示128个字符,而把最高位用作奇偶校验(或者不用)。
国标码介绍:在GB2312-80代码表中,纵向分为0~93,共94行;横向也是0~93,共94列。
行与列分别用b7b6b5b4b3b2b1七位二进制码表示,第一字节表示行,第二字节表示列。
其值从0100001到1111110(十六进制为21-7E)。
这正是ASCII码的可打印字符的编码范围。
国标码是将第一字节和第二字节连写而得。
由于二进太长,一般用十六进制表示。
区位码介绍:在国标GB2312-80中,国标码除了用双七位二进制表示外,还可以表示成区位码的形式。
即在国标代码表中,将行号称为区号,列号称为位号,分别有94个区和94个位。
区号和位号用十进制表示,不足两位前面补0。
这样每个汉字或符号都可用4位十进制表示。
区位码因此可以用来作输入码。
是汉字输入的基本编码方法之一。
机内码介绍:在计算机中双字节汉字与单字节西文字符混合使用、处理,汉字编码的各个字节若不予以特别标识,就会与单字节的ASCII码混淆不清;为此,将标识汉字的两个字节编码的最高位置为1,这种最高位为1的双字节汉字编码就是中国大陆普遍采用的汉字机内码,简称内码,是计算机内部存储、处理汉字所使用的代码。
内码、国标码、区位码三者的关系是:高字节内码=高字节国标码+80H=区码+20H+80H=区码+0A0H=区码+160低字节内码=低字节国标码+80H=位码+20H+80H=位码+0A0H=位码+160 繁体汉字在一些地区和领域仍在使用,国家又制定出相应的繁体汉字字符集,国家标准代号是GB12345-90“信息交换用汉字编码字符集——辅助集”,包含了717个图形符号和6866个繁体汉字。
计算机应用基础1.3字符的编码1.3 字符的编码
1.3 字符的编码
9
4. 汉字字形码
汉字字形码 —— 汉字字形点阵的代码
计算
16×16点阵显示汉字, 需要多少存储空间?
16×16/8 = 32字节
用于汉字在显示屏或打印机输出。 通常有两种表示方式:点阵和矢量表示方式。
9
1.3 字符的编码
10
5. 汉字地址码
汉字库中存储汉字字形信息的逻辑地址码
计算机用一个字节(8个二进制位)存放一个7位 ASCII码,最高位置为0。
1.3 字符的编码
2
7位ASCII代码表
1.3 字符的编码
3
字符 十六进制表示
空格
20H
‘0’~‘9’ 30H~39H
‘A’~‘Z’ 41H~5AHHale Waihona Puke ‘a’~‘z’ 61H~7AH
十进制表示
32 48~57 65~90 97~122
1.3 字符的编码
1
1.3.5 字符的编码
1.西文字符的编码
计算机中最常用的字符编码是ASCII(American Standard Code for Information Interchange,美国信 息交换标准交换代码),为国际标准。
国际通用的ASCII码是7位ASCII码,用7位二进制数 表示一个字符的编码,共有27=128个不同的编码值,相 应可以表示128个不同字符的编码。
汉字内码:2个字节存储 每个字节最高位置“1”
例
目地:区分于ASCII码 方法:汉字的国标码 +8080H
“中”字的国标码转换为汉字内码: 国标码 (5650)H+(8080)H=(D6D0)H 或:( 0101 0110 0101 0000)+(1000 0000 1000 0000)