字符编码.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第0~31号及第127号共33 个,为非打印字符,是控
制字符或通讯专用字符, 如控制符:LF(换行)、 CR(回车)、FF(换页) 、DEL(删除)、BEL( 振铃)等;通讯专用字符 :SOH(文头)、EOT( 文尾)、ACK(确认)等 。
第32~126号共95个可打印 字符,其中第33个(32号 )为空格,第48~57号为0 ~9十个阿拉伯数字;65~ 90号为26个大写英文字母 ,97~122号为26个小写英 文字母,第127个(126号 )为“~”,其余为一些 标点符号、运算符号等。
14
ASCII码表的扩展集EASCII
扩展ASCII编码(Extended ASCII,延伸美国标准信息交 换码)是将基本ASCII码由7位扩充为8位,表示256个字 符。
基本ASCII码:最高位为0,称为基本ASCII码; 扩充的ASCII码:最高位为1,扩充部分编码范围为
10000000~11111111,相应的十进制数为128~255 用ASCII码组成的文件,称为“文本文件”,其扩展名为
.TXT。
15
ASCII码表的扩展集
16
ASCII码表基本集+扩展集(16进制)
Microsoft Windows
IBM PC DOS
17
二、计算机中中文字符的表示 汉字交换码
又称“国标码”,即GB2312-1980,是中华人民共和国国 家标准汉字交换编码。
10
关于最高位
若在该位置1,可表示一 若将传送数据的该位置1
些特殊的符号(图形符) ,则用于数据传输校验
由于ASCII码只用了字节 虽然标准ASCII码是7位编码,
的七个位,最高位并不使
但由于计算机基本处理单位为
用,所以后来又将最高的
字节(1byte = 8bit),所以一
一个位也编入这套编码码
文本存储形式
ASCII形式
int型数 10000的表示
0011000100110000001100000011000000110000
1
0
0
00
ห้องสมุดไป่ตู้
0010011100010000
内存存储形式
二进制形式
213 + 210 +29 +28 +24 = 8192 + 1024 + 512 + 256 + 16
001 010 011 100 101 110
DLE
SP
0
@
P
`
DC1
!
1
A
Q
a
DC2
"
2
B
R
b
DC3
#
3
C
S
c
DC4
$
4
D
T
d
NAK
%
5
E
U
e
SYN
&
6
F
V
f
ETB
’
7
G
W
g
CAN
(
8
H
X
h
EM
)
9
I
Y
i
SUB
*
:
J
Z
j
ESC
+
;
K
[
k
FS
,
<
L
\
l
GS
-
=
M
]
m
RS
.
>
N
^
n
US
/
?
O
_
o
111
般仍以一个字节来存放一个
中,成为八个位的延伸
ASCII字符。每一个字节中多
ASCII(Extended ASCII)码, 这套内码加上了许多外文
和表格等特殊符号,成为 目前常用的编码。
余出来的一位(最高位)在计 算机内部通常保持为0(在数 据传输时可用作奇偶校验位) 。
11
关于数据传输的奇偶校验
在计算机的存储单元中,一个ASCII码值 占一个字节(8个二进制位),其最高位(b7)用作 奇偶校验位。
所谓奇偶校验,是指在代码传送过程中用 来检验是否出现错误的一种方法,一般分奇校 验和偶校验两种。奇校验规定:正确的代码一 个字节中1的个数必须是奇数,若非奇数,则 在最高位b7添1;偶校验规定:正确的代码一 个字节中1的个数必须是偶数,若非偶数,则 在最高位b7添1。
12
ASCII码表基本集(2,10,8,16进制)
高3位
低4位
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
000
NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO
SI
ASCII码表(二进制)
p q r s t u v w x y z { | } ~ DEL
5
基本ASCII码字符的分类
显示字符
控制字符
范围为33~126,共94 范围是0~32和127,
个,指能从键盘输入、
可以显示和打印的字 符。
共34个,主要用于控 制输入、输出设备。
6
基本ASCII码字符的内容
字符
ASCII编码
字符编码
1
提纲
一 计算机中字符的表示(ASCII码) 二 计算机中中文字符的表示
2
概述
在计算机中,各种信息都是以二进制编码的形式存在 不管是文字、图形、声音、动画,还是电影等信息, 在计算机中都是以0和1组成的二进制代码表示
计算机之所以能区别这些不同的信息,是因为它们采 用的编码规则不同 比如:同样是文字,英文字母与汉字的编码规则就不 同,前者采用单字节的ASCII码,后者采用双字节的汉 字内码
十进制值
控制 0000,0000—0001,1111 字符 和0111,1111
0 —9 0011,0000—0011,1001 48—57
A—Z 0100,0001—0101,1010 65—90
a —z 0110,0001—0110,1010 97—122 符号 其余
解读基本ASCII码字符内容
但随着需求的变化,这两种编码有被统一的 UNICODE码(由Unicode 协会开发的能表示几乎世界 上所有书写语言的字符编码标准)所取代的趋势
3
一、计算机中字符的表示(ASCII码)
ASCII(American Standard Code for Information Interchange,美国标准信息交 换码)规定了常用的数字、字符的编码。标准 ASCII码采用7位二进制编码,对应的ISO标准 为ISO646标准,最多可以表示128个字符。 每 个字符可以用一个字节表示,字节的最高位为 0。
从键盘上按键输入“ CHINA”的字串,传送进计 算机的,则是01000011、01001000、01001001、
01001110、01000001这五个二进制数字串。
比较字符ASCII码值的大小
空格<标点符号<数字<大写字母<小写字母
十进制数字符号的ASCII码值与其二进制值的区别
ASCII码表示 vs. 二进制表示