第四节 信息的编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
074
J
043
+
075
K
044
,
076
L
045
-
077
M
046
.
078
N
ASCⅡ值
096 097 098 099 100 101 102 103 104 105 106 107 108 109 110
控制字符
` a b c d e f g h i j k l m n
ASCⅡ字符编码
015
SI(^O)
• 例1:汉字“啊”的区位码是1601D,它的国标码和机内码是多少?
计算机的基础知识-----信息的编码
地址码 • 是指汉字字库中存储汉字字形信息的逻辑地址码,
用于确定字模的位置。
• 例如:字典中每个汉字在那个位置。
计算机的基础知识-----信息的编码
字形码
1、汉字字型码:所谓汉字字形码实际上就是用来将汉 字显示到屏幕上或打印到纸上所需要的图形数据。
• ASCII码(美国标准信息交换码)。 • ASCII码有7位码和8位码,通用7位。
• 一个字符用1个字节表示,最高位为0(符号 位),27=128个字符。
ASCⅡ值 000 001 002 003 004 005 006 007 008 009 010 011 012 013 014
控制字符
NUL SOH(^A) STX(^B) ETX(^C) EOT(^D) ENQ(^E) ACK(^F) BEL(bell) BS(^H) HT(^I)
计算机的基础知识-----信息的编码
国标码
• 由于汉字数量极多,一般用连续的两个字节(16个二进制 位)来表示一个汉字。
• 一个国标码用2个字节表示,第一个字节表示“区码”, 第二个字节表示“位码”。
区位码
区码 (94个) 位码 (94个)
计算机的基础知识-----信息的编码
国标码
非汉字 682个
ห้องสมุดไป่ตู้
GB共收录的汉字 和图形符号7445个
一级汉字 3755个
(按汉字拼音字母排列)
汉字 6763个
(根据使用频率分类)
二级汉字 3008个
(按偏旁部首排列)
计算机的基础知识-----信息的编码
机内码
1、计算机内部存储、处理的代码。
2、在计算机内部表示汉字时把交换码(国 标码)两个字节最高位改为1,称为“机 内码”。
W
024
CAN(^X)
056
8
088
X
025
EM(^Y)
057
9
089
Y
026
SUB(^Z)
058
:
090
Z
027
ESC
059
;
091
[
028
FS
060
<
092
\
029
GS
061
=
093
]
030
RS
062
>
094
^
031
US
063
?
095
_
111
o
112
p
113
q
114
r
115
s
116
t
117
u
118
047
/
079
O
016
DLE(^P)
048
0
080
P
017
DC1(^Q)
049
1
081
Q
018
DC2(^R)
050
2
082
R
019
DC3(^S)
051
3
083
S
020
DC4(^T)
052
4
084
T
021
NAK(^U)
053
5
085
U
022
SYN(^V)
054
6
086
V
023
ETB(^W)
055
7
087
v
119
w
120
x
121
y
122
z
123
{
124
|
125
}
126
~
127
DEL
计算机的基础知识-----信息的编码
128个字符的组成
•
34个通用控制字符
33个不可打印
•
10数字(0-9)
1个空格
95 个
• 128个
可
• •
52个英文大小写字母 94个图形字符
打 印 字
•
32标点符号和运算符号
符
计算机的基础知识-----信息的编码
3、区位码也是一种输入法,优点是无重码,缺点是难于记忆。
计算机的基础知识-----信息的编码
国标码
1980年,我国颁布了第一个汉字编码字符集标准, 即GB2312-80《信息交换用汉字编码字符集----基本集》,该标准编码简称国标码。(简写GB)。 • 国标码用于不同系统之间的汉字信息的存储与交 换。
LF(^J) VT(^K) FF(^L) CR(^M) SO(^N)
ASCⅡ字符编码
ASCⅡ值
控制字符
ASCⅡ值
控制字符
032
(space)
064
@
033
!
065
A
034
“
066
B
035
#
067
C
036
$
068
D
037
%
069
E
038
&
070
F
039
‘
071
G
040
(
072
H
041
)
073
I
042
*
排列原则
• ASCII在标准ASCII码表中,根据码值由小到大的排列原则 是:
• 控制符号<标点符号<数字 < 大写字母< 小写字母 < DEL(特殊)
相差32
•A
65
a
97
0
48
• CR(回车) BS(退格) SP(空格) DEL(删除)
计算机的基础知识-----信息的编码
2、 汉字编码 • 汉字处理过程
计算机的基础知识-----信息的编码
转换公式
• 国标码=区位码+2020H=区位码+3232D • 机内码=国标码+8080H=区位码+A0A0H
• 例1:汉字“中”的区位码是5448D,它的国标码和机内码是多少? • 5448D-----3630H • 国标码=3630H+2020H=5650H 或者 国标码=5448D+3232D=8680D • 机内码=5650H+8080H=D6D0H 或者 机内码=3630H+A0A0H=D6D0H
2、汉字字形码记录汉字的外形,是汉字的输出形式。 记录汉字字形通常有两种方法:点阵法和矢量法, 分别对应两种字形编码:点阵码和矢量码。所有的 不同字体、字号的汉字字形构成汉字库。汉字字库 分为软字库和硬字库。 3、点阵码是一种用点阵表示汉字字形的编码,它把 汉字按字形排列成点阵,一个16×16点阵的汉字要 占用32个字节,一个32×32点阵的汉字则要占用128 字节,而且点阵码缩放困难且容易失真。
第一章 计算机基础知识
第四节 信息的编码
主讲:李飞 2014.9
计算机的基础知识-----信息的编码
1、 ASCII码
• 字符包括西文字符(字母、数字、各种符号) 和中文字符,即所有不可做算术运算的数据
• 计算机中最常用的字符编码是ASCII(American Standard Code for Information Interchange) 码。
输入码
汉字输入
国标码
机内码
地址码
字形码
汉字输出
不同输入法
统一标准 计算机真正处理
确定位置
显示
汉字库
计算机的基础知识-----信息的编码
输入码
1、将汉字通过键盘输入到计算机采用的代码称为汉字输入码, 也称为汉字外部码(外码)。汉字输入码的编码原则应该易 于接受、学习、记忆和掌握,码长尽可能短。
2、目前我国的汉字输入码编码方案已有上千种,但是在计算机 上常用的有几种,根据编码规则,有以下四种: ①数字编码:如电报码、区位码。 ②字音编码:如双拼、全拼输入方案。 ③字形编码:如五笔字形码、表形码。 ④音形编码:根据语音和字形双重因素确定的输入码。