数据编码的基本方式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E
5
A.
B
9
20
精品课件
练习
0 0000 1 0001 2 0010 3 0011 4 0100
5 0101 6 0110 7 0111 8 1000 9 1001
(1110011010.111)2= (
(
21
精品课件
)16=
10 1010 11 1011 12 1100 13 1101 14 1110 15 1111
3
6
7 .4
2
5
18
精品课件
二进制与十六进制间的转换
十六进制数转换成二进制数 把每一个十六进制数字改写成等值的4位二进制数 即一位拆成四位,且要保持高、低位的次序不变 。
(4C.2E)16=(0100
1100 . 4
0010 C
1110)2
2
E
=(1001100.0010111)2
19
精品课件
二进制数转换为十六进制数
机中用二进制编码来表示。
二·十进制编码的方法很多,8421码是最常见 的一种,即每一位十进制数用四位二进制编码来表 示。
例如,十进制数2816的8421码为:
十进制数
2
8
1
6
01式10,B而CD实码际在上形它8式4表2上1示码变的成是了十000和1进01制组数成1,的00只二0 不进过制0形是001
十进制转化成 八、十六 进制
100(D)=144(Q)=64(H)
八进制 8 100 8 12 4 81 4
01
十六进制
16 100
16 6
4
06
16
精品课件
二进制与八进制之间的转换
八进制数转换为二进制数
只需将每一个八进制数字改写成等值的3位二进制
数即可,且要保持高、低位次序的不变。
(16.327)8=(001 110 . 011 010 =
)8=
编码
计算机是美国人发明的,因此计算机的字 符集中自然包含了英文的26个字母。
计算机要在全世界通用,必须采用公认的 标准格式对字符、符号进行编码。
常用的字符编码有ASCII码、BCD码、西文 字符编码和EBCDIC码。
22
精品课件
BCD(Binary Coded Decimal )码
十进制数的二进制编码(BCD)是指十进制数在计算
国标码
我国在1980年制定了《信息交换用汉字编码字符集·基本 集》作为国家标准GB2312-80编码字符集,称为国标码。 GB2312-80中规定了信息交换用的6763个汉字和682个非汉 字图形符号(包括字母、数字和符号,例如英文、俄文、 日文平、片假名等)的代码。
在国家标准GB2312-80中,每个汉字采用双字节表示。每 个字节只用ASCII码中的低7位,最高位为0。
整数部分从低位向高位方向每4位用一个等值的十六 进制数来替换,即四位并为一位,最后不足4位时在 高位处补0,补够4位;小数部分从高位向低位方向 每4位用一个等值的十六进制数来替,最后不足4位 时在低位处补0,补够4位。
(1110 0101 1010 . 1011 1001)2 =( E5A.B9)16
0.125 ×2
0 .250 ×
2 0. 500 ×2
1 . 000
(高位)
(低位)
15 结精品果课件:(0.125)10=(0.001)2
并非所有的十 进制小数都能 用有限位的二 进制小数来表 示。例如将 (0.63)10 转 换 为 二进制。因为, 小数部分乘以2 会无限循环下 去,故:只能 取近似值。
扩展的ASCII码用8位二进制数来表示,可 以表示256种不同的符号。
24
精品课件
西文字符处理起来比较简单,而中文信息 处理起来就复杂了。汉字是图形文字,常 用汉字就有3000~6000个,形状和笔画差 异很大。这就决定了汉字字符的编码方案 必须完全不同于西文的编码方案。
在计算机系统中汉字的输入、内部处理、 存储和输出过程中不能使用同一代码。
13 精品课(件28.75)10
十进制整数转换成二进制整数
方法:除2反序取余法
例:(29)10=(?)2 结果:(29)10=(11101)2
2 29
(低位)
2 1 4 ……1
2 7 ……0
2 3 ……1
2 1 ……1
0 ……1
(高位)
14
精品课件
十进制小数转换成二进制小数
方法:乘2顺序取整法
例:(0.125)10=(?)2
特点:数值用0,1表示,基数为2,是逢二进一的计 数制,各数位的权是以2为底的幂。
表示:1101.01B或(1101.01)2
9
精品课件
八进制表示法
一个八进制数可以表示成下列形式(用Q代表):
(B)8=Bn-1×8n-1+Bn-2×8n-2++B0×80+B-1×8-1 + B-m×8-m
举例:
举例:
A3F.3B =10×162+3×16+15×160+3×16-1+11×16-2
特点:有0-9及A-F共16个数字符号,基数为16,是 逢十六进一的计数制,各数位的权是以16为底的幂 。
表示:3EFH或(20)16
11
不同进制数之间的转换
二进制
八进制
十六进制
12
精品课件
十进制
二、八、十六进制转换成十进制
国标码采用十六进制表示。每个汉字的区位码同时对应一 个国标码。
27
十六进制编码
十进制编码
区位编码
00……20
21 22 23 24 25 26 …………7C 7D 7E
7F
00~ 20
21~ 2F 30~ 57 58~ 77
78~7E
位 区1~15
16~55
56~87
88~94
1 2 3 4 5 6 ………………91 92 93 94
例如,汉字“中国”,的机内码分别是十六进制 30 的精“品课D件6D0”和“B9FA” 。
字形码
国标码和机内码解决了汉字的编码标准和存储表示, 但还没有解决汉字的显示和输出问题。
一套汉字(如GB2312)其所有字符形状的数字描述信 息组合在一起称之为字库(font)。
对汉字形状的数据描述,我们称为汉字字形码。
目前计算机系统中有两种字形码:点阵式字形码和矢 量字形码。
31
精品课件
字形码
以点阵方式来表示汉字。每个点用二进制的一位“0”或 “1”来分别表示汉字相应位置处的状态,如白、黑特征, 从而体现出字的形和体。 点阵越大,点数越多,输出的字形就越清晰,越美观。 常见的有16×16、24×24、32×32、48×48和128×128 。
(11001.101)2=1×24+1×23+0×22+0×21+1×20 +1×2–1+0×2–2+1×2–3 = (25.625)10
(16A.B)16=(1×162+6×161+10×160 +11×161)10 =(256+96+10+0.69)10 =(362.69)10
(34.6)=8=( ?3×81+4×80 +6×8-1)10 = (24+4+0.75)10=
25
精字品课库件
字形码
输入码
机内码
输入码
输入码是解决汉字输入采用的编码,如“ 国标区位码”、“全拼”、“双拼”、“ 五笔”、“智能ABC”、“搜狗拼音”等输 入编码。
每一种输入码之所以能存在,是因为各有 其特点。如果有人问,哪种输入码最好, 回答是“你熟练掌握的那种输入码就是最 好的”。
26
精品课件
二进制的基数为2,数码为0,1两个。
八进制的基数为8,数码为0,1,…,7八个。
十六进制的基数为16,数码为0~9,A~F十六个 。
位权:数制每一位所具有的值,简记为“权”。
6
精品课件
权
6 7 6 1 82 0 7 11 0 8 100
数码
基数
按权展开式:234.32=2*102+3*101+4*100+3*10-1+2*10-2
3765.02 = 3×83+ 7×82+ 6×81+5×80+ 0×8-1+2×8-2
特点:数值用0-7表示,基数为8,是逢八进一的计数制, 各数位的权是以8为底的幂。
表示:452.16Q或(1101.01)8
10
精品课件
十六进制表示法
一个十六进制数可以表示成(用H代表):
(H)16= Hn-1×16n-1+Hn-2×16n-2++H0×20+H-1×16-1 + H-m×16-m
二进制运算规则简单(逢二进一)。
二进制编码在物理上最容易实现;自然界 中具有两个固定状态的物理量很多,例如 :电流的有无、电压的高低等。
5
精品课件
计算机中的数制
数制:人们利用符号来计数的科学方法。
进位计数制:按一定进位规则进行计数的方法。
基数:是指该进制中允许使用的基本数码的个数 。
十进制的基数为10,数码为0,1,2,…,9十个 。
29
精品课件
机内码
GB2312-80统一规定了汉字的基本编码标准,但是 要存储在计算机中与西文编码在计算机中的表示 有冲突。
例如,英文字符“L”和“1”的ASCII码是“76” 和“108”,而汉字的“天”的区位码也是“76” 和“108”。问题出在ASCII码和汉字国标码都采 用字节的低7位编码方式。为了避免冲突,将国标 码两个字节的最高位置“1”,形成汉字的机内码 。
非汉字图形符号(常用符号、数字序号、俄文、 英文、法文、希腊字母、日文平、片假名等)
啊阿埃 (3755个)
一级汉字
二级汉字(3008个)
空白区域
7F
国标码编码
28
精品课件
由于低7位中只有94种状态可用于汉字编码(其 它34位是控制字符,不能用),所以两个字节的
低7位共有94 × 94 = 8836种不同的状态。
每位十进制数是用4位二进制编码表示。
23
精品课件
ASCII码
(American Standard Code for Information Interchange,美国标准信息 交换码)
ASCII码有标准ASCII码和扩展ASCII码两 种。
标准的ASCII码使用7位的二进制数来编码 ,即每一个字符对应着一个7位的二进制数。 所以用标准的ASCII码可以表示27 = 128个字 符,其中包含10个阿拉伯数字,52个英文大 小字母,33个符号及33个控制字符。
7
精品课件
十进制表示法
在按位定制的计数制中,十进制数可以表示成下列 形式(用D代表或略去,无后缀符默认为十进制数):
n-1
(D)10
=å
i= -m
Di×10i
= Dn-1×10n-1+Dn-2×10n-2++D0×100+D-1×10-1++D-m×10-m
举例:
519.02 = 5×102+ 1×101+ 9×100+ 0×10-1+ 2×10-2
(1110.011010111)2
111)2
17
精品课件
二进制数转换成八进制数
整数部分从低位向高位方向每3位用一个等值的八进 制数来替换,最后若不足3位的在高位处用0补够3位 ;小数部分从高位向低位每3位用一个等值的八进制
数来替换,不足3位的在低位处用0补够3位。
(011 110 111 . 100 010 101)2=(367.425)8
数据编码的基本方式
精品课件
成武一中技术中心 2017-10-20
学习目标
了解二进制的基本原理和进制转换方法 知道数值、文字、图形图像、音视频等数据在
计算机中的编码方式。
精品课件
计算机与信息处理
计算机最主要的功能就是处理信息,而信 息在计算机中如何表示、存放、传递?这是首先要解 决的问题。基本要求是:信息的表示、存放和传递要 方便、可靠、易处理。显然,在计算机内部,信息只 有经过数字化编码后才能表示、存放和传递。
国标码将6763个汉字和682个非汉字字符(共 7445个)划分为94个区,每个区又分为94位,称 其为区位表。每个汉字在区位表中有唯一的一个 区位码(四位十进制数,前两位数是区号,后两 位数是位号)与之对应,称之为“区位码”。
例如,汉字“啊”在区位表中的编码是“1601”
,既区号是“16”,位号是“01”。
3
精品课件
数据编码的基本方式
信息的表示及采集
编码:用少量的基本符号,根据简单的 组合规则,以表示大量复杂的信息。
二进制:是一种最简单的编码系统。
多媒体信息的表示与采集
基于计算机的信息处理
信息的组织
信息的传输
信息的检索
4
精品课件
计算机为什么选用二进制
计算机中的信息采用二进制编码来表示。 二进制表示数字容易实现(只有0、1)。
特点:有0-9十个数字符号,基数为10,是逢十进一 的计数制,各数位的权是以10为底的幂。
8
精品课件
二进制表示法
一个二进制数可以表示成下列形式(用B代表):
(B)2=Bn-百度文库×2n-1+Bn-2×2n-2++B0×20+B-1×2-1 + B-m×2-m
举例:
1101.01 = 1×23+ 1×22+ 0×21+1×20+ 0×2-1+1×2-2