计算机中的信息表示
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章计算机中的信息表示
一.数制、基数、权
数制
↖数制也称进制计数制,是指用一组固定的符号和统一的规则来表示数值的方法
↖不同进制数的表示
( ) 角标表示:(1001 )2,(3728 )10
加字母标示:
⇧十位制(Decimal notation) D ,如3728D
⇧二进制(Binary notation) B
⇧八进制(Octal notation) O
⇧十六进制数(Hexadecimal notation) H ,如20H
↖十进制数举例
数字:十个,(0 ,1 ,…,9 )
进位:逢十进一
(3728 )10 =3*103+7*102+2*101+8*100
基数
↖基数定义
某进制计数制允许选用的基本数字符号的个数
↖对于N 进制数
基数为 N
⇧十六进制数的基数为16
⇧十六进制的基本数字符号:0 、1 、…、9 、A 、B 、C 、D 、E 、F 逢N进一
权
↖权的定义
某数制中每位上的“1”所表示的数值称为该位“位权”(简称“权”),是一常数↖位权的大小
以基数为底,数字符号所处的位置的序号为指数的整数次幂
(3728)10 =3*103+7*102+2*101+8*100
↖采用位权表示法
N =a n-1m n-1 +……+ a2m2 + a1m1+a0m0 (m为基数)
N10=a n-110n-1+……+a2102+a1101+a0100
N2 = a n-12n-1 +……+ a222 +a121 +a020
(1011 )2 =1*23+1*22+1*21+1*20
二.二进制
任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。
采用二进制的原因
↖可行性
↖简易性
↖逻辑性
↖可靠性
二进制数的算术运算规则
↖加法
0+0=0,0+1=1
1+0=1,1+1=10(进位)
↖减法
0-0=0, 1-1=0
1-0=1, 0-1=1 (借位)
↖乘法
0*0=0,0*1=0
0*1=0,1*1=1
↖除法
0÷1=0,1÷1=1,0做除数无效
二进制数的逻辑运算
↖注意:运算按位进行,没有进位和借位
↖逻辑加法 + (或∨运算)
0+0=0 0+1=1 1+0=1 1+1=1 ↖逻辑乘法×(或∧运算)
0×0=0 0×1=0 1×0=0 1×1=1
↖逻辑非运算ˉ
三.数制转换
十进制数与非十进制数的转换
↖十进制数→非十进制数
↖非十进制数→十进制数
非十进制数之间的转换
↖二进制与八进制、十六进制之间的转换
↖八进制与十六进制之间的转换
十进制数与非十进制数的转换
↖十进制数→非十进制数
基本规则
⇧整数转换的规则是“除基取余”
⇧第一个余数是最低位
十进制数→非十进制数
例如:(19)10 →二进制数,结果为(10011)2
↖非十进制数→十进制数
基本规则
⇧“按权展开”求和
例如:(1101)2 →十进制数
(1101 )2=1╳23+1 ╳22+0╳21+1 ╳20= (13 )10
例如:(34)8 →十进制数
(34 )8=3╳81+4 ╳80= (28 )10
例如:(2A)16 →十进制数,结果为(42 )10
非十进制数之间的转换
↖二进制与八进制、十六进制之间的转换
二进制→八进制、十六进制 ( 收缩法)
八进制、十六进制→二进制
八进制、十六进制→二进制 (扩展法)
⇧例如:
↖八进制与十六进制之间的转换
通过二进制转换
四.计算机中数的表示 计算机中数的表示范围
↖与字长有关;
↖字长越长,运算精度越高
计算机中无符号数的表示
8 位:0~255 (=28-1 )
↖16 位:0~65535 (=216-1 )
计算机中有符号数的表示
↖计算机中有符号数字是以补码的形式存储的
引入了补码概念后,通过对负数的简单处理,使减法运算转化成加法运算,简化了处
理的复杂性
五.西文信息在计算机中的表示
编码
↖将各类信息转换成¡° 0¡±和¡° 1¡±表示的代码,从而利用计算机进行处理,这一过程成为编码
↖编码是要通过计算机的软件、硬件来实现的
西文信息在计算机中的表示
ASCII 码( 7位编码)
↖ASCII 码( 美国标准信息交换码)
规定了常用的数字、字母、符号的编码
用7 位二进制表示一个字符,所以最多可以表示128 个字符;每个字符可以用一个
字节表示,字节的最高位为0
↖ASCII 码中的符号可以分成两类
显示字符:指能从键盘输入、可以显示和打印的字符
控制字符:主要用来控制输入、输出设备
扩展ASCII 码( 8位编码)
↖使用一个字节的全部8 位(bit) 来表示字符;最多可以表示256 个字符
↖ABC<ACD
己知大写字母E的ASCII码(16进制)是45, 大写字母O的ASCII码(16进制)是4F (=45+A)
六.汉字信息在计算机中的表示
汉字处理过程
汉字信息在计算机中的表示
汉字交换码
↖汉字交换码是汉字信息处理系统之间或通信系统之间传输信息时,对每个汉字所规定的统一编码,交换码之设计须符合国际标准
↖信息交换码统一的意义
↖国标GB2312码
其中包含了6763 个汉字,并分作两级
⇧一级为常用字,含3755 个,按照拼音排序
⇧二级,含3008 个,按照部首排序
采用一个汉字两个字节的编码方案,每字节的最高位为0
汉字输入码(外码)
↖作用
是为了通过键盘字符把汉字输入计算机而设计的一种编码
↖汉字输入方案大致可分为以下4 种类型
音码
形码
音形码
数字码
汉字机内码(内码,汉字存储码)
↖作用
将输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉
字处理
↖内码的表示方法可以不同
如中国大陆(及新加坡)的GB2312、 GBK 、GB18030-2000 标准
台湾的BIG-5
ISO 10646 国际编码标准、 Unicode 编码
GBK
⇧与GB2312-80完全兼容,支持GB13000的CJK汉字和BIG5中的非汉字符号,收录21003
个汉字
GB18030-2000
⇧国家最新发布的新的汉字编码标准,它是在GBK 的基础上做进一步扩充,收录
27000 多个汉字
Big5
⇧台湾,420 个图形符号,13070 个汉字,繁体
ISO 10646国际编码标准
⇧国际标准化组织(ISO)制定的编码标准,该标准旨在囊括世界上所有文种的字符,
到目前为止ISO 10646已编码汉字达七万字之多
⇧C JK是此方案的大中国区的统一编码;特指其中的中、日、韩统一编码的汉字部分 Unicode 编码
⇧编码用两个字节,但UTF-8 是变长的编码,不一定是2 字节
⇧由IT 企业集团制定的工业标准
⇧总体上,它的内容与ISO 10646 几乎等同
↖中国大陆使用的汉字机内码
即国标码每个字节最高位为1 →内部码
因此,不与ASCII 码产生二义性,这是计算机区分汉字编码和西文编码的基础
汉字地址码
↖是指汉字库中存储汉字字形信息的逻辑地址
↖与汉字内码间有着简单的对应关系
汉字输出码(字形码)
↖汉字字形码是表示汉字字形信息的编码,是一串二进制数
↖字形码存储在汉字字库中,不同的字体对应不同的字库
↖汉字字库
点阵字库
⇧“1”表示对应位置是黑点、“0”±表示是空白
⇧常用的点阵有16 *16、24*24、32*32、48*48、64*64
⇧16 * 16点阵字形的字要使用32个字节存储
(16*16/8=32)
⇧存储100个16x16点阵汉字字形所需的存储容量是
[(16*16/8)*100]/1024=3.125KB
矢量字库:精度高、任意缩放,如TrueType字形技术
乱码
↖造成乱码的原因是,其实内码对于字库来说,只是查找字形的索引;而不同系统的汉字内码和汉字字形码没有固定的一一对应关系,即:写入方的码本和读出方的码本不一致,同一个字符串就会呈现不同的字形,也就是乱码。
↖在使用浏览器的过程中,当出现乱码时,通过[查看]->[编码]选择合适的编码标准,就可解决乱码问题。