计算机基础知识2—数据在计算机中的表示
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机基础知识(二)数据在计算机中的表示
考点6 计算机采用二进制编码
1、二进制编码
在计算机中,数字和符号都是用电子元件的不同状态表示的,即以电信号表示。电信号只有两种“0”和“1”。所以计算机内部的信息都是以这两个状态的组合存储的,即二进制数。平常在解决实际问题中输入/输出使用的都是十进制数,即“逢十进一”。而计算机内部采用二进制数,按“逢二进一”的原则进行计算,即每位计满2时向高位进一。
二进制数的特点是:数字的个数等于基数2;最大数字是1,最小数字是0;有两个数字字符——0、1;在数的表示中,每个数字都要乘以基数2的幂次方.
计算机内部均使用二进制数来表示各种信息,但计算机与外部交往仍采用人们熟悉和便于阅读的形式,如十进制数据、文字显示以及图形描述等。而两种数制的转换是由计算机系统的硬件和软件来实现的。计算机系统采用二进制编码的主要原因是电路设计简单、运算简单、工作可靠、逻辑性强。
2、十进制数及其之间的转换
(1)十进制整数转换成R进制整数。
分两种情况进行:整数部分和小数部分。
整数:除R取余,逆序排列
小数:乘R取整,顺序排列
例:(241.43)10=(11110001.0110)2
(2)二、八、十六进制数转换成十进制数:按权展开求和。
(11010110)2= 1×27 + 1×26 + 0×25 + 1×24 + 0×23 + 1×22 + 1×21 + 0×20 = (214)10(2365)8 = 2×83 + 3×82 + 6×81 + 5×80 = (1269)10
(4BF)16=4×162 + 11×161 + 15×160 = (1215)10
(3)八进制数和十六进制数转换成二进制数
方法是:将八进制数(或十六进制数)的每一位用相应的3位(或4位)二进制数代替即可253.65O = 010 101 011.110 101B
AB.D4H = 1010 1011.1101 0100B
(4)二进制数转换成八进制数和十六进制数
整数部分:从低位向高位每3/4位一组,高位不足3/4位用0补足3/4位,然后每组转换。
小数部分:从高位向低位每3/4位一组,低位不足3/4位用0补足3/4位,然后每组转换。
考点7 计算机中的信息单元
1、位(bit)
位是度量数据的最小单位,在数字电路和电脑技术中采用二进制,代码只有0和1,无论0还是1,在CPU中都是1位。
2、字节(Byte)
一个字节由八位二进制数组成(1Byte=8bit)。字节是信息组织和存储的基本单元,也是计算机体系结构的基本单元。
早期的计算机并无字节的概念,20世纪50年代中期,随着计算机逐渐从单纯用于科学计算扩展到数据处理领域,为了在体系结构上兼顾表示“数”和“字符”,就出现了“字节”。
为了便于衡量存储器的大小,统一以字节(Byte,简写B)为单位。常用的存储单元大小表示为:
K字节1KB=1024B M字节1MB=1024KB G字节1GB=1024MB T字节1TB=1024GB 考点8 字符与编码
1、西文字符编码
计算机中常用的字符编码有EBCDIC码和ASCII码。IBM系列大型机采用EBCDIC码,微型机采用ASCII码是美国标准信息交换码,被国际化组织指定为国际标准。它有7位码和8位码两种版.国际的7位ASCII码是用7位二进制数表示一个字符的编码,其编码范围从0000000B一1111111B,共有7=128个不同的编码值,相应可以表示128个不同的编码。
新版本的ASCII-8采用8位二进制编码表示,可表示256个字符。最高位为0的ASCII 码称标准ASCII码;最高位为1的128个ASCII码称扩充ASCII码。
数字0—9的ASCII码为48—97;大写字母A—Z的ASCII码为65—90;小写字母a—z 的ASCII码为97—112。小写英文字母的ASCII码比对应的大写字母的ASCII码多32。在ASCII码表中,基本是按数字、大写英文字母、小写英文字母的顺序排列的,排在后面的码值比排在前面的大。
2、Unicode编码
它最初是由Apple公司发起制定的通用多文字集,后来被Unicode协会开发为能表示几乎世界上所有书写语言的字符编码标准。Unicode字符清单有多种代表行使,包括UTF-8,UTF-16和UTF-32,分别用8位,16位,32位表示字符。
3、中文字符编码
(1)汉字信息的交换码(国标码)
GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集。基本集》,由原中国国家标准总局发布,1981年5月1日开始实施。
汉字信息交换码简称交换码,也叫国标码。国标码的编码范围?121 H 一7E7EH 。规定了7 445个字符编码,其中有682个非汉字图形符和6763个汉字的代码。有一级常用字3 755个,二级常用字3 008个。
两个字节存储一个国标码。区位码和国标码之间的转换方法是将一个汉字的十进制区号和十进制位号分别转换成十六进制数,然后再分别加上20H ,就成为此汉字的国标码: 汉字国标码
=区号(十六进制数)+20H 位号(十六进制数)+ 20H
汉字机内码=汉字国标码+8080H
(2)汉字偷入码
汉字输人码也叫外码,都是由键盘上的字符和数字组成的。目前流行的编码方案有全拼输人法、双拼输入法、自然码输人法和五笔输人法等。
(3)汉字内码
汉字内码是在计算机内部对汉字进行存储、处理的汉字代码,它应能满足存储、处理和传输的要求。一个汉字输人计算机后就转换为内码。内码需要两个字节存储,每个字节以最高位置‘1”作为内码的标识。
(4)汉字字型码
汉字字型码也叫字模或汉字输出码。在计算机中,8个二进制位组成一个字节,它是度量空间的基本单可见一个16 x 16点阵的字型码需要16 x 16/8=32字节存储空间。 汉字字型通常分为通用型和精密型两类。
(5)汉字地址码
汉字地址码是指汉字库中存储汉字字型信息的逻辑地址码。它与汉字内码有着简单的对应关系,以简化内码到地址码的转换。
4、汉字的处理过程
5、其他汉字内码
(1)BIG5字符集:又称大五码或五大码。