计算机中的信息表示

合集下载

计算机组成原理(2计算机中的信息表示)

第2章计算机中的信息表示数据信息（数值型数据、非数值型数据）的表示、控制信息（指令）的表示2.1 数值型数据的表示方法进位计数制带符号数的表示带小数点数的表示2.1.1进位计数制计算机中常用的进位计数制二进制R=2, ak=0,1八进制R=8, ak=0,1,…,7十六进制R=16, ak=0,1,…9,a,b,c,d,e,f 相互间的转换二-八/十六进制之间转换非十-十进制之间转换二-八/十六进制转换表二进制0000 0001 0010 0011 0100 0101 0110 0111十进制0 1 2 3 4 5 6 7十六进制0 1 2 3 4 5 6 7二进制1000 1001 1010 1011 1100 1101 1110 1111十进制8 9 10 11 12 13 14 15十六进制8 9 A B C D E F八进制数转换成二进制数7 4 • 1 3 111 100 • 001 011()28)001011.111100(13.74=二进制转换成八进制数110 010 • 001 1016 2 • 1 5()82)15.62(001101.110010=———直接对应法十六进制数转换成二进制数A 6 • 1 C 1010 0110 • 0001 1100()216)00011100.10100110(1.6=C A 二进制数转换成十六进制数1101 0101 • 1110 1001D 5 • E 9()162)9.5(11101001.11010101E D =———直接对应法非十进制数转换成十进制数二进制数转换：1011232)5.10(2120212021)1.1010(=×+×+×+×+×=−八进制数转换：100128)262(868084)406(=×+×+×=十六进制转换：1012316)10830(1616416162)42(=×+×+×+×=E A E A .把各个非十进制数按权展开求和即可。

计算机中信息表示

计算机中信息表⽰1、概述现在的我们⽆时⽆刻不在接触计算机，即常说的电脑。

计算机能⼲很多事，⽐如浏览⽹页、看视频、玩游戏、办公等，实现这些功能都需要计算机有信息存储和处理的能⼒。

现代计算机的信息存储和处理都以⼆进制为基础，简单来说我们在电脑上看到的信息(⽐如⽂字、图⽚、⾳频、视频)都是以⼆进制表⽰的形式存储在计算机上或被计算机以⼆进制这种形式处理的。

⽐如我们在计算机上的记事本中写⽇记，写⼊的是中⽂，在计算机中是以⼆进制编码(01010......)存储的，同时会给这些⼆进制编码指定⼀种解释⽅式，⽐如GB2312编码等，这样⽇记显⽰在屏幕上的才是中⽂。

为什么计算机选择⼆进制存储和处理信息？主要原因是⼆进制容易被电⼦元件表⽰、存储和传输，⽐如可以以电压⾼低表⽰0/1，或以磁场的⽅法顺时针和逆时针表⽰0/1等。

我们⽇常使⽤⼗进制表⽰数字，原因是每个⼈都有⼗个⼿指或⼗个脚趾，使⽤⼗进制符合我们⼤部分⼈的认知，也⽅便⽇常使⽤。

1.1 计算机存储和表⽰的基本单位计算机中存储和表⽰数据的基本单位是位 (bit)，和我们平常在⼗进制中所说的位概念相同，⽐如个位、⼗位、百位等。

⼆进制中每位的取值范围是0或者1。

计算机中每8位代表⼀个字节(byte)，即 1byte = 8bit，这是计算机中的常⽤存储⼤⼩单位。

⽐字节⼤的还有KB、MB、GB、TB、PB、EB，其换算关系如下：1KB = 1024B，1MB = 1024KB，1GB = 1024MB，1TB = 1024GB，1PB = 1024TB，1EB = 1024PB。

’需要注意两个问题：1. B和b的区别，⼤写B代表字节，⼩写b代表⽐特位。

⽐如1KB = 8Kb，常见的⽹速10Mbps，代表每秒10Mb，即⼤约1MB/s；2. 标准换算关系是 1KB = 1024B，但在⼀般⾮正式计算中为了⽅便计算，使⽤1KB = 1000B，其他的依此类推。

⽐如新买的电脑的磁盘或U盘，标称⼤⼩和实际⼤⼩不符合1024的换算关系，原因就是在⼯程制造中⼀般使⽤1000的换算⽐例，⽽计算机使⽤的1024的换算⽐例，所以会导致存在⼀定的偏差。

计算机中的信息表示

换一个角度： 162
161
1
6
160
16－1 16－2
11(B) 6
8
1
·推广：任意一个十六进制数可以表示为： (H)16 = hn×16n-1 ＋ hn-1×16n-2 ＋… h2×161 ＋ h1×160 ＋ h-1×16-1 ＋ h-2×16-2 ＋… h-m×16-m
n
m
= ∑ hi×16i-1 ＋ ∑ hj×16-j
换一个角度： 23
22
21
20
1
1
0
1
2－1 2－2
0
1
·推广：任意一个二进制数可以表示为： (B)2 = bn×2n-1 ＋ bn-1×2n-2 ＋… b2×21 ＋ b1×20 ＋ b-1×2-1 ＋ b-2×2-2 ＋… b-m×2-m
n
m
= ∑ bi×2i-1 ＋ ∑ bj×2-j
i=1
j=1
其中： bi和 bj 为0或1；n为整数部分位数；m为小数部分位数； 2i-1 和2-j分别为整数部分和小数部分位权。
济南大学信息学院公共教学部
2.1.3、八进制数（E ）
·特点： (1)、有0－7八个数 (2)、逢八进一，进位基数为8。
·举例：八进制数2533.42可以表示为： 2533.42 =2×83 ＋ 5×82 ＋ 3×81 ＋ 3×80 ＋ 4×8-1＋ 2×8－2
= 8+4+0+1+0+0.25 = (13.25) 10 【注】括号外的下标用来表示不同的数制
问：八进制数和十六进制数如何转换成十进制数？
【注】方法同二进制数转换成十进制数
济南大学信息学院公共教学部

字符编码——计算机中信息的表示

三、非数值信息的表示
1、字符编码
2、Hale Waihona Puke 子编码“逢十进一”的记数方法
由学生说出
“逢二进一”的记数方法
如：（9）10=（1001）2
换算关系：1kb=1024b
1mb=1024kb
1gb=1024mb
1tb=1024gb
国际标准化：ASCII码
共128个
（1）汉字交换机码
（2）汉字机内码
（3）汉字字型码
课题
第四课字符编码——计算机中信息的表示
授课计划
1课时
授课形式
理论课
授课地点
微机室
授课教师
马许鸽
学
习
任
务
1、了解数值信息的不同进制表示方法；
2、了解数在计算机中的表示方法，会用“逢二进一”的记数法记数；
3、知道计算机中数据的单位之间的换算；
4、了解非数值信息在计算机中的表示方法。
学
习
活
动
1、教师通过学生熟练的十进制来帮助学生理解二进制，通过例题的数数方法来使学生学会怎样数二进制数；
2、教师介绍数据的单位及单位之间的换算关系；
3、学生自主学习非数值信息在计算机中如何表示。
知
识
与
技
能
一、数值信息的表示
1、十进制
2、时间的进制
3、二进制
十进制
二进制
0
1
2
3
4
5
6
7
8
9
0
1
10
11
100
101
110
111
1000
1001
1010
二、计算机中数据的单位

计算机的信息表示方式

塑料壳读写窗口挡板
盘片
轴盘连接孔
写保护孔
3.5英寸软盘示意图
软盘的技术指标有：
1．面数(side)：软盘分为单面(第0面)和双面(第0、1面)软盘。 2．磁道(track)：以盘片中心为圆心的一组同心圆．数据存储在软盘片的磁道内，磁道数一般为40或80,编号从0开始,即0—39 或0—79，编号从外到内。
ROM和RAM的区别：
1、一般ROM的存储容量小于RAM。
2、ROM中的信息出厂时就已经固化在芯片上，而RAM是计算机运行是用来暂存程序和数据的。
3、ROM中的信息一般情况下不会发生变化，而RAM中的程序和数据计算机掉电则信息丢失。
外部存储器：
软盘存储器软盘一般有5寸盘(5.25“)和3寸盘 (3.5”),高密3寸盘的存储容量为 1.44M,高密5寸盘容量为1.2M，现在一般采用3寸盘。是所有存储器读写速度最慢的一类

1、CPU
CPU（Central Processing Unit）就是
系统的中央处理器，主要功能是执行程序指令、完成
各种运算和系统控制功能。它是一块超大规模集成电路，它的内部包含着几十万、几百万或几千万个晶体管。Intel公司的PC机微处理器有Intel 8088、80286、 80386、80486、Pentium、Pentium Pro、Pentium MMX、 Pentium II、Pentium III和Pentium 4等。与之兼容的CPU主要还有AMD。
3、信息的量化 A、位（bit），简写b：是计算机中最小的信息单位，是二进制中的一个数位，简称位。一个二进制位表示两种状态，（0、 1），由此可知，N位二进制表示2N种状态；比特流 B、字节（Byte）,简写B：是表示存储空间大小的最基本单位，也可理解为计算机中最基本的存储单位，常用8位二进制表示一个字节，（1Byte=8bit）,也可写为：1B=8b。

2计算机信息表示

✓ 定点整数：小数点固定在表示数值的最低位之后 ✓ 定点小数：小数点固定在符号位和数值位之间
41
计算机编码_数值
小数的表示
✓ 浮点数：小数点的位置不固定。由阶码和尾数组成
✓ 阶码：指数部分，是一个整数 ✓ 尾数：数的有效数值，整数或纯小数两种形式
42
计算机编码_字符
字符编码
✓ 如何表示A、B、C等字母？ ✓ 如何表示句号、逗号等？ ✓ 如何表示回车、换行等？
9
1001
11
不同数制值之间的关系
12
二进制运算
算术运算规则： 0+0=0 0+1=1 0*0=0 0*1=0
1+0=1 1*0=0
1+1=10 1*1=1
110 ＋ 011
1001
011 ＋ 011
110
13
二进制运算
逻辑运算规则：与 / ：或 / ：非:
0
1
0
1
110001 011111
✓ 一个字节可有256个值 ✓ 可存放一个半角英文字符（ASCII码）。两
个或四个字节存放一个汉字编码
26
数据的计算机存储
位： b 字节：B
1B＝8b
1KB = 1024 B＝210B 1MB = 1024KB ＝220B 1GB = 1024MB ＝230B 1TB = 1024GB ＝240B
5
1 数制
数制(number system)
✓ 用一组固定的数字（数码符号）和一套统一的规则来表示数值的方法。也叫计数制
6
数制
几种常用进位计数制。
✓ 十位制(Decimal notation) D –十个手指 ✓ 24进制（一天）；60进制（秒、分、时） ✓ 二进制(Binary notation) B ✓ 八进制(Octal notation) O ✓ 十六进制数(Hexadecimal notation) H ✓ 古巴比伦人-60进制 ✓ 玛雅人-20进制

计算机中的信息表示

64O： 64O
第3章计算机中的信息表示 Nhomakorabea2. 二进制转化成八进制
原则：三位一组法。原则：三位一组法。整数部分：进行分组。整数部分：从右向左进行分组。进行分组，不足3位补零。小数部分：小数部分：从左向右进行分组，不足3位补零。 110 101 111 . 010 10 0 B=657.24O =657.24O 6 5 7 2 4
无符号整数的表示
无符号整数指的是计数系统中只有大于等于无符号整数指的是计数系统中只有大于等于0的只有大于等于0 因此，不需要表示符号。数，没有负数，因此，不需要表示符号。例如：用8位二进制表示整数的范围：二进制表示整数的范围表示整数的范围：例如： 0000 0000～1111 1111 0000～对应的十进制整数的范围：对应的十进制整数的范围： 0 ～ 255
第3章计算机中的信息表示
二、八、十六进制之间的转换
1. 八进制转换成二进制八进制转换成二进制
原则：一分为三法。原则：一分为三法。位二进制码。每 1 个八进制数对应 3 位二进制码。 27.461O 27.461O ： 2 7. 4 6 1 010 111 100 110 001B 001B 6 110 4 100B 100B
后边补两个零
第3章计算机中的信息表示
八进制与二进制的对应关系
八进制 0 1 2 3 011 4 100 5 101 6 110 7 111
二进制
000 001 010
第3章计算机中的信息表示
十六进制与二进制的对应关系
十六进制二进制十六进制二进制 0 0000 8 1000 1 0001 9 1001 2 0010 A 1010 3 0011 B 1011 4 0100 C 1100 5 0101 D 1101 6 0110 E 1110 7 0111 F 1111

计算机中的信息表示

50
(3) 补码定点加减法所需硬件配置
51
(4).补码加减运算控制流程
52
2.3.3 乘法运算
53
54
55
56
上述运算过程可归纳为： ①乘法运算可用移位和加法来实现，当两个四位数相乘，总共需做四次加法和四次移位。 ②由乘数的末位值确定被乘数是否与原部分积相加，然后右移一位，形成新的部分积；同时乘数也右移一位，由次低位作新的末位，空出的最高位放部分积的最低位。 ③每次做加法时，被乘数仅仅与原部分积的高位相加，其低位被移至乘数所空出的高位位置。实现这种运算比较容易，用一个寄存器存放被乘数，一个寄存器存放乘积的高位，另一个寄存器存放乘积的低位与乘数。再配上加法器及其它相应电路，就可组成乘法器。又因加法只在部分积的高位进行，故这种算法不仅节省硬件资源，而且缩短运算时间。
40
2.3.2 加法与减法运算
41
42
43
44
45
（2）溢出判断
对于加法，只有正数加正数和负数加负数两种情况下才可能出现溢出，符号不同的两个数相加是不会出现溢出的。对于减法，只有在正数减负数或负数减正数两种情况下才可能产生溢出，符号相同的两个数相减是不会出现溢出的。
由于减法运算在机器中是用加法器实现的，因此可得如下结论：不论是作加法还是减法，只要实际参加运算的两个数（减法时即为被减数和“求补”以后的减数）符号相同，结果又与原操作数的符号不同，即为溢出。
106
107
2.8.1 奇偶校验码
108
109
2.8. 2 循环冗余校验码
循环冗余校验码（Cyclic Redundancy Check），简称CRC码，是一种具有很强检错、纠错能力的校验码。循环冗余校验码常用于外存储器的数据校验，在计算机通信中，也被广泛采用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1. 进位计数制1. 常见的进位计数制Bi nary 二进制 O ctonary 八进制 D ecimalism 十进制 H exadecimal 十六进制进位计数制：利用固定的数字符号和统一的规则来计数的方法。

有3个基本要素：基数->指数制中可以使用的基本符号个数。

进位规则->R 进制数逢R 进1。

位权->不同位置上数字表示的单位数值 2. 常见的进位计数制的数的转换 1.二、八、十六进制转成十进制多项式展开直接求和 2.十进制转换成二进制整数部分：除基到零，反向写余小数部分：乘基到精，正向写整 3. 二进制转成八、十六进制小数点为界，向两边分组。

八进制3个一组，十六进制4个一组，不足添0。

各组二进制转成十进制再转成八（十六）进制即可。

2.计算机中的数据 1.二进制与计算机位（bit ）：计算机中最基本的单位，一个二进制数字0/1。

字节（Byte ）：8个位。

字：字节的集合。

字长：一个字中二进制的位数。

字长是计算机一次能同时进行运算的二进制位数。

现在一般为32bit 、64bit 。

一般来说，n 位的二进制数字能够表示种状态。

2. 模拟数据和数字数据模拟数据：一种连续表示法，模拟它表示的真实信息。

数字数据：一种离散表示法，把信息分割成了独立的元素。

阈值：大于阈值的电压看成高电压，小于阈值的电压看成低电压。

10.7725 10 2 5 0 2 2 1 2 1 0 2 0 1 1010.1100 0.7725x2=1.5450 0.5450x2=1.0900 0.0900x2=0.18000.1800x2=0.3600 001010.110000 12.60计算机不能处理模拟数据，要对模拟数据进行数字化。

3. 数据及其分类数值、文本、音频、视频、图像、图形。

4. 数值型数据的表示机器数：一个数在计算机中的表示形式。

机器数有位数限制，多余的位数将被截断，少的位数将被填充。

（机器数的）真值：带有正负号的数。

1. 数值型数据的分类根据是否带小数点分为实数和整数。

按照是否带有符号，整数分为带符号和无符号。

对于带符号的整数要对符号进行编码。

数值数据可以用原码和补码表示。

为了表示实数中的小数点的位置，可以表示为定点数或浮点数。

2. 整数的表示无符号整数表示：转成二进制数，对不足机器字长的在前面补0。

最小值全是0，最大值全是1。

带符号整数表示：0表示正，1表示负。

符号位占用一位二进制数位。

原码数值型数据整数实数带符号整数无符号整数定点表示浮点表示. .补码：正数同原码，负数补码除符号位外其他位取反，末尾位加1。

+、-0的补码一致。

3.实数的表示定点数的表示：定点数就是在运算过程中小数点的位置固定不变。

小数点位置不一定是明确指定的。

由于小数点位置固定，计算时可以直接进行加减运算。

浮点数的表示：任何一个数都可以用科学计数法来表示，这种表示方法称为浮点表示法。

浮点数的一般表示形式：IEEE 754规定单精度浮点数（32b）双精度浮点数（64b）。

对于二进制实数，现将其写成尾数是定点小数的科学计数法的形式。

再将其尾数扩充为23位，阶码扩充为8位，再把尾数转换成补码形式。

4.溢出计算机中n位有符号数的表示围（12~2-11---nn）。

超出围会产生溢出。

100010101111010111110110（0.1110100）x（-0.1110100）x5.文本表示一个文本是由一系列字符构成的。

要处理一个文本，必须表示和存储每个可能出现的字符。

码：字符在计算机中存储和处理时的编码。

1.文本类型1.简单文本：仅由一串字符代码组成，没有字体字号的变化和其他媒体。

文件扩展名为txt。

2.丰富格式文本：允许在文档中设置格式（字体、颜色、页边距、自选图形、公式等）的文本。

3.超文本（HTML文本）：有声音、视频等多媒体信息，还有。

不管是哪种类型，核心问题是要表示字符本身，格式符号需要单独表示。

最早也是最常用的方法是列出所有字符，给每个字符编一个二进制位串。

要表示的符号数决定了需要多少二进制位数来表示。

西文字符——>ASCII码汉字字符——>GB 2312-1980全世界所有字符——>Unicode码2.文本码1.ASCII码美国标准信息互换标准代码。

最初，ASCII字符集中每个字符由7个二进制位表示，总共有128个不同字符。

用一个字节存储，第8位用作校验位。

ASCII码表中特殊的33个字符（0~31和127）是不可显示和打印的控制码。

比如CR（回车）。

2.Unicode编码表示世界上使用的所有语言的所有字符。

Unicode使用16位表示每个字符，能够表示162个字符。

Unicode字符集是ASCII字符集的超集。

Unicode 常用的两种编码方案如下：1）UTF-8单字节可变长编码：每个字符占1~4个字节。

有单、双、三、四字节。

2）UTF-16双字节可变长编码：每个字符占2或4个字节。

3.汉字编码汉字码是计算机部使用的用二进制表示的汉字编码。

i)区位码94x94个ASCII字符为基础构成二维平面，行为区，列为位。

每一个汉字/字符都对应唯一一个区（左）位（右）号。

每个汉字用2个字节表示。

ii)汉字码GB2312标准ASCII码用1每个字节最高位是1。

为了与ASCII码的可打印字符位置一致，在区号和位号上分别加上20H（32），称为国标码。

区位码转换成机码的方法是：将十进制的区码和位码转成十六进制的，将他们分别加上20H得到国际码。

再在高低字节上加上80H。

iv)汉字码 GB18030汉字编码标准国家发布过GB 18030-2000和GB 18030-2005，现已强制贯彻执行。

4.文本输入1．键盘输入2．联机手写输入3．语音输入4．印刷体识别5.文本输出1.字符点阵描述每个字符按照图形符号设计成点阵图，用一位二进制对应屏幕上的一个点，亮为1暗为0，就得到相应的点阵代码（字形码）。

2.字符轮廓描述以字符轮廓的转折点为特征来描述字符，又称矢量字体。

用一组直线和曲线命令以及一些参数来描述字体的轮廓。

3.字库把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中，称为字形库。

C：\windows\fonts4.文本压缩数据压缩：又称数据编码。

是为了在存储和传输数据时减小数据所占空间大小的方法。

分为有损/无损。

压缩率：原始数据大小/压缩后大小。

1.关键字编码：用单个字符代替常用单词。

2.行程长度编码：又称迭代编码。

将重复的字符序列替换为标志字符。

后面加重复字符和说明重复次数的数字。

Ex：*A7 就是AAAAAAA。

3.赫夫曼编码用不同长度的二进制位串表示不同字符。

把较少的位串表示经常出现的字符，而较长的位串表示不常出现的字符。

郝夫曼编码的重要特征：用于表示一个字符的位串是表示另一个字符的位串的前缀。

从左到右扫描一个位串事，每当发现一个位串对应一个字符时，他就一定表示这个字符，他不可能是更长的位串的前缀。

5.图像和图形的表示1.颜色表示三基色原理：人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。

计算机中颜色表示：用RGB指表示。

RGB是3个数（0~255），表示每种颜色占的比例。

对颜色编码：把一种颜色分解为RGB值的过程。

颜色深度：用于表示颜色的数据量。

通常用表示颜色的位数来表示。

现在用24位的真彩色表示（3x8），即RGB值中的每个数字由8位表示，围是0~255。

能表示1670万种颜色。

2.图像数字化数字化图像：将图像按照行和列的方式均匀地划分为若干个小格子（像素）。

分辨率：水平像素点x垂直像素点。

图像：像素点的集合。

存储一幅图像就是要存储图像上每个像素点的信息。

图像的编码：每个像素呈现一种颜色（灰度层次），对每个像素进行RGB编码，再把所有行列的像素编码连接起来。

图像的获取：是模拟信号数字化的过程。

扫描、分色、取样、量化、编码。

3.数字图像的表示根据图像中每个像素点的信息位数，可将图像分为彩色图像、灰度图像和黑白图像。

1.彩色图像：由RGB 3个彩色分量组成，需要用3个矩阵分别表示每个彩色分量的亮度值。

2.灰度图像：每个像素只有1个灰度分量。

通常8位表示，代表256个灰度。

1010110001111011B O A R D人眼能识别的灰度大概是100个。

3.黑白图像：每个像素只有1个黑色分量。

只用一个二进制位表示。

取值只有0（黑）1（白）。

二值化：把图像转换成黑白图像的操作。

二值化选定一个阈值，高于它为黑，反之为白。

4.图像的存储和压缩图像数字化后的大小 = 水平分辨率x垂直分辨率x颜色深度/81024 x 1024 x 24 / 8 = 3.75MB图像压缩：提高在网络上传输的速度。

流行的图像压缩都遵循静态图像压缩国际标准JPEG。

流行的逐个像素存储图像方法有位图（BMP）、GIF、PNG、JPEG、TIFF、PSD，他们都采用了不同方式的压缩方式。

5.图形的表示图形：由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。

分为平面图形和三维图形。

矢量图形：计算机图形一般用矢量图形格式来描述。

它不适用于描述真实世界的图像，是用于艺术线条和卡通绘画。

图像效果差，但是放大不失真。

常见格式：3DS\DXF\WMF\FLASH\SVG。

6.音频信息表示1.声音数字化采样：周期性测量模拟信号的电压，记录合适的数值。

将模拟信号数字化。

量化：把采样的结果用有限个数字表示出来。

量化精度：量化的二进制数值的位数。

每秒声音的数据量可以用声音的码率来表示（每秒二进制位b/s）声音码率=采样频率x量化精度x声道数声音数据量=声音的码率x时间/8编码：声音经过量化后数据量比较大，需要进行数据压缩，以减小数据量。

失真：采样频率低于每秒40000次，不足以复原原始声音，人耳听到就会失真。

2.音频格式WAV、AU、AIFF、VQF、MP3、MID。

视频表示视频是一系列压缩的静态图像组成的，每一幅镜头图像成为帧。

常用的两种压缩方式：时间压缩和空间压缩。

常见格式：rm、rmvb、wmv、asf、mpeg、dat、avi。