计算机中的信息表示
计算机组成原理(2计算机中的信息表示)
第2章计算机中的信息表示数据信息(数值型数据、非数值型数据)的表示、控制信息(指令)的表示2.1 数值型数据的表示方法 进位计数制带符号数的表示带小数点数的表示2.1.1进位计数制计算机中常用的进位计数制二进制R=2, ak=0,1八进制R=8, ak=0,1,…,7十六进制R=16, ak=0,1,…9,a,b,c,d,e,f 相互间的转换二-八/十六进制之间转换非十-十进制之间转换二-八/十六进制转换表二进制0000 0001 0010 0011 0100 0101 0110 0111十进制0 1 2 3 4 5 6 7十六进制0 1 2 3 4 5 6 7二进制1000 1001 1010 1011 1100 1101 1110 1111十进制8 9 10 11 12 13 14 15十六进制8 9 A B C D E F八进制数转换成二进制数7 4 • 1 3 111 100 • 001 011()28)001011.111100(13.74=二进制转换成八进制数110 010 • 001 1016 2 • 1 5()82)15.62(001101.110010=———直接对应法十六进制数转换成二进制数A 6 • 1 C 1010 0110 • 0001 1100()216)00011100.10100110(1.6=C A 二进制数转换成十六进制数1101 0101 • 1110 1001D 5 • E 9()162)9.5(11101001.11010101E D =———直接对应法非十进制数转换成十进制数二进制数转换:1011232)5.10(2120212021)1.1010(=×+×+×+×+×=−八进制数转换:100128)262(868084)406(=×+×+×=十六进制转换:1012316)10830(1616416162)42(=×+×+×+×=E A E A .把各个非十进制数按权展开求和即可。
计算机中信息表示
计算机中信息表⽰1、概述现在的我们⽆时⽆刻不在接触计算机,即常说的电脑。
计算机能⼲很多事,⽐如浏览⽹页、看视频、玩游戏、办公等,实现这些功能都需要计算机有信息存储和处理的能⼒。
现代计算机的信息存储和处理都以⼆进制为基础,简单来说我们在电脑上看到的信息(⽐如⽂字、图⽚、⾳频、视频)都是以⼆进制表⽰的形式存储在计算机上或被计算机以⼆进制这种形式处理的。
⽐如我们在计算机上的记事本中写⽇记,写⼊的是中⽂,在计算机中是以⼆进制编码(01010......)存储的,同时会给这些⼆进制编码指定⼀种解释⽅式,⽐如GB2312编码等,这样⽇记显⽰在屏幕上的才是中⽂。
为什么计算机选择⼆进制存储和处理信息?主要原因是⼆进制容易被电⼦元件表⽰、存储和传输,⽐如可以以电压⾼低表⽰0/1,或以磁场的⽅法顺时针和逆时针表⽰0/1等。
我们⽇常使⽤⼗进制表⽰数字,原因是每个⼈都有⼗个⼿指或⼗个脚趾,使⽤⼗进制符合我们⼤部分⼈的认知,也⽅便⽇常使⽤。
1.1 计算机存储和表⽰的基本单位计算机中存储和表⽰数据的基本单位是位 (bit),和我们平常在⼗进制中所说的位概念相同,⽐如个位、⼗位、百位等。
⼆进制中每位的取值范围是0或者1。
计算机中每8位代表⼀个字节(byte),即 1byte = 8bit,这是计算机中的常⽤存储⼤⼩单位。
⽐字节⼤的还有KB、MB、GB、TB、PB、EB,其换算关系如下:1KB = 1024B,1MB = 1024KB,1GB = 1024MB,1TB = 1024GB,1PB = 1024TB,1EB = 1024PB。
’需要注意两个问题:1. B和b的区别,⼤写B代表字节,⼩写b代表⽐特位。
⽐如1KB = 8Kb,常见的⽹速10Mbps,代表每秒10Mb,即⼤约1MB/s;2. 标准换算关系是 1KB = 1024B,但在⼀般⾮正式计算中为了⽅便计算,使⽤1KB = 1000B,其他的依此类推。
⽐如新买的电脑的磁盘或U盘,标称⼤⼩和实际⼤⼩不符合1024的换算关系,原因就是在⼯程制造中⼀般使⽤1000的换算⽐例,⽽计算机使⽤的1024的换算⽐例,所以会导致存在⼀定的偏差。
计算机中的信息表示
换一个角度: 162
161
1
6
160
16-1 16-2
11(B) 6
8
1
·推广:任意一个十六进制数可以表示为: (H)16 = hn×16n-1 + hn-1×16n-2 +… h2×161 + h1×160 + h-1×16-1 + h-2×16-2 +… h-m×16-m
n
m
= ∑ hi×16i-1 + ∑ hj×16-j
换一个角度: 23
22
21
20
1
1
0
1
2-1 2-2
0
1
·推广:任意一个二进制数可以表示为: (B)2 = bn×2n-1 + bn-1×2n-2 +… b2×21 + b1×20 + b-1×2-1 + b-2×2-2 +… b-m×2-m
n
m
= ∑ bi×2i-1 + ∑ bj×2-j
i=1
j=1
其中: bi和 bj 为0或1;n为整数部分位数;m为小数部分位数; 2i-1 和2-j分别为整数部分和小数部分位权。
济南大学信息学院公共教学部
2.1.3、八进制数(E )
·特点: (1)、有0-7八个数 (2)、逢八进一,进位基数为8。
·举例: 八进制数2533.42可以表示为: 2533.42 =2×83 + 5×82 + 3×81 + 3×80 + 4×8-1+ 2×8-2
= 8+4+0+1+0+0.25 = (13.25) 10 【注】括号外的下标用来表示不同的数制
问:八进制数和十六进制数如何转换成十进制数?
【注】方法同二进制数转换成十进制数
济南大学信息学院公共教学部
字符编码——计算机中信息的表示
1、字符编码
2、Hale Waihona Puke 子编码“逢十进一”的记数方法
由学生说出
“逢二进一”的记数方法
如:(9)10=(1001)2
换算关系:1kb=1024b
1mb=1024kb
1gb=1024mb
1tb=1024gb
国际标准化:ASCII码
共128个
(1)汉字交换机码
(2)汉字机内码
(3)汉字字型码
课题
第四课字符编码——计算机中信息的表示
授课计划
1课时
授课形式
理论课
授课地点
微机室
授课教师
马许鸽
学
习
任
务
1、了解数值信息的不同进制表示方法;
2、了解数在计算机中的表示方法,会用“逢二进一”的记数法记数;
3、知道计算机中数据的单位之间的换算;
4、了解非数值信息在计算机中的表示方法。
学
习
活
动
1、教师通过学生熟练的十进制来帮助学生理解二进制,通过例题的数数方法来使学生学会怎样数二进制数;
2、教师介绍数据的单位及单位之间的换算关系;
3、学生自主学习非数值信息在计算机中如何表示。
知
识
与
技
能
一、数值信息的表示
1、十进制
2、时间的进制
3、二进制
十进制
二进制
0
1
2
3
4
5
6
7
8
9
0
1
10
11
100
101
110
111
1000
1001
1010
二、计算机中数据的单位
计算机的信息表示方式
盘 片
轴盘连接孔
写 保 护 孔
3.5英寸软盘示意图
软盘的技术指标有:
1.面数(side):软盘分为单面(第0面)和 双面(第0、1面)软盘。 2.磁道(track):以盘片中心为圆心的一组同心圆.数据存储 在软盘片的磁道内,磁道数一般为40或80,编号从0开始,即0—39 或0—79,编号从外到内。
ROM和RAM的区别:
1、一般ROM的存储容量小于RAM。
2、ROM中的信息出厂时就已经固化在芯片上,而RAM是 计算机运行是用来暂存程序和数据的。
3、ROM中的信息一般情况下不会发生变化,而RAM中的 程序和数据计算机掉电则信息丢失。
外部存储器:
软盘存储器 软盘一般有5寸盘(5.25“)和3寸盘 (3.5”),高密3寸盘的存储容量为 1.44M,高密5寸盘容量为1.2M,现 在一般采用3寸盘。是所有存储器读 写速度最慢的一类
1、CPU
CPU(Central Processing Unit)就是
系统的中央处理器,主要功能是执行程序指令、完成
各种运算和系统控制功能。它是一块超大规模集成电 路,它的内部包含着几十万、几百万或几千万个晶体 管。Intel公司的PC机微处理器有Intel 8088、80286、 80386、80486、Pentium、Pentium Pro、Pentium MMX、 Pentium II、Pentium III和Pentium 4等。与之兼容 的CPU主要还有AMD。
3、信息的量化 A、位(bit),简写b:是计算机中最小的信息单位,是二进制 中的一个数位,简称位。 一个二进制位表示两种状态,(0、 1),由此可知,N位二进制表示2N种状态; 比特流 B、字节(Byte),简写B:是表示存储空间大小的最基本单位, 也可理解为计算机中最基本的存储单位,常用8位二进制表示一 个字节,(1Byte=8bit),也可写为:1B=8b。
2计算机信息表示
41
计算机编码_数值
小数的表示
✓ 浮点数:小数点的位置不固定。由阶码和尾数组 成
✓ 阶码:指数部分,是一个整数 ✓ 尾数:数的有效数值,整数或纯小数两种形式
42
计算机编码_字符
字符编码
✓ 如何表示A、B、C等字母? ✓ 如何表示句号、逗号等? ✓ 如何表示回车、换行等?
9
1001
11
不同数制值之间的关系
12
二进制运算
算术运算规则: 0+0=0 0+1=1 0*0=0 0*1=0
1+0=1 1*0=0
1+1=10 1*1=1
110 + 011
1001
011 + 011
110
13
二进制运算
逻辑运算规则: 与 / :或 / : 非:
0
1
0
1
110001 011111
✓ 一个字节可有256个值 ✓ 可存放一个半角英文字符(ASCII码)。两
个或四个字节存放一个汉字编码
26
数据的计算机存储
位: b 字节:B
1B=8b
1KB = 1024 B=210B 1MB = 1024KB =220B 1GB = 1024MB =230B 1TB = 1024GB =240B
5
1 数制
数制(number system)
✓ 用一组固定的数字(数码符号)和一套 统一的规则来表示数值的方法。也叫计 数制
6
数制
几种常用进位计数制。
✓ 十位制(Decimal notation) D –十个手指 ✓ 24进制(一天);60进制(秒、分、时) ✓ 二进制(Binary notation) B ✓ 八进制(Octal notation) O ✓ 十六进制数(Hexadecimal notation) H ✓ 古巴比伦人-60进制 ✓ 玛雅人-20进制
计算机中的信息表示
64O: 64O
第3章 计算机中的信息表示 Nhomakorabea2. 二进制转化成八进制
原则:三位一组法。 原则:三位一组法。 整数部分: 进行分组。 整数部分:从右向左进行分组。 进行分组,不足3位补零。 小数部分: 小数部分:从左向右进行分组,不足3位补零。 110 101 111 . 010 10 0 B=657.24O =657.24O 6 5 7 2 4
无符号整数的表示
无符号整数指的是计数系统中只有大于等于 无符号整数指的是计数系统中只有大于等于0的 只有大于等于0 因此,不需要表示符号。 数,没有负数 ,因此,不需要表示符号。 例如:用8位二进制表示整数的范围: 二进制表示整数的范围 表示整数的范围: 例如: 0000 0000~1111 1111 0000~ 对应的十进制整数的范围: 对应的十进制整数的范围: 0 ~ 255
第3章 计算机中的信息表示
二、八、十六进制之间的转换
1. 八进制转换成二进制 八进制转换成二进制
原则: 一分为三法。 原则: 一分为三法。 位二进制码。 每 1 个八进制数对应 3 位二进制码。 27.461O 27.461O : 2 7. 4 6 1 010 111 100 110 001B 001B 6 110 4 100B 100B
后边补两个零
第3章 计算机中的信息表示
八进制与二进制的对应关系
八进制 0 1 2 3 011 4 100 5 101 6 110 7 111
二进制
000 001 010
第3章 计算机中的信息表示
十六进制与二进制的对应关系
十六进制 二进制 十六进制 二进制 0 0000 8 1000 1 0001 9 1001 2 0010 A 1010 3 0011 B 1011 4 0100 C 1100 5 0101 D 1101 6 0110 E 1110 7 0111 F 1111
计算机中的信息表示
(3) 补码定点加减法所需硬件配置
51
(4).补码加减运算控制流程
52
2.3.3 乘法运算
53
54
55
56
上述运算过程可归纳为: ①乘法运算可用移位和加法来实现,当两个四位数相乘,总 共需做四次加法和四次移位。 ②由乘数的末位值确定被乘数是否与原部分积相加,然后右 移一位,形成新的部分积;同时乘数也右移一位,由次低位作 新的末位,空出的最高位放部分积的最低位。 ③每次做加法时,被乘数仅仅与原部分积的高位相加,其低 位被移至乘数所空出的高位位置。 实现这种运算比较容易,用一个寄存器存放被乘数,一个寄 存器存放乘积的高位,另一个寄存器存放乘积的低位与乘数。 再配上加法器及其它相应电路,就可组成乘法器。又因加法只 在部分积的高位进行,故这种算法不仅节省硬件资源,而且缩 短运算时间。
40
2.3.2 加法与减法运算
41
42
43
44
45
(2)溢出判断
对于加法,只有正数加正数和负数加负数两种情况下才可能出 现溢出,符号不同的两个数相加是不会出现溢出的。 对于减法,只有在正数减负数或负数减正数两种情况下才可能 产生溢出,符号相同的两个数相减是不会出现溢出的。
由于减法运算在机器中是用加法器实现的,因此可得如下结论: 不论是作加法还是减法,只要实际参加运算的两个数(减法时 即为被减数和“求补”以后的减数)符号相同,结果又与原操 作数的符号不同,即为溢出。
106
107
2.8.1 奇偶校验码
108
109
2.8. 2 循环冗余校验码
循环冗余校验码(Cyclic Redundancy Check),简称CRC码,是一种具有很 强检错、纠错能力的校验码。循环冗余校验码常用于外存储器的数据校验, 在计算机通信中,也被广泛采用。
第5讲-信息在计算机中的表示
第5讲信息在计算机中的表示计算机中进行处理的信息也称为数据。
数据在计算机中均以二进制形式存放,并用它们的组合表示不同类型的信息。
本节介绍各种形式的数据在计算机中的存储。
一、进位计数制数制,即进位计数制,是指用统一的符号规则来表示数值的方法。
数制中的术语:1.基数(基):在采用进位计数的数字系统中,如果只用r个基本符号(例如0、1、2、……、r-1)表示数值,则称其为基r数制,r称为该数制的“基数”,在进位计数制中常用“基数”来区别不同的进制。
2.位权(权):任何一个进制的数都是由一串数码表示的,其中每一位数码所表示的实际大小与它所在的位置有关,由位置决定的值叫位权。
各数位的权都是基数的幂,即权=(基)i。
其中i为数码所在位的编号,从小数点向左依次为0、1、2、3、……;自小数点向右依次为-1、-2、-3、……。
3.按权展开式:某数位的数值等于该位的系数和权的乘积。
对任何一种进位计数制表示的数都可以写出按其权展开的多项式之和,任意一个r进制数N可表示为:N=an-1×rn-1+an-2×rn-2+…+a1×r1+a0×r0+a-1×r-1+…+a-m×r-m其中:ai是数码,r是基数,ri是权;不同的基数,表示是不同的进制数。
(一)十进制数十进制数的主要特点:1.基数是10。
有10个数码(数符)构成,即0、1、2、3、4、5、6、7、8、9。
2.进位规则是“逢十进一”。
当基数为M时,便是“逢M进一”。
3.各数位的权为10的幂。
4.任意一个十进制数,如527 可表示为(527 )10 、[527]10 或527D 。
有时表示十进制数后的下标10 或D 也可以省略。
5.一般地说,任意一个十进制N 可表达为以下形式:[N]10 =an-1×10n-1+an-2×10n-2+…+a1×101+a0×100+a-1×10-1+…+a-m ×10-m 例:1234.56=21123106105104103102101--⨯+⨯+⨯+⨯+⨯+⨯=1000+200+60+7+0.5+0.06(二)二进制数二进制数的特点:1.基数是2。
计算机中信息的表示
计算机中信息的表示
1信息或数据都是以二进制编码的方式存储在计算机中
2.存储单位从小到大: 位(bit)、字节( Byte) 千字节( KB) 兆宇节( MB)、吉字节(GB) 太字节(TB)
3、存储容量单位的换算:
1B =8bit 或1Byte=8bit ;1KB= 1024B ;1MB= 1024KB ;IGB= 1024MB ;1TB= 1024GB
注: 一个英文字母(不区分大小写)
占一个字节
一个阿拉伯数学
一个符号
占两个字节:一个汉字
1、文件名命名格式: 主文件名.
扩展名
注意: 文件夹的命名没有扩展名
2、文件夹名、主文件名可以是数字、字母、符号和汉字组成,但不能出现下列字符:
\ 、/、:、*、?、“、”、<、>、|。
英语字母不区分大小写,支持长文件名,最长可达255 个字
符。
3、同一磁盘下同一文件夹内,不能出现两个同类型同文件名的文件。
4、常见的文件类型:。
计算机组成原理第02章 计算机中的信息表示
2.1 数值型数据的表示方法
2.1.2 带符号数的表示 2. 补码表示法 ⑴ 补码定义 ·通式 [X]补=M+X (mod M) 数X对模M 的补 数称作其补码 X>0, 作为正常溢出量可以舍去。 若X>0,则模 M 作为正常溢出量可以舍去。 因而正数的补码就是其本身, 因而正数的补码就是其本身,形式上与原码 相同。 相同。
2.1 数值型数据的表示方法
2.1.3 数的定点表示与浮点表示 2. 浮点表示法 浮点数格式(原理性) ⑴ 浮点数格式(原理性) N =±RE×M 其中: 其中: N :真值 RE :比例因子 E :阶码 R :阶码的底 M :尾数 一般采取规格化的约定 一般采取规格化 规格化的约定
Ef Em
…
E2 E1 Mf M1 M2
2.1 数值型数据的表示方法
2.1.3 数的定点表示与浮点表示 ⑵ 带符号定点整数 设代码序列为: ……X 设代码序列为:XnXn-1……X1X0 ,Xn为符号位
原码 典型值 真值 最大正数 非零最小正数
2n-1 1
补码 真值
2n-1 1 -2n -1
代码序列
01…… ……11 …… 00…… ……01 ……
第2章 计算机中的信息表示
重点:定点、浮点数的表示; 重点:定点、浮点数的表示;操作码扩展技 术;指令系统的设计 难点:浮点数的IEEE754格式表示, 难点:浮点数的IEEE754格式表示,定点和 IEEE754格式表示 浮点数的表示范围,浮点数的规格化问题, 浮点数的表示范围,浮点数的规格化问题, 操作码扩展技术,指令系统的设计 操作码扩展技术,
2.1 数值型数据的表示方法
2.1.2 带符号数的表示 3. 反码表示法 若定点小数的反码序列为X ·若定点小数的反码序列为X0.X1X2……Xn,则 X X 1>X≥0 [X]反= 0>X≥2-2-n+X 0>X≥-1 若定点整数的反码序列为X ·若定点整数的反码序列为XnXn-1……X1X0,则 X X 2n>X≥0 [X]反= 0>X≥2n+1-1+X 0>X≥-2n
信息在计算机中的表示
文字
图像
声音
视频
数字信息的表示
•十进制数 用 “0,1,2,…,9”十个数码表示。 加法运算“逢十进一”,减法运算“借一当十”。 •二进制数 用“0”与“1”两个数字来表示。 加法运算“逢二进一”, 减法运算“借一当二”。
例:十进制的“2”可以被转化为二进制的“0010”, 十进制的“6”可以被转化为二进制的“0110” 。
“十进制”与“二进制”数值对照表
十进制 0 1 2 3 4 5
二进制 0000 0001 0010 0011 0100 0101
十进制 6 7 8 9 10 11
二进制 0110 0111 1000 1001 1010 1011
文字信息的表示
文本的表示:
----英文字符:ASCII (American Standard Code for Information Interchange) ----汉字字符: 输入码 :输入汉字时的编码; 内码:存储汉字时的编码; 字形码 :显示和打印汉字的码,通常字体有位图字体和矢量字体; 信息交换码:当计算机之间或与终端之间进行信息交换时,要求它们 之间传送的汉字代码信息完全一致,国家规定了信息交换用的标准汉字 交换码“GB312-80信息交换用汉字编码字符集(基本集)”,即国标码。国 标码共收集了7445个图形字符。 常用字符集:GB2312、GBK、BIG5、GB18030、UTF-8。
矢量图以几何图形居多,图形可以无限放大,不变色、不模糊。
矢量图与位图的对比
• 图像中的位图-黑白图像
当图像被数字化后,就被分解成了按行、列顺序排列的一个个的点, 我们把这些点称为“像素”。
我们可以把黑白图像的每一个像素从纯黑到纯白,划分成256个不同的 灰度等级,称为灰度值。
计算机中的信息表示
第五章计算机中的信息表示一.数制、基数、权数制↖数制也称进制计数制,是指用一组固定的符号和统一的规则来表示数值的方法↖不同进制数的表示( ) 角标表示:(1001 )2,(3728 )10加字母标示:⇧十位制(Decimal notation) D ,如3728D⇧二进制(Binary notation) B⇧八进制(Octal notation) O⇧十六进制数(Hexadecimal notation) H ,如20H↖十进制数举例数字:十个,(0 ,1 ,…,9 )进位:逢十进一(3728 )10 =3*103+7*102+2*101+8*100基数↖基数定义某进制计数制允许选用的基本数字符号的个数↖对于N 进制数基数为 N⇧十六进制数的基数为16⇧十六进制的基本数字符号:0 、1 、…、9 、A 、B 、C 、D 、E 、F 逢N进一权↖权的定义某数制中每位上的“1”所表示的数值称为该位“位权”(简称“权”),是一常数↖位权的大小以基数为底,数字符号所处的位置的序号为指数的整数次幂(3728)10 =3*103+7*102+2*101+8*100↖采用位权表示法N =a n-1m n-1 +……+ a2m2 + a1m1+a0m0 (m为基数)N10=a n-110n-1+……+a2102+a1101+a0100N2 = a n-12n-1 +……+ a222 +a121 +a020(1011 )2 =1*23+1*22+1*21+1*20二.二进制任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。
采用二进制的原因↖可行性↖简易性↖逻辑性↖可靠性二进制数的算术运算规则↖加法0+0=0,0+1=11+0=1,1+1=10(进位)↖减法0-0=0, 1-1=01-0=1, 0-1=1 (借位)↖乘法0*0=0,0*1=00*1=0,1*1=1↖除法0÷1=0,1÷1=1,0做除数无效二进制数的逻辑运算↖注意:运算按位进行,没有进位和借位↖逻辑加法 + (或∨运算)0+0=0 0+1=1 1+0=1 1+1=1 ↖逻辑乘法×(或∧运算)0×0=0 0×1=0 1×0=0 1×1=1↖逻辑非运算ˉ三.数制转换十进制数与非十进制数的转换↖十进制数→非十进制数↖非十进制数→十进制数非十进制数之间的转换↖二进制与八进制、十六进制之间的转换↖八进制与十六进制之间的转换十进制数与非十进制数的转换↖十进制数→非十进制数基本规则⇧整数转换的规则是“除基取余”⇧第一个余数是最低位十进制数→非十进制数例如:(19)10 →二进制数,结果为(10011)2↖非十进制数→十进制数基本规则⇧“按权展开”求和例如:(1101)2 →十进制数(1101 )2=1╳23+1 ╳22+0╳21+1 ╳20= (13 )10例如:(34)8 →十进制数(34 )8=3╳81+4 ╳80= (28 )10例如:(2A)16 →十进制数,结果为(42 )10非十进制数之间的转换↖二进制与八进制、十六进制之间的转换二进制→八进制、十六进制 ( 收缩法)八进制、十六进制→二进制八进制、十六进制→二进制 (扩展法)⇧例如:↖八进制与十六进制之间的转换通过二进制转换四.计算机中数的表示 计算机中数的表示范围↖与字长有关;↖字长越长,运算精度越高计算机中无符号数的表示8 位:0~255 (=28-1 )↖16 位:0~65535 (=216-1 )计算机中有符号数的表示↖计算机中有符号数字是以补码的形式存储的引入了补码概念后,通过对负数的简单处理,使减法运算转化成加法运算,简化了处理的复杂性五.西文信息在计算机中的表示编码↖将各类信息转换成¡° 0¡±和¡° 1¡±表示的代码,从而利用计算机进行处理,这一过程成为编码↖编码是要通过计算机的软件、硬件来实现的西文信息在计算机中的表示ASCII 码( 7位编码)↖ASCII 码( 美国标准信息交换码)规定了常用的数字、字母、符号的编码用7 位二进制表示一个字符,所以最多可以表示128 个字符;每个字符可以用一个字节表示,字节的最高位为0↖ASCII 码中的符号可以分成两类显示字符:指能从键盘输入、可以显示和打印的字符控制字符:主要用来控制输入、输出设备扩展ASCII 码( 8位编码)↖使用一个字节的全部8 位(bit) 来表示字符;最多可以表示256 个字符↖ABC<ACD己知大写字母E的ASCII码(16进制)是45, 大写字母O的ASCII码(16进制)是4F (=45+A)六.汉字信息在计算机中的表示汉字处理过程汉字信息在计算机中的表示汉字交换码↖汉字交换码是汉字信息处理系统之间或通信系统之间传输信息时,对每个汉字所规定的统一编码,交换码之设计须符合国际标准↖信息交换码统一的意义↖国标GB2312码其中包含了6763 个汉字,并分作两级⇧一级为常用字,含3755 个,按照拼音排序⇧二级,含3008 个,按照部首排序采用一个汉字两个字节的编码方案,每字节的最高位为0汉字输入码(外码)↖作用是为了通过键盘字符把汉字输入计算机而设计的一种编码↖汉字输入方案大致可分为以下4 种类型音码形码音形码数字码汉字机内码(内码,汉字存储码)↖作用将输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉字处理↖内码的表示方法可以不同如中国大陆(及新加坡)的GB2312、 GBK 、GB18030-2000 标准台湾的BIG-5ISO 10646 国际编码标准、 Unicode 编码GBK⇧与GB2312-80完全兼容,支持GB13000的CJK汉字和BIG5中的非汉字符号,收录21003个汉字GB18030-2000⇧国家最新发布的新的汉字编码标准,它是在GBK 的基础上做进一步扩充,收录27000 多个汉字Big5⇧台湾,420 个图形符号,13070 个汉字,繁体ISO 10646国际编码标准⇧国际标准化组织(ISO)制定的编码标准,该标准旨在囊括世界上所有文种的字符,到目前为止ISO 10646已编码汉字达七万字之多⇧C JK是此方案的大中国区的统一编码;特指其中的中、日、韩统一编码的汉字部分 Unicode 编码⇧编码用两个字节,但UTF-8 是变长的编码,不一定是2 字节⇧由IT 企业集团制定的工业标准⇧总体上,它的内容与ISO 10646 几乎等同↖中国大陆使用的汉字机内码即国标码每个字节最高位为1 →内部码因此,不与ASCII 码产生二义性,这是计算机区分汉字编码和西文编码的基础汉字地址码↖是指汉字库中存储汉字字形信息的逻辑地址↖与汉字内码间有着简单的对应关系汉字输出码(字形码)↖汉字字形码是表示汉字字形信息的编码,是一串二进制数↖字形码存储在汉字字库中,不同的字体对应不同的字库↖汉字字库点阵字库⇧“1”表示对应位置是黑点、“0”±表示是空白⇧常用的点阵有16 *16、24*24、32*32、48*48、64*64⇧16 * 16点阵字形的字要使用32个字节存储(16*16/8=32)⇧存储100个16x16点阵汉字字形所需的存储容量是[(16*16/8)*100]/1024=3.125KB矢量字库:精度高、任意缩放,如TrueType字形技术乱码↖造成乱码的原因是,其实内码对于字库来说,只是查找字形的索引;而不同系统的汉字内码和汉字字形码没有固定的一一对应关系,即:写入方的码本和读出方的码本不一致,同一个字符串就会呈现不同的字形,也就是乱码。
计算机内的信息表示
计算机内的信息表示计算机内的信息表示数据时信息的载体,是信息的具体表示形式。
数据⎩⎩⎩数值型数据:主要用来表示数量,可比较大小非数值型数据:人工处理过的。
常用数据:字符型数据(表示文字信息。
)、图象、声音、活动图象等。
信息表示是采用二进制计数。
(0或1)采用二进制的原因:因数载计算机中是由电子器件的物理状态来表示的,而物理状态中的高、低状态较稳定且易于实现。
数制:用一组固定的数字和一套统一的规则来表示数目的方法。
数制特点:①采用进位计数方式;②有固定的数码;③使用位权表示法;④使用基数。
位权法:同样的数所处位置不同其代表的值不同,这与该数位的权值有关。
各种数制中,数的权值恰好是基数的某次幂。
八进制:有8个数码0~7,八进制基数是8,逢八进一。
十六进制:有16个数码,分别是0~9以及A ~F ,A ~F 分别表示十进制的10~15。
十六进制基数是16,逢十六进一。
二进制的算术运算和逻辑运算。
(1)二进制算术运算(算术运算会发生进位和借位处理)⎩⎩⎩加法:0+0=0;0+1=1;1+0=1;1+1=10(向高位进一)减法:0-0=0;1-0=1;1-1=0;0-1=1(向高位借一) ⎩⎩⎩乘法:0×0=0;0×1=0;1×0=0;1×1=1除法:0÷0=0;0÷1=0;(1÷0无意义);1÷1=1 (2)二进制逻辑运算(逻辑运算是按位独立进行的,位与位之间不发生进位关系。
)⎩⎩⎩⎩⎩逻辑加(“或”运算):0+0=0 0+1=1 1+0=1 1+1=1(取大)逻辑乘(“与”运算):0×0=0 0×1=0 1×0=0 1×1=1(取小)逻辑非(“取反”运算):0取反是1 1取反是0(取反)0表示假; 1表示真。
不同数制之间相互转化: 原理:用位权法表示。
例1:十进制整数转化成二进制整数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 进位计数制1. 常见的进位计数制Bi nary 二进制 O ctonary 八进制 D ecimalism 十进制 H exadecimal 十六进制进位计数制:利用固定的数字符号和统一的规则来计数的方法。
有3个基本要素: 基数->指数制中可以使用的基本符号个数。
进位规则->R 进制数逢R 进1。
位权->不同位置上数字表示的单位数值 2. 常见的进位计数制的数的转换 1.二、八、十六进制转成十进制多项式展开直接求和 2.十进制转换成二进制整数部分:除基到零,反向写余小数部分:乘基到精,正向写整 3. 二进制转成八、十六进制小数点为界,向两边分组。
八进制3个一组,十六进制4个一组,不足添0。
各组二进制转成十进制再转成八(十六)进制即可。
2.计算机中的数据 1.二进制与计算机位(bit ):计算机中最基本的单位,一个二进制数字0/1。
字节(Byte ):8个位。
字:字节的集合。
字长:一个字中二进制的位数。
字长是计算机一次能同时进行运算的二进制位数。
现在一般为32bit 、64bit 。
一般来说,n 位的二进制数字能够表示种状态。
2. 模拟数据和数字数据模拟数据:一种连续表示法,模拟它表示的真实信息。
数字数据:一种离散表示法,把信息分割成了独立的元素。
阈值:大于阈值的电压看成高电压,小于阈值的电压看成低电压。
10.7725 10 2 5 0 2 2 1 2 1 0 2 0 1 1010.1100 0.7725x2=1.5450 0.5450x2=1.0900 0.0900x2=0.18000.1800x2=0.3600 001010.110000 12.60计算机不能处理模拟数据,要对模拟数据进行数字化。
3. 数据及其分类数值、文本、音频、视频、图像、图形。
4. 数值型数据的表示机器数:一个数在计算机中的表示形式。
机器数有位数限制,多余的位数将被截断,少的位数将被填充。
(机器数的)真值:带有正负号的数。
1. 数值型数据的分类根据是否带小数点分为实数和整数。
按照是否带有符号,整数分为带符号和无符号。
对于带符号的整数要对符号进行编码。
数值数据可以用原码和补码表示。
为了表示实数中的小数点的位置,可以表示为定点数或浮点数。
2. 整数的表示无符号整数表示:转成二进制数,对不足机器字长的在前面补0。
最小值全是0,最大值全是1。
带符号整数表示:0表示正,1表示负。
符号位占用一位二进制数位。
原码数值型数据 整数 实数 带符号整数 无符号整数 定点表示 浮点表示. .补码:正数同原码,负数补码除符号位外其他位取反,末尾位加1。
+、-0的补码一致。
3.实数的表示定点数的表示:定点数就是在运算过程中小数点的位置固定不变。
小数点位置不一定是明确指定的。
由于小数点位置固定,计算时可以直接进行加减运算。
浮点数的表示:任何一个数都可以用科学计数法来表示,这种表示方法称为浮点表示法。
浮点数的一般表示形式:IEEE 754规定单精度浮点数(32b)双精度浮点数(64b)。
对于二进制实数,现将其写成尾数是定点小数的科学计数法的形式。
再将其尾数扩充为23位,阶码扩充为8位,再把尾数转换成补码形式。
4.溢出计算机中n位有符号数的表示围(12~2-11---nn)。
超出围会产生溢出。
100010101111010111110110(0.1110100)x(-0.1110100)x5.文本表示一个文本是由一系列字符构成的。
要处理一个文本,必须表示和存储每个可能出现的字符。
码:字符在计算机中存储和处理时的编码。
1.文本类型1.简单文本:仅由一串字符代码组成,没有字体字号的变化和其他媒体。
文件扩展名为txt。
2.丰富格式文本:允许在文档中设置格式(字体、颜色、页边距、自选图形、公式等)的文本。
3.超文本(HTML文本):有声音、视频等多媒体信息,还有。
不管是哪种类型,核心问题是要表示字符本身,格式符号需要单独表示。
最早也是最常用的方法是列出所有字符,给每个字符编一个二进制位串。
要表示的符号数决定了需要多少二进制位数来表示。
西文字符——>ASCII码汉字字符——>GB 2312-1980全世界所有字符——>Unicode码2.文本码1.ASCII码美国标准信息互换标准代码。
最初,ASCII字符集中每个字符由7个二进制位表示,总共有128个不同字符。
用一个字节存储,第8位用作校验位。
ASCII码表中特殊的33个字符(0~31和127)是不可显示和打印的控制码。
比如CR(回车)。
2.Unicode编码表示世界上使用的所有语言的所有字符。
Unicode使用16位表示每个字符,能够表示162个字符。
Unicode字符集是ASCII字符集的超集。
Unicode 常用的两种编码方案如下:1)UTF-8单字节可变长编码:每个字符占1~4个字节。
有单、双、三、四字节。
2)UTF-16双字节可变长编码:每个字符占2或4个字节。
3.汉字编码汉字码是计算机部使用的用二进制表示的汉字编码。
i)区位码94x94个ASCII字符为基础构成二维平面,行为区,列为位。
每一个汉字/字符都对应唯一一个区(左)位(右)号。
每个汉字用2个字节表示。
ii)汉字码GB2312标准ASCII码用1每个字节最高位是1。
为了与ASCII码的可打印字符位置一致,在区号和位号上分别加上20H(32),称为国标码。
区位码转换成机码的方法是:将十进制的区码和位码转成十六进制的,将他们分别加上20H得到国际码。
再在高低字节上加上80H。
iv)汉字码 GB18030汉字编码标准国家发布过GB 18030-2000和GB 18030-2005,现已强制贯彻执行。
4.文本输入1.键盘输入2.联机手写输入3.语音输入4.印刷体识别5.文本输出1.字符点阵描述每个字符按照图形符号设计成点阵图,用一位二进制对应屏幕上的一个点,亮为1暗为0,就得到相应的点阵代码(字形码)。
2.字符轮廓描述以字符轮廓的转折点为特征来描述字符,又称矢量字体。
用一组直线和曲线命令以及一些参数来描述字体的轮廓。
3.字库把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中,称为字形库。
C:\windows\fonts4.文本压缩数据压缩:又称数据编码。
是为了在存储和传输数据时减小数据所占空间大小的方法。
分为有损/无损。
压缩率:原始数据大小/压缩后大小。
1.关键字编码:用单个字符代替常用单词。
2.行程长度编码:又称迭代编码。
将重复的字符序列替换为标志字符。
后面加重复字符和说明重复次数的数字。
Ex:*A7 就是AAAAAAA。
3.赫夫曼编码用不同长度的二进制位串表示不同字符。
把较少的位串表示经常出现的字符,而较长的位串表示不常出现的字符。
郝夫曼编码的重要特征:用于表示一个字符的位串是表示另一个字符的位串的前缀。
从左到右扫描一个位串事,每当发现一个位串对应一个字符时,他就一定表示这个字符,他不可能是更长的位串的前缀。
5.图像和图形的表示1.颜色表示三基色原理:人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。
计算机中颜色表示:用RGB指表示。
RGB是3个数(0~255),表示每种颜色占的比例。
对颜色编码:把一种颜色分解为RGB值的过程。
颜色深度:用于表示颜色的数据量。
通常用表示颜色的位数来表示。
现在用24位的真彩色表示(3x8),即RGB值中的每个数字由8位表示,围是0~255。
能表示1670万种颜色。
2.图像数字化数字化图像:将图像按照行和列的方式均匀地划分为若干个小格子(像素)。
分辨率:水平像素点x垂直像素点。
图像:像素点的集合。
存储一幅图像就是要存储图像上每个像素点的信息。
图像的编码:每个像素呈现一种颜色(灰度层次),对每个像素进行RGB编码,再把所有行列的像素编码连接起来。
图像的获取:是模拟信号数字化的过程。
扫描、分色、取样、量化、编码。
3.数字图像的表示根据图像中每个像素点的信息位数,可将图像分为彩色图像、灰度图像和黑白图像。
1.彩色图像:由RGB 3个彩色分量组成,需要用3个矩阵分别表示每个彩色分量的亮度值。
2.灰度图像:每个像素只有1个灰度分量。
通常8位表示,代表256个灰度。
1010110001111011B O A R D人眼能识别的灰度大概是100个。
3.黑白图像:每个像素只有1个黑色分量。
只用一个二进制位表示。
取值只有0(黑)1(白)。
二值化:把图像转换成黑白图像的操作。
二值化选定一个阈值,高于它为黑,反之为白。
4.图像的存储和压缩图像数字化后的大小 = 水平分辨率x垂直分辨率x颜色深度/81024 x 1024 x 24 / 8 = 3.75MB图像压缩:提高在网络上传输的速度。
流行的图像压缩都遵循静态图像压缩国际标准JPEG。
流行的逐个像素存储图像方法有位图(BMP)、GIF、PNG、JPEG、TIFF、PSD,他们都采用了不同方式的压缩方式。
5.图形的表示图形:由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。
分为平面图形和三维图形。
矢量图形:计算机图形一般用矢量图形格式来描述。
它不适用于描述真实世界的图像,是用于艺术线条和卡通绘画。
图像效果差,但是放大不失真。
常见格式:3DS\DXF\WMF\FLASH\SVG。
6.音频信息表示1.声音数字化采样:周期性测量模拟信号的电压,记录合适的数值。
将模拟信号数字化。
量化:把采样的结果用有限个数字表示出来。
量化精度:量化的二进制数值的位数。
每秒声音的数据量可以用声音的码率来表示(每秒二进制位b/s)声音码率=采样频率x量化精度x声道数声音数据量=声音的码率x时间/8编码:声音经过量化后数据量比较大,需要进行数据压缩,以减小数据量。
失真:采样频率低于每秒40000次,不足以复原原始声音,人耳听到就会失真。
2.音频格式WAV、AU、AIFF、VQF、MP3、MID。
视频表示视频是一系列压缩的静态图像组成的,每一幅镜头图像成为帧。
常用的两种压缩方式:时间压缩和空间压缩。
常见格式:rm、rmvb、wmv、asf、mpeg、dat、avi。