第二章 汉字信息在计算机内部的表示
计算机练习题
第一章计算机与信息处理一、单项选择题:1. 计算机应用的领域主要有:科学计算,过程控制,辅助设计以及。
A. 数据处理B. 图形处理C. 工厂自动化D. 文字处理2. 通常所说计算机的第一代、第二代、第三代和第四代是以为依据进行划分的。
A. 计算机的处理速度B. 计算机的主要元器件C. 计算机的应用领域D. 计算机的系统软件3. 世界上第一台电子数字计算机是20世纪年代研制成功的。
A. 50B. 60C. 40D. 304. 新一代计算机系统的本质是。
A. 具有更多更高的智能B. 具有逻辑判断能力C. 具有媒体功能D. 采用超大规模集成电路5. 人们习惯于将计算机的发展划分为四代。
划分的主要依据是。
A.计算机的运行速度B.计算机主机所使用的主要元器件C.计算机的应用领域D.计算机的规模6. 微型计算机的问世,主要是由于的出现。
A.晶体管B.集成电路C.大、超大规模集成电路D.电子管7. 银行利用计算机进行存贷款业务管理属于计算机的应用领域。
A.数据处理B.实时控制C.科学计算D.辅助设计8. 是指通过计算机网络等电子手段来完成商业贸易活动。
A.远程登录B.信息检索C.电子商务D.信息通信9. 计算机用于水电站厂房的设计属于计算机在领域的应用。
A.辅助设计B.人工智能C.数值计算D.自动控制10. 在计算机发展过程中,第三代计算机主机所使用的主要元器件为。
A.中小规模集成电路B.超大规模集成电路C.晶体管D.大规模集成电路11. 目前计算机广泛应用于财务管理、数据统计、办公自动化等,这些应用可统称为。
A.科学计算B.实时控制C.数据处理D.辅助设计12.CAI是计算机应用的一个重要领域,它的含义是。
A. 计算机辅助测试B. 计算机辅助设计C. 计算机辅助教学D. 计算机辅助管理二、多项选择题:1. 计算机发展的方向是巨型化,微型化,网络化,智能化,其中巨型化指。
A 重量重B 存储容量大C 体积大D 运算速度快第二章信息在计算机内的表示一、单项选择题:1. 在信息处理领域,下面关于数据的叙述中,不正确的是。
计算机基础第二部分汉字输入
2、汉字的四种结构
单:字根本身成为一个汉字,如“王” 散:汉字由几个字根组成,且字根间有一定的距
离,或字根相互接触。如“计、午” 连:不要理解为字根间相互接触。而是特指二种 情况 ①单笔画与字根相互连接,如“千、产” ②带点结构,如“太、术” 交:字根相互交叉,如“里、专”
3、末笔交叉识别码
中英文切换按钮 全角/半角切换按钮 软键盘按钮
输入法显示及切换按钮
中英文标点切换按钮
按Shift+Space键可以快速切换
单击(左键)
单击右键
2. 外码窗和侯选窗
在键入某个汉字的编码后,会出现外码窗和侯选窗。外码 窗显示输入的汉字编码,候选窗显示与之对应的所有汉字。
候选窗
外码窗
为选定所需的汉字或词组,可以: ◎输入这个字或词组前面的数字。 ◎按+或 – 键,或者单击 或 按钮,还可以按 [PageUp]或[PageDown]键进行前后翻页查找。
完
编码规则图
(2) 成字字根的编码 在一个字根键上,不是键名字的那些既是字根又是汉字 的键内字称为成字字根。 编码方法: 第一码是成字字根所在的键位代码; 第二码是成字字根笔画中第一个笔画所在的键位代码; 第三码是成字字根笔画中第二个笔画所在的键位代码; 第四码是成字字根笔画中最末一个笔画所在的键位代码。 如果某字根只有两个笔画,则加空格键结束。
月文凵 刀二阝 文凵冂厶 木古 二小 三丨 士丿一乙 二人 EYB VFB YBMC SD FI DH FTGN FW
能连不交的拆字
天 下 自 太 产 于
一大 一卜 丿目 大丶 立丿 GD GH TH DY UT
一十
GF
折字综合练习
高 汉 速 姓 名 标 等 简 乙
(知识点10)信息在计算机内部的表示与存储
534 3位二进制可以表示______。
A 8种状态B 2种状态C 9种状态D 4种状态A 10535 ASCII码是“美国信息交换标准码”的简称,若已知大写英文字母A的ASCII编码为41H,则大写英文字母D的机内表示为______。
A 0100 0010B 0100 0011C 0100 0101D 0100 0100D 10536 按16×16的点阵存放国标GB2312-80中的一级汉字(共3755个)的汉字库,大约需要占用______的存储空间。
A 512KB B 1MBC 256KBD 128KBD 10537 把十进制数121转化为二进制数为______。
A 10 0111B 100 1111C 111 1001D 11 1001C 10538 把十进制数513转换成八进制数是______。
A 1001B 1110C 1021D 1003A 10539 把十进制数513转换成二进制数是______。
A 10 0000 0001B 11 0001 0001C 11 0000 0011D 1 1000 0001A 10540 把十进制数513转换成十六进制数是______。
A 201B 1F1C 311D 3B1A 10541 二进制数0101 1011转化为十进制数为______。
A 91B 171C 71D 103A 10542 二进制数01100100转换成十六进制数是______。
A 144B 63C 64D 100C 10543 给出一个十进制整数D,它对应的二进制整数为B,那么就这两个数的位数而言,B与D 相比,______。
A B的数字位数一定不小于D的数字位数B B的数字位数一定大于D的数字位数C B的数字位数一定小于D的数字位数D B的数字位数一定不大于D的数字位数A 10544 汉字信息在计算机中通常是以______形式存储的。
A 首尾码B 区位码C 机内码D 国际码C 10545 将二进制数0110 0100转换为十六进制数为______。
第二章 计算机中信息的表示习题及答案
第二章一、选择题1.下列数中,最小的数是 A 。
8A.(101001)2B.(52) C.(2B)16D.452.下列数中,最大的数是 D 。
A.(101001)2B.(52)8C.(2B)16 D.453.计算机中表示地址时使用__ _D___A.原码B.补码C.反码D.无符号数4.字长16位,用定点补码小数表示时,一个字能表示的范围是__D___ 1-2-15A.-1~()B.0~(1-2-15)1-2-15C.-1~+1 D.-()~(1-2-15)5.若X补=10000000,则十进制真值为___ C___。
A、-0B、-127C、-128D、-16.定点整数16位,含1位符号位,原码表示,则最大正数为___C ___A、216B、215C、215-1D、216-17.当-1<x<0时,[x]原=___B___A.xB.1-xC.4+xD.(2-2n)-1*18.8位反码表示数的最小值为_______,最大值__ A___。
A.-127,+127B.-128,+128C.-256,+256D.-255,+2559.N+1位二进制正整数的取值范围是____D ___A.0~2n-1 B.1~2n-1C.0~2n+1-1 D.1-2n+1-110.浮点数的表示范围和精度取决于___ A____A.阶码的位数和尾数的位数B.阶码的位数和尾数采用的编码C.阶码采用的编码和尾数采用的编码D.阶码采用的编码和尾数的位数11.在浮点数编码表示中,___ C___在机器数中不出现,是隐含的。
A.尾数B.符号C.基数D.阶码12.移码和补码比较,只有____ C___不同,其他都相同。
A.正号 B.负号C.符号 D.标志13.一个24×24点阵的汉字,需要___ _B____字节的存储空间。
A.62 B.72C.64 D.3214.62个汉字的机内码需要 CA.62字节 B.32字节C.124字节 D.248字节15.ASCII码是对____ A____进行编码的一种方案A.字符、图形符号 B.汉字C.数字 D.声音16.D/A转换是___ C___A.把计算机输出的模拟量转化为数字量B.把模拟量转化为数字量,把数字量输入到计算机C.把数字量转化为模拟量,把转化结果输出计算机D.把计算机输出的模拟量转为数字量17.在大量数据传送中常用且有效的检验法是__ D___A.奇偶校验法 B.海明码校验C.判别校验 D.CRC校验二、填空题1.二进制中的基数为 2,十进制中的基数为 10 ,八进制中的基数为8 ,十六进制中的基数为 16 。
2计算机信息表示
41
计算机编码_数值
小数的表示
✓ 浮点数:小数点的位置不固定。由阶码和尾数组 成
✓ 阶码:指数部分,是一个整数 ✓ 尾数:数的有效数值,整数或纯小数两种形式
42
计算机编码_字符
字符编码
✓ 如何表示A、B、C等字母? ✓ 如何表示句号、逗号等? ✓ 如何表示回车、换行等?
9
1001
11
不同数制值之间的关系
12
二进制运算
算术运算规则: 0+0=0 0+1=1 0*0=0 0*1=0
1+0=1 1*0=0
1+1=10 1*1=1
110 + 011
1001
011 + 011
110
13
二进制运算
逻辑运算规则: 与 / :或 / : 非:
0
1
0
1
110001 011111
✓ 一个字节可有256个值 ✓ 可存放一个半角英文字符(ASCII码)。两
个或四个字节存放一个汉字编码
26
数据的计算机存储
位: b 字节:B
1B=8b
1KB = 1024 B=210B 1MB = 1024KB =220B 1GB = 1024MB =230B 1TB = 1024GB =240B
5
1 数制
数制(number system)
✓ 用一组固定的数字(数码符号)和一套 统一的规则来表示数值的方法。也叫计 数制
6
数制
几种常用进位计数制。
✓ 十位制(Decimal notation) D –十个手指 ✓ 24进制(一天);60进制(秒、分、时) ✓ 二进制(Binary notation) B ✓ 八进制(Octal notation) O ✓ 十六进制数(Hexadecimal notation) H ✓ 古巴比伦人-60进制 ✓ 玛雅人-20进制
第二章.信息数据与计算机表示
1
二进制数高位
13
2.1 进位计数制 例1:(13)10 = ( 1101 )2
21
3
2
6
2
3
21 0
余数 二进制数低位
1
0
1
1
二进制数高位
14
例2:(0.6875)10 = (
0. 6 8 7 5
×
2
1. 3 7 5 0
×
2
0. 7 5 0
×
2
1. 5制
)2
整数 1
二进制数高位
0
1 二进制数低位
1
15
2.1 进位计数制
例2: (0.6875)10 = (0.1011 )2
0. 6 8 7 5
×
2
整数
1. 3 7 5 0
1
×
2
0. 7 5 0
0
×
2
1. 5 0
1
×2
1. 0
1
二进制数高位 二进制数低位
16
2.1 进位计数制 例3:(13.6875)10 =(13)10+(0.6875)10
30
2.2 字符信息的表示方法
① 数的长度
在计算机中,数的长度按比特(bit)来计算。但因 存储容量常以“字节”为计量单位,所以数据长度也常 以字节为单位计算。
机器数的位数是固定的。所能表示的范围受到字长 和数据类型的限制。
② 数的符号
一般用数的最高位(左边第一位)来表示数的正负号, 并约定以“0”表示正,以“1”表示负。
9
2.1 进位计数制 (4)十六进制数制
主要特点: ① 有16个不同的计数符号:0、1、2、3、4、5、 6、7、8、9、A(10)、B(11)、C(12)、D(13)、 E(14)、F(15),其基数为16位; ② 按“逢十六进一”的规则计数。 ③ 转换为十进制数。
计算机考试相关题目汇总
计算机基础考试题型:单选题(50分)、填空题(10分)、操作题(40分)。
考试注意事项:附加题也要做第一章计算机基础知识1.计算机的发展世界上第一台电子计算机的发展已经历了4代,4代计算机的主要元器件分别是冯·诺依曼体系结构主要的设计思想:用于科学计算的计算机其特点是2.数制转换(二、八、十六进制的整数,小数)在计算机内部,数据加工、处理和传送的形式是。
机器指令以形式存放在计算机内部在计算机中,负数是按进行存储和参与运算的。
计算机中,一个浮点数由。
⏹二进制、八进制、十六进制的相互转换八个二进制位表示的无符号十进制数的范围0~255,有符号的十进制数的范围-127~127例. (123.75)10=( 1111011。
11 )2=( 173。
6 )8=( 7B。
C )16下列四个不同数制表示的数中,数值最大的是( )。
D(A)二进制数11111111 (B)十进制数219(C)八进制数334 (D)十六进制数DA逻辑或运算10101010 OR 01001010,其结果是111010103.信息在计算机内的表示⏹西文字符编码(ASCII)7位编码,128个字符;在机器内部,一个字符的ASCII码采用一个字节存储,最高位为0;例.字符A的ASCII码为65,则字符D的ASCII码为(68)二进制为()例:字符中,ASCII码值最大的是()。
D(A)字符9 (B)字符 A (C)空格(D)字符m⏹汉字编码(国标码GB2312-80、机内码、字形码)汉字的处理流程:汉字的输入、汉字的存储、汉字的输出。
输入码国标码机内码输出码国标码作为汉字交换码用2个字节表示汉字的机内码是将汉字国标码的每个字节的最高位置为1转换而来的。
点阵字形编码存储容量的计算公式(以16×16点阵为例):16×16/8=256/8=32 B用32×32点阵的汉字字形表示100个汉字,需要的存储空间是(12800 )B图1.4 汉字信息处理的流程图⒋描述存储容量的单位1B=8bit 1KB=1024B=210B 1MB=1024KB=210KB 1GB=1024MB=210MB第二章硬件基础⒈计算机的基本工作原理计算机系统是指硬件系统和软件系统,硬件只能通过软件起作用。
第2章 数码系统--数据在计算机内部的表示形式
进位记数法与进制转换
• 进位记数法 • 任何一个数都可以写成以下算式: N=∑Di*ri (i=-k,-k+1,…..,m-1)
–N 代表一个数值 –r 是这个数制的基(Radix)。r=2,8,10,16,…… –i表示这些符号排列的位号 –Di是位号为i的位上的一个符号 –ri是位号为i的位上的一个 1 代表的值 –Di*ri是第i位的所代表的实际值 –∑表示m+k位的值求累加和
• 高电压—1,低电压----0。
二进制无符号数据算术运算规则
(1) 加法运算规则 0+0=0 0+1=1 1+0=1 1+1=0 并产生进位 (2) 减法运算规则 0-0=0 0-1=1 并产生借位 1-0=1 1-1=0
例如:
0101 +) 0001 0110
例如:
1011 -) 0101 0110
计算机中常用的数制
常用数制 基数r
2 二进制 8 八进制 十六进制 16 十进制 10
基本符号
0,1 0,1,2,3,4,5,6,7 0,1,2,3,4,5,6,7,8,9, A,B,C,D,E,F 0,1,2,3,4,5,6,7,8,9
第i位的权值
2i 8i 16i 10i
十--八--十六进制数据的二进制编码
• 可以用点阵表示任何图形,但需要较多的 空间。 • 对于规则图形,可以存储有关的特征和规 则即可。
– 直线,可以存储起点、终点和线条的类型即可。
2.1.3 数据格式的相互转换
• 通过键盘向计算机输入的数字肯定是用 ASCII码形式表示的十进制数,必须通过软 件将其转换成二进制数。反之,计算机的 运行结果输出时,常常需要通过软件转换 成十进制数。
计算机组成原理第02章 计算机中的信息表示
2.1 数值型数据的表示方法
2.1.2 带符号数的表示 2. 补码表示法 ⑴ 补码定义 ·通式 [X]补=M+X (mod M) 数X对模M 的补 数称作其补码 X>0, 作为正常溢出量可以舍去。 若X>0,则模 M 作为正常溢出量可以舍去。 因而正数的补码就是其本身, 因而正数的补码就是其本身,形式上与原码 相同。 相同。
2.1 数值型数据的表示方法
2.1.3 数的定点表示与浮点表示 2. 浮点表示法 浮点数格式(原理性) ⑴ 浮点数格式(原理性) N =±RE×M 其中: 其中: N :真值 RE :比例因子 E :阶码 R :阶码的底 M :尾数 一般采取规格化的约定 一般采取规格化 规格化的约定
Ef Em
…
E2 E1 Mf M1 M2
2.1 数值型数据的表示方法
2.1.3 数的定点表示与浮点表示 ⑵ 带符号定点整数 设代码序列为: ……X 设代码序列为:XnXn-1……X1X0 ,Xn为符号位
原码 典型值 真值 最大正数 非零最小正数
2n-1 1
补码 真值
2n-1 1 -2n -1
代码序列
01…… ……11 …… 00…… ……01 ……
第2章 计算机中的信息表示
重点:定点、浮点数的表示; 重点:定点、浮点数的表示;操作码扩展技 术;指令系统的设计 难点:浮点数的IEEE754格式表示, 难点:浮点数的IEEE754格式表示,定点和 IEEE754格式表示 浮点数的表示范围,浮点数的规格化问题, 浮点数的表示范围,浮点数的规格化问题, 操作码扩展技术,指令系统的设计 操作码扩展技术,
2.1 数值型数据的表示方法
2.1.2 带符号数的表示 3. 反码表示法 若定点小数的反码序列为X ·若定点小数的反码序列为X0.X1X2……Xn,则 X X 1>X≥0 [X]反= 0>X≥2-2-n+X 0>X≥-1 若定点整数的反码序列为X ·若定点整数的反码序列为XnXn-1……X1X0,则 X X 2n>X≥0 [X]反= 0>X≥2n+1-1+X 0>X≥-2n
第二章 汉字信息在计算机内部的表示
0
1
2
3
4
5
6
7
ASCII码字符标准中用7 ASCII码字符标准中用7位 码字符标准中用 二进制数定义了128个字符, 128个字符 二进制数定义了128个字符, 其中94个为图形字符, 94个为图形字符 其中94个为图形字符,32 个为控制字符, 个为控制字符,1个为空格 字符和一个Del Del键 字符和一个Del键。 ASCII的编码空间如图所示, ASCII的编码空间如图所示, 的编码空间如图所示 图中把7位二进制数分为高 图中把7位二进制数分为高 位作为列号, 3位作为列号,低4位作为 行号,并用十六进制表示, 行号,并用十六进制表示, 从而组成了一个ASCII编码 从而组成了一个ASCII编码 ASCII 空间。 空间。
7.代码页 代码页 不同国家的人使用着不同语言的操作系统。然而, 不同国家的人使用着不同语言的操作系统。然而,操 作系统厂商若要根据各个国家和地区使用不同语言文字的 人开发不同的操作系统,在成本、 人开发不同的操作系统,在成本、系统维护与升级等方面 的开销太大。为此,微软公司在开发MS DOS和 MS的开销太大。为此,微软公司在开发MS-DOS和Windows3.1 的各种产品时, 的各种产品时,进一步将依赖于各具体平台的各文种的字 符集加以整理,并对各个具体的代码页都赋予一个代号, 符集加以整理,并对各个具体的代码页都赋予一个代号, 称作“代码页ID ID”。 称作“代码页ID 。
0 0 1 2 3 4 5 6 7 8 9 A B C D E F
1
2
3
4
5
6
7
8
9
A
B
C
D
E
Fቤተ መጻሕፍቲ ባይዱ
C0控制 字符区
信息在计算机中的表示
文字
图像
声音
视频
数字信息的表示
•十进制数 用 “0,1,2,…,9”十个数码表示。 加法运算“逢十进一”,减法运算“借一当十”。 •二进制数 用“0”与“1”两个数字来表示。 加法运算“逢二进一”, 减法运算“借一当二”。
例:十进制的“2”可以被转化为二进制的“0010”, 十进制的“6”可以被转化为二进制的“0110” 。
“十进制”与“二进制”数值对照表
十进制 0 1 2 3 4 5
二进制 0000 0001 0010 0011 0100 0101
十进制 6 7 8 9 10 11
二进制 0110 0111 1000 1001 1010 1011
文字信息的表示
文本的表示:
----英文字符:ASCII (American Standard Code for Information Interchange) ----汉字字符: 输入码 :输入汉字时的编码; 内码:存储汉字时的编码; 字形码 :显示和打印汉字的码,通常字体有位图字体和矢量字体; 信息交换码:当计算机之间或与终端之间进行信息交换时,要求它们 之间传送的汉字代码信息完全一致,国家规定了信息交换用的标准汉字 交换码“GB312-80信息交换用汉字编码字符集(基本集)”,即国标码。国 标码共收集了7445个图形字符。 常用字符集:GB2312、GBK、BIG5、GB18030、UTF-8。
矢量图以几何图形居多,图形可以无限放大,不变色、不模糊。
矢量图与位图的对比
• 图像中的位图-黑白图像
当图像被数字化后,就被分解成了按行、列顺序排列的一个个的点, 我们把这些点称为“像素”。
我们可以把黑白图像的每一个像素从纯黑到纯白,划分成256个不同的 灰度等级,称为灰度值。
计算机原理 计算机中数据的表示方法
第二章计算机中数据的表示方法第一节计算机中数据的分类和表示方法计算机内部传送的信息分为两大类:控制信息和数据信息。
数据信息又分为两种,数值型数据和非数值型数据。
注意:任何数据在计算机中都是用二进制表示的。
一、数据的单位1.位(bit):是计算机中最小的数据单位,常用小写字母b来表示。
2.字节(Byte):用大字母B来表示,1B=8b表示文件的长度,衡量存储器的容量,存储器编址用字节做单位。
磁盘的存储单位是:簇磁盘存放信息的最小编址单位是:扇区信息编码的的最小单位是:码元3.字(word):由若干字节组成,是字节的整数倍。
在计算机内部进行数据传送,或CPU进行数据处理时,用它作基本单位。
字的长度即字长,并不是所有的计算机字长都一样,常见的字长有16位,32位,64位。
字长是CPU一次能够处理二进制的位数。
字长越长,计算机速度越快,精度越高。
4.常用的存储单位之间的换算1TB=1024GB 1GB=1024MB 1MB=1024KB 1KB=1024B 210 1B=8b二、数据的分类1.按数据处理方式分类数值型和非数值型非数值型又分为:字符数据和逻辑数据2.按数据传输形式分类数字数据和模拟数据数字数据:离散型的;模拟数据:连续的值模拟数据被数字化后存入计算机,采用模数转化将模拟数据数字化后存入计算机。
三、数据的表示方法1.数值型数据的表示(1)按小数点的处理可分为定点数和浮点数。
(2)按符号位有原码、补码,反码三种形式的机器数2.非数值型数据的表示第二节各种数制及其转换方法一、数制的组成数制是指计数的方法,任何一种数制都有两个要素:基数和权。
例如二进制数1001.01,它的基数是2,最左边1的权是23,最右边的1的权是2-2。
234二、常用字的数制二进制(B),八进制(Q),十进制(D),十六进制(H)三、不同进制之间的转换1.十进制转换成非十进制分成整数部分和小数部分:整数部分:除基数倒取余小数部分:乘基数取整注意:十进制数转换在二进制数的方法是除2倒取余。
汉字信息在计算机中的处理 汉字 计算机 汉字信息
汉字信息在计算机中的处理随着计算机技术的发展,计算机具有了中文信息处理的能力,那么汉字信息在计算机中是如何被存储、输入输出和显示的呢?一、汉字信息在计算机中的处理与存储计算机对每一个字符进行编码形成其对应的唯一一个内码就是汉字的存储,然而同一个字符(例如“中”字)不同编码对应的内码不一样。
计算机中汉字编码一般采用两个高位(左边第一位)为1 的ASCⅡ码表示一个汉字,即用两个字节表示一个汉字。
汉字在计算机内的编码很复杂,涉及汉字的各种代码,如汉字输入码,汉字机内码,汉字交换码,汉字字形码等。
1、汉字输入码汉字输入码也叫外码,是为了通过键盘字符把汉字输入计算机而设计的一种编码。
汉字的输入码种类繁多,大致有4种类型,即音码、形码、数字码和音形码。
2、汉字机内码汉字机内码又称内码或汉字存储码。
该编码的作用是统一了各种不同的汉字输入码在计算机内的表示。
汉字机内码是计算机内部存储、处理的代码。
3、汉字交换码:汉字交换码主要是用作汉字信息交换的。
4、汉字字形码汉字字形码是指确定一个汉字字形点阵的代码(汉字字形码)。
一般采用点阵字形表示字符。
目前普遍使用的汉字字型码是用点阵方式表示的,称为“点阵字模码”。
所谓“点阵字模码”,就是将汉字像图像一样置于网状方格上,每格是存储器中的一个位,16×16点阵是在纵向16点、横向16点的网状方格上写一个汉字,有笔画的格对应1,无笔画的格对应0。
这种用点阵形式存储的汉字字型信息的集合称为汉字字模库,简称汉字字库。
通常汉字显示使用16×16点阵,而汉字打印可选用24×24点阵、32×32点阵、64×64点阵等。
汉字字形点阵中的每个点对应一个二进制位,1字节又等于8个二进制位,所以16×16点阵字形的字要使用32个字节(16×16÷8字节=32字节)存储,64×64点阵的字形要使用512个字节。
计算机原理随堂练习(第二章)
第2章数据在计算机中的表示[考纲要求:]1.了解计算机中数据的分类和表示方法2.掌握ASCII编码用汉字编码3.掌握各种数制用其转换方法第一节计算机中数据的分类和表示方法[预复习知识:]计算机的基本功能是对数据进行运算和加工处理。
任何数据在计算机中都是以_________代码表示的。
一、数据的单位1、位(bit):它是计算机中_____的数据单位,可用小写字母____来表示。
2、字节(Byte):可用大写字母____来表示。
用_____个二进制位来表示1个字节。
3、字(word):由若干个字节组成,即它通常是字节的________倍。
在计算机内部进行数据传送时,或CPU进行数据处理时,用它作基本单位。
字的长度称______。
1、按数据处理方式分类分为数值型如:______________和非数值型如_________________________2、按数据的传输形式分:分为_________数据和________数据。
三、数据的表示方法2、非数值型数据的表示:非数值型数据主要有_________________、_______________。
3、常见的非数值型数据编码及特点:BCD码特点:保留十进进制的权,数字用0、1组合表示ASCII码特点:国际标准信息交换码,用7位二进制代码的编码来代表符号。
汉字编码:○1汉字输入码特点:也称外码,将汉字输入计算机用的,有五笔字型、拼音、智能ABC、区位码(无重码)。
○2国标码特点:也称交换码,用在不同汉字系统间交换交换信息用的○3机内码特点:也称内码,用于计算机内部存储、处理汉字。
○4字形码特点:汉字的输出码,是用来将计算机内的汉字显示在屏幕上或通过打印机打印出来用的。
区位码、国标码、内码之间转换关系:区位码高(低)字节+_________=国标码高(低)字节;国标码高(低)字节+_________=内码高(低)字节GB2312-80(1981年公布的国家标准信息交换用汉字编码基本字符集),汉字及各种符号7445个,一级汉字3755个,按拼音字母序排列,二级汉字3008个,按部首排列,图形符号682个。
计算机内的信息表示
计算机内的信息表示计算机内的信息表示数据时信息的载体,是信息的具体表示形式。
数据⎩⎩⎩数值型数据:主要用来表示数量,可比较大小非数值型数据:人工处理过的。
常用数据:字符型数据(表示文字信息。
)、图象、声音、活动图象等。
信息表示是采用二进制计数。
(0或1)采用二进制的原因:因数载计算机中是由电子器件的物理状态来表示的,而物理状态中的高、低状态较稳定且易于实现。
数制:用一组固定的数字和一套统一的规则来表示数目的方法。
数制特点:①采用进位计数方式;②有固定的数码;③使用位权表示法;④使用基数。
位权法:同样的数所处位置不同其代表的值不同,这与该数位的权值有关。
各种数制中,数的权值恰好是基数的某次幂。
八进制:有8个数码0~7,八进制基数是8,逢八进一。
十六进制:有16个数码,分别是0~9以及A ~F ,A ~F 分别表示十进制的10~15。
十六进制基数是16,逢十六进一。
二进制的算术运算和逻辑运算。
(1)二进制算术运算(算术运算会发生进位和借位处理)⎩⎩⎩加法:0+0=0;0+1=1;1+0=1;1+1=10(向高位进一)减法:0-0=0;1-0=1;1-1=0;0-1=1(向高位借一) ⎩⎩⎩乘法:0×0=0;0×1=0;1×0=0;1×1=1除法:0÷0=0;0÷1=0;(1÷0无意义);1÷1=1 (2)二进制逻辑运算(逻辑运算是按位独立进行的,位与位之间不发生进位关系。
)⎩⎩⎩⎩⎩逻辑加(“或”运算):0+0=0 0+1=1 1+0=1 1+1=1(取大)逻辑乘(“与”运算):0×0=0 0×1=0 1×0=0 1×1=1(取小)逻辑非(“取反”运算):0取反是1 1取反是0(取反)0表示假; 1表示真。
不同数制之间相互转化: 原理:用位权法表示。
例1:十进制整数转化成二进制整数。
2汉字信息在计算机内部的表示
区分代码空间中的字汇。
2019年6月28日8时33分
16/70
§3 汉字代码
什么是汉字代码 汉字交换码 汉字机内码 汉字区位码 交换码、 区位码和内码关系 代码页 汉字编码字符集
2019年6月28日8时33分
JIS-Roman(日本国家指定的ASCII码标准,代号为JIS X 02011997);
KS-Roman(韩国制订的国家ASCII码标准,代号为KS X 1003:1993)。
这些字符集的编码与ASCII码一样,采用7位二进制数编码, 收录的字符也基本与ASCII码一样,只是个别字符作了调 整。
第二章 汉字信息在计算机内部的表示
延边大学计算机科学与技术
2019年6月28日8时33分
内容
ASCII码 中文信息在计算机内的表示 汉字代码 常用汉字代码集 Internet上的汉字交换码
2019年6月28日8时33分
2/70
§1 ASCII码
ASCII码 扩展ASCII CJK-Roman
绝大多数计算机系统所采用的字符集,都 是以ISO/IEC 2022为基础:
GB2312 Big-5 ……
2019年6月28日8时33分
11/70
2.2 ISO/IEC 2022-单八位代码空间图
2019年6月28日8时33分
12/70
2.2 ISO/IEC 2022-单八位代码空间图(续)
19/70
5.3 汉字机内码
汉字机内码
用于信息处理的汉字代码 也称汉字处理码、处理码、机内码、内码
汉字内码长度可以不同,通常是双字节 对于单字节操作系统内核,汉字代码为了与ASCII
汉字的机内码是指在计算机中表示一个汉字的编码
汉字的机内码是指在计算机中表示一个汉字的编码。
机内码与区位码稍有区别。
汉字区位码的区码和位码的取值均在1~94之间,如直接用区位码作为机内码,就会与基本ASCII码混淆。
为了避免机内码与基本ASCII码的冲突,需要避开基本ASCII码中的控制码(00H~1FH),还需与基本ASCII码中的字符相区别。
为了实现这两点,可以先在区码和位码分别加上20H,在此基础上再加80H(此处“H”表示前两位数字为十六进制数)。
经过这些处理,用机内码表示一个汉字需要占两个字节,分别称为高位字节和低位字节,这两位字节的机内码按如下规则表示:高位字节=区码+20H+80H(或区码+A0H)低位字节=位码+20H+80H(或位码+AOH)由于汉字的区码与位码的取值范围的十六进制数均为01H~5EH(即十进制的01~94),所以汉字的高位字节与低位字节的取值范围则为A1H~FEH(即十进制的161~254)。
例如,汉字“啊”的区位码为1601,区码和位码分别用十六进制表示即为1001H,它的机内码的高位字节为B0H,低位字节为A1H,机内码就是B0A1H。
2603 = 1A03H 区位码+ A0A0H= BAA3H 机内码[本帖最后由rossini23 于2006-10-11 13:28 编辑]计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。
汉字信息在系统内传送的过程就是汉字编码转换的过程。
汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。
国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。
GB 2312—80就是国标码。
该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。
信息在计算机中的表示
注意:十进制小数不一定能转换成完全等值的其他进制
小数。遇到这种情况时,根据精度要求,取近似值。
11
例:
(100.345)10(1100100.01011)2 2 2 2 2 2 2 2 100 50 25 12 6 3 1 0 0.345 2 0.690 2 1.380 2 0.760 2 1.520 2 1.040 (100)10=(144)8=(64)16 8 100 8 12 8 1 0 16 100 16 6 0
3
1、进位记计数制的概念
• 十进制(D) 十种状态,逢十进一, (0,1,2,3,4,5,6,7,8,9) • 二进制(B) 两种状态,逢二进一,(0,1) • 八进制(Q) 八种状态,逢八进一,(0,1,2,3,4,5,6,7) • 十六进制(H) 十六种状态,逢十六进一 (0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F)
逻辑性强
二进制的两种状态正好与逻辑代数中的真和假相对 应,可以方便地进行逻辑运算。
2
1、进位记计数制的概念
进位计数制(简称数制)就是按进位的方法计数。 在不同的数制中,把某一进位计数制中涉及的数字符号
的个数称为基数,用R表示,一个具体的数用(S)R的形式
表示。计算机中经常用到的数制有十进制、二进制、十 六进制和八进制。
汉字的机内表示:机内码 汉字的输出:字形码(字库
输入码
Font)
字形 检索 程序
字形码
键盘
键盘 处理 程序
代码 转换 程序
机内码
储存、加工
输出设备
码表
字模库
25
汉字输入编码
汉字输入编码的实质就是用字母、数字和一些符号代码 的组合来描述汉字。目前,汉字编码的方案有很多种,主要 可分为四种:数字编码、字音编码、字形编码、音形编码。 数字码 (利用一串数字代表一个汉字) 如:电报码、区位码、纵横码 字音码 (用汉语拼音代表一个汉字) 如:全拼、双拼、微软拼音 字形码 (根据汉字结构或笔画用字母或数字表示汉字) 如:五笔字型 音形码 (根据汉语拼音和字形结构规定汉字编码) 如:声形码、王林快码
《计算机组成原理》名词解释
摩尔定律:对集成电路上可容纳的晶体管数目、性能和价格等发展趋势的预测,其主要内容是:成集电路上可容纳的晶体管数量每18个月翻一番,性能将提高一倍,而其价格将降低一半。
主存: 计算机中存放正在运行的程序和数据的存储器,为计算机的主要工作存储器,可随机存取。
控制器:计算机的指挥中心,它使计算机各部件自动协调地工作。
时钟周期:时钟周期是时钟频率的倒数,也称为节拍周期或T周期,是处理操作最基本的时间单位。
多核处理器:多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。
字长:运算器一次运算处理的二进制位数。
存储容量: 存储器中可存二进制信息的总量。
CPI:指执行每条指令所需要的平均时钟周期数。
MIPS:用每秒钟执行完成的指令数量作为衡量计算机性能的一个指标,该指标以每秒钟完成的百万指令数作为单位。
CPU时间:计算某个任务时CPU实际消耗的时间,也即CPU真正花费在某程序上的时间。
计算机系统的层次结构:计算机系统的层次结构由多级构成,一般分成5级,由低到高分别是:微程序设计级,机器语言级,操作系统级,汇编语言级,高级语言级。
基准测试程序:把应用程序中使用频度最高的那那些核心程序作为评价计算机性能的标准程序。
软/硬件功能的等价性:从逻辑功能的角度来看,硬件和软件在完成某项功能上是相同的,称为软/硬件功能是等价的,如浮点运算既可以由软件实现,也可以由专门的硬件实现。
固件:是一种软件的固化,其目的是为了加快软件的执行速度。
可靠性:可靠性是指系统或产品在规定的条件和规定的时间内,完成规定功能的能力。
产品可靠性定义的要素是三个“规定”:“规定条件”、“规定时间”和“规定功能”。
MTTF:平均无故障时间,指系统自使用以来到第一次出故障的时间间隔的期望值。
MTTR:系统的平均修复时间。
MTBF:平均故障间隔时间,指相邻两次故障之间的平均工作时间。
可用性:指系统在任意时刻可使用的概率,可根据MTTF、MTTR和MTBF等指标计算处系统的可用性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.汉字输入码
汉字的输入码通常指汉字的键盘输入编码。根据汉字
若采用双字节的7位代码,则为了保持与ASCII系统的兼 容,通常采用高位置1的方法来区分汉字代码与ASCII代 码。若采用3字节的7位代码,则可以用一个字节作为汉字 代码,其余2个7位编码作为汉字代码。
参照ISO/IEC2022标准,中国大陆、中国台湾地区、日本 和韩国等在标准的框架下制定了相应的字符编码标准。
使用国家和地区在计算机技术发展中,也制定了形式多样
的汉字编码字符集。其中最具有代表性的是ISO/IEC
2022标准。
该标准定义了7位代码和8位代码的空间及其代码空间 扩充技术。迄今为止,绝大多数计算机系统所采用的字符 集都是以此标准作为基础。
从ASCII码的扩展中我们可以得出,如果采用多个7位编 码,则除去控制字符区之外,可以获得94*94*94……个 编码空间。
的属性,汉字的输入键盘码可以分为:音码、形码以及音
形组合码。根据汉字编码说用的字符类别,则可以分别采
用26个英文字母的大键盘编码和采用10个素质的小键盘
编码。汉字的输入码通过键盘转换程序转换成汉字的机内
码。
4.汉字字形码
汉字的字形码是表示汉字字形的字模数据,通常用点 阵、矢量函数等方式表示。用点阵表示时,汉字字形码就 是这个汉字字形点阵代码。
1.拼音序
按照拼音顺序对汉字进行排列。 为此首先要设计一张汉字与拼音的对照表,也要考虑到
从而组成了一个ASCII编码 C
空间。
D
E
F
2.扩展ASCII码
由于ASCII码只能表示94个字符,因此若需要使计算 机还能够处理其他西文(如德文、法文、西班牙文等), 则必须对ASCII码进行扩充。
最简单的方式是采用8位二进制编码来表示一个扩展的 ASCII码字符集。
扩展ASCII码的编码空间如图所示。
码元值
ASCII
GB-Roman CNS-Roman JIS-Roman KS-Roman
0x24
$
¥
$
$
$
0x5C
\
\
\
¥
W
0x7E
~
—
—
—
—
2.2 中文信息在计算机中的表示
为了能使汉字能够在计算机中通行,亚洲国家和地区
除了制定CJK-Roman标准外。国际化标准组织(IS
O)、国际电气电子工程师协会(IEEE)以及各汉字
这10个部分分别定义了ASCII码和其扩展字符集。不同 的扩展字符集用ISO8859后跟不同的数字表示。
扩展ASCII码采用高4位作列号,低4位作行号。
3.CJK-Roman
CJK-Roman是指在中日韩字符编码标准中开发的 ASCII码,分别是GB-Roman、CNS-Roman、JISRoman 和KS-Roman。CJK-Roman除下列字符与ASCII 码不一致之外,其他都与ASCII相同。
01 2 3 4 5 6 7
ASCII码字符标准中用7位
0控 制
1
二进制数定义了128个字符, 2
字 符
其中94个为图形字符,32 3 区
图形字符区
个为控制字符,1个为空格 4
字符和一个Del键。
5
6
ASCII的编码空间如图所示, 7
图中把7位二进制数分为高 8
3位作为列号,低4位作为
9
行号,并用十六进制表示, A B
第二章 汉字信息在计算机内部表示
主要内容: 英文字符在计算机内部的表示 中文信息在计算机中的表示 汉字代码体系 汉字的排序 汉字编码字符集
2.1 英文字符在计算机内部的表示
1.ASCII码
ASCII码(America Standard Codefor for Information Interchange)美国信息交换标准码,作 为数据传输的标准码。早期使用7 个位来表示英文字母、 数字0~9及其它符号,现在则使用8个位,最多可以给 256个字符(包括字母、数字、标点符号、控制字符及其他 符号)分配(或指定)数值。
GL图形区用作ASCII码,GR图形字符区为其他一个西 方国家的语言文字编码。
0 1 2 3 4 5 6 7 8 9 ABCDE F
0 C0控制 1 字符区
GL图形字符区
C1控制 字符区
GR图形字符区
2
3
4
5
6
7
8
9
A
B
CDEF来自 为了尽可能多地使得英文与其他西方语言文字系统兼 容,国际化组织在ISO8859的第1~10部分中定义了新增 128个码元的字符编码集。
作系统厂商若要根据各个国家和地区使用不同语言文字的
人开发不同的操作系统,在成本、系统维护与升级等方面
的开销太大。为此,微软公司在开发MS-DOS和
Windows3.1的各种产品时,进一步将依赖于各具体平台
的各文种的字符集加以整理,并对各个具体的代码页都赋
予一个代号,称作“代码页ID”。
2.4汉字的排序
2.3 汉字代码体系
1.汉字交换码
汉字交换码是用于信息交换的汉字代码,也称汉字传 输码,在GB2312中用双字节表示。它用于汉字信息在计 算机之间的传输。与ASCII码不同,汉字的这种代码表示
一般不能直接用于信息处理。
2.汉字处理码
汉字处理码是用于信息处理的汉子代码,也称汉字内 码或汉字机内码。
5.汉字地址码
汉字地址码是在一个汉字系统中,某一汉字字型信息
存放在汉字库中的逻辑地址的编码。
相对于GB2312中16*16点阵字库,地址码和汉字码之 间的关系:
地址码=[(内码第一字节—A1H)×94+(内码第二字节)] ×32
6.汉字区位码
汉字区位码既是一种输入码,也是汉字交换码的另一 种表示形式。
在GB2312-80中,交换码、区位码、处理码之间存在 着简单的转换,设交换码为JH(十六进制),区位码为 QW(十进制),处理码为CL(十六进制),则:
J=Q+32 ——再转换为十六进制 H=W+32 ——再转换为十六进制 C=J+80H L=H+80H
7.代码页
不同国家的人使用着不同语言的操作系统。然而,操