计算机中的信息表示

合集下载

计算机中的信息如何表示

计算机中的信息如何表示

计算机要处理的信息是多种多样的,如日常的十进制数、文字、符号、图形、图像和语言等。但是计算机无法直接“理解”这些信息,所以计算机需要采用数字化编码的形式对信息进行存储、加工和传送。

信息的数字化表示就是采用一定的基本符号,使用一定的组合规则来表示信息。计算机中采用的二进制编码,其基本符号是“0”和“1”,主要有数的表示和非数值表示。

一、计算机中数的表示

在普通数字中,用“+”或“—”符号在数的绝对值之前来区分数的正负。在计算机中有符号数包含三种表示方法:原码、反码、补码。

●原码表示法:用机器数的最高位代表符号位,其余各位是数的绝对值。符号

位若为0则表示正数,若为1则表示负数。

●反码表示法:正数的反码和原码相同,负数的反码是对原码除符号位外各位

取反。

●补码表示法:正数的补码和原码相同,负数的补码是该数的反码加1。

二、非数值数据的表示

1.字符的表示

在计算机处理信息的过程中,要处理数值数据和字符数据,因此需要将数字、运算符、字母、标点符号等字符用二进制编码来表示、存储和处理。目前通用的是美国国家标准学会规定的ASCII码——美国标准信息交换代码。每个字符用7位二进制数来表示,共有128种状态,这128种状态表示了128种字符,包括大小字母、0…9、其他符号、控制符。

2.汉字的表示

计算机中的汉字使用汉字交换码来表示。汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。自国家标准

GB2312-80公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码。GB2312-80标准包括了6763个汉字,按其使用频度分为一级汉字3755个和二级汉字3008个。一级汉字按拼音排序,二级汉字按部首排序。此外,该标准还包括标点符号、数种西文字母、图形、数码等符号682个。区位码的区码和位码均采用从01到94的十进制,国标码采用十六进制的21H到73H(数字后加H表示其为十六进制数)。区位码和国标码的换算关系是:区码和位码分别加

计算机内的信息表示

计算机内的信息表示

计算机内的信息表示

计算机内的信息表示

数据时信息的载体,是信息的具体表示形式。

数据⎩⎩⎩数值型数据:主要用来表示数量,可比较大小

非数值型数据:人工处理过的。

常用数据:字符型数据(表示文字信息。)、图象、声音、活动图象等。

信息表示是采用二进制计数。(0或1)

采用二进制的原因:因数载计算机中是由电子器件的物理状态来表示的,而物理状态中的高、低状态较稳定且易于实现。数制:用一组固定的数字和一套统一的规则来表示数目的方法。

数制特点:①采用进位计数方式;②有固定的数码;③使用位权表示法;④使用基数。

位权法:同样的数所处位置不同其代表的值不同,这与该数位的权值有关。各种数制中,数的权值恰好是基数的某次幂。八进制:有8个数码0~7,八进制基数是8,逢八进一。

十六进制:有16个数码,分别是0~9以及A ~F ,A ~F 分别表示十进制的

10~15。十六进制基数是16,逢十六进一。二进制的算术运算和逻辑运算。

(1)二进制算术运算(算术运算会发生进位和借位处理)

⎩⎩⎩加法:0+0=0;0+1=1;1+0=1;1+1=10(向高位进一)减法:0-0=0;1-0=1;1-

1=0;0-1=1(向高位借一) ⎩⎩⎩乘法:0×0=0;0×1=0;1×0=0;1×1=1除

法:0÷0=0;0÷1=0;(1÷0无意义);1÷1=1 (2)二进制逻辑运算(逻辑运算是按位独立进行的,位与位之间不发生进位关系。)

⎩⎩⎩⎩⎩逻辑加(“或”运算):0+0=0 0+1=1 1+0=1 1+1=1(取大)

逻辑乘(“与”运算):0×0=0 0×1=0 1×0=0 1×1=1(取小)逻辑非(“取反”运算):0取反是1 1取反是0(取反)

信息的表示

信息的表示

7、汉字编码
Fra Baidu bibliotek


ASCII码是计算机处理英文字符的编码,如果处 理汉字信息还需要汉字编码。 1981年,我国制定了《中华人民共和国国家标 准信息交换用汉字编码字符集——基本集》国家 标准,代号为GB2312—80,这种编码称为国标 码,是所有汉字编码都必须遵循的共同标准。 GB2312—80以94个可以显示的ASCII码作为基 本集,共收录了汉字和图形符号7445个。一级 汉字3775个,二级汉字3008个,非汉字字符 682个
5、字符编码
在计算机内部及与外部设备交换信息时,采 用固定长度的二进制编码。在微型计算机系统中 普遍采用ASCII码,在汉字系统中,还要使用汉 字编码
6、ASCII码



ASCII码即美国标准信息交换代码。 是一种使用最广泛的编码方案,已经被标准化组 织(ISO)接收为国际标准。 ASCII码由7位二进制数组成的128个字符编码, 其范围为0000000~1111111。
3、表示数据的单位
1、表示数据的单位有“位”和“字节”。 2、位(bit) 是计算机处理数据的最小单位,用0或1来表 示,“位”常用“b”表示。 3、字节(Byte) 是计算机中数据的最小存储单元,常用B表 示。
4、数据换算方法
1、微机中由8个二进制位组成一个字节。一个字 节可存放一个半角英文字符的编码,两个字节可 存放一个汉字编码。 2、换算方法 8b=1B; 210B=1024B=1KB; 220B=1024KB=1MB;230B=1024MB=1GB; 240B=1024GB=1TB;250B=1024TB=1PB

计算机中的信息表示

计算机中的信息表示

计算机中的信息表示

在计算机领域中,信息是通过各种形式的数据进行表示和处理的。计算机中的信息表示是一个重要的概念,它涉及到了数字和字符的存储、传输和处理等方面。本文将探讨计算机中的信息表示方法以及相关的概念。

1. 二进制表示法

计算机使用二进制表示法来存储和处理信息。在二进制系统中,只有两个数字0和1。这是因为计算机内部的电路只能处理低电平和高电平的信号。

二进制系统的基本单位是比特(bit),一个比特可以表示0或1。多个比特组成了字节(byte),常用的字节大小是8位。例如,一个字节可以表示从0到255的整数。

2. 字符表示

计算机中的字符表示通常使用ASCII码(American Standard Code for Information Interchange)或Unicode码。ASCII码是用来表示英文字符,它将每个字符映射到一个唯一的7位或8位二进制数值。Unicode 码则是用来表示几乎所有的字符,包括各个语言的字符和特殊符号。

3. 数字表示

计算机中的数字表示是通过一种称为二进制补码(binary representation)的方法来实现的。在二进制补码中,正数和负数都可以用二进制数值来表示。

例如,一个字节的无符号整数可以表示从0到255的数值。而有符号整数则使用最高位表示符号位,0表示正数,1表示负数。

4. 浮点数表示

计算机中的浮点数表示法用于处理带有小数点的数值。通常使用IEEE 754浮点数标准来表示浮点数。

IEEE 754标准规定了浮点数的表示形式、运算规则等。它包括了正负零、正无穷、负无穷和NaN(Not a Number)等特殊值的表示。

计算机中的信息表示

计算机中的信息表示
94
2.6.3 汉字编码简介
1
2. 汉字通过输入码从键盘或通过语音识别从麦克风或通过联机手写或印 刷体文字扫描输入等各种手段被输入到计算机内部后,就按照一种称为 “内码”的编码形式在系统中进行存储、查找、传送等处理。对于西文 字符数据,它的内码就是ASCII码。对于汉字内码的选择,我们必须考虑 以下几个因素:(1)不能有二义性,即不能和ASCII码有相同的编码。 (2)要与汉字在字库中的位置有关系,以便于汉字的处理、查找。(3) 编码应尽量短。
40
2.3.2 加法与减法运算
41
42
43
44
45
(2)溢出判断
对于加法,只有正数加正数和负数加负数两种情况下才可能出 现溢出,符号不同的两个数相加是不会出现溢出的。 对于减法,只有在正数减负数或负数减正数两种情况下才可能 产生溢出,符号相同的两个数相减是不会出现溢出的。
由于减法运算在机器中是用加法器实现的,因此可得如下结论: 不论是作加法还是减法,只要实际参加运算的两个数(减法时 即为被减数和“求补”以后的减数)符号相同,结果又与原操 作数的符号不同,即为溢出。
57
(3)原码乘法
58
59
60
61
0.0000
62
图中A、X、Q均为n+1位的寄存器,其中X存放被乘数的原码,Q存放乘数的原 码。移位或加的选择控制电路受乘数末位Qn控制(当Qn=1时,A和X内容相加后, A、Q右移一位;当Qn=0时,只作A、Q右移一位的操作)。计数器C用于控制逐位 相乘的次数。S存放乘积的符号。GM为乘法标记。

4. 信息在计算机中的表示

4. 信息在计算机中的表示

3. 字(word) ) 在计算机中作为一个整体被存取、传送、 在计算机中作为一个整体被存取、传送、处 理的二进制数字符串叫做一个字或单元, 理的二进制数字符串叫做一个字或单元, 目前是4字节一个字 字节一个字。 目前是 字节一个字。
10K Byte = ____bit 64M bit = __M Byte 2*220 B = ____KB 4个字节是___位 1024*1000B = 1000 KB = 1MB ( ) 1MB = ______bit 128 M bit =___M Byte 230 bit = ___G Byte 0.5G =_____M
计算机中信息的 表示
1. 位(Bit) 计算机采用二进制, 计算机采用二进制,运算的和控制和存储 的数据和程序是二进制数。 的数据和程序是二进制数。 显然,在计算机内部到处都是由0和 组成 显然,在计算机内部到处都是由 和1组成 的数据流。 的数据流。 计算机中最小的数据单位是二进制的一个 数位,简称为位(英文名称为 英文名称为bit,读音为比特)。 数位,简称为位 英文名称为 ,读音为比特 。
1KB=1024B=210 B 1KB=1024字节,“K”的意思是“千” 字节, 的意思是“ 字节 的意思是 1MB=1024KB=210KB=220 B=1024×1024B × 1MB=1024KB字节,“M”读“兆”。 字节, 字节 读 1GB=1024MB=210MB=230 B=1024×10Baidu Nhomakorabea4KB × 1GB=1024MB字节,“G”读“吉”。 字节, 字节 读

计算机的信息表示

计算机的信息表示

知识回顾

一、信息在计算机中的表示

◆计算机中的所有信息都用二进制表示:

1.电子设备容易实现,且可靠性和稳定性高。

2.算数运算简单

3.易于采用逻辑代数

二、计算机中的数据类型

◆数值、文本、图形、图像、音频、视频

三、数值在计算机中的表示

四、ASCII码

◆编码:信息按照约定的规则从一种形式转换为另一种形式的过程。

◆美国国家标准信息交换码(American Standard Code for Information Interchange),简称ASCII码。

五、中文信息编码

◆1980年我国颁布了第一个汉字编码标准

——国标码。国标码的全称是“国家标准信息

交换用汉字编码”GB2312-80。

◆我国绝大部分中文系统都支持GB2312,新

加坡等地也采用此编码。而香港、台湾等使用

繁体字的计算机系统中则采用大5码(BIG5)。

◆Unicode是一种标准的国际通用编码格式,用16位二进制编码。

◆为国际上各主要文字符号建立统一的编码系统,让网络上的文本及软件应用能被全球各地读懂。

《计算机基础》计算机中的信息表示

《计算机基础》计算机中的信息表示

《计算机基础》计算机中的信息表示计算机中的信息表示

计算机是现代科技领域的一个重要发明,它运用数字信号来处理和

存储信息。而在计算机中,信息的表示方式也是非常关键的一部分。

本文将探讨计算机中的信息表示,包括二进制表示、字符编码、图像

表示等方面内容。

一、二进制表示

在计算机中,所有的信息都以二进制的形式进行表示。二进制由0

和1两个数字组成,这两个数字被称为位(bit)。计算机内部的所有

数据,例如数字、文字、图像等都被转化为二进制码的形式进行存储

和处理。

二进制是一种十分简洁的表示方式,只需通过两个数字即可表达一

切信息。这是因为计算机的电路系统能够根据二进制的高低电平判断

信息的真假。例如,0可以表示电路关闭、低电平,1则表示电路打开、高电平。通过这种方式,计算机能够处理大量的数据和复杂的运算。

二、字符编码

在计算机中,字符的表示和存储也十分重要。不同的字符需要对应

不同的二进制码,这就需要用到字符编码。

最早的字符编码是ASCII码(American Standard Code for Information Interchange,美国标准信息交换码)。ASCII码使用一个字

节(8个二进制位)来表示一个字符,包括大小写字母、数字、标点符

号等,共计128个字符。

然而,随着计算机的普及,字符编码的需求变得越来越复杂。为了

满足不同地区和不同语言的需求,逐渐产生了多种不同的字符编码标准,如GB2312、GBK和Unicode等。其中,Unicode是当今最广泛使

用的字符编码标准,它能够表示几乎所有的字符,并且可以支持多种

计算机的信息表示方式

计算机的信息表示方式

1、输入设备
功 主 键
能 盘
键 区

光 标 控 制 区
状态灯
数 字 小 键 盘
鼠标器:主要用于视窗界面的操作环境中,移动光标来实现各种操作。
鼠标器通过串行通讯接口与主机相连,有机械工和光电式两种。
鼠标器的操作: 1、左单击-用在指定、选中、切换到某对象
2、左双击-用在打开、启动、运行某对象 3、右单击-用在调用某对象的快捷菜单 4、拖动-用在复制、移动、改变位置和大小的场合 5、指向-可以显示某对象的用途 扫描仪 是一种光机电一体化的输入设备,它可以将图文形象转换成可由计算 机处理的数字数据。
3.扇区(sector):将各个磁道分成的若干个扇形的区域。扇区是软盘 的基本存储单位,一个扇区称为一个记录,计算机在读、写数据时总是 以一个或几个完整的扇区为单位。
扇区的编号从1开始。每个磁道上的扇区数可为8、9、15或18。 每个扇区存储512个字节。
磁道软盘的磁道和扇区示意图
主轴孔 软 盘 边 缘 扇区 软盘上的信息是写在各磁道的扇区内的,存放在软盘上的信息以它所在的软盘面 号、磁道号和扇区号唯一地来确定位置。 磁道39(或79)
只读存储器 ROM 可编程只读存储器 PROM 可改写只读存储器 EPROM 磁盘存储器 光盘存储器 硬磁盘 软磁盘
外存 (辅助存储器)
存储器中的几个概念:

计算机中的信息如何表示

计算机中的信息如何表示

计算机中的信息如何表示

在计算机中,信息是通过“位”来表示和存储的。位(bit)是计算机

中最小的单位,它只能表示0或1两种状态,也就是二进制。一组8个位被称为字节(byte),字节是计算机处理数据的基本单位。

信息可以被抽象为数字、字符、图像、音频和视频等形式。不同的

信息类型需要不同的编码方式来表示。下面将介绍几种常用的信息表

示方式。

1. 数字表示:

在计算机中,数字是通过二进制编码来表示的。计算机内部使用的

是补码形式,其中最高位表示符号位,0表示正数,1表示负数。对于

整数,数值直接以二进制形式存储,而小数则采用浮点数表示法,如IEEE 754标准。

2. 字符表示:

在计算机中,字符使用字符编码来表示。最常用的字符编码是

ASCII码(美国信息交换标准码),它将字符映射到一个唯一的整数值。ASCII码可以表示128个字符,包括英文字母、数字、标点符号和一些特殊字符。扩展ASCII码可以表示更多的字符,如国际字符集ISO-8859。

3. 图像表示:

图像是由一组像素组成的。每个像素表示图像中的一个点,它包含了该点的颜色信息。在计算机中,图像可以用位图或矢量图的形式表示。位图使用像素矩阵来表示每个像素的颜色值,而矢量图使用数学公式来描述图像的形状和颜色。

4. 音频表示:

音频是由一系列声音波形组成的。在计算机中,音频信号被采样为一系列离散的数字值。常见的音频格式有PCM(脉冲编码调制)、MP3(有损压缩)和WAV(无压缩音频)等。

5. 视频表示:

视频是由一系列连续帧组成的。每帧包含了图像的信息。在计算机中,视频采用压缩编码方式表示,以减小存储和传输的需求。常见的视频编码标准有MPEG,其中包括MPEG-1、MPEG-2和MPEG-4等。

信息在计算机中的表示方法

信息在计算机中的表示方法

信息在计算机中的表示方法

信息在计算机中的表示方法是计算机科学领域中的重要概念之一。

计算机通过不同的方式来表示和存储信息,以便能够进行处理和计算。本文将介绍一些常用的信息表示方法,包括二进制、十进制、十六进

制以及ASCII码。

一、二进制表示法

二进制是计算机系统中最常用的信息表示方法。二进制只包含两个

数字,即0和1,也被称为“0/1码”或“二码”。在计算机中,所有的数

据以二进制形式存储和处理。例如,数字“10”的二进制表示为“1010”。

二进制的优点是能够更直接地与计算机内部的电路进行对应,从而

使计算机更高效地处理数据。同时,二进制表示法也非常简洁,只需

使用两个数字即可表示任意数据。

二、十进制表示法

十进制是我们日常生活中最常用的数字表示方法。十进制有十个数字,即0到9,是一种基于十的数制系统。在计算机中,十进制数需要

转换为二进制数才能被计算机理解和处理。

十进制的优点在于它更符合人们的思维方式,便于人们直观地理解

和计算。然而,与二进制相比,十进制的表示方式更占用存储空间,

并需要更多的计算资源。

三、十六进制表示法

十六进制是一种基于十六的数制系统,它使用了0到9的十个数字

和A到F的六个字母。十六进制广泛应用于计算机科学和工程领域,

特别是在编程和网络通信中。

十六进制的优点在于它既比二进制更简洁,又比十进制更易于计算。在计算机中,十六进制数经常用于表示内存地址、颜色代码等。例如,颜色代码"#FF0000"表示红色。

四、ASCII码

ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码)是一种常用的字符编码标准。它定义了128个字

计算机内的信息表示

计算机内的信息表示

计算机内的信息表示

计算机内的信息表示

数据时信息的载体,是信息的具体表示形式。

数据⎩⎩⎩数值型数据:主要用来表示数量,可比较大小

非数值型数据:人工处理过的。

常用数据:字符型数据(表示文字信息。)、图象、声音、活动图象等。

信息表示是采用二进制计数。(0或1)

采用二进制的原因:因数载计算机中是由电子器件的物理状态来表示的,而物理状态中的高、低状态较稳定且易于实现。数制:用一组固定的数字和一套统一的规则来表示数目的方法。

数制特点:①采用进位计数方式;②有固定的数码;③使用位权表示法;④使用基数。

位权法:同样的数所处位置不同其代表的值不同,这与该数位的权值有关。各种数制中,数的权值恰好是基数的某次幂。八进制:有8个数码0~7,八进制基数是8,逢八进一。

十六进制:有16个数码,分别是0~9以及A ~F ,A ~F 分别表示十进制的

10~15。十六进制基数是16,逢十六进一。二进制的算术运算和逻辑运算。

(1)二进制算术运算(算术运算会发生进位和借位处理)

⎩⎩⎩加法:0+0=0;0+1=1;1+0=1;1+1=10(向高位进一)减法:0-0=0;1-0=1;1-

1=0;0-1=1(向高位借一) ⎩⎩⎩乘法:0×0=0;0×1=0;1×0=0;1×1=1除

法:0÷0=0;0÷1=0;(1÷0无意义);1÷1=1 (2)二进制逻辑运算(逻辑运算是按位独立进行的,位与位之间不发生进位关系。)

⎩⎩⎩⎩⎩逻辑加(“或”运算):0+0=0 0+1=1 1+0=1 1+1=1(取大)

逻辑乘(“与”运算):0×0=0 0×1=0 1×0=0 1×1=1(取小)逻辑非(“取反”运算):0取反是1 1取反是0(取反)

3. 计算机中信息的表示

3. 计算机中信息的表示

• 反码 正数的反码是其本身,负数的反码是 在其原码的基础上, 符号位不变,其 余各个位取反。 [+1] = [00000001]原 = [00000001]反 [-1] = [10000001]原 = [11111110]反
反码的问题
( 1 )10 - ( 1 ) 10= ( 1 ) 10+ ( -1 ) 10= ( 0 )10
补码:
正数的补码就是其本身; 负数的补码是在其原码的基础上, 符号位不变, 其 余各位取反, 最后+1. (即在反码的基础上+1)
[+1] = [00000001]原 = [00000001]反 = [00000001]补 [-1] = [10000001]原 = [11111110]反 = [11111111]补
2 │ 7 ┄┄┄┄┄┄┄┄┄┄┄┄1
├──── 2 │ 3 ┄┄┄┄┄┄┄┄┄┄┄┄1 ├──── 2 │ 1 ┄┄┄┄┄┄┄┄┄┄┄┄1 └──── 0 ┄┄┄┄┄┄┄┄┄┄┄┄1 二进制整数高位
24
② 小数部分的转换: 0.6875×2=1.375 0.375×2=0.75 0.75×2=1.5 0.5×2=1.0 积的整数部分 a1 =1 a 2 =0 a3 =1 a 4 =1
1 1 0 1 1 1 0 0 1 0 1
0 1 2 3 4 5
十六进制

计算机中信息的表示方法

计算机中信息的表示方法

计算机中信息的表示方法

随着计算机科学和技术的不断发展,计算机已经成为了现代社会不可或缺的一部分。而在计算机中,信息的表示方法是十分重要的,它直接关系到计算机的性能和功能。本文将介绍一些常见的计算机中信息的表示方法,包括二进制表示、字符编码以及浮点数表示等。

一、二进制表示

二进制是计算机中最基本的数字系统,只包含了0和1两个数字。计算机使用二进制来表示信息,可以通过将信息分解成一系列的二进制位来存储和处理。例如,我们可以用8个二进制位来表示一个字节(Byte),它能够表示256种不同的状态。

二、字符编码

在计算机中,字符编码是将字符映射到二进制表示的方法。最常见的字符编码是ASCII码,它使用了7个或8个二进制位来表示128或256个不同的字符。ASCII码覆盖了常见的字母、数字和标点符号,但对于其他语言的字符来说,ASCII码是不够的。

为了解决多语言字符表示的问题,出现了Unicode编码。Unicode 编码使用更多的二进制位来表示更多的字符,它能够包含几乎所有的已知字符。不过,Unicode编码也带来了一些问题,比如存储和传输的效率较低。

为了解决Unicode编码的效率问题,出现了一些针对特定语言的字符编码,如UTF-8、UTF-16和UTF-32等。其中,UTF-8编码是目前

最常用的字符编码之一,它采用变长表示的方式,可以根据字符的不

同使用1到4个字节表示,既能兼容ASCII码,又能表示Unicode字符。

三、浮点数表示

在计算机中,浮点数是用来表示实数的一种方法。浮点数一般由符

号位、指数位和尾数位组成。其中,符号位表示浮点数的正负号,指

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 进位计数制

1. 常见的进位计数制

Bi nary 二进制 O ctonary 八进制 D ecimalism 十进制 H exadecimal 十六进制 进位计数制:利用固定的数字符号和统一的规则来计数的方法。有3个基本要素: 基数->

进位规则->R 位权->2. 1.

多项式展开直接求和 2.十进制转换成二进制整数部分:除基到零,反向写余 小数部分:乘基到精,正向写整 3. 二进制转成八、十六进制

小数点为界,向两边分组。八进制3个一组,十六进制4个一组,不足添0。各组二进制转成十进制再转成八(十六)进制即可。

2.计算机中的数据

1.二进制与计算机

位(bit):计算机中最基本的单位,一个二进制数字0/1。

字节(Byte):8个位。

字:字节的集合。

字长:一个字中二进制的位数。字长是计算机一次能同时进行运算的二进制位数。现在一般为32bit、64bit。

一般来说,n位的二进制数字能够表示种状态。

2.模拟数据和数字数据

模拟数据:一种连续表示法,模拟它表示的真实信息。

数字数据:一种离散表示法,把信息分割成了独立的元素。

阈值:大于阈值的电压看成高电压,小于阈值的电压看成低电压。

计算机不能处理模拟数据,要对模拟数据进行数字化。

3.数据及其分类

数值、文本、音频、视频、图像、图形。

4.数值型数据的表示

机器数:一个数在计算机中的表示形式。机器数有位数限制,多余的位数将

被截断,少的位数将被填充。 (机器数的)真值:带有正负号的数。

1. 数值型数据的分类

根据是否带小数点分为实数和整数。

按照是否带有符号,整数分为带符号和无符号。对于带符号的整数要对符号进行编码。数值数据可以用原码和补码表示。

为了表示实数中的小数点的位置,可以表示为定点数或浮点数。

2. 整数的表示

无符号整数表示:转成二进制数,对不足机器字长的在前面补0。最小值全是0,最大值全是1。

带符号整数表示:0表示正,1表示负。符号位占用一位二进制数位。 原码

符号位

补码:正数同原码,负数补码除符号位外其他位取反,末尾位加1。 +、-0的补码一致。

3. 实数的表示

定点数的表示

:定点数就是在运算过程中小数点的位置固定不变。小数点位置不一定是明确指定的。由于小数点位置固定,计算时可以直接进行加减运算。

浮点数的表示:任何一个数都可以用科学计数法来表示,这种表示方法称为浮点表示法。浮点数的一般表示形式:

IEEE 754

规定单精度浮点数(32b )双精度浮点数(64b )。

对于二进制实数,现将其写成尾数是定点小数的科学计数法的形式。再将其尾数扩充为23位,阶码扩充为8位,再把尾数转换成补码形式。

假想的小数点

数值位

=

=

单精度(32b )

4. 溢出

计算机中n 位有符号数的表示范围(1

2~2

-11

---n n )。

超出范围会产生溢出。

5. 文本表示

一个文本是由一系列字符构成的。要处理一个文本,必须表示和存储每个可能出现的字符。

内码:字符在计算机中存储和处理时的编码。

1. 文本类型

1. 简单文本:仅由一串字符代码组成,没有字体字号的变化和其他媒体。文件扩展名为txt 。

2. 丰富格式文本:允许在文档中设置格式(字体、颜色、页边距、自选图形、公式等)的文本。

3. 超文本(HTML 文本):有声音、视频等多媒体信息,还有链接。 不管是哪种类型,核心问题是要表示字符本身,格式符号需要单独表示。最早也是最常用的方法是列出所有字符,给每个字符编一个二进制位串。 要表示的符号数决定了需要多少二进制位数来表示。 西文字符——>ASCII 码 汉字字符——>GB 2312-1980 全世界所有字符——>Unicode 码

2. 文本内码

1. ASCII 码

美国标准信息互换标准代码。最初,ASCII 字符集中每个字符由7个二进制位表示,总共有128个不同字符。用一个字节存储,第8位用作校验位。ASCII 码表中特殊的33个字符(0~31和127)是不可显示和打印的控制码。比如CR (回车)。 2. Unicode 编码

表示世界上使用的所有语言的所有字符。Unicode 使用16位表示每个字符,能够表示162个字符。Unicode 字符集是ASCII 字符集的超集。Unicode 常用的两种编码方案如下:

1)UTF-8单字节可变长编码:每个字符占1~4个字节。有单、双、三、四字节。

2)UTF-16双字节可变长编码:每个字符占2或4个字节。 3. 汉字编码

汉字内码是计算机内部使用的用二进制表示的汉字编码。 i)

区位码

94x94个ASCII 字符为基础构成二维平面,行为区,列为位。每一个汉字/字符都对应唯一一个区(左)位(右)号。每个汉字用2个字节表示。 ii)

汉字内码GB2312标准

ASCII 码用1个字节表示,最高位为0。汉字内码用2个字节来表示,每个字节最高位是1。为了与ASCII

码的可打印字符位置一致,在区号和

位号上分别加上20H(32),称为国标码。

区位码转换成机内码的方法是:将十进制的区码和位码转成十六进制的,将他们分别加上20H得到国际码。再在高低字节上加上80H。

Ex:中国OK! 占

2+2+1+1+1=7个字节

iii)

汉字内码GBK标准编码

1995年汉字内码扩充标准。要求双字节最高位为1。

iv)汉字内码GB18030汉字编码标准

国家发布过GB 18030-2000和GB 18030-2005,现已强制贯彻执行。

4.文本输入

1.键盘输入

2.联机手写输入

3.语音输入

4.印刷体识别

5.文本输出

1.字符点阵描述

每个字符按照图形符号设计成点阵图,用一位二进制对应屏幕上的一个点,亮为1暗为0,就得到相应的点阵代码(字形码)。

2.字符轮廓描述

以字符轮廓的转折点为特征来描述字符,又称矢量字体。用一组直线

相关文档
最新文档