补充非数值信息的编码
信息的表示与编码
内存容量直接影响到电脑的速度,甚至关系到某些软
件是否能够运行,因此它是电脑性能的一项重要指标。 目前单条内存的容量有64MB、128MB、256MB等规 格。从一定程度上讲,计算机性能瓶颈并不再CPU或 其它部件,而在于内存。现在的应用软件越来越大, 对内存的容量要求也越来越高。
2020/8/9
莱阳农学院计算机系
2020/8/9
莱阳农学院计算机系
24
内存——内存的参数
(1)内存条的引脚(pin 线)
内存引脚(也称“金手指”)是内存条与内存插槽连
接的部分。SDRAM 和 DDR内存条的引脚规格是不同 的。前者为168线,两个定位缺口;后者为184线,一 个定位缺口。 DDR内存的速度是SDRAM 的两倍。
(2)内存容量
( 1 B 7 . 4 )16
2020/8/9
莱阳农学院计算机系
12
数据在计算机中的表示方式 编码和数制
+77
机
01 0011 01
器
符号位
数
真值
/
真
机器数
值
即:+77 0 1001101
2020/8/9
莱阳农学院计算机系
13
数据在计算机中的表示方式
编码和数制
-77
带
原码 1 1 0 0 1 1 0 1
2020/8/9
莱阳农学院计算机系
7
十进制小数 非十进制小数
进位法:“乘基数取整数” ,用十进制小数乘
基数,当积为0或达到所要求的精度时,将整数
部分由上而下排列。
示例: 0.625
╳
2
1.250
结果为:.101
整数为1
6_非数值信息的表示
20
BIG5 Big5是台湾地区使用的汉字编码方案 13060个繁体字,420个图形符号, 16位(2字节)编码 CJK(C 指中国,J 指日本,K 指朝鲜) 中日韩统一表意文字 把中文、日文、韩文、越文中,本质、意义相同、形状 一样或稍异的表意文字于ISO 10646及Unicode标准内 赋予相同编码。 是ISO 10646的子集
制ASCII的分别是多少?其他数字、其他大写字母和 其他小写字母分别与0,A,a的ASCII有什么关系? 大写字母和小写字母的ASCII码有什么关系? 2.计算图像文件的大小:分辨率1280*720,灰度级 256. 3.计算声音文件的大小:采样频率44.1kHz,样本位 数16位,双声道,4分钟。 4.汉字的不同编码会给计算机的应用带来什么影响?
Organization for Standardization)
ISO/10646 :Information technology - Universal
Coded Character Set (UCS) ,缩写为UCS
多语言软件制造商组成的统一码联盟
Unicode
23
ISO 10646/Unicode
4
ASCII
5
ISO/IEC8859-7
6
扩展字符集
7
2)中文字符编码
汉字符号多,一个字节容纳256个符号的编码
计算机网络2-第3章-补充内容数据编码技术
φ=π φ=0
φ=0
φ=π
相对相移键控PSK
相位 偏移π φ不变 偏移π 偏移π φ不变 φ=0 φ=π φ=π φ=0 φ=π φ=π
2021/4/9
7
多相调制
二进制比特 相位值
00
0
π
01
2
11
3π 2
10
π
数字数据 0 0 1
四相 相移键控
0
π
10
01
3π 2
01 00
11 10
π 2
ASK、FSK和PSK都是最基本的调 制技术,实现容易,技术简单,抗 干扰能力差,调制速率不高,为了 提高数据传输速率,也可以采用多 相调制的方法。
对数字数据调制的基本方法有三种:幅移键控、频移键控和相移键控。
计算机
调制解调器
公用电话网
调制解调器
计算机
2021/4/9
4
数字数据的调制
在调制过程中,选择音频范围内的某一角频率ω的正(余)弦信号作 为载波,该正(余)弦信号可以写为: u(t)= um·sin(ωt+φ0)
3个可以改变的电参量: — 振 幅 um — 角频率 ω — 相位 φ
模拟信号 (模拟信道)
模拟数据
调制 (AM、FM、PM等)
模拟信号 (模拟信道)
2021/4/9
3
数字数据的调制
传统的电话通信信道是为传输语音信号设计的,用于传输音频 300Hz~3400Hz的模拟信号,不能直接传输数字数据。为了利用模拟 语音通信的电话交换网实现计算机的数字数据的传输,必须首先将数 字信号转换成模拟信号,也就是要对数字数据进行调制。
PCM 输出(编码) 011100011011001100
数据的表示与编码
2i B
8i O
10i D
16i H
1 计算机中的数和数制
3 数制之间的相互转换
(1)二、八、十六进制数转换为十进制数 (2)十进制数转换为二、八、十六进制数 十进制数转换为二进制 十进制数转换为八进制 十进制数十六进制数 (3)二进制数和八进制数、十六进制数的转换 二进制数转换为八、十六进制数 八、十六进制数转换为二进制数
1 计算机中的数和数制
计算机内部采用的二进制表示方式的原因
1、二进制只有两个数码“0”和“1”,易于用物理器件表示。这 些物理状态都是不同的质的变化,形象鲜明、易于区别,并且 数的存储、传送和处理可靠性高。 2、运算规则简单,操作实现容易 3、二进制加、减、乘、除运算,可以归结为加、减、移位三种操 作。 4、理论和实践证明,采用R= e =2.71828进制时,存储设备最省, 取3比取2更节省设备,但二进制比三进制易于表示 5、二进制中的“1”和“0”与逻辑命题中的“真”、“假”相对 应,为计算机实现逻辑运算和程序中的逻辑判断创造了良好条 件。 为了书写方便,在用户层计算机也采用八进制和十六进制 表示方式,进制的表示和进制之间的转换统称为进位计数制。
1 计算机中的数和数制
(4)八、十六进制数转换为二进制数
转换规则:
• 从右向左按一位八进制数转换为三位二进制数 • 从右向左按一位十六进制数转换为四位二进制数
1 计算机中的数和数制
举例:
• 例1-8 八进制数(1365.24)8 转换为二进制数 (1365.24)8 = (001 011 110 101. 010 100)2 = (1011110101.0101)2 例1-9 十六进制数(FB4.5C)16 转换为二进制数 (FB4.5C)16 = (1111 1011 0100. 0101 1100) 2 = (111110110100.010111) 2
计算机科学第2章 数据的表示与编码
加 1 便得到负数的补码。
2.2.2 实数的表示
实数是带有整数部分和小数部分的数字。用于维持正确度或精度的 解决方法是使用浮点表示法。 1. 规范化
为了使表示法的固定部分统一,科学计数法(用于十进制)和浮点 表示法(用于二进制)都在小数点左边使用了唯一的非零数码。这称 为规范化。 2. 符号、指数和尾数
计算机学科导论
第2章 数据的表示与编码
本章教学目的
1. 理解数字系统和数制的概念; 2. 掌握二进制、十进制及其他进制的计数方法,掌握不同
进制间的转换方法; 3. 掌握二进制整数和实数的表示方法 4. 掌握二进制原码、反码、补码的表示方法; 5. 掌握二进制数的算术运算; 6. 了解英文字符、汉字字符等的编码方式; 7. 了解各种数据类型的编码方式及在计算机中存储
权 ห้องสมุดไป่ตู้式表示
二进制 逢二进一
R=2 0,1 2i B
八进制 逢八进一
R=8 0,1,2,…,7
8i O
十进制 逢十进一
R=10 0,1,2,…,9
10i D
十六进制 逢十六进一
R=16 0,1,..,9,A,..,F
16i H
2.1.5 不同进制间的相互转换
1. 任意进制数转换为十进制数 2. 十进制数转换任意进制数
2.1.3 二进制和位
二进制数字系统是最简单的数字系统。其底为2,数字的取值范围 是0和l,计数规则是“逢2进位”。二进制数字系统中只有两个数字0 和1。
位是信息的基本单位,也是存储在计算机中的最小单位。位的英文 是“bit” (比特)代表“binary digit”,1位具备最少的信息量,更 复杂的信息需要多位比特来表示。
计算机组成原理第二章第4讲字符和字符串(非数值)的
其字符集内容与UCS的BMP相同。
• GBK码
GBK等同于UCS的新的中文编码扩展国家标准,2字节表示一个汉字
第一字节从81H~FEH,最高位为1;
第二字节从40H~FEH,第二字节的最高位不一定是1。
• BIG5编码
整理ppt
5
2.1.3字符和字符串(非数值)的表示 方法
2、字符串的表示
字符串是指连续的一串字符,通常方式下, 它们占用主存中连续的多个字节,每个字节 存一个字符。
当主存字由2个或4个字节组成时,在同一 个主存字中,既可按从低位字节向高位字节 的顺序存放字符串的内容,也可按从高位字 节向低位字节的次序顺序存放字符串的内 容。
➢ 机内码范围是:A1A1H~FEFEH
整理ppt
14
汉字编码体系
汉字
国标码
汉字内码
中 8680(01010110 01010000)B
(11010110 11010000)B
华 5942(00111011 00101010)B
(10111011 10101010)B
“西”的区位码是4687,求其内码?
➢ 汉字字形码:也叫字模码,确定一个汉字字形点 阵的编码,用于汉字显示和打印输出。保留在存 储介质中的全部汉字字形码称为字库。
➢ 汉字地址码:表示汉字字形信息在汉字库中的地 址,用于在汉字库中查找汉字字形信息的汉字地 址码等。
整理ppt
10
汉字编码体系
➢ 区位码:
将字符按其排列位置划分成94区×94位,以字 符所在区位编码。
字符和字符串(非数值)的 表示方法
整理ppt
1
2.1.3字符和字符串(非数值)的表示 方法
➢ 符号数据:字符信息用数据表示,如ASCII 等;
大学计算机基础教案计算机与计算思维教案(二)
第2讲计算机与计算思维(二)课时内容计算机与计算思维(二)授课时间课时 2教学目标☑掌握二进制数与其他进制之间的数值转换☑了解计算机中信息的表示和存储☑了解计算思维教学重点☑计算机中的数据及其单位、计算机中字符的编码规则☑计算思维的概念和计算思维的本质教学难点☑数制及其转换的方法☑二进制数的运算方法☑计算机中字符的编码规则教学设计1、教学思路:(1)讲解计算机中信息的表示和存储,包括认识计算机中的数据及其单位,以及计算机中常用的进位数制的表示方法;(2)讲解计算机信息处理的表示,非数值数据的编码。
(3)讲解计算思维的概念。
2、教学手段:(1)通过演示讲解基础知识,以及常见的二进制数的运算例题,讲解结束后通过课后练习巩固所学知识;(2)对于重点内容着重讲解。
3、教学资料及要求:除教材中的实例外,可以补充讲解思维,逻辑思维,实验思维,计算思维的的特征和代表学科,以及计算思维的应用领域,加深学员的知识面。
教学内容讨论问题:1、什么是信息?2、怎么将二进制数转换成八进制、十六进制数?3、什么是计算思维?内容大纲:具体可结合本章的PPT课件进行配合讲解。
任务一数值及不同进制之间数值的转换任务要求:掌握进位计数制的基本概念;掌握不同进制数之间的互相转换。
相关知识:计算机表示数值的方法。
按进位的方法进行计数。
任务实现:(一)进位计数制按进位的方法进行计数,称为进位计数制。
为了电路设计的方便,计算机内部使用的是二进制计数制,即“逢二进一”的计数制,简称二进制(Binary)。
但人们最熟悉的是十进制(Decimal),所以计算机的输入/输出也要使用十进制数据。
此外,为了编写程序的方便,还常常会用到八进制(Octal)和十六进制(Hexadecimal)。
下面介绍这几种进位计数制和它们之间的转换。
1.十进制任意一个十进制数都可以表示为一个按位权展开的多项式之和,如十进制数5678.4可表示为:5678.4=5 ⨯103+ 6 ⨯102+ 7 ⨯101+8 ⨯100+ 4 ⨯10−1其中,103、102、101、100、10−1分别是千位、百位、十位、个位和十分位的位权。
1.2信息编码-非数值信息编码
为什么7位二进制数就能够表示出 128个代码呢?计算机中的存储器用来 存储计算机运行时的数据、程序等,它 在存放ASCⅡ码时,占用1个字节 (Byte),相当于8位二进制数,在存 放ASCⅡ码时占用一个字节的右面7位, 剩下的最左面一位用“0”填充。
如果内存中有一个字节的内容是65,它究 竟代表的是65这个数值,还是表示字母“A”, 或是其它呢?计算机中会设置相应的数据类型 加以区分这些数码,也就是说首先将他们归类, 然后再进行相应的机器识别。 例:如果规定显示的为字符类型,则这个 65就表示字母“A”;如果规定为数值类型, 那么这个65它就表示65这个数值。
汉字输出
3.处理码 处理码是计算机内部用于信息处理的汉字 代码,也称汉字机内码。 计算机内部怎么区分汉字编码和ASCⅡ码? 为了在计算机内部能够区分是汉字编码还 是ASCⅡ码,将区位码的 每个字节的最高位 设置为“1”,并将区号和位号各增加一个适当 的常数,构成汉字机内码。这样,汉字机内码 的每个字节都大于128,而每个西文字符的 ASCⅡ码值均小于128。
ASCⅡ码简介
ASCⅡ码是美国信息交换标准委员会制 定的7位二进制码,共有128种元素(详见书本 的第6页表1.2.3 ASCⅡ字符编码表)。它包括 两部分:94个图形字符码和34个控制符码, 图形字符码包括52个大小写英文字母、10个 数字符号、32个标点及其他常用符号(如@$% 等)。其中34个控制符不可以打印显示,而其 余的94个可以全部打印显示出来。
阅读教材P7回答输入码有那些种类?(1分钟)
• 按照汉字的音特征编码,称为音码(如 只能拼音码、搜狗拼音输入法、QQ拼 音输入法等等); • 按照汉字的形体结构特征编码,称为形 码(如五笔字型码) • 以字音为主,辅以字型特征的编码,称 为音形码。反之,则称为型音码。
计算机信息编码_图文
2.2.1 数值信息编码_数制
• 进位计数制三要素:
– 基数(Radix):若一种数制由R个基本字符组成 ,则基数为R;
– 位权(Weight):固定的数值大小,不同位上所 代表的数值的大小=(基数)位序-1;
• 位权是指一个固定值,是指在某种进位计数制中,每 个数位上的数码所代表的数值的大小,等于在这个数 位上的数码乘上一个固定的数值,这个固定的数值就 是这种进位计数制中该数位上的位权。数码所处的位 置不同,代表数的大小也不同。
2 2
2
73510 = (1011011111)2
735
余数
367 ……... 1
183 ……... 1
91 ……... 1
45 ……... 1 22 ……... 1
11 ……... 0
5 ……... 1
2 2 ……... 1 2 1 ……... 0 0 ……... 1
2.2.2 数值信息编码_数制转换
计算机信息编码_图文.ppt
Chp.2 计算机中信息的表示及编码
内容简介与提要
2.1 信息编码基本概念 2.2 数值信息编码 2.3 非数值信息编码
Chp 2 计算机中信息表示及编码
基本要求
掌握二进制与不同进制数之间的转换算 法;
二进制数在计算机内的表示; 常用的文字信息编码如ACCII码和汉字
– 将机器内存放的正负号数码化的数据成为机器数
。
+91D
-91D
01 011011
符号位
真值
1 1 0 1 1 0 11
机器数
2.2.5 数值信息编码_整数的表示法
带符号的整数表示范围:
2022年计算机等级三级-编非数值数据的表示
2022年计算机等级三级:编非数值数据的表示计算机除了具有进展数值计算力量之外, 还具有进展非数值计算的力量。
现在, 后者的应用领域已远远超过了前者的应用领域, 如:文字处理、图形图象处理、信息检索、日常的办公治理等。
所以, 对非数值信息的编码就显得越加重要。
1、ASCII码ASCII码(American Standard Code for Information Interchange)是目前应用极其广泛的一种信息编码, 很多计算机系统都是采纳它为字符进展编码。
它是一种7位二进制编码。
右表是ASCII码的详细编码方案。
在该表中, 对学习本课程有用的主要信息有:字符’0’~’9’是连续编码的, 其编码的低4位就是该字符在十进制中的数值;小写字母的编码比大写字母的编码大, 对应字母的编码之间相差20H。
固然, 从ASCII码表中还可看出其它有用信息, 还有扩展的ASCII 码等学问, 但这些内容对学习本课程的帮忙不明显, 故不再表达。
有兴趣的读者可参阅其它书籍。
表1.3 ASCII码的编码方案高位低位 0000010100111001011101110000NULDELSP0@P`p0001SOHDC1!1AQaq0010STXDC2“2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQNAK%5EUeu0110ACKSYNK[k{1100FFFS 《L\l|1101CRGS-=M]m}1110SORS.》N^n~1111SIUS/?O_oDel2、汉字编码ASCII码是针对英文的字母、数字和其它特别字符进展编码的, 它不能用于对汉字的编码。
要想用计算机来处理汉字, 就必需先对汉字进展适当的编码。
我国在1981年5月对6000多个常用的汉字制定了交换码的国家标准, 即:GB2312-80。
该标准规定了汉字交换用的根本汉字字符和一些图形字符, 它们共计7445个, 其中汉字有6763个。
非数值数据的编码表示
⾮数值数据的编码表⽰⾮数值数据:逻辑值、字符等数据都是⾮数据值数据,在机器内部它们也⽤⼆进制表⽰。
逻辑值:逻辑数据和数值数据都是⼀串0/1的序列,在形式上⽆任何差异,需要通过指令的操作码类型来识别他们。
西⽂字符:西⽂字符由拉丁字母、数字、标点符及⼀些特殊符号所组成,它们统称为字符。
汉字字符汉字系统必须处理这⼏种汉字代码:输⼊码、内码、字模点阵码。
汉字特点汉字是表意⽂字,-个字就是-个⽅块图形。
汉字数量巨⼤,总数超过6万字,给汉字在计算机内部的表⽰、汉字的传输与交换、汉字的输⼊和输出等带来了⼀系列问题。
编码形式:输⼊码:对汉字⽤相应按键进⾏编码表⽰,⽤于输⼊。
内码:⽤于在系统中进⾏存储、查找、传送等处理。
字模点阵或轮廓描述:描述汉字字模点阵或轮廓,⽤于显⽰/打印。
输⼊码:汉字的输⼊码的码元(及组成编码的基本元素)是西⽂键盘中的某个按键。
汉字内码的选择考虑因素:不能有⼆义性即不能和ASCII码有相同的编码、要与汉字在字库的位置有关系以便查找处理、编码应当尽量短。
GB2312国标字符集:由三部分组成,第⼀部分是字母、数字和各种符号,包括英⽂、俄⽂、⽇⽂平假与⽚假名、罗马字母、汉语拼⾳等共687个,第⼆部分分为⼀级常⽤汉字,共375个,按汉语拼⾳排列,第三部分分为⼆级常⽤字,共3008个,按偏旁部⾸排列。
GB2312-80字符集:字母、数字和各种符号,包括英⽂、俄⽂、⽇⽂平假名与⽚假名、罗马字母、汉语拼⾳等共687个.⼀级常⽤汉字,共3755个,按汉语拼⾳排列.⼆级常⽤汉字,共3008个,不太常⽤,按偏旁部⾸排列。
汉字的区位码码表由94⾏、94列组成,⾏号为区号,列号为位号,各占7位。
指出汉字在码表中的位置,共14位,区号在左)位号在右。
汉字的国标码每个汉字的区号和位号各⾃加上32(20H),得到其“国标码”。
国标码中区号和位号各占7位。
在计算机内部,为⽅便处理与存储,前⾯添⼀个0,构成⼀个字节。
多媒体信息的表⽰图形、图像、⾳频、视频等信息在机器内部也⽤0和1表⽰。
计算机组成原理——第3章2之信息编码及数据表示
第3章信息编码与数据表示• 3.4 浮点机器数表示方法– 3.4.1 浮点数的格式•浮点数的典型格式N=M*RE –阶符,数符。
阶码一般采用移码和补码表示。
尾数一般采用原码和补码表示。
–E :定点整数。
E 决定了浮点数N 的绝对值;E S 不是N 的符号–M :定点小数。
M S 决定了浮点数N 的符号;M S =0,则N 为正数,M S =1,则N 为负数 E 1E 2……E m .阶码数值尾数数值. M 1M 2……M nE S M S 阶符数符IEEE 754 国际标准常用的浮点数格式有3种,阶码的底隐含为2短实数又称为单精度浮点数,长实数又称为双精度浮点数,临时实数主要用于进行浮点数运算,保存临时的计算结果。
单精度浮点数和双精度浮点数的阶码采用移码,但不同的是:它的偏移量不是27和210,而是27-1=127和210-1=1023;尾数使用原码表示,且采用隐藏位,也就是将规格化浮点数尾数的最高位的“1”省略,不予保存,认为它隐藏在尾数小数点的左边。
由此,推导出它们的真值计算公式如上表,其中E为阶码ESE1……Em的加权求和的值。
Ms Es E1…E8M1M2…M23Ms Es E1…E11M1M2…M52IEEE754单精度格式IEEE754双精度格式例 3.10:若X 和Y 均是IEEE 754 标准的单精度浮点数,若X 浮点数的存储形式为41360000H ,求X 的真值。
若Y=-135.625,求Y 的浮点数表示。
解:(1)[X]浮= 0100 0001 0011 0110 0000 0000 0000 0000 B按照表3-3中的真值计算公式及IEEE 754 标准的单精度浮点数格式,可以知道:M S =0 ,E=E S E 1……E m = 10000010 B = 130 D ,1. M 1M 2…… M n = 1.011 0110 0000 0000 0000 0000 ,所以,X =(-1)MS ×(1.M 1M 2…… M n )×2E -127= (-1)0×(1. 011 011)×2130-127;X=(+1011.011)2= (+11.375 )10(2)Y=(-10000111.101)2;Y =-1. 0000111101×27=(-1)1×(1.0000111101)×2134-127;因此:M S =1 ,E=E S E 1……E m = 134 D = 10000110 B ,1.M1 M2…… Mn = 1. 000 0111 1010 0000 0000 0000 ,求出:[Y]浮= 1 10000110 000 0111 1010 0000 0000 0000 B = C307A000 H–3.4.2 规格化定义:采用规格化形式表示浮点数可以提高精度。
计算机中的非数值信息
中文信息编码(按处理过程分)
• 汉字输入码(对应输入法) –数码 –音码 –形码 –音形码
汉字交换码与汉字机内码
• 一个汉字由两个字节表示,我国国家标准 局采用了加以修正的两字节汉字编码方案 ,只用了两个字节的低7位 ,但为了与标 准ASCII码兼容,每个字节中都不能再用 32个控制功能码和码值为32的空格以及 127的操作码。所以每个字节只能有94个 编码。这样,双七位实际能够表示的字数 是:94×94=8836个。
汉字交换码与汉字机内码
• GB2312-80,即信息交换用汉字编码字符集基本 集,其中共收录汉字和图形符号(682个)7445 个 ,可以表示为国标码和区位码,若在计算机 中使用,还要转化成机内码(国标码的高位变1 )。
• GB 18030是GB 2312的扩展,共收录了2.7万个 汉字中的非数值信息
• 数字编码 –BCD编码(如8421码,十进制的一位对应二进制的4 位) • 西文字符编码 –ASCII码
• 中文信息编码(按处理过程分)
–汉字输入码 –汉字交换码(GB2312-80,Unicode)
–汉字机内码
–汉字字形码(输出码) • 多媒体信息编码 –信息经过数字化后,以某种二进制形式表示。
多媒体信息编码
• 在计算机中存储和处理图形要用二进制数字编 码的形式。表示一幅图片或屏幕图形最直接的 方式是“点阵表示”。 • 在这种方式中,图形由排列成若干行、若干列 的像元(pixels)480行,每行640个点,则该 图形的分辨率为640×480。 • 点阵表示的存储空间计算
• 黑白像元 一个二进制位表示一个像元, 640×480的像元阵列需要640×480 / 8 = 38400字节。 • 256级灰度像元 一个像元用一个字节表示, 640×480的像元阵列需要640×480 = 307200 字节 。 • 真彩色图形 任何颜色的光都可以由红绿蓝三 种纯的基色(光)通过不同的强度混合而成, “真彩色”的图形显示,就是用三个字节表示 一个点(像元)的色彩,其中每个字节表示一 种基色的强度,强度分成256个级别 ,要表示 一个640×480的“真彩色”的点阵图形,需要 将近106(1MB)的存储空间。
沪教版(2019)高中信息技术 必修1 项目二 探究计算机中的数据表示——认识数据编码 教案(4课时)
项目二探究计算机中的数据表示——认识数据编码
■学习目标
(1)了解数据编码的意义和作用,体会数据编码的基本思想与方法。
(2)经历数值数据编码的过程,掌握数值数据编码的基本方法。
(3)了解计算机处理文本数据的基本过程,知道常用的文本数据编码方式。
(4)经历声音数据数字化的过程,掌握声音数据数字化的基本方法,了解声音数字化的基本原理,知道采样频率、量化位数和声道数对数字化音频文件大小及效果的影响。
(5)经历图像数字化的过程,掌握图像数字化的基本方法,了解图像数字化的基本原理,知道分辨率和量化位数对位图的影响。
(6)亲历方案设计、对比分析、探究实验等学习活动,体会运用信息技术开展学习、解决问题的思想与方法。
(7)在数字化学习过程中掌握数字化学习的策略和方法,能够根据需要选用恰当的方法及合适的数字化工具和资源开展有效学习。
■教学准备
(1)软硬件环境:机房,音频编辑软件,图像处理软件。
(2)教学素材:各类数据编码实例和编码表,用于体验活动的声音文件和图像文件。
■教学重点和难点
(1)重点:编码的意义与作用,数值、文本声音、图像等类型数据的基本编码方式。
(2)难点:声音数字化和图像数字化。
非数值信息在计算机中的表示
非数值信息在计算机中的表示--- ASCII码、BCD码、汉字交换码、汉字机内码1、西文字符编码常用的字符编码有EBCDIC码和ASCII码。
IBM系列大型机采用EBCDIC码,微型机采用ASCII码。
(1)ASCII码ASCII码(American Standard Code for Information Interchange)是美国标准信息交换代码的简称。
ASCII码占一个字节,标准ASCII码为7位(最高位为0),扩充ASCII码为8位。
7位二进制数给出了128个编码,表示了128个不同的字符。
其中95个字符可以显示。
包括大小写英文字母、数字、运算符号、标点符号等。
另外的33个字符,是不可显示的,它们是控制码,编码值为0~31和127。
例如A的ASCII码为1000001,十六进制表示为41H。
回车符(CR)的ASCII码为13。
空格 20H'0'~'9' 30H~39H'A'~'Z' 41H~5AH'a'~'z' 61H~7AH2、数字编码:BCD码BCD码用4位二进制数表示一位十进制数。
3、汉字的编码(1)汉字交换码①汉字交换码(国标码): GB2312-80"信息交换用汉字编码字符集-基本集",规定了进行一般汉字信息处理时所用的7445个字符编码。
其中682个非汉字图形字符和6763个汉字代码。
汉字代码中又有一级常用字3755个,二级次常用字3008个。
两个字节存储一个国标码。
②区位码:将国标码放置在一个94行*94列的矩阵中,每一行称为一个"区",用区号表示;每一列称为一个"位",用位号表示,一个汉字的区号和位号合在一起构成"区位码"。
国标码=区位码(十进制)的两个字节分别转换为十六进制后加20H。
(2)汉字的输入码为将汉字输入计算机而编制的代码称为汉字输入码。
信息的编码
输出
内码
1.汉字输入:
自动识别方式:包括汉字字形的自动识别和汉字语 音的自动识别。 汉字输入 将汉字编码输入,称为输入码,输入码分按汉字的 音、形活其他一些特征对指定的汉字集编制相应的 代码,比如智能ABC,搜狗拼音,五笔输入法等等。
2.交换码
交换码是用于汉字信息处理系统之间或者与通信系统进行信息交换的汉 字代码,简称交换码。 为了方便各种数字系统之间的汉字信息的通信交换,在1981年,国家就颁 布了编号为GB2312-80的标准《信息交换用汉字编码及字符集》,这种汉 字信息交换用的代码又称为区位码。每个区94个位,构成一张94*94个单元 的表格。每个字符占一个单元,因此每个字符都可以用其所处的“区号” 和该区的“位号”表示。在计算机中一红第一个字节标记区码,第二个字 节标记位码。
h
i j | } ~ DEL
—
11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
VT FF CR SO SI DLE DCI DC2 DC3 DC4 NAK SYN TB CAN EM SUB ESC
43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
+ , . / 0 1 2 3 4 5 6 7 8 9 : ;
75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91
K L M N O P Q R X T U V W X Y Z [
107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123
ASCII表
非数值数据的编码_大学计算机基础 (微课版)_[共2页]
0 0 0 1 0 0 1 0+ 1 1 1 1 0 0 1 11 0 0 0 0 0 1 0 1最高位进位自动丢失后,结果的符号位为0,即为正数,补码原码同形。
转换为十进制数即为+5,运算结果正确。
(2)25 − 36 = −11由式25 − 36 = 25 + (− 36),则8位补码计算的竖式如下:0 0 0 1 1 0 0 1+ 1 1 0 1 1 1 0 01 1 1 1 0 1 0 1结果的符号位为1,即为负数。
由于负数的补码原码不同形,所以要将其求补得到原码:1 0 00 1 0 1 1,再转换为十进制数即为−11,运算结果正确。
4.计算机中数的浮点表示前面已经了解了数的浮点表示形式,即阶码和尾数的表示形式。
原则上讲,阶码和尾数都可以任意选用原码、补码或反码,这里仅简单举例说明采用补码表示的定点纯整数表示阶码、采用补码表示的定点纯小数表示尾数的浮点数表示方法。
例如,在IBM PC系列微机中,采用4个字节存放一个实型数据,其中阶码占1个字节,尾数占3个字节。
阶码的符号(简称阶符)和数值的符号(简称数符)各占一位,且阶码和尾数均为补码形式。
当存放十进制数+256.8125时,其浮点格式为:0 000 100 1 0 1000000 00110100 00000000阶符 数符 尾数即(256.8125)10 = (0.1000000001101 × 21001)2。
当存放十进制数-0.21875时,其浮点格式为:1 111 1110 1 0010000 00000000 00000000阶符阶码数符尾数即(-0.21875)10 = (-0.00111)2=(-0.111 × 2-010)2。
由上例可以看到,当写一个编码时必须按规定写足位数。
另外,为了充分利用编码表示高的数据精度,计算机中采用了“规格化”的浮点数的概念,即尾数小数点的后一位必须是非“0”。
即对正数小数点的后一位必须是“1”;对负数补码,小数点的后一位必须是“0”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
汉字代码之间的关系
区位码和国标码的转换:将汉字的十进制区号和位号分别转 换为十六进制,然后分别加上20H,就成为汉字的国标码。 国标码高位字节=(区号)H+20H 国标码低位字节=(位号)H+20H
"德"的区位码为2134 国标码 高位字节=(21)(十进制)+20H(十六进制)=15H+20H=35H 低位字节=(34)(十进制)+20H(十六进制)=22H+20H=42H 所以,国标码为3542
非数值信息的编码
1. 英文字符的编码 2. 汉字编码 3. 图形、图像和声音的编码
1. 英文字符的编码
ASCII码(美国国家信息交换标准码)
计算机内无法直接表示英文字母和各种符号,故必须对其 编码。目前最广泛使用的是ASCII码,用7位二进制数表示一 个字符,包含数字,大小写英文字母,常用标点和运算符 号以及控制字符,共128个。 A:1000001=》65 Z:1011010=》90
a:1100001=>97
z:1111010=>122
规律:数字、大写字母、小写字母的ASCII码递增。
பைடு நூலகம்
2. 汉字编码
(1)汉字信息交换码(国标码)
所有的国际汉字和符号组成一个94*94的矩阵,该方阵中,行称为 “区”,列称为“位”,这样就有94个区号和94个位号,一个汉字所 在的区号和位号简单的组合在一起就构成了该汉字的“区位码”。区位 码高两位为区号,低两位为位号。
(2)汉字输入码 (3)汉字机内码:汉字输入计算机而编制的代码。
机内码与区位码 机内码高位字节=(区号)H+A0H 机内码低位字节=(位号)H+A0H
"德"的区位码为2134 机内码 高位字节=(21)(十进制)+A0H(十六进制)=15H+A0H=B5H 低位字节=(34)(十进制)+A0H(十六进制)=22H+A0H=C2H
机内码=国标码+8080H
4)汉字字形码(5)汉字地址码
点阵字形就是用点阵来描述汉字的字形,这个点阵用一组 二进制来编码。如“学”的16*16字形点阵中,每行16位 二进制数,即2B,共16行,所以在此点阵中每个汉字字形 占32B.
24*24点阵的每个汉字字形占24*24/8=72B 64*64点阵的每个汉字字形占64*64/8=512B