信息数字化 正式
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
十进制与二进制的转换
(1)十进制转换为二进制的法则是:除以2反序取余法 2 65 32 余数 1 0 0 0 0 0 1
2 2 16 2 8 2 4 2 2 2 1 0
低
高
(65)10 =( 1000001)2
二进制转换为十进制
(2)二进制转换为十进制的法则是:乘权求和法。 (1000001)2=(65)10 1*2^6+0*2^5+------ 0*2^1+1*2^0=65
ASCII码
目前通用的是美国国家标准学会规定的ASCII。它由7位二进制 数编码字符集组成,共有2^7=128个 字符编码。它包括: A、大小写字母(A~Z、a~z) B、十进制 数(0~9) C、运算符和标识符(*、–) D、控制符(CR) 以后又改进为8位(占一个字节)二进制数组成的扩展的ASCII, 共有2^8=256个字符。
数字化信息的特点:易于表示与存储、易于处理和检索、易 于传播和集成、易于获取与共享等。
一、文字信息的数字化
你有没有想过敲
击的字符如何显 示到屏幕
01100001 a
1. 字符编码
ASCII是“美国信息交换标准码”的英文缩 写,用来制订计算机中每个符号对应的代 码,这也叫做计算机的内码(code)。 一个字节的低7位表示,共有128个编码。 如:A-----65 (1000001) a ----97 (1100001)
0
0
1
0
1
0
1
1
字节(Byte)
基本单位 位、比特(bit) 最小单位
1 Byte = 8 bit
1 KB = 1024 B 1 GB = 1024 MB
1 MB = 1024 KB 1 TB = 1024 GB
1、信息为什么要用数字化表示
我们大致可以将这些非数字化资料归纳成文本、 图像、声音和视频等几类,它们要经过数字化的 过程才能由计算机处理。
3.计算机处理汉字的过程
2、计算机处理汉字的过程
4、OCR技术:
OCR(Optical Character Recongition), 叫做光学字符识别技术,它要求首先把要输入的 文稿通过扫描仪转化为图形才能识别,一般最好 是印刷体的文字,比如图书、杂志等,文字识别 包括以下几个步骤:图文输入、预处理、单字识 别和后处理等。 在系统对图形进行识别后,系统会把不能肯定 的字符标记出来,让用户自行修改。 演示
模拟信号 采样 量化 编码
二进制编码
数字音频
过程:声音 -- 采样 -- 量化 -- 编码 -- 数字音频 数字音频的质量取决于:采样频率、量化位数、声道数
声音的数字化原理
对于声波,通用是根据声波在指定点位 于0线之上或之下的量,用一个二进制数 记录。
声卡的工作原理
4、声音的信息表示
采样频率:是指1秒钟内的采样次数。计算机音频处理中,常用的采样频率有
获、处理并生成数字视频信号的过程。
特点:数字视频信号可以在无损的情况下无限次地 复制和长时间地保存,方便进行编辑和加工。 两种方式: 1、 将模拟视频信号数字化 2、 由数码摄像机之类的设备直接摄制。
视频是由一连串相关的静止图象组成,我们将一幅图象 称为一个帧。
第一帧
第二帧
计算:假如视频一秒钟要显示30帧,那么一 段播放时间为1秒钟,分辨率为640*480像素的 256色的视频占多少存储容量(单位KB)?
实现过程: 原始图
非数字 化图像
每个人对应图上某一点 采样
人为表示该点 量化
拼出图像
数字化 图像
图像的数字化
采样频率:采样点之间的间隔大小,采样频率越
高,获取的样本就细腻逼真,图像的质量越高
量化等级:是指图像样本量化后每个采样点用多
少位二进制数表示,它反映了采样的质量
了解数码相机
与传统相机相比,数码相机(Digital Camera)有许多诱人的魅力,例如“即拍即得”,刚 刚拍摄的照片立即可以显示在相机的显示屏上, 如果照片不满意还可以马上删掉重拍。 数码相机通过镜头拍摄人物或景物,又将这个图像转换成数字的图像文件,通过PC卡或 者电缆转送至计算机。 数码相机分辨率的高低决定了所拍摄影像最终所能打印出画面的大小,或在计算机显 示器上所能显示画面的大小。数码相机分辨率的高低,取决于相机中CCD(Charge Coupled Device:电荷耦合器件)芯片上像素的多少,像素越多,分辨率越高。 使用数码相机拍照时,往往有几组数字供我们选择:640×480, 1024×768, 1600×1200, 2048×1536,……每一组数字中,前一数字表示在照片的长度方向上所 含的像素点数,后一数字表示在宽的方向上所含的像素点数,两者的乘积,就是像素数; 例如1600×1200=1920000≈2000000,就是200万(像素)。
640 * 480 * 8 * 30 = 73728000 (bit) 73728000 / 8 / 1024 = 9000 (KB)
信息的数字化表示
文本信息 声音信息 图像信息 视频信息
.txt .doc .mp3 .wma .wav .rm .mid .jpg(jpeg) .gif .bmp .avi .mpeg .mov .flv .rmvb
现在有一幅图像只有黑和白两种颜色,计算机可以怎么来表示呢,它占的二进制位有多少位?
计算机中的表示:
“黑” —— ―1‖ ―白” —— ―0‖
存储空间:
图像有多少个 像素,乘上每个像 素几个位。
一幅分辨率为800×600的黑白图像需要占几个二进制位?
步骤分析: 分辨率为800×600 黑白图像 图像有800×600=480000个像素
黑和白两种状态,一个位就能表示两种状态。
计算过程:= 800×600 ×1=60000(位)
一幅16位位图图像,分辨率为800*600,占多少二进制位?
16位位图图像,表示每个像素需要16位来表示 计算过程:=800*600* 16
4、声音的信息表示
文字符号可以通过编码的方法在计算机中存 储表示(数字化),声音图像如何数字化,在计算 机中又存储表示呢? 声音信号
上机实践
2、信息的数字化过程
信息的数字化过程:就是利用仪器设备把非数字化资料采集 为声光电等物理信号(模拟信号),再经过采样量化和数字 编码,转换成用二进制数字表示的数字信息,最后进入计算 机存储保存。 模拟信号 采样 量化 编码
采样:是以相等的间隔来测量模拟信号的物理量,完成对连续 模拟信号的离散化提取。 量化:是将采样值变换到最接近的数字值,即用有限个数的 数值近似表达原来连续变化的值。 编码:是把量化后的值用一组二进制数字代码表示。 (参考P32“数字化原理”)
图Βιβλιοθήκη Baidu的数字化表示
1、图像是如何输入计算机的
通过扫描仪、数码相机、绘图软件等
图片通过某种方式输入计算机后,需 要在计算机内部进行处理。而计算机内部 是用二进制处理信息的。 所以,在处理图片之前,要先将图片 转换成二进制信息。
计算机内部表示图片的方法
位图、矢量图 所谓位图,又称光栅图,是由许多像小方块一样 的像素组成的图形。简单地说,位图就是以无数 的色彩点组成的图案。 当你无限放大时你会看到一块一块的像素色块, 效果会失真。
信息的数字化
计算机是处理01的工具
为什么采用二进制?
可行性:电子元件易实现 可靠性:状态稳定 简易性:算法简单
求和法则
0+0=0 , 0+1=1+0=1 , 1+1=10 求积法则 0*0=0 ,0*1=1*0=0 ,1*1=1
逻辑性:可用进制的0,1直接代表逻辑代 数中的“假”和“真”。
首先要把图片打格子分成若干小块,每块用一个数字来表示一种颜色。 如果图像是纯黑白两色的,那每块只用1或0表示即可。若图像是16色 的,每块用4位二进数表示,因为2^4=16,即4位二进制有16种组合, 每种组合表示一种颜色就行了。真彩色位图的每个小块,都是由不同 等级的红绿蓝三种色彩组合的,如图所示,每种颜色有2^8个等级, 所以共有2^24种颜色, 因此每小块需要24位二进制数来表示。
文本的信息表示
OCR技术的应用: 扫描仪的应用:用于图象制作、文字识别和图象 识别等领域
平板式扫描仪 手持式的扫描仪
滚筒式的扫描仪
2、图像的信息表示
将图像上每个点的颜色信息按某种规律编成
一系列二进制编码,即用0和1表示图像信息 的过程就是图像数字化。
主要有两个参数:
采样频率 图像样本的量化等级
•ASCII码值 A B C---- a 65 66 67
b
c----99
0 1
2---
CR
13
——
32
97 98
48 49 50
ASCII码表
000 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI 001 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US ! ― # $ % & ‗ ( ) * + , 。 / 010 011 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 100 @ A B C D E F G H I J K L M N O 101 P Q R S T U V W X Y Z [ \ ] | — a b c d e f g h i j k l m n o 110 111 p q r s t u v w x y z { | } _ DEL
因为计算机是用二进制编码方式工作的、它 无法直接理解人们日常接触到的信息,所以计算 机需要采用数字化编码的形式对信息进行存储、 加工、传送。
二进制表示数据
表现: 只有0和1两个数码 逢二进一
十进制 二进制
0 1 2 3 4 5 6 7 8 9
0 1 10 11 100 101 110 111 1000 1001
11.025kHz、22.05kHz和44.1kHz。 量化位数:是指描述每个采样点值的二进制数位。常用的量化位数为8位和16位。 声道数:又称为声音通道的个数,是指一次采样同时记录的声音波形个数。随着 声道数的增加,存储容量也相应增大。
5、视频的信息表示
数字视频:以一定的采样频率对模拟视频信号进行捕
2、汉字的编码:
汉字字符的编码技术相对复杂。具体有GB2312 汉字编码标准(信息交换用汉字编码字符集), 简称国标码。GB2312收录简化汉字及符号、字 母、日文假名等共7445个图形字符,每个汉字占 两个字节,共6763个。 GBK是GB2312的扩展, 收录汉字20902个。台湾地区用的是BIG5码。 GB2312-2000 ---94区94位 区码+位码:一个汉字用两个字节存储。 16 01 —— “啊”