信息数字化 正式PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字化信息的特点:易于表示与存储、易于处理和检索、易 于传播和集成、易于获取与共享等。
一、文字信息的数字化
你有没有想过敲 击的字符如何显 示到屏幕
a
1. 字符编码
ASCII是“美国信息交换标准码”的英文缩 写,用来制订计算机中每个符号对应的代 码,这也叫做计算机的内码(code)。
一个字节的低7位表示,共有128个编码。
0 0 1 0 10 1 1
位、比特(bit) 最小单位
字节(Byte) 基本单位
1 Byte = 8 bit
1 KB = 1024 B 1 GB = 1024 MB
1 MB = 1024 KB 1 TB = 1024 GB
1、信息为什么要用数字化表示
我们大致可以将这些非数字化资料归纳成文本、 图像、声音和视频等几类,它们要经过数字化的 过程才能由计算机处理。
GB2312-2000 ---94区94位 区码+位码:一个汉字用两个字节存储。 16 01 —— “啊”
3.计算机处理汉字的过程
2、计算机处理汉字的过程
4、OCR技术:
OCR(Optical Character Recongition), 叫做光学字符识别技术,它要求首先把要输入的 文稿通过扫描仪转化为图形才能识别,一般最好 是印刷体的文字,比如图书、杂志等,文字识别 包括以下几个步骤:图文输入、预处理、单字识 别和后处理等。 在系统对图形进行识别后,系统会把不能肯定 的字符标记出来,让用户自行修改。
数码相机分辨率的高低决定了所拍摄影像最终所能打印出画面的大小,或在计算机显 示器上所能显示画面的大小。数码相机分辨率的高低,取决于相机中CCD(Charge Coupled Device:电荷耦合器件)芯片上像素的多少,像素越多,分辨率越高。
信息的数字化
计算机是处理01的工具
为什么采用二进制?
可行性:电子元件易实现 可靠性:状态稳定 简易性:算法简单
求和法则 0+0=0 , 0+1=1+0=1 , 1+1=10 求积法则 0*0=0 ,0*1=1*0=0 ,1*1=1
逻辑性:可用进制的0,1直接代表逻辑代 数中的“假”和“真”。
•ASCII码值 A B C---- a b c----- 0 1 2--- CR ——
65 66 67 97 98 99 48 49 50
13 32
ASCII码表
000
001
010
0 11
100
101
11 0
111
0000
N UL
DLE
0
@
P
p
0001
SOH
DC1
!
1
A
Q
a
q
0010
STX
DC2
;
K
[
k
{
11 0 0
FF
FS
,
<
L
\
l
|
11 0 1
CR
GS
-
=
111 0
SO
RS
。
>
1111
SI
US
/
?
M
]
m
}
N
|
n
_
O
—
o
Baidu Nhomakorabea
DEL
2、汉字的编码:
汉字字符的编码技术相对复杂。具体有GB2312 汉字编码标准(信息交换用汉字编码字符集), 简称国标码。GB2312收录简化汉字及符号、字 母、日文假名等共7445个图形字符,每个汉字占 两个字节,共6763个。 GBK是GB2312的扩展, 收录汉字20902个。台湾地区用的是BIG5码。
如:A-----65 (1000001)
a ----97 (1100001)
ASCII码
目前通用的是美国国家标准学会规定的ASCII。它由7位二进制 数编码字符集组成,共有2^7=128个
字符编码。它包括: A、大小写字母(A~Z、a~z) B、十进制 数(0~9) C、运算符和标识符(*、–) D、控制符(CR) 以后又改进为8位(占一个字节)二进制数组成的扩展的ASCII, 共有2^8=256个字符。
2、信息的数字化过程
信息的数字化过程:就是利用仪器设备把非数字化资料采集 为声光电等物理信号(模拟信号),再经过采样量化和数字 编码,转换成用二进制数字表示的数字信息,最后进入计算 机存储保存。
模拟信号 采样 量化
编码
采样:是以相等的间隔来测量模拟信号的物理量,完成对连续 模拟信号的离散化提取。 量化:是将采样值变换到最接近的数字值,即用有限个数的 数值近似表达原来连续变化的值。 编码:是把量化后的值用一组二进制数字代码表示。 (参考P32“数字化原理”)
“
2
B
R
b
r
0 0 11
ET X
DC3
#
3
C
S
c
s
0100
EOT
DC4
$
4
D
T
d
t
0101
ENQ
N AK
%
5
E
U
e
u
0 11 0
ACK
SYN
&
6
F
V
f
v
0 111
BEL
ET B
‘
7
G
W
g
w
1000
BS
CAN
(
8
H
X
h
x
1001
HT
EM
)
9
I
Y
i
y
1010
LF
SUB
*
:
J
Z
j
z
1 0 11
VT
ESC
+
演示
文本的信息表示
OCR技术的应用: 扫描仪的应用:用于图象制作、文字识别和图象
识别等领域
平板式扫描仪 手持式的扫描仪
滚筒式的扫描仪
2、图像的信息表示
❖将图像上每个点的颜色信息按某种规律编成 一系列二进制编码,即用0和1表示图像信息 的过程就是图像数字化。
❖主要有两个参数: 采样频率 图像样本的量化等级
十进制与二进制的转换
(1)十进制转换为二进制的法则是:除以2反序取余法
2 65
余数
2 32
1
低
2 16
0
28
0
24
0
22
0
21
0
0
1
高
(65)10 =( )2
二进制转换为十进制
(2)二进制转换为十进制的法则是:乘权求和法。 ()2=(65)10 1*2^6+0*2^5+------ 0*2^1+1*2^0=65
因为计算机是用二进制编码方式工作的、它 无法直接理解人们日常接触到的信息,所以计算 机需要采用数字化编码的形式对信息进行存储、 加工、传送。
二进制表示数据
表现: 只有0和1两个数码 逢二进一
十进制 0 1 2 3 4 5 6 7 8 9
二进制 0 1 10 11 100 101 110 111
1000 1001
实现过程:原始图
非数字 化图像
每个人对应图上某一点 采样
人为表示该点 量化
拼出图像
数字化 图像
图像的数字化
❖采样频率:采样点之间的间隔大小,采样频率越 高,获取的样本就细腻逼真,图像的质量越高
❖量化等级:是指图像样本量化后每个采样点用多 少位二进制数表示,它反映了采样的质量
了解数码相机
与传统相机相比,数码相机(Digital Camera)有许多诱人的魅力,例如“即拍即得”,刚 刚拍摄的照片立即可以显示在相机的显示屏上, 如果照片不满意还可以马上删掉重拍。 数码相机通过镜头拍摄人物或景物,又将这个图像转换成数字的图像文件,通过PC卡或 者电缆转送至计算机。