数字媒体及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 包括 6763 个汉字和 682 个非汉字字符
• GB2312 构成:
一级常用汉字 3755 个,按汉语拼音排列 二级常用汉字 3008 个,按偏旁部首排列 非汉字字符 682 个
• GB2312 构成一个二维平面,分成 94 行和 94列, 行号称为区号,列号称为位号,两者组合就是汉字编码。 称为区位码。
2020/12/21
NJNU
30
常用(通用)图像编辑软件
微软公司 画图软件(paint):可查看和 编辑处理.jpg、.gif 或 .bmp图像
微软公司 imaging for windows
Microsoft Photo Editor
Ulead system 的PhotoImpact
ACD System公司的ACDSee32
相互交换使用,以兼容不同格式文本。
2020/12/21
NJNU
14
文本的类型
3、超文本
– 超文本采用一种网状结构来组织信息
– 一个超文本由若干个文本块组成,这些文本块称为节点
– 节点可以是文字、图形、图像、声音或视频
– 基于多媒体信息结点的超文本,也称为超媒体。
– 例:Windows中的 “帮助” 文件就是一种典型的超文
建 模 / 造 型 ( M o d e l i n g )
景 物 形 状 的
绘 制
模 型 ( m o d e l )
( R e n d e r i n g )
( I m a g e S y n t h e s i s )
景 物 形 状 的 视 图
2020/12/21
NJNU
33
2.计算机合成图像的应用
字符的点阵描述 2020/12/21
NJNU
字符的轮廓描述 21
5.2 图像与图形
数字图像按其生成方法可以分为两大类:
• 通过数字化设备获取的图像,它们称为取样图像 (sampled image)、点阵图像(dot matrix image)、位图图像(bitmap image),以下简称 图像(image)
2020/1•2/21像素深度:各种颜色(亮NJN度U )分量的位数之和
25
彩色图像的表示
红 色 分 量 绿色 分量
2020/12/21
NJNU
蓝色 分量
26
2. 图像的压缩编码
图像数据量的计算公式(以字节为单位):
数据量 = 图像水平分辨率×图像垂直分辨率×像素深度/ 8
数据压缩的必要性
数据压缩的两种类型:
承担文本输出任务的软件称为文本阅读器或浏览器:
• 嵌入在文本编辑(处理)软件中,如微软的 Word • 独立的软件:如 Adobe 公司的 Acrobat Reader,微软
公司的 IE 等
202ຫໍສະໝຸດ Baidu/12/21
NJNU
19
输出过程中字形的生成
文本展现过程中,字符形状的生成是一个关键 先根据字符的字体确定相应的字型库(font) 再按照该字符的代码从字型库中取出该字符的形
专业绘图软件:
• AutoCAD
• MAPInfo、ARCInfo
办公与事务处理、平面设计、电子出版等领域:
• Corel公司的CorelDraw,
• Adobe 公司的Illustrator,
• Macromedia公司的FreeHand,
• 微软公司的Microsoft Visio等
内嵌的绘图软件
例: “汉王”手写笔
正识率达到 90% 以上,识别速度超过12字/
秒
2020/12/21
NJNU
11
汉语语音识别
分类:
1) 孤立语音/连续语音识别 2) 小词汇量/大词汇量语音识别 3) 特定人/非特定人语音识别
• 现状:特定人连续语音识别率已达到 90% 以 上
• 目标:非特定人大词汇量的连续语音识别
• 目的:使文本内容正确,版面清晰整齐、美观大方
• 所见即所得: 编辑的效果在屏幕上可以立即看到 在屏幕上看到的效果与打印出来的效果一致
2020/12/21
NJNU
17
2. 文本处理软件
(1)面向通信的文本处理软件 :
Outlook Express
(2)面向办公的文本处理软件 :
MS Word , WPS2000
输入编码要求:易学、易记、效率高、 重码少、容量大
输入编码分类:
• 数字编码 • 字音编码 • 字形编码 • 形音编码
用不同的输入编码方法输入同一个汉字,其内码
是一样的
2020/12/21
NJNU
10
联机手写汉字识别
原理:用专用笔在专用书写板上书写汉字 (或符号)
计算机实时自动识别
用该汉字 (或符号) 对应的代码进行保 存
• 除了表达正文的字符和几个打印控制字符外,不含其 它格式信息和结构信息。简单文本又称为纯文本, ASCII文本,其文件的后缀为“ .txt”(文本文件)
• 简单文本为一种线性结构,由若干行构成,每行由若 干个字构成
2、丰富格式文本
• 在简单文本中增加格式控制和结构说明信息,构成丰 富格式文本
• RTF是一种中间格式,它的目的是使各种丰富格式文本
(1) 计算机辅助设计和辅助制造(CAD/CAM) (2) 利用计算机生成各种地形图、交通图、天气图、
海洋图、石油开采图等 (3) 作战指挥和军事训练 (4) 计算机动画和计算机艺术 (5) 其它:电子出版、数据处理、工业监控、
辅助教学、软件工程等
2020/12/21
NJNU
34
3. 矢量绘图软件
数字媒体及应用
5.1 文本与文本处理
文本:基于特定字符集的、按一定格式组织起来的、具有 上下文相关性的一个字符流,每个字符均使用编码表示。
文本处理
文本生成
文本编辑
(文本处理软件)
文本存储
电子 文本
(编辑器)
格式化的 电子文本
与传输
2020/12/21
文本展现
NJNU
2
(阅读器)
(1) GB2312 – 1980 汉字编码
• 无损压缩
• 有损压缩
压缩编码方法的评价:
• 压缩倍数的大小,
• 重建图像的质量(有损压缩时)
20•20/1压2/21缩算法的复杂程度
NJNU
27
图像压缩编码的国际标准
JPEG JPEG2000
2020/12/21
NJNU
28
3. 常用图像文件格式
要求:
• 熟悉常用的图像文件名 • 了解它们有什么特性和适用的场合
NJNU
8
二、文本的准备
文本信息的输入:
文 本 信 息 的 输 入
人 工 输 入
自 动 文 字 识 别
键 盘 输 入 联 机 手 写 输 入 语 音 输 入
自 动 识 别 输 入
自 动 文 字 识 别
印 刷 体 识 别
手 写 体 识 别
2020/12/21
NJNU
9
汉字键盘输入
汉字的键盘输入编码
名称
压缩编码方法
性质
典型应用
BMP
RLC
无损
Windows应用程序
TIF
RLC,LZW
无损
desktop publishing
GIF
LZW
无损
Internet
JPEG
DCT,Huffman
无损/有损 Internet,数码相机等
JP2 小波变换,算术编码 无损/有损 Internet,数码相机等
开发组织/公司 Microsoft
2020/12/21
NJNU
12
4.印刷体汉字识别输入
对于将现存的大量书、报、刊物、档案、资 料等输入计算机是非常重要的手段。
5.脱机手写汉字识别输入
是一种用于将预先手写好的文稿输入计算机 的方法,也是计算机字符识别中最困难的 一个问题。
2020/12/21
NJNU
13
三、文本的类型
1、简单文本(纯文本)
(3)面向印刷出版的文本处理软件:
“飞腾”排版软件,PageMaker,PDF Writer
(4)面向网络信息发布和电子出版的文本处理软件:
2020/12/21
NJNU
18
FrontPage, PDF Writer
五、文本的展现
过程:
1. 对文本的格式描述进行解释 2. 生成文字和图表的映像(bitmap) 3. 传送到显示器或打印机输出
2020/12/21
NJNU
6
(2) GBK汉字内码扩充规范
•总计 23940 个码位,共收入 21003 个 汉字和883图形符号
•简体和繁体汉字在同一个字符集中;
•包含了中、日、韩认同的全部CJK汉 字;
•与GB2312-80保持向下兼容;
2020/12/21
NJNU
7
3、UCS/Unicode 与 GB18030 汉字编码标准
• 区位码的区号和位号分别加上 20H,得到国标码。
• 国标码的两个字节的最高位置 1,得到 PC 机常用的 机内码
2020/12/21
NJNU
5
以汉字“啊”为例: 区位码为:1601,表示区号16位号01 对应二
进制数为:00010000,00000001 国标码对应二进制数为: 00110000,00100001B 机内码对应二进制数为: 10110000,10100001B
本 2020/12/21
NJNU
15
A
a1 a2
a3
E
e1
2020/12/21
超文本结构
B
C
c1 b1
b2
c2
F
G
g1 f1
NJNU
D
d1
H
h1
16
四、文本的编辑与处理
1、文本编辑与文本处理
文本编辑:
• 内容:对字(词, 句)、段落、页面等进行添加、删除、 修改等操作
• 字的处理
• 段落的处理 • 页面布局的处理
1. 图像的表示方法与主要参数
每个取样点称为像素
彩色图像用三个矩阵来表示
• 矩阵的行数称为垂直分辩率
• 矩阵的列数称为水平分辩率
• 矩阵的元素值是像素颜色分量的亮度值
一幅取样图像,除了像素数据外,还有以下属 性:
• 图像分辩率:图像在屏幕上的大小
• 颜色空间的类型:描述彩色图像所使用的颜色描述方 法(常用的有RGB、CMYK、HSV、YUV)
状描述信息 然后按形状描述信息生成字形,并按照字号大小
及有关属性(粗体、斜体、下横线)将字形作必 要的变换 最后将变换得到的字形放置在页面的指定位置处
2020/12/21
NJNU
20
字形描述方法
点阵字形:“1”表示对应位置是黑点 “0”表示是空白
轮廓字形:用曲线描述,精度高、字形可变, 如:Windows 中的 TrueType
• 计算机合成的图像(synthetic image),它们称为矢量 图形(vector graphics),或简称图形(graphics)
2020/12/21
NJNU
22
一、图像的获取
1. 图像的数字化 (1)扫描 : 将图像分成 M * N 个点进行取样
(2)分色 : 将每个点分成 R、G、B 三个基色。
Adobe PhotoShop
2020/12/21
NJNU
31
3. 数字图像的应用
(1) 图像通信。包括图像传输、电视电话、电视会 议 等。
(2) 遥感。 (3) 医疗诊断。 (4) 工业生产中的应用。如产品质量检测,生产过
程 的自动控制等。
(5) 机器人视觉。对三维景物进行理解与识别。 (6) 军事、公安、档案管理等其他方面的应用。如
Aldus,Microsoft CompuServe ISO/IEC ISO/IEC
2020/12/21
NJNU
29
数字图象处理与应用
1.数字图象的处理 图象处理的主要目的有以下几个方面: (1)提高图象的视觉质量 (2)图象复原与重建 (3)图象分析 (4)图象数据的变换、编码和数据压缩 (5)图象的存储、管理、检索等。
2020/12/21
NJNU
35
5.3 数字声音及应用
数字声音的特点:
• 是一种连续媒体,传输与播放有实时性要求
• 数据量大,对存储和传输的要求很高。
数字声音的类型:
(1) 通用编码字符集 UCS/Unicode
• UCS 实现了对所有字符统一编码
(2) GB18030 编码(2000年)
• 目的是向 UCS 过渡,同时与 GB2312、GBK 兼容,目前已经在许多计算机系统中使用。
• 用 1、2 或 4 字节编码,汉字数达到 27000 多个
2020/12/21
军 2020/12/事21 目标的侦察,制导和NJNU警戒,自动火器的控制 32
四、计算机图形
1、景物形状的计算机表示
使用算法或几何要素(如点、线、面、体的位置、形状和 大小)及表面材料的性质,在计算机中对景物和形体(无 论是真实的还是假想的)进行描述(modeling)
需要显示时,计算机根据观察者的位置及光线的设定,生 成该景物的图像。
(3)取样 :测量每个取样点每个分量的亮度值
(4)量化 :对每个分量进行 A / D 转换,再用
2020/12/21
数字量表示 NJNU
23
2. 数字图像获取设备
• 功能:将现实的景物输入到计算机内
• 种类:2D 扫描仪、数码相机、3D 扫描仪等
2020/12/21
NJNU
24
二、图像的表示与压缩编码