第五章数字媒体及应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A
B
a1源自文库b1
a3 a2
b2
C
D
c1 d1
c2
E
F
G
H
e1
f1
g1
h1
超文本的应用: Windows等一些软件中的“帮助”文件; 使用浏览器从Web服务器上下载的网页(html或htm 文件)。
超媒体(Hypermedia):超文本中的节点不单是文本 节点,还包含图形、图像、声音或动画节点,这种基 于多媒体信息结点的超文本,有时也称为“超媒体” 。
等4种,在同一种汉字编码字符集中,使用不同的编码方法向计算机输入 的同一个汉字,它们的内码不同。(X) (2019判) 【例】1KB的内存空间能存储512个汉字内码,约存_14__个24×24点阵汉 字的字型码。(2019填) 【例】在24×24点阵的汉字字库中,存储每个汉字字型码所需的字节是70B。 (X)(2019判断)
码,即字符的二进制表示,称为该字符的编码。
标准ASCII字符集
• 美国标准信息交换码(American Standard Code for Information Interchange):使用7 个二进位对字符进行编码(叫做标准 ASCII码)
• 基本的ASCII字符集可表示27=128个符号: 96个可打印字符(常用字母、数字、标 点符号等)和32个控制字符。
重点知识点:
西文编码标准ASCII : 一个字节存储,最高位为“0” 特殊字符:空格(32)、0(48) 、 A(65) 、 a(97)
【例】在下列字符中,其ASCII码值最大的是_D__。(2019单选)
A.X
B.6
C.5
D.Y
【例】在ASCII编码中,字母A的编码为41H,那么字母f的编码为_B__。 (2019单选)
中,含有的汉字和西文字符的个数分别是_3个2个__。(2019填空)
GBK国标汉字内码扩展集:
我国目前汉字总数大约有6万字左右,但GB2312-80只有6763个简 体汉字,在Windows中不够用。因此,我国在2019年发布GBK-95,全 称为《汉字内码扩展规范》, GBK-95国标汉字内码扩展集中一共有 21003个简繁体汉字和883个图形符号,共收入21886个汉字和图形符 号,它与GB2312国标汉字字符集及其内码保持兼容。
第五章 数字媒体及应用
5.1 字符与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用
多媒体基本概念
媒体:承载信息的载体,是信息的表示形式。
媒体的分类: • 感觉媒体 • 表示媒体 • 显示媒体 • 存储媒体 • 信息交换媒体 多媒体:融合两种以上的人机交互信息交流和传播的 数据载体。
简化、重码减少。
缺点:不易掌握。
4、汉字的输出
• 区位码、国标码和机内码均不能表示汉字的字形。 为了显 示和打印,计算机内必须保存汉字的字 形。
• 计算机内一套汉字所有字符的形状描述信息的集 合叫“字库”
• 不同的字体对应不同的字库。 • 汉字字形有两种描述方法,点阵字形和轮廓字形。
• 点阵字形:
1.区位码:是我国于1981年颁布的国家标准GB 2312 -80,即《中华人民共和国国家标准的汉字编码》, 用四位十进制数码表示对应的汉字,前两位表示区号, 后两位表示位号。用于表示汉字在字库中的位置,共 表示6763个简体汉字。称为基本字库集。
其中:一级汉字库有3755个,以汉语拼音为序排列;
二级汉字库有3008个,以偏旁部首为序排列;
区位码、国标码、机内码
【例】某汉字的区位码为(2710)D,则其_AB_。(2019多选)
A.机内码为(BBAA)H
B.国标码为(3B2A)H
C.国标码为(4730)H D.机内码为(3B8A)H
【例】在中文Windows环境下,西文使用标准ASCII码,汉字采用GB2312
编码,现有一段文本的内码为:AB F4 D1 E3 78 C2 B7 55,则在这段文本
还有682个常用的非汉字字符(图形、符号)。
位号:
1 2 3 ……………… 94
区1 号9 : 16
字母、数字和各种符号 一级汉字
(3755个)
…… ……
55
二级汉字
56
(3008个)
87
94
(扩充使用)
GB2312-80字符集(94行☓ 94列)
2.国标码:在信息通信中,汉字的区位码与通信使 用的控制码(00H~1FH)发生冲突。由于传输的需要, 需将区位码的区码和位码各加上(00100000)2,即 32, 便成了国标码。作为汉字信息交换使用。
– 用一组排成方阵(16×16、24×24、32×32 ……)的 比特来表示一个汉字,1表示是 点,0表示空白。
– 字模码:用点阵表示的汉字字形代码,它是汉字的输 出形式。
• 练习:使用16×16点阵描述10个汉字,需要多少 个字节?(16×16÷8×10)
字符的点阵描述
重点知识点:
汉字的输入和输出: 【例】汉字输入的编码方法有数字编码、字音编码、字形编码和形音编码
2D图像获取设备(如扫描仪、数码相机等):只能对图片或景物 的2D投影进行数字化。
3D图像获取设备: 3D扫描仪能获取包括深度信息在内的3D 景物的数字化信息。
5.2.2 图像的表示与压缩编码 1、图像的表示方法与主要参数
从取样图像的获取过程可以知道,一幅取样图像由M ╳ N个取样点 组成,每个取样点是组成取样图像的基本单位,称为像素(picture element, 简写为pel)。彩色图像的像素是矢量,它由3个彩色分量组成,灰度或黑 白图像的像素只有1个亮度值。
特性:呈现为一种线性结构,以行、字为单位,顺序写作与阅读是 最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字 处理软件都能识别和处理。不能插入图片、表格等,不能建立超链接。
2、格式文本
为了使文本能以整齐、醒目、美观、大方的形式展现给用户,人们 还需要对纯文本进行设定,确定文本所在页面的大小、文本在页面上的 位置及布局等,这个过程称为文本的格式化,也称为“排版”。排版后 的文本就增加了许多格式控制和结构信息,称为“丰富格式文本”。
练习
• 1、文本编辑的目的是使文本正确、清晰、美观,下列 _BCD_____操作属于文本处理而不属于文本编辑功能。 (2019多选) A、添加页眉页脚 B、统计文本字数 C、文本压缩 D、识别并提取文本中的关键字
• 2、不同文本中处理软件使用的格式控制和结构说明信 息并不统一,不同的丰富格式文本互不兼容,因此一 些公司联合提出了一个中间格式,称为___D____格式。 (2019单选) A、DOC B、PDF C、HTML D、RTF
A.46H
B.66H C.67H
D.78H
2、汉字的编码
• 汉字输入计算机中时使用的编码为汉字外部码 (输入码);计算机处理汉字信息时使用内部 码(机内码);输出时使用字形码。汉字的交 换码也成为国标码。
• 1981年我国颁布了GB2312-80国标字符集,该 字符集共收入7445个字符
GB 2312-80国标汉字基本集:
5.2 图像与图形
计算机中的数字图像按其生成方法可以分为两大类: 1、取样图像(sampled image):从现实世界中通过数字化设备 获取的图像。也称为:点阵图像(dot matrix image)、位图图像 (bitmap image)。简称图像(image)。 2、矢量图形(vector graphics):计算机合成的图像(synthetic image)。 简称图形(graphics)。
3.机内码:是指在计算机中用二进制表示的汉字编 码。是计算机系统内部用于对汉字进行存储、处理、传 输的代码。由于汉字数量多,1个汉字需要占2个字节来 存放汉字的内码。
在计算机中汉字字符必须与英文字符ASCII编码区 别开来,以免造成混乱。汉字机内码中两个字节的最高 位均置为“1”。
重点知识点:
GB2312-80汉字编码标准:
取样:测量每个取样点每个分量的亮度值。 量化:对取样点每个分量的亮度值进行A/D模数转换。



扫描

分色
取样 取样 取样
量化


量化

量化

2、数字图像获取设备
图像获取的设备:从现实世界获得数字图像的设备,通称为 数字图像获取设备。
图像设备的功能:将现实的景物输入到计算机内,并以取样 图像的形式存放在计算机中。
3、超文本
传统的纸质文本其内容的组织是线性(顺序)的,因而读者总 是按顺序先读第1页,再读第2页、……,这就是“线性文本”。
超文本(hypertext)的概念是对传统文本的一个扩展。除了传统 阅读方式之外,它还可以通过链接、跳转、导航、回溯等操作, 实现对文本内容的跳跃式阅读和访问。
超文本的结构:
文本的分类与表示
使用计算机制作的数字文本,根据用途分为:简单文本、丰 富格式文本和超文本三类。
1、简单文本(纯文本)
是由一连串的字符组成的,除了用于表达正文内容的字符(包括汉字) 及“回车”、“换行”、“制表”等有限的几个打印(显示)控制字符之外, 几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或 ASCII文本,在PC机中的文件后缀名是.txt。
“格式文本”的格式,目前有许多种:DOC、PDF、PDG、CAJ等。 为了便于在不同的软件和系统中互换使用,一些公司联合提出了一种公 用的中间格式,称为“RTF格式”(代码是公开的)。
此外,在许多应用场合还要求在文本中插入图、表、公式,甚至声 音和视频。这种含有声音或视频信息的文本,有时也称为“多媒体文 档”(Multimedia Document) 。
例如:計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。
重点知识点:
常用汉字编码标准:
GB2312-80、GBK、GB18030、unicode、BIG5
【例】下列汉字编码标准中,不支持繁体汉字的是___。 (2019单选)
A.GB 2312-80 B.GBK
C.BIG5
D.GB 18030
3、汉字的输入
字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非 专业人员。
缺点:同音字引起的重码多,需增加选择操作。
字形编码:将汉字的字形分解归类而给出的编码方法,重码少、 输入速度较快,如:五笔字形法和表形码等。
缺点:编码规则不易掌握。
形音编码:吸取了字音编码和字形编码的优点,使编码规则适当
标准ASCII码在计算机中实际用了8位二进制表示一个字符,最高 位设为“0” ,在数据传输时可用作奇偶校验位。
扩充ASCII字符集
• 标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位, 故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般 保持为“0”。
• 扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多 应用中无法满足要求。按照ISO2022标准(《七位字符集的代码扩充 技术》)的规定,ISO陆续制定了一批适用于不同地区的扩充ASCII字 符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符 的编码均是高位为1的8位代码(十进制数128~255),称为扩展 ASCII码。
• 用键盘输入汉字,不可能一键一字,必须用几个 字符代表 一个汉字,这几个字符叫做汉字的 “输入编码” 。
• 汉字的输入编码与汉字的内码是不同范畴的概念。 使用不同的输入编码方法向计算机输入的同一个 汉字,它们的内码是相同的
汉字输入编码方法的分类:
数字编码:使用一串数字来表示汉字的编码方法,例如电报码、 区位码等。缺点: 难以记忆,不易推广。
5.1 字符与文本处理
由于计算机中所有信息均以二进制形式 传输、存储及处理。为此,需要按一定 的规则对数字、字符、汉字、声音、图 像等用二进制进行编码。
1.西文字符的编码
• 字符集:常用字符的集合。 • 西文字符集:由拉丁字母、数字、标点符号及
一些特殊符号组成。 • 字符的编码:字符集中每一个字符各有一个代
5.2.1 图像的获取
1、图像的数字化
图像的获取(capturing):从现实世界中获得数字图像的过程 实质上是模拟信号的数字化过程,步骤如下:
扫描:将画面划分为M(行) ╳ N(列)个网格,每个网格称为一个取样点。 一幅模拟图像就被转换为M╳N个取样点组成的一个阵列。
分色:将彩色图像取样点的颜色分解成三个基色(例如RGB三基色),如果 不是彩色图像(即灰度或黑白图像),则不必进行分色。
相关文档
最新文档