第二章多媒体信息处理(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
I(ai)= -log2Pi 或简写 I(ai)= -logPi
(i=1,2,3,…,r) 其中,Pi(i=1,2,…,r) 表示随机消息集X:{a1, a2,…,ar}中消息 ai(i=1,2,…,r)的先验概率。
I(ai) (i=1,Leabharlann Baidu,…,r)即为ai所含的信息量,其基本单
位为比特(bit)。
视频和动画序列都是由节段构成的,它们都是时 基类媒体。与传统的影视视频和动画不同的是,在多 媒体计算机中,这些动态图像不仅要存储和播放,而 且要能进行变换、压缩、传输和编辑等处理。
④符号。符号是人类对信息进行抽象的结果。 符号可以表示数值,表示事物或事件,也可以表 示语言和文字。
文本是具有上下文相关特性的符号流。由于 符号是人类创造出来表示某种含义的符号,所以 它与使用者的知识有关,是比图形更高一级的抽 象。必须具备特定的知识,才能解释特定的符号, 才能解释特定的文本(如语言)。
不同的媒体就有不同的信息形式。由于各种 媒体表达的信息方式不同,所能承载的信息量也 就不同。
有的媒体可以直接表达信息,如文字、声音、图像、 动画等,有的则必须转换成人类感觉器官可以接受的形式, 如物理定理、股票升跌规律等,即要转换成文字、符号或 某种图形曲线等形式,才能被人们所理解和接受。
2.数据是记录信息的符号,信息是对数据的解释;
四、媒体的不同表现形式
在计算机中,常按人的感觉来划分媒体,一般将媒 体划分为:视觉类媒体、听觉类媒体、触觉类媒体、 活动媒体、抽象事实媒体和混合媒体等。其中,视觉 类媒体和听觉类媒体所承载的信息占人们获取信息的 绝大部分。对于这些媒体,根据不同的抽象程度可分 成若干层次,每一层次对应不同的表现形式。
根据量化的颜色深度的不同,又可分为二值和灰 度(彩色)图像两大类。
位图图像是所有视觉表示方法的基础。
②矢量图形。矢量图形一般也称为图形 (Graphics),它是对图像进行抽象化的结果,反 映了图像中实体最重要的特征,如点、线、面等。
它不直接描述图像数据的每一个点,而是描述产 生这些点的过程和方法。抽象化(矢量化)过程可以 由计算机自动进行,也可以由人工进行。在计算机中, 矢量图形以一组指令的形式存在,而不用像位图那样 对图像的每一个点进行量化存放。因此,它所需要的 存储量很小。
计算机中常见的媒体如表2.1所示。下面简单介绍 这几类媒体的不同表现形式。
(1)视觉类媒体 主要包括以下几类: ①位图图像(Bitmap)。将所观察的图像
(Picture)按行列方式进行数字化,对图像的每一 点(称为像素点)数字化为一个值(称为灰度值), 所有这些值就组成了位图图像。
这是一种对视觉信号进行了直接量化的媒体形式, 反映了信号的原始形式。
符号的表示是用特定值表示的,例如ASCII 码、中文图标码等。
(2) 听觉类媒体 凡是通过声音形式以听觉传递信息的媒体,都
属于听觉类媒体,这类媒体是连续的时基类媒体, 具有过程性和时间性,它的范围比视觉类媒体要小 得多,主要有以下几类:
①波形声音(Wave Voice)。所谓波形声音, 实际上已经包含了所有的声音形式,因为任何声音 都可以进行采样量化,并恰当恢复出来。事实上, 波形声音就是自然界中所有声音的“数字化声音”, 它的获取是通过声音的数字化接口进行的。
知 识
分类、规格化
联系、归纳、表达
解释、描述
解释、描述
数
信
数
据 记录、表达 息 记录、表达 据
承载、表达 分类、规格化
媒 体
图2.1 媒体、数据、信息、知识之间的关系示意图
三、信息量的度量
信息论的创始人香农(Shannon)以概率论的观点 方法, 提供了一种度量信息量的方法。
1、信息函数 定义为:
多媒体数据是以不同媒体形式记录下来的、可 以解释的格式化符号。它有各种不同的形式,是客 观的,而且总是具体为某种媒体。
而多媒体信息是对多媒体数据的解释,是主观 的、抽象的,因人而异,以增加知识为目的。
3.知识是高层次的信息;
知识,是对客观规律的认识,是高层次的信息, 需要人们对信息进行接收、归纳和总结等能动思维, 才能获取对客观规律的认识。而且这种认识还与个 人受教育程度、个人理解水平的差异等各种因素有 关。
2、信息熵
在信息函数的基础上,信息熵定义为:
r
r
H (x) H ( p1, p2 , , pr ) piI (ai ) pi log pi
i 1
i 1
(比特/符号)
H(x)用来度量消息集X中每一种消息所含的平
均信息量,是信息函数I(ai)( i=1,2,…,r )在 X的先验概率空间P:{p1,p2,…,pr }中的统计 平均值。
对于信息量(或信息熵),应有如下理解: ①一个消息所表示的内容对于接受者来说,应该 是事先不知道的,这样的消息才是信息,否则对他毫 无意义。 ②这个信息要有正确的表达方式,否则接收者无 法理解,当然也就无法接收。 ③该信息对使用者来说是有意义的,即要有使用 价值。 我们可以利用上述两个公式来衡量某种媒体所承 载的信息量,尽量使得媒体承载的信息保持本来特性, 以获取最大信息量,便于使用者理解和接受。
第二章 多媒体信息处理技术
2.1 多媒体信息处理技术概述 2.2 信息表示与编码 2.3 多媒体数据压缩技术 2.4 多媒体数据压缩技术标准简介
作业
2.1 多媒体信息处理技术概述
一、多媒体信息的一般处理过程
媒体
数字化
变换与编码
存储传输
表示
各种应用处理
数据管理
二、媒体、数据与信息之间的关系
1.媒体是承载信息的载体,是信息的表示形式。
由此可见,媒体以一定的客观状态而存在,不 同状态以不同形式承载信息;
数据经过处理解释过程形成信息; 信息又经过人脑的思维处理过程形成知识; 知识是用信息表达的,信息则是用数据表达的。 这种层次,不仅反映了数据、信息和知识的因 果产生的关系,而且也反映了它们之间不同的抽象
程度。
媒体、数据、信息、知识之间关系示意图,如图2.1所示
在计算机图形学上,图形一般分为二维图形和三 维图形两大类。
③动态图像。这是利用人眼的视觉惰性,将若干 连续的静态图像或图形在时间轴上不断变化所产生的 结果。
如果单帧图像是真实图像,则为动态影像视频 (Video);若单帧图像是由计算机生成的真实感图 像,则为三维真实感动画(Animation),如果在连 续过程中变化的是图形,则是二维或三维动画。
(i=1,2,3,…,r) 其中,Pi(i=1,2,…,r) 表示随机消息集X:{a1, a2,…,ar}中消息 ai(i=1,2,…,r)的先验概率。
I(ai) (i=1,Leabharlann Baidu,…,r)即为ai所含的信息量,其基本单
位为比特(bit)。
视频和动画序列都是由节段构成的,它们都是时 基类媒体。与传统的影视视频和动画不同的是,在多 媒体计算机中,这些动态图像不仅要存储和播放,而 且要能进行变换、压缩、传输和编辑等处理。
④符号。符号是人类对信息进行抽象的结果。 符号可以表示数值,表示事物或事件,也可以表 示语言和文字。
文本是具有上下文相关特性的符号流。由于 符号是人类创造出来表示某种含义的符号,所以 它与使用者的知识有关,是比图形更高一级的抽 象。必须具备特定的知识,才能解释特定的符号, 才能解释特定的文本(如语言)。
不同的媒体就有不同的信息形式。由于各种 媒体表达的信息方式不同,所能承载的信息量也 就不同。
有的媒体可以直接表达信息,如文字、声音、图像、 动画等,有的则必须转换成人类感觉器官可以接受的形式, 如物理定理、股票升跌规律等,即要转换成文字、符号或 某种图形曲线等形式,才能被人们所理解和接受。
2.数据是记录信息的符号,信息是对数据的解释;
四、媒体的不同表现形式
在计算机中,常按人的感觉来划分媒体,一般将媒 体划分为:视觉类媒体、听觉类媒体、触觉类媒体、 活动媒体、抽象事实媒体和混合媒体等。其中,视觉 类媒体和听觉类媒体所承载的信息占人们获取信息的 绝大部分。对于这些媒体,根据不同的抽象程度可分 成若干层次,每一层次对应不同的表现形式。
根据量化的颜色深度的不同,又可分为二值和灰 度(彩色)图像两大类。
位图图像是所有视觉表示方法的基础。
②矢量图形。矢量图形一般也称为图形 (Graphics),它是对图像进行抽象化的结果,反 映了图像中实体最重要的特征,如点、线、面等。
它不直接描述图像数据的每一个点,而是描述产 生这些点的过程和方法。抽象化(矢量化)过程可以 由计算机自动进行,也可以由人工进行。在计算机中, 矢量图形以一组指令的形式存在,而不用像位图那样 对图像的每一个点进行量化存放。因此,它所需要的 存储量很小。
计算机中常见的媒体如表2.1所示。下面简单介绍 这几类媒体的不同表现形式。
(1)视觉类媒体 主要包括以下几类: ①位图图像(Bitmap)。将所观察的图像
(Picture)按行列方式进行数字化,对图像的每一 点(称为像素点)数字化为一个值(称为灰度值), 所有这些值就组成了位图图像。
这是一种对视觉信号进行了直接量化的媒体形式, 反映了信号的原始形式。
符号的表示是用特定值表示的,例如ASCII 码、中文图标码等。
(2) 听觉类媒体 凡是通过声音形式以听觉传递信息的媒体,都
属于听觉类媒体,这类媒体是连续的时基类媒体, 具有过程性和时间性,它的范围比视觉类媒体要小 得多,主要有以下几类:
①波形声音(Wave Voice)。所谓波形声音, 实际上已经包含了所有的声音形式,因为任何声音 都可以进行采样量化,并恰当恢复出来。事实上, 波形声音就是自然界中所有声音的“数字化声音”, 它的获取是通过声音的数字化接口进行的。
知 识
分类、规格化
联系、归纳、表达
解释、描述
解释、描述
数
信
数
据 记录、表达 息 记录、表达 据
承载、表达 分类、规格化
媒 体
图2.1 媒体、数据、信息、知识之间的关系示意图
三、信息量的度量
信息论的创始人香农(Shannon)以概率论的观点 方法, 提供了一种度量信息量的方法。
1、信息函数 定义为:
多媒体数据是以不同媒体形式记录下来的、可 以解释的格式化符号。它有各种不同的形式,是客 观的,而且总是具体为某种媒体。
而多媒体信息是对多媒体数据的解释,是主观 的、抽象的,因人而异,以增加知识为目的。
3.知识是高层次的信息;
知识,是对客观规律的认识,是高层次的信息, 需要人们对信息进行接收、归纳和总结等能动思维, 才能获取对客观规律的认识。而且这种认识还与个 人受教育程度、个人理解水平的差异等各种因素有 关。
2、信息熵
在信息函数的基础上,信息熵定义为:
r
r
H (x) H ( p1, p2 , , pr ) piI (ai ) pi log pi
i 1
i 1
(比特/符号)
H(x)用来度量消息集X中每一种消息所含的平
均信息量,是信息函数I(ai)( i=1,2,…,r )在 X的先验概率空间P:{p1,p2,…,pr }中的统计 平均值。
对于信息量(或信息熵),应有如下理解: ①一个消息所表示的内容对于接受者来说,应该 是事先不知道的,这样的消息才是信息,否则对他毫 无意义。 ②这个信息要有正确的表达方式,否则接收者无 法理解,当然也就无法接收。 ③该信息对使用者来说是有意义的,即要有使用 价值。 我们可以利用上述两个公式来衡量某种媒体所承 载的信息量,尽量使得媒体承载的信息保持本来特性, 以获取最大信息量,便于使用者理解和接受。
第二章 多媒体信息处理技术
2.1 多媒体信息处理技术概述 2.2 信息表示与编码 2.3 多媒体数据压缩技术 2.4 多媒体数据压缩技术标准简介
作业
2.1 多媒体信息处理技术概述
一、多媒体信息的一般处理过程
媒体
数字化
变换与编码
存储传输
表示
各种应用处理
数据管理
二、媒体、数据与信息之间的关系
1.媒体是承载信息的载体,是信息的表示形式。
由此可见,媒体以一定的客观状态而存在,不 同状态以不同形式承载信息;
数据经过处理解释过程形成信息; 信息又经过人脑的思维处理过程形成知识; 知识是用信息表达的,信息则是用数据表达的。 这种层次,不仅反映了数据、信息和知识的因 果产生的关系,而且也反映了它们之间不同的抽象
程度。
媒体、数据、信息、知识之间关系示意图,如图2.1所示
在计算机图形学上,图形一般分为二维图形和三 维图形两大类。
③动态图像。这是利用人眼的视觉惰性,将若干 连续的静态图像或图形在时间轴上不断变化所产生的 结果。
如果单帧图像是真实图像,则为动态影像视频 (Video);若单帧图像是由计算机生成的真实感图 像,则为三维真实感动画(Animation),如果在连 续过程中变化的是图形,则是二维或三维动画。