第3章 多媒体技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体的特性
• 与传统的数值相比,多媒体具有许多特性,包括信息载体的多样性、 集成性、交互性、时间相关性、数据量大等。 • 信息载体的多样性是指计算机可以处理的信息空间范围更大,不仅仅 是数值,还包括人们的视觉(图形、图像、视频)、听觉(声音或音频) 、触觉(指点触摸、位置跟踪)等信息空间。
• 多媒体的集成性是指在多媒体应用程序中,多媒体元素至少要达到两 种,单一的数值、文本、图像等限制了信息的应用,而同时有音频、 视频、文字等多媒体元素的应用程序才可以满足人们对信息的更多需 求。多媒体元素的同步性成为集成性需要解决的重要问题。 • 交互性是指用户可以参与到多媒体应用程序中,用户可以根据需要和 偏好对应用程序的执行过程进行干涉。
• 有损压缩来自百度文库法可以达到比较高的压缩比,因此,大多数的图像、音频、 视频格式为了达到高压缩比,采用了有损压缩方法。
• 在有损压缩方法中,能够达到的压缩程度往往与初始数据的类型相关, 压缩比通常在10:1至100:1之间。 • 常见的有损压缩算法主要有离散余弦变换法(discrete cosine trsnsform, DCT)、分形压缩法(fractal compression)、小波压缩法(wavelet compression)、向量量化法(vector quantization)、线性预测编码法 (linear predictive coding)、有损分布式信源编码压缩法(lossy distributed source coding,有损DSC)等。
第3章 多媒体技术
本章简介
• 随着计算机硬件和软件技术的飞速发展及其广泛深入的应 用,只能处理数字、文本的计算机软件已经不能满足人们 更高要求的需要,越来越多的应用需要在程序中处理声音、 图像、动画、视频等多种元素。
• 处理多种媒体元素的技术称为多媒体技术,包含了多媒体 元素的程序是多媒体应用程序。 • 多媒体技术是一种重要的计算机软件技术。
3.2.2 RLE
• RLE(run-length encoding,游程编码,变动长度编码法)是一种简单的 数据无损压缩方法。 • 在RLE中,run定义为一组相同的字符。 • 对于那些包含了许多run的数据,例如相对来说简单的图像而言,RLE 方法是非常有效的。 • 例如,字符串s="bbbbbjjjjjjaa"中就有3个run。第一个run是5个b,第 二个run是6个j,第三个run是2个a。这时字符串s的压缩结果是5b6j2a。 • 如果要传输的数据中有数字,例如,111112222222222255333,这里 有5个1、11个2、2个5、3个3,则应该编码为511112533,为了区分数 据和字符个数,这时需要使用ASCII码进行编码。 • 例如,如果run中有37个字母c,则可以表示为%c,字符%的ASCII码值 是37;如果有43个3,则可以表示为+3,字符+的ASCII码值是43。
JPEG
• JPEG是Joint Photographic Experts Group(静态图像 专家组)的简称,是静态图像压缩方法,是 Internet上使用最为广泛的图像格式。
• 这是一种有多种压缩程度的有损压缩方法,其文 件名后缀包括.jpg、.jpeg等。 • 该图像格式于1994年成为ISO 10918-1标准。该标 准采用了多种压缩方法,主要包括DCT、向量量 化法和Huffman编码法等。 • 目前,JPEG是Internet上流行最为广泛的静态图像 格式。
3.2 多媒体数据压缩技术
3.2 多媒体数据压缩技术
• 由于多媒体数据量巨大,所以多媒体数据压缩技术是多媒 体技术中非常重要的技术之一。 • 数据压缩可以降低对磁盘空间、传输带宽的资源需求。 • 在多媒体技术领域中,数据压缩(data compression)是指通 过特定的数据编码方式将数据转换为另外一种存储形式的 过程。 • 与压缩相对应的是数据还原。数据还原是指将压缩编码的 数据还原为原始数据的过程。 • 下面,首先讲解常见的压缩方法和标准的特点,然后介绍 行程编码算法等典型算法的基本思想。
再依次建立哈夫曼树,如下图:
其中各个权值替换对应的字符即为下图:
所以各字符对应的编码为:A->11,B->10,C->00,D->011,E->010
Zip和RAR
• • ZIP文件格式是一种流行的数据压缩和文档储存的文件格式,原名Deflate,发明者为菲 尔· 卡茨(Phil Katz),他于1989年1月公布了该格式的资料。 ZIP通常使用后缀名“.zip”。ZIP格式属于主流的压缩格式之一,其竞争者包括RAR格式 以及开放源码的7z格 式。从性能上比较,RAR及7-Zip格式较ZIP格式压缩率较高,而7Zip由于提供了免费的压缩工具在更多的领域得到应用。 Microsoft从Windows ME操作 系统开始内置对zip格式的支持,即使用户的电脑上没有安装解压缩软件,也能打开和 制作zip格式的压缩文件,mac os x和流行的linux操作系统也对zip格式提供了类似的支 持。因此如果在网络上传播和分发文件,zip格式往往是最佳选择。 RAR是一种专利文件格式,用于数据压缩与归档打包,开发者尤金· 罗谢尔(Eugene Roshal),所以RAR的全名是:Roshal ARchive(即“罗谢尔的归档”之意)。首个公开版 本RAR 1.3发布于1993年。尤金· 罗谢尔,1972年3月10日生于俄罗斯。毕业于俄罗斯车 里雅宾斯克工业大学(Chelyabinsk Technical University)。他开发程序压缩/解压RAR 文件,最初用于DOS,后来移植到其它平台。主要的Windows版本编码器,称为 WinRAR,以共享软件的形式发行。不过Roshal公开了解码器源码,UnRAR解码器许可 证允许有条件自由发布与修改(条件:不许发布编译RAR兼容编码器)。而RAR编码器 一直是有专利的。
•
3.3 图像
3.3 图像
• 本章将研究多媒体技术的基本概念、数据压缩技术以及音 频、图形、图像、动画、视频等处理技术,最后讨论多媒 体软件开发的基本过程。
本章提要
3.1 3.2 3.3 3.4 3.5 3.6 3.7 概述 多媒体数据压缩技术 图像 音频 视频 动画 多媒体软件开发过程
3.1 概述
3.1 概述
• “多媒体”一词来源于英文multimedia。 • multimedia由multiple和media复合而成,multiple的含义是多个、两 个或两个以上等,media是medium的复数形式,其含义是媒介、传播 媒体等。 • 在计算机领域,媒体是指与信息载体、存储、传输等相关的介质。
3.2.1 常见的压缩方法和标准
• 目前,有许多数据压缩方法。
• 根据还原后的数据与压缩前的原始数据是 否相同,可以把数据压缩方法分为: • 有损压缩方法 • 无损压缩方法
有损压缩方法
• 有损压缩方法(lossy compression)是指还原后的数据与压缩前的原始数 据不相同,数据中的部分信息在压缩过程中损失了。 • 例如,JPEG图像是指采用JPEG编码方式进行存储的图像数据,JPEG编 码方式就是一种有损压缩方法。 • 有损压缩方法应用于那些允许信息有一定失真的领域。
• 根据多媒体元素的特点,可以把多媒体技术划分为图形处 理技术、图像处理技术、音频处理技术、动画处理技术、 视频处理技术等。
• 因此,多媒体技术是指对多媒体的采集、加工处理、存储、 传输、应用等相关技术,也可以说,多媒体技术是图形、 图像、音频、动画、视频等相关技术的集成。 • 多媒体技术在许多领域中都有广泛的应用。
•
•
Huffman编码示例
假如我有A,B,C,D,E五个字符,出现的频率(即权值)分别为 5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造 一个新树,即取1,2构成新树,其结点为1+2=3,如图: 虚线为新生成的结点,第二步再把新生成的权值为3的结点 放到剩下的集合中,所以集合变成{5,4,3,3},再根据第二步, 取最小的两个权值构成新树,如图:
• 多媒体是指通过计算机或其他媒介传 播的文字、图形、图像、声音、视频、 动画等多种媒体的组合。 • 每一种媒体都是多媒体的媒体元素。 • 至少有两个或两个以上的媒体元素的 应用程序才称得上是多媒体应用程序。 • 如果用户可以控制何时显示何种元素, 那么这种媒体元素就称为交互式多媒 体。
• 如果应用程序提供了多媒体元素的链 接,用户可以通过链接进行导航,那 么这种交互式多媒体称为超媒体。
MPEG
• 数字视频音频的主要压缩标准是MPEG(Moving Picture Experts Group,动态图像专家组)。 • 该组织发布了一系列有关数字视频音频的标准。 • MPEG-1是MPEG组织制定的第一个视频和音频有 损压缩标准。MPEG-1音频分三层,其中第三层协 议被称为MPEG-1 Layer 3,简称MP3。 • 目前MP3已经成为流行的音频压缩技术。 • 为了提高压缩性能,MPEG标准使用了多种压缩算 法和技术
• 从信息载体角度来看,文字、图形、图像、声音、视频、动画等都是 某种信息的载体。 • 从信息存储方面来看,CD-ROM、DVD等都是信息存储的介质。 • 从信息传输角度来看,计算机网络是信息传输的重要介质。
• 一般地认为,多媒体中的媒体特指除数字之外的文字、图形、图像、 声音、视频、动画等。
多媒体的概念
无损压缩方法
• 无损压缩方法(lossless compression)是指还原后的数据与压缩前的原 始数据是完全相同的,压缩过程中没有丢失原始数据的信息。 • 无损压缩算法在很多领域都是必需的,例如记载有财务数据的电子表 格、合同文本、可执行程序等数据在压缩过程中都不能丢失任何数据。 • 常见的无损压缩算法包括:行程编码算法(run-length encoding,RLE)、 LZW压缩算法(Lempel-Ziv-Welch Encoding)、BWT变换法(BurrowsWheeler transform,BWT)、部分匹配预测法(prediction by partial matching,PPM)、动态马尔可夫压缩法(dynamic Markov compression, DMC)、Huffman编码法(Huffman coding)、算术编码法(arithmetic coding)、Golomb编码法(Golomb coding)、无损分布式信源编码压缩 法(lossless distributed source coding,无损DSC)等。
• 时间相关性是指多媒体中的许多元素,都与时间相关,随着时间的变 化而变化。这也是实现多媒体应用程序自动化的一个重要基础。 • 数据量大是多媒体的又一个重要特征。
多媒体技术
• 一般地,根据技术的作用,可以将多媒体技术划分为多媒 体数据压缩技术、多媒体软件技术、多媒体硬件平台技术、 多媒体数据管理技术、多媒体展示技术、多媒体人机交互 技术、多媒体通讯技术等。
• 示例演示,简单屏幕和复杂屏幕,截图,压缩
3.2.3 Huffman编码法
• • • Huffman编码法是David Huffman于1952年在其博士论文中提出的,是一种 基于概率的、变长度编码表进行压缩的编码方法,目的是找到最有效的二 进制编码。 目前,Huffman编码法是一种经典的数据无损压缩方法,在许多领域中都 有广泛的应用。 编码压缩方法要遵循一些基本的原则。通过编码,使得基于概率计算的平 均编码字的长度最小。在编码时,每个编码字只能对应于原始数据中的一 个符号。 在编码时,如果原始数据中的符号使用的不是很频繁,则倾向于赋予较长 的编码字;对于使用频繁的符号,则应赋予较短的编码字。 例如,假设A、F出现的概率分别是0.25和0.12,则A可以编码为1,F应该编 码为01。也就是说,给定符号的编码字长度不能超过概率较小的符号的编 码字长度。