图像有损压缩技术的研究毕业论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像有损压缩技术的研究毕业论文
目录
前言 (1)
第一章图像压缩技术的研究及进展 (2)
第一节图像压缩技术概述 (2)
第二节图像压缩技术标准 (2)
一、静止图像压缩标准 (2)
二、运动图像压缩标准 (3)
第三节图像压缩技术分类 (6)
第四节图像压缩技术的发展趋势 (7)
第五节本章小结 (7)
第二章图像有损压缩技术 (8)
第一节有损压缩概述 (8)
第二节有损压缩机制 (9)
第三节本章小结 (10)
第三章图像有损压缩的主要编码技术 (11)
第一节预测编码 (11)
一、脉冲编码调制 (11)
二、差分脉冲编码调制 (12)
三、自适应差分脉冲编码调制 (13)
第二节变换编码 (14)
第三节基于模型编码 (15)
一、基于语义编码 (16)
二、基于物体编码 (17)
第四节分形编码 (18)
一、分形编码的思路 (18)
二、分形编码的方法和步骤 (19)
三、分形编码的特点 (19)
第五节其它编码 (20)
一、子带编码 (20)
二、矢量量化编码 (21)
三、感知编码 (22)
第六节本章小结 (23)
第四章图像有损压缩与无损压缩比较 (25)
第一节有损压缩技术的优缺点 (25)
一、有损压缩的优点 (25)
二、有损压缩的缺点 (25)
第二节无损压缩技术的优缺点 (26)
一、无损压缩的优点 (26)
二、无损压缩的缺点 (26)
第三节两种不同图像压缩方式的综合比较 (27)
一、两种压缩方式在精确度上的比较 (27)
二、两种压缩方式拥有不同的压缩比率 (27)
三、两种压缩方式可逆性的差别 (27)
第四节本章小结 (28)
结论 (29)
致谢 (30)
参考文献 (31)
附录 (33)
一、英文原文 (33)
二、英文翻译 (36)
前言
在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。

随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质,相比传统方式,数字图像有着传统方式无法比拟的优越性。

而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。

所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。

图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。

利用图像压缩可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。

图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。

图像压缩编码的目的就是消除各种冗余,并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。

虽然人们总是期望无损压缩,但冗余度很少的信息对象,用无损压缩技术并不能得到可接受的结果。

当使用的压缩方法会造成一些信息损失时,关键的问题是看这种损失的影响。

有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。

在由音频、彩色图像、视频以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。

有损压缩编码不具有可恢复性和可逆性,该编码在压缩时舍弃冗余的数据。

所以有损压缩技术也走进了人们的视野。

第一章图像压缩技术的研究及进展
第一节图像压缩技术概述
图像压缩就是减少表示数字图像时需要的数据量。

是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码[1]。

在我们的生活中无论是普通人还是一些工作在科研领域的科技工作者,都会对数据信息进行传输与存储有所接触。

随着数字时代的到来,影像的制作、处理和存储都脱离了传统的介质(纸、胶片等),相比传统方式,数字图像有着传统方式无法比拟的优越性。

但是每种技术出现的同时,都有制约其发展的一面。

比如数字电视、遥感照片、由雷达、飞机等提供的军事侦察图像、可视、会议电视和传真照片,在教育、商业、管理等领域的图文资料、CT机、X射线机等设备的医用图像、天气云图等等,无论是利用哪种传输媒介进行传输的信息,都会遇到需要对大量图像数据进行传输与存储的问题。

而对大量图像数据进行传输要保证其传输的质量、速度等,对其进行存储也要考虑其大小容量等。

所以,要解决大量图像数据的传输与存储,在当前传输媒介中,存在传输带宽的限制,故在一些限制条件下传输尽可能多的活动图像,如何能对图像数据进行最大限度的压缩,并且保证压缩后的重建图像能够被用户所接受等问题,就成为研究图像压缩技术的问题之源。

图像数据之所以可以进行压缩,主要是因为一般原始图像数据是高度相关的,都含有大量的冗余信息。

图像压缩编码的目的就是消除各种冗余[2],并在给定的畸变下用尽量少的比特数来表征和重建图像,使它符合预定应用场合的要求。

第二节图像压缩技术标准
一、静止图像压缩标准
① JPEG标准:JPEG全名为Joint Photographic Experts Group,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。

JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(Adaptive Discrete Cosine Transform)方式为基础的算法作标准,于1991年3月提出10918号标准“连续色调静止图像的数字压缩编码”,即JPEG 标准。

它在较低的计算复杂度下,能提供较高的压缩比与保真度[3]。

JPEG采用4种编解码方式:串行DCT[4](Discrete Cosine Transform)方式、渐进浮现式DCT方式、无失真方式和分层方式。

由于JPEG优良的品质,使它在短短几年就获得极大的成功。

随着多媒体应用领域激增,传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。

因此,更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。

② JPEG2000:JPEG2000[5],正式名称为“ISO 15444”,亦是由JPEG组织负责制定。

自1997年3月开始筹划,2000年规定基本编码系统的最终协议草案才提出。

JPEG2000与JPEG 最大的不同,在于它放弃了JPEG所采用的以DCT为主的区块编码方式,而改用以DWT (Discrete Wavelet Transform)为主的多分辨率编码方式。

JPEG2000的新特征有:JPEG2000作为JPEG的升级版,具有良好的低比特率性能,特别是对细节丰富的图像以0.25bpp的比特率进行压缩时,总体上其压缩率比JPEG高约30%左右;
JPEG2000同时支持有损和无损压缩;而JPEG只支持有损压缩;
JPEG2000能实现渐进传送。

它先传输图像的轮廓,然后逐步传输图像数据的细节,接收端重构图像时让图像由朦胧到清晰显示,而不像JPEG那样由上到下由左到右的显示;
JPEG2000支持所谓的“感兴趣区域”编码(Region of interest coding)。

可任意指定图像上感兴趣区域的压缩质量,亦可以选择指定的部分先解压缩以突出重点。

二、运动图像压缩标准
(一)MPEG系列
MPEG(Moving Picture Experts Group)运动图像专家组成立于1988年,专门从事运动图像和伴音编码的标准制定。

MPEG最初的三个任务是制定1.5Mb/s,10Mb/s,40Mb/s的压缩编码标准,即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消。

MPEG-4于1994年开始制定,其目的是实现甚低码率的音/视频压缩编码。

MPEG-1是1991年11月提出草案,1992年11月通过,1993年8月公布的。

它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。

MPEG-1追求高的压缩比,去除图像序列的时间冗余度,同时满足多媒体等随机存取的要求。

它的图像类型有三种:I 图像,采用部编码,不参照其他图像,亦称部编码图像[6];P图像,采用预测编码,参照前一幅I或P图像作运动补偿编码,亦称预测编码;B图像,采用双向预测编码,参照前一幅和后一幅I或P图像作双向运动补偿编码,亦称双向预测图像。

MPEG-2制定于1994年,其设计目标是高级工业标准的图像质量以及更高的传输率。

它进一步提高了压缩比,改善了音频、视频质量,采用的核心技术是分块DCT和帧间运动补偿预测技术。

MPEG-2所能提供的传输率在3~10Mb/s间,在NTSC制下的分辨率可达720×486;可提供广播级的视像和CD级的音质;向下兼容MPEG-1,使得大多数MPEG-2解码器可播放MPEG-1格式的数据,如VCD;MPEG-2除了作为DVD的指定标准外,还可以用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频;MPEG-2可提供一个较广围的压缩比,以适应不同画面质量、存储容量以及带宽的要求。

MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准,并为各种通信环境提供一种通用的技术解决方案。

MPEG专家组深入分析了信息领域中计算机、通信以及以电视为代表的消费电器即3C交叉融合的方式后,认为MPEG-4应提供用于通信的新方式,其中心是基于容的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。

在其结构上应具有适应性与可扩性,以适应软、硬件技术的不断发展,及时融合新的技术。

由于MPEG-4的中心是基于容与交互性的,它就不再对低码率围做出特别要求。

MPEG-4在通信信息描述中,首次提出了对象的概念,如视频对象VO(Video Object)、音频对象AO(Audio Object)等,这是一个新的飞跃。

在编码方案上,MPEG-4仍是以块为基础的混合编码。

MPEG-4标准主要应用于视频、视频电子和电子新闻等,其传输速率要求较低,在4.8~64kb/s之间,分辨率为176 144。

MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少数据获得最佳图像质量。

MPEG-4更适用于交互AV服务以及远程监控。

MPEG-7由MPEG委员会于1998年10月提出提议,2001年9月正式成为国际标准,又称为“多媒体容描述接口(Multimedia Content Description Interface)”,其目标是建立对多媒体信息容的标准化描述,试图规不同种类多媒体信息的描述而不受表达形式的限制。

这些描述要与信息容直接相关以便用来快速有效的查询、访问各种多媒体信息。

MPEG-7的应用围广泛,既可以应用于存储,也可用于流式应用(如广播、将模型加入Internet等)。

它可以在实时或非实时环境下应用,如数字图书馆、多媒体编辑等。

另外,MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。

MPEG-21是基于“多媒体框架(Multimedia Framework)标准”的,其最终目的是建立
一个多媒体框架,以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。

MPEG-21的基本框架要素包括数字项目说明、容表示、数字项目的识别和描述、容管理和使用、知识产权管理和保护、终端和网络、事件报告等。

它支持的功能有:通过网络存储,使用并交互操作多媒体对象;实现多种业务模型,包括对和交易的自动管理;对容进行隐私的尊重等。

目前,这一标准仍处于开发当中。

(二)H.26X系列
1984年国际电报咨询委员会的第23研究组建立了一个专家组专门研究电视的编码问题。

经过研究与努力,1988年形成草案,1990年12月通过ITU-T的H.261[7]建议。

H.261是ITU-T针对可视和会议、窄带ISDN等要求实时编码和低延时应用提出的一个编码标准。

它允许“采用p⨯64kbit的图像业务的图像编解码”,因而H.261简称p⨯64。

其中p是一个整数,取值围为1~30,对应比特率为64kb/s~1.92Mb/s。

它建议采用中间格式CIF(Common Intermediate Format)和QCIF(Quarter CIF)解决不同制式通信的矛盾;解决了编码算法问题。

H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案,获得很好的图像压缩效果。

1995年,在H.261的基础上,ITU-T总结当时国际上视频图像压缩编码的最新进展,针对低比特率视频应用制定了H.263标准。

它提高了运动补偿的精度,常用于超低速率的图像传输,被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。

之后,ITU-T又对其进行了补充,以提高编码效率,增强编码功能。

补充修订的版本有1998年的H.263+,2000年的H.263++。

H.263采用第一代编码技术,在低速率视频传输质量,抗误码能力方面有明显提高,在视频业务传输中得到广泛应用。

与H.261只能工作在CIF、QCIF两种格式不同,H.263的信源编码器可以工作于5种图像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。

另外,H.263还在H.261基本编码算法
的基础上提供了四种可选编码模式:非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式。

由于仅限于五种固定图像大小、形状和时钟频率,它应用的灵活性较低。

H.263+[8]即ITU-T在1998年通过的H.263第二版,增加了12个新的高级模式,修正了第一版中的非限制运动矢量模式。

修订版首先在视频格式多样性上做了改进,还提出一些新技术:如附加增强信息模式和增强参考帧再采样模式,进一步扩大适用围,支持图像冻结和快照,以及多分辨率视频的应用,同时还增加了一些新技术来增强抗误码的能力:如分片结构模式、增强参考帧选择模式等,使视频信号经过压缩编码后能够在具有较大噪声干扰的窄带信道PSTN(Integrate Services Digital Network)和无限移动信道等上传输。

通过使用去方块效应滤波器,降低分辨率更新模式和修正量化模式等新技术,重建图像的主观质量显著提高。

由于H.263+的高级模式有些不能同时使用,有些需结合使用,如何选择合适的编码模式结合,对使用者来说很困难,因此ITU-T于2000年11月提出了H.263++,称为H.263的第三版。

它在H.263+的基础上增加了三个高级模式。

H.26L[9]标准是ITU-T和ISO/IEC联合制定的最新的图像压缩编码标准,它最先由ITU-T 的VCEG于1997年提出的,它的目标是提出一种更高性能的视频质量有实质性提高的视频编码标准。

该标准于2003年3月完成,在ITU-T中被称为Recommendation H .264而在ISO/IEC中成为MPEG-4标准的第10部分(ISO/IEC 14496-10 AVC,简称MPEG-4-10)。

H.26L的一个基本概念是引入了两个不同的层次:视频编码层(VCL:Video Coding Layer)以及网络适配层(NAL:Network Adapter Layer),前者负责对视频进行高效的压缩,后者则负责根据网络的传输需要进行编码数据的打包。

H.26L相对于其他标准有以下的特点:低码率、高质量、可达到比H.263+提高一倍以上的编码效率;广阔的应用围,既可用于严格时延限制的实时通信,可用于对时延要求不高的其他应用;稳健性,在网络中传
输时,有较强的抗误码性能;对各种网络的友好性,提供了友好的网络接口。

第三节图像压缩技术分类
图像压缩的优点在于,如抗干扰、处理精度高、灵活性好等,其中主要缺点是数据量太大,传输中占频带太宽。

数字图像数据量的压缩按应用不同可分为以下三类:
①信息保持型数据压缩(无损压缩):它要求压缩图像的比特数而不丢失任何信息。

主要用在图像信息保存中,要求图像存储能保持信息并能快速存取图像。

例如短时随机存取主要用于处理过程中的各个环节的存储,它要求经过不同存储介质多次重复不变质、不失真。

又如遥感图像,摄取地球上许多地区,因来不及处理,可暂时保存以便以后处理。

②保真度型数据压缩:传送的图像应该能够适应通信的通道限制,若接收端是人观看的情况,由于人眼的生理特性不需要过高的空间分辨率和灰度分辨率,因此在压缩过程中允许丢失一些人感觉不到的信息,这就是一种允许微量失真的图像压缩。

数字电视、图像传输和多媒体中常用这种压缩。

③特征保持型数据压缩(有损压缩):许多图像处理的目的是为了计算机的识别、分析、控制,这时并不需要图像的全部细节及灰度细节。

只要能保存图像中的感兴趣的特征信息,无用信息都可丢掉。

例如识别军舰类型、巡航导弹地形识别等只要轮廓信息就可以了。

又如在机场跑道的识别中农田、房屋信息皆可丢掉,只保留跑道的图像信息即可。

这些图像信号可以进行特征保持型数据压缩。

图像编码也可以根据编码所在数据域划分为空间域编码和变换域编码。

第四节图像压缩技术的发展趋势
从国际数据压缩技术的发展尤其是MPEG的发展可以看出,基于容的图像压缩编码方法是未来编码的发展趋势。

它不仅能满足进一步获得更大的图像数据压缩比的要求,而且能够实现人机对话的功能。

另外,任意形状物体的模型建立的关键问题还没有解决,这严重影响其应用的广泛性。

通过元数据进行编码也是今后编码的发展方向。

元数据是指详细的描述音/视频信息的基本元素,利用元数据来描述音视频对象的同时也就完成了编码,因为此时编码的对象是图像的一种描述而不再是图像本身。

从另一个角度来说,进一步提高压缩比,提高码流的附属功能(码流容的可访问性、抗误码能力、可伸缩性等)也将是未来的编码的两个发展方向。

第五节本章小结
图像压缩技术已经为开拓全新的应用领域打下了坚实的基础。

图像压缩技术的基本应用在更深更广层次上的应用就成为我们研究的热点。

本章重点对现代图像压缩技术进行概括性介绍。

图像压缩就是减少表示数字图像时需要的数据量。

是指以较少的比特有损或无
损地表示原来的像素矩阵的技术,也称图像编码。

其次介绍了静态与动态图像的压缩标准。

最后分别介绍了图像压缩技术的分类。

第二章图像有损压缩技术
随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。

图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。

利用图像压缩可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。

第一节有损压缩概述
有损压缩[10]是对利用了人类是绝对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全回复原始数据,但是所损失的部分对理解原始图像的影响缩小有损压缩,却换来了大得多的压缩比。

有损压缩广泛应用于语音,图像和视频数据的压缩。

常见的声音、图像、视频压缩基本都是有损的。

有损压缩可以减少图像在存和磁盘中占用的空间,在屏幕上观看图像时,不会发现它对图像的外观产生太大的不利影响。

因为人的眼睛对光线比较敏感,光线对景物的作用比颜色的作用更为重要,这就是有损压缩技术的基本依据。

有损压缩的特点是保持颜色的逐渐变化,删除图像中颜色的突然变化。

生物学中的大量实验证明,人类大脑会利用与附近最接近的颜色来填补所丢失的颜色。

例如,对于蓝色天空背景上的一朵白云,有损压缩的方法就是删除图像中景物边缘的某些颜色部分。


在·屏幕上看这幅图时,大脑会利用在景物上看到的颜色填补所丢失的颜色部分。

利用有损压缩技术,某些数据被有意地删除了,而被取消的数据也不再恢复。

无可否认,利用有损压缩技术可以大大地压缩文件的数据,但是会影响图像质量。

如果使用了有损压缩的图像仅在屏幕上显示,可能对图像质量影响不太大,至少对于人类眼睛的识别程度来说区别不大。

可是,如果要把一幅经过有损压缩技术处理的图像用高分辨率打印机打印出来,那么图像质量就会有明显的受损痕迹。

在多媒体应用中,常见的压缩方法[11]有:PCM(脉冲编码调制),预测编码,变换编码,插值和外推法,统计编码,矢量量化和子带编码等,混合编码是近年来广泛采用的方法。

mp3、divX、Xvid、jpeg、rm、rmvb、wma、wmv等都是有损压缩。

有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。

有损数据压缩又称破坏型压缩,即将次要的信息数据压缩掉,牺牲一些质量来减少数据量,使压缩比提高。

这种方法经常用于因特网尤其是流媒体以及领域。

在这篇文章中经常成为编解码。

它是与无损数据压缩对应的压缩方法。

根据各种格式设计的不同,有损数据压缩都会有generation loss:压缩与解压文件都会带来渐进的质量下降。

第二节有损压缩机制
由于图像数据之间存在这一定的冗余,所以使得数据的压缩成为可能。

信息论的创始人Shannon 提出把数据看作是信息和冗余度[12](redundancy)的组合。

所谓冗余度是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到
减少冗余压缩数据的目的。

为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。

图像的冗余包括以下几种:
①空间冗余:像素点之间的相关性;
②时间冗余:活动图像两个连续帧之间的冗余;
③信息熵冗余:单位信息量大于其熵;
④结构冗余:区域上存在非常强的纹理结构;
⑤知识冗余:有固定的结构,如人的头像;
⑥视觉冗余:某些图像的失真是人眼不易觉察的。

对数字图像进行有损压缩通常利用两个基本原理:
一是数字图像的相关性。

在图像的同一行相邻像素之间,相邻像素之间,活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也即去除或减少图像信息中的冗余度也就实现了对数字图像的有损压缩。

帧像素的相关称为空域相关性。

相邻帧间对应像素之间的相关性称为时域相关性。

二是人的视觉心理特征。

人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分,适当降低编码精度而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像有损压缩的目的。

有损压缩有两种压缩机制[13]:
①有损变换编解码:首先对图像或者声音进行采样、切成小块、变换到一个新的空间、量化,然后对量化值进行熵编码。

②预测编解码:先前的数据以及随后解码数据用来预测当前的声音采样或者图像帧,预测数据与实际数据之间的误差以及其它一些重现预测的信息进行量化与编码。

有些系统中同时使用这两种技术,变换编解码用于压缩预测步骤产生的误差信号。

相关文档
最新文档