研究生学位论文选题报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编码阶段,对于每个子块Ri,为了寻求其最佳匹配块D∈Ω,必须求解下面的极小化问 题(把R、D视为向量): 其中是向量2-范数,mi、si和oi分别表示Ri的最佳匹配块的序号和对该匹配块对比度和 亮度的最优调整。极小化上述问题的三元组称为 Ri的分形码,其中、是量化值。 全体Ri的分形码就组成原始图像的分形码,它描述了一个使图像近似不变的压缩 仿射变换T。 分形编码虽然压缩比比较高,解码速度快,但其编码速度满,尤其是子块和父块匹配 的搜索复杂度很高,难以做到实时处理。因此,近年来有关分形和其他方法的结 合的研究正在开展。本文就是采用分形和小波变换相结合的方法进行编码。因为 小波变换具有高效的能量压缩和空间-频率局部特性被广泛应用于图象处理领域。 小波编码的基本思想,是将原始图象经二维小波变换转换成小波域上的小波系数, 然后对小波系数进行量化编码。一幅图象经过小波变换分解后有两种相似性可供 利用:一种是子图象本身的自相似性,也即编码时子图象作为一幅空间域的图象, 可以利用通常的分形图象编码方法单独进行图象压缩编码;另一种是同方向不同 分辨率的子图象之间的互相似性。在编码中我们以树为单位。代替在空间域中的 子块和父块的匹配,因而分形编码的方法就延伸到小波域中进行,在空间域中的 取块和放块,在小波域中为取树和放树,空间域中父块和子块的仿射变换,在小 波域中为父树与子树的仿射变换。本文编码的步骤是首先对图像进行小波变换, 小波基一般用哈尔小波或双正交小波,第二对小波变换后的图像进行分形编码。 需要修改,因不知其意 关于分形与小波结合的编码方法,文献[11]讨论了基于小波变换的迭代分形编码方法。 提出了以细节失量的相似度(?),作为匹配判据的思想。文献[12]给出了基于 小波分解的统计预测分形编码方案。实验结果表明利用统计预测技术与纯粹的小 波分解及VQ方法相比较能获得1.5倍的编码效率(?)的提高。 本文主要着力于研究小波-分形图像进行压缩编码方法的研究。
一、论文选题报告(申请时间:2003 年12月9 日)
论文题目:小波-分形图像压缩编码的研究
研究方向:分形理论及应用
部、省级 项 目
国家项目
横向联系
自 拟
√
ห้องสมุดไป่ตู้
合同编号
课题来源
经费数(万 元)
基础研究
应用研究 √
工程应用
其它
题目类型
报告内容:(课题学术和实用意义,国内外现状综述;研究目的、 内容、技术路线;可行性论证等)
二、分形图像编码概述 基于分形理论的图象压缩方法介于(3)和(4)之间,但有又其独特的一面,即把一 幅图象看作一个分形,只要找到迭代函数的参数,那么就可用迭代的方法把原来 的图象恢复出来。分形编码的原理从数学上看是简单的,基于拼贴定理,待编码 图像由使得它近似不变的压缩仿射变换表示,压缩映象原理保证不动点图像由压 缩变换迭代作用于任意初始图像来生成,拼贴定理则保证不动点图像是待编码图 像的近似图像。 分形图像编码的数学基础主要是迭代函数系统、压缩映象原理和拼贴定理。迭代函数 系统(Iterated Function System,IFS)是Bernsley及其研究小组在Hutchinson 1981年提出的迭代函数理论(Iterated Function Theory)的基础上发展起来的, 它是分形几何的一个重要组成部分。拼贴定理是Bernsley 于20世纪80年代后期提 出的,它是压缩映象原理的一个简单推论,并成功地用于集合、函数(包括信号、 图像)等的逼近。 分形理论(核心是分形几何)是非线性科学研究中十分活跃的一个分支,特别是十余 年来在计算机图像处理和分析中显示出越来越重要的作用。自然图像的模拟、图 像压缩、图像纹理分析、数字水印技术和模式识别等领域的大量学术论文都可见 分形的身影。总之,分形图像编码是分形几何、泛函分析等现代数学分支最成功 的应用之一。
现代多媒体应用和通信技术的发展,提出了大量存贮和传输各种静态图像和动态 图像的问题,高质量传输和存贮图像的一种途径是把连续的图像信息离散化形成数字 化图像。一幅图像的各象素之间存在很大的相关性,因此,可以利用一些编码的方法 删去相关性达到减少冗余的目的,使其数据量大大小于原始的图像的数据量,接着对 压缩后的图像进行存贮或传输。如何用尽可能少的数据来尽可能不失真地表示图像已 成为这些应用的关键,这就是图像压缩编码问题。 自1948年Oliver提出PCM编码理论开始,图像压缩技术走过了50余年的历史。许 多压缩方法(如DPCM、DCT、VQ等)被提出,并得到较为广泛的实际应用。目前还 有了基于DCT 等的国际压缩标准(如JPEG,MPEG等)。然而,随着这些传统编码方 法的深入应用,人们逐渐发现了它们的许多缺点(比如高压缩比时图像出现的严重方 块效应,压缩算法不易反映人的视觉系统特性等等)。为克服传统压缩方法中的上述 缺点,人们不断探索新的图像编码方法。分形图像编码就是在这样的背景下产生的, 它被认为是第二代图像压缩编码技术的三大方法之一。分形图像编码是一个新颖的迭 代解码压缩技术。自1990年初Jacquin提出实用的分形块编码(fractal block coding) 以来,短短十余年间,分形图像编码的研究取得了长足的进展。
一、图像压缩编码方法 图像压缩编码可分为无失真编码和限失真编码。为了进一步提高图像编码的压缩 比,除了利用图像中象素之间的相关性外,还必须充分利用人的视觉系统对图像灰度 灵敏度的差异,因此,限失真编码便成了压缩图像的常用方法。 (1) 变换编码:在变换编码中,进行图像编码的一项重要工作就是寻求一种正交变 换,图像数据经这种变换后,可以用一组解除了相关性的数据(变换系数)代替 对于大多数自然图像,变换得到的系数值大都很小。如果把这些系数按其含有图 像信息及其对图像主观质量影响的重要程度顺序排列起来,那么,粗量化或完全 忽略掉一些不重要的系数将不会对重建图像质量发生什么重大影响(只产生很少 的失真),从而达到压缩数据的目的。图像处理学中介绍的各种变换(如离散余 弦变换,小波变换等)都可以用于变换编码。 (2) 预测编码:图像的相邻象素之间通常呈现出高度的相关性,这种高度的相关 性使得未加工数据中蕴涵高度的信息冗余。因此,解除数据的这种相关性有可能 获得图像数据的有效压缩编码。预测编码(又称DPCM,Differential Pulse-Code Modulation,差分脉冲编码调制)就是基于这样的基本原理,每个像素可以根据以 前已知的几个象素值来预测。因此在预测法编码中,编码和传输的并不是象素取 样值本身,而是这个取样值的预测值与实际值之间的差值。
研究生学位论文选题报告及论文工作实施计划
学 专
院:数 理 学 院 业: 应 用 数 学 静 士
研 究 生:杨 学位级别:硕
指导教师:何 传 江
入学年月:2002年9月
重庆大学研究生院
2003年12 月9 日
说 明
一、论文选题报告由研究生向教研(研究)室汇报并听取意见后,整理成文填写。 二、研究生应在入学后的第三学期内完成选题报告。 三、本表一式三份,一份交学院,指导教师和研究生各存一份。研究生自存表应于答 辩前交学院,作为答辩申报材料之一。
基于IFS的早期分形压缩编码(数学家Barnsley [1] 提出)的大致步骤为:通过一些如颜 色分割、边缘检测、频谱分析、纹理分析等图像处理技术,从图像中提取分形子图 (如一棵树、一片云、一片海景),使得每个子图具有一定的分形结构(子图的整体 与局部之间存在某种自仿射特征),由此构造由大量子图组成的分形库。分形库中每 个子图对应一个仿射变换(迭代函数),这些迭代函数具有仿射形式,因此只要几个 参数即可确定。此外,需要存储的并不是子图本身,而是由若干参数组成的IFS码 (仿射变换参数),因此,分形库并不占有很大的储存空间。编码时,一幅数字图像 被划分成互不重叠、形状任意的子图。对于每个子图,在分形库中寻找与之最仿射相 似的子图(即在旋转、反射、伸缩、偏斜等操作之后与之相似),以保证它们的“拼 贴”(Collage)与原始图像相似。于是,一幅图像对应于一个由若干迭代函数组成 的迭代函数系统,迭代函数系统的所有参数就构成图像的IFS码。因此,这种编码方 法能够实现很高的压缩比(Barnsley称可以得到10000:1以上的压缩比)。尽管事实 证明这种方法是不实用的(因为编码时间太长,且需要人机交互,对操作者有较高要 求),但它毕竟为图像压缩提供了一条与以往完全不同的新思路 。实际上, Jacquin[8,9]提出的实用分形块编码正是在此基础上发展起来的。 从矢量量化编码的观点来看,分形块编码算法可描述如下:图像被分割成大小两类子块, 小块称为range块(子块),大块称为domain块(父块),子块互不重叠且覆盖整幅 图像,父块可以重叠且边长为R块的两倍。父块经四邻域象素平均收缩为子块的大小, 然后每个这样的父块按等距变换(4个旋转和4个反射)扩大为8个子块,这种子块的 全体就构成虚拟码书(记为Ω)——与矢量量化编码不同,分形解码器并不存在(也 不需要)这样的码书,而是以自参考方式暗含于图像中,故称为“虚拟码书”。然后 每个子 块R由其最佳匹配块D∈Ω的亮度变换(对比度和亮度调整)来近似,即,其 中1是亮度值均为1的常值块,s、o起调整D的对比度和亮度的作用。
(3)
矢 量 量 化 : 预 测 编 码 与 变 换 编 码 都 属 于 标 量 量 化 ( 数 值 量 化 , Scalar Quantization),即先将图像经某种映射变换变成一个数列,然后逐一进行量化编 码。向量量化(Vector Quantization, VQ)与标量量化方法不同,它把图像数据分 成很多组,每组看成为一个向量,然后逐个向量进行量化编码。(R.M. Gray and D. L. Neuhoff, Quantization, IEEE Trans. Information Theory, vol.44, no.6, Oct. 1998, pp. 2325-2383) (4) 模型法:把图像分割成几个基本模型,模型具有一定的参数,只要将参数进行 编码传输,就可恢复出原始图像。 众所周知,经典压缩编码方法主要依据图像本身固有的统计特性,并利用了人眼 视觉系统的某些特性,但是利用得还不够充分。随着感知生理-心理学的发展,人 们越来越清楚地认识到,人的视觉感知特点与统计意义上的信息分布并不完全一致, 统计上需要许多信息量才能表征的某些特征对视觉感知也许并不重要。因此,从感 知角度来说,详细表征这部分特征是不必要的。受此启发,人们从微观转向宏观去 研究开发新的编码方法(因为视觉感知是一种宏观认识过程),并注重对感知特性 的利用。新一代编码技术,如子带与小波编码(Subband and Wavelet Coding)[J. W. Woods and S. P. O. Neil, Subband Coding of Image, IEEE Trans. on ASSP, 1986, 34 (6), pp. 1278-1288; S. Mallat, A theory for multiresolution signal decomposition the wavelet representation, IEEE Trans. Pattern Analysis and Machine Intelligence, vol.11, no. 7, July 1989, pp. 674-693; M. Vetterli, Wavelets and Filter Banks: Theory and Design, IEEE Trans. Signal Processing, 1992, 40(9), pp.2207-2232.]、模型编码(Model Based Coding)[K.Aizwa and T. S. Huang, Model-based image coding: advanced video coding techniques for very low bitrate applications, Proceedings of the IEEE, vol. 83, no.2, 1995, pp.259-271]、神 经网络编码[R.D. Dony and S. Haykin, Neural Network Approaches to Image Compression, Proceedings of the IEEE, vol. 83, no.2, 1995, pp.288-303; J. Jiang, Image compression with neural networks - A survey, Signal Processing: Image Communication 14 (1999) 737-760; M.Egmont-Petersena, D. de Ridderb and H. Handelsc, Image processing with neural networks - a review, Pattern Recognition 35 (2002) 2279–2301.]与分形编码(Fractal Coding)就是在这样的背景下发展起 来的。