图像编码、处理、识别技术综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像编码、处理、识别技术综述

摘要:随着科技水平的发展和生活质量的提高,在生产生活中,实时处理图像技术被应用得越来越广泛,数字图像处理技术涉及信息科学、计算机科学数学、物理学及生物学,应用于生活中的各个领域。图形识别技术也越来越多地渗透到我们的日常生活中,详细叙述了图像处理、编码和识别技术,展望图像处理技术在现实生活种的重要性。

关键词:科技,图像处理,图像识别

1、图像编码技术

1.1图像编码基础

图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是设法改变信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界,压缩比饱和于10:1,如Huffman编码、算术编码、行程编码等。另一种是联合信源的冗余度也寓于信源间的相关性之中,去除它们之间的相关性,使之成为或基本成为不相关信源,如预测编码、变换域编码、混合编码等,但也大都受信息熵的约束。总体上可以概括为熵编码,预测编码,变换编码,也称为三大经典编码方法。

随着人们对传统压缩编码方法的深入研究和应用,逐渐发现了这些传统方法的许多缺点。如高压缩比时恢复图像会出现方块效应,人眼视觉系统(HVS)的特性不易被引入到算法中等。为了克服这些缺点,1985年M.Kunl等人提出了第2代图像压缩编码的概念。经过近20年的发展,在这一框架下,人们提出了几种新的编码方法:分形编码、小波变换编码和基于模型的编码方法等。于是,对数据压缩技术的研究就突破了传统Shannon理论的框架,使得压缩效率得以极大提高。

1.2图像编码基本原理

数字图像的冗余主要表现为一下几种形式:空间冗余,时间冗余,视觉冗余,信息熵冗余,结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别时空间冗余,时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之

一。虽然表示图像需要大量的数据,但是图像数据是高度相关的,或者说存在冗余信息,去掉这些信息后可以有效压缩图像,同时不会损害图像的有效信息。

1.3图像编码分类(第二代)

1.3.1分型编码

分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展,是研究不规则图形和混沌运动的一门新科学。它描述了自然界物体的自相似性,这种自相似性可以是确定的,也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像,例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性,因此编码效率与图像性质学特性有关,而且分形图像编码方法实质上是通过消除图像的几何冗余度来压缩数据的,根本没有考虑人眼视觉特性的作用。

分形图像压缩的概念是80年代中后期由Barnsley等人提出的,其理论基础是迭代函数系统(IFS: Iterated Function System)理论,着眼点是利用自然图像普遍存在的自相似特性(几何尺度不论怎样变化,景物任何一小部分的形状都与较大部分的形状极其相似),将这些自相似的结构以某种函数映射关系的形式表现出来,当这些函数映射关系满足一定的条件时,就可通过迭代计算重建图像。所以,分形图像编码过程是找映射关系的过程,而解码过程则是依照映射关系迭代计算的过程。整个方法包括以下步骤:

(1)将原图(集合X)予分割为若干分形子图X(m),m=1,2,3⋯M;

(2)对每一个子块X(m)提取IFS代码;

(3)对IFS代码进行编码、传输(或储存);

(4)译码形成IFS代码;

(5)由IFS代码构造X(m)的重构子块Y(m);

(6)由Y(m)构造X的重构图Y。这种分形图像压缩方法的实现不需要对图像有什么先验知识的了解。

1.3.2模型编码

基于模型的图像编码技术是近几年发展起来的一种很有前途的编码方法它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型,针对输入的图像提取模型参数,或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模,一般要求对输入图像要有某些先验知识。目前研究最多、进展最快的是针对可视电话应用中的图像序列编码。这类应用中的图像大多为人的头肩像。

基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题,例如:(1)模型法需要先验知识,不适合于一般的应用。(2)对不同的应用所建模型是不一样的。(3)在线框模型中控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取。(4)由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的,因此看起来不够自然。(5)传统的误差评估准则不适合用于对模型编码的评价。

1.3.3小波变换编码

一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算,从而可把信号分解到一系列频带上进行分析处理,将其离散化后即为离散小波变换。

小波变换图像编码压缩的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量,即包含图像的基本特性。它在图像重构算法中起主导作用,对重建图像的质量有很大影响,因此这部分信号应精确保留。高频子图像的系数分布符合广义高斯分布,对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性,根据对人眼视觉系统的研究可知,人眼视觉灵敏度具有明显的低通特性,而且对不同方向上的敏感度也不一样,尤其是对倾斜方向的刺激不太敏感,如人眼对对角线方向子图像系数误差敏感度较低,因此可对对角线方向子图像进行粗量化高压缩。小波变换后的能量主要集中在低频系数分量,而其他高频系数分量大多为零值,这为高倍率压缩提供了可能。通过选择合适的具有平滑特性的小波基,就可消除重建图像中出现的方块效应,减小量化噪声,获得较好的重建图像质量。

小波变换图像编码压缩方法可分为如下两大类:基于传统的图像编码方法、基于分形理论的小波变换图像编码方法。

1.4图像编码评价

随着众多图像压缩算法的出现,如何评价图像压缩算法就成为重要的课题。一般来说,评价图像压缩算法的优劣有以下4个参数:

(1)算法的编码效率

(2)编码图像的质量

(3)算法的适用范围

(4)算法的复杂度

2、图像处理技术

2.1图像基础

相关文档
最新文档