图像超分辨率重建和插值算法研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
另外,Topaz Labs已经将图像和影像的增强技术软件商业 化应用。LCAV(Audiovisual CommunicationsLaboratory) 开发了在MAC和XP操作系统下的SRR程序。其他一些视 频网站已公开出售增强视频流分辨率的软件插件等。 国内,中科院自动化研究所、武汉大学、哈尔滨工业大学、 香港中文大学等在SRR领域的研究上比较活跃,为图像重 建相关领域的研究和发展做出了巨大贡献,其中一部分是 关于图像频谱外推、混叠效应消除的研究;另一部分是关 于SRR算法的改进,例如MAP算法和POCS算法的改进, 对小波域隐马尔可夫树
图像超分辨率重建和插值算法研究
• 超分辨率重建的背景和意义
图像的高分辨率是指着图像含有的像素密度高, 能提供丰富的细节信息,对客观场景的描述更准 确细致。 高分辨率图像在信息时代的需求非常广泛,诸 如卫星遥感图像、视频安全监控、军事侦查航拍 领域、医学数字影像和视频标准转换等领域都具 有十分重要的应用。
三.超分辨率重建中的插值
• 插值技术概述
工程实践和科学实验等实际问题的解决过程中, 通常需要研究某些变量之间的函数关系,这些函 数关系常常隐含在观测数据中,能否找到变量之 间相对准确的函数关系就成为解决问题的关键。 如对实践中的某个物理量进行观测,在若干个不 同的地方得到相应的观测值,需要从观测数据 (xi,yi), i =1,....,n中找出自变量与因变量间的函数关 系,用近似函数y =f (x)来表示。近似函数的产生 办法多种多
经典插值算法
• 最邻插值
最近邻插值,又叫零阶插值(Nearest Neighbor Interpolation),是最简单的插值方法。它是用原 始图像中的特定像素点的像素值去填充缩放后的图 像,容易实现,对于灰度图像,即将原始图像进行 逐点处理,把每一个像素点的灰度值进行插值倍数 次复制。它采用的插值函数是一个常量函数,是矩 形函数如下:
综上,由于技术水平和经济条件的限制,使得 成像传感器和光学器件的性能指标可能无法满足 应用的需要,因此,需要采用信号处理方法提高 图像分辨率。经典图像插值算法可以提高图像分 辨率,包括最近邻插值、线性插值、双三次插值、 样条插值,但只是可以增加图像的像素尺寸,改 变图像的视觉效果,不能突破原有的信息量。因 此,需要有一种新的方法来克服信息量不足的问 题。
对具有相互位移的低分辨率图像序列进行非均匀插值处理, 然后对插值的重建图像进行去模糊处理。随后凸集投影法 出现了。最早是由Stark和Oskoui提出将解的先验知识融 入到重建过程中迭代求解,从多个约束集合的交集中求解 高分辨率图像。针对SRR中依赖配准精度的问题,出现了 基于卡尔曼(Kalman)滤波的自适应滤波SRR算法,该 算法的优化目标是最小化均方误差,具有较强的对配准误 差的鲁棒。Elad和Feure对包含任意图像运动的超分辨率 恢复进行了研究,但是基于动态低分辨率图像序列的该算 法的缺点是容易造成迭代过程中积累误差效应。通常, SRR算法中需要求解一个维数很大的方程组,计算量大, 解空间的维数也不小,非常复杂。于是正则化方法在SRR 中得以广泛的发展和应用,利用不适定性问题的逆问题求 解SRR方程组。确定性正则化方法主要有:基于L1范数加 双边滤波估计(L1+BTV)、约束最小二乘法估计 (CLS)。
样,通常可采用数据拟合与函数插值两种办法实现。 数据拟合主要考虑受随机观测误差的影响,寻求整 体误差最小能反映观测数据的近似函数,并不要求 所得到近似函数满足y i=f (x i) ,i=1,...,n。函数插值 要求相反,近似函数必须满足y i=f (x i) ,i=1,...,n。 这就要求观测数据相对准确,不考虑观测误差的影 响。拉格朗日(Lagrange)插值法是以十八世纪法 国数学家约瑟夫·路易斯·拉格朗日命名的一种多项 式插值方法。Lagrange插值法可以找到一个多项式, 其恰好在各个观测的点取到观测到的值。
于图像统计特征自学习的插值方法,以及基于最 佳重建的插值方法等。虽然这些方法一定程度上 提高了插值图像的质量,但是所需的计算量较大, 复杂度高。Farsiu等从线性插值方法出发,提出 了平移相加(Shift and Add)法,该方法仅仅需 要将核函数进行最佳平移,就能使图像的清晰度 大大提高,但是同时强化了边缘锯齿现象,限制 了该算法的应用范围。
这样的多项式称为Lagrange插值多项式。数学上, Lagrange插值法可以给出一个恰好穿过二维平面 上若干个已知点的多项式函数。图像插值方法多 种多样,应用较多的是基于多项式函数的内插, 如Lagrange内插和样条内插等。这些方法均假设 图像的各局部区域能用多项式函数表征,用已知 各像素点拟合出连续函数并对其进行重采样以获 得高分辨率图像。优点是速度快,缺点是不精细, 有较严重的边缘锯齿和细节模糊现象。不少学者 从不同方面对插值方法进行了比较,提出了多种 解决方案,如多分辨率小波插值方法,基
最近邻插值的优点是简单易实现计算量很小, 使得这种方法在很多场合得以应用。它的缺点是 插值后的图像质量不高,常常出现方块效应和锯 齿效应。
• 线性插值
线性插值,又叫双线性插值(Bilinear Interpolation),也是一种简单的插值方法, 广泛在图像重建领域中使用,主要是由于线 性插值较低的计算量和优于邻域插值的图像 质量,因为它是二阶代数拟合。它被称为双 线性插值是因为在对图像的插值是分两次对 行、列像素分别线性插值处理得到的。
(HMT)模型SRR方法的改进,对SRR插值方法的改进, 以及对SRR重构方法的改进。超分辨率的概念最早出现在 光学领域,是指复原衍射极限以外数据的过程。第一次超 分辨率概念的提出是在1955年Toraldo di Francia关于光 学成像的雷达文献中。 图像SRR的研究要始于上世纪80年代,Tsai和Huang[4]首 先提出了基于序列或多帧图像的SRR问题,他们分析并证 明了:彼此间互相有平移的图像序列中获取分辨率增强的 静态图像的可能性,而且给出了在频域里解决问题的方法。 1982年,H.Webb和D.C.C.Youla在总结前人的基础上, 提出了凸集投影图像复原(POCS)方法。 1986年,S.E.Meinel提出了服从泊松分布的最大似然 (Possion-ML)复原方法。 1991年,B.R.Hunt在贝叶斯理论的基础上,提出
超分辨率重建过程中,由于低分辨率图像序列 往往受光学模糊、运动模糊、噪声以及混叠因素 的影响,所以超分辨率重建技术涵盖图像复原技 术。二者的区别是图像复原技术是在不改变图像 尺寸的情况下恢复一幅图像,所以图像复原技术 和图像超分辨率重建具有相当紧密的联系,可认 为图像超分辨率重建是在理论上的第二代图像复 原问题。研究图像超分辨率重建技术一方面理具 有重要的理论意义,推动图像复原技术的进一步 发展;另一方面具有重要的实践意义,克服光学 成像系统硬件方面的局限性,某些场合下仍然可 以继续使用原有的低分辨率成像系统,在较小数 据量传输的情况下,获得满足特定分辨率要求的 图像。
图像数字化处理过程中:成像、转换、编码、压 缩、存储都会影响到图像的分辨率。另外,还有 成像噪声、电气噪声、系统噪声的叠加。所以实 际应用中,无法按照理想状况实现,存在的这些 因素,必然影响图像的质量,获得较高质量的图 像分辨率也是相当困难的。理论上,获得高分辨 率只要增加成像系统的个数,最直接的方法是, 通过传感器制造技术减小像素尺寸,增加单位面 积的成像点阵就可以解决问题。
了泊松最大后验概率(Possion-MAP)复原方法,并且在 1993年对超分辨率的定义和特性做了分析,提出物体的空 间限制、噪声和采样间隔决定图像超分辨率的能力。 2006年,P.Vandewalle与S.Süsstrunk提出了图像间存在 旋转的解决方法,将空域的旋转参数估计通过频域积分方 法转换到频域的平移估计。频域方法进行去混叠处理虽然 直观简单,但是只能处理具有全局位移的情况,因为它们 的前提条件是线性空间不变模型为基础的全局位移。频域 中难以考虑先验知识,缺乏数据间的相关性。频域方法对 模型误差极为敏感,图像序列配准步骤处理稍有偏差便会 导致重建图像质量极大的降低,应用范围因此受到很大限 制。在空域内实现分辨率增强是另一种提高图像分辨率的 方法。Ur和Gross利用改进的多通道采样理论,
上世纪70年代,CMOS和电荷耦合元件CCD (Charge-coupled device)做为图像传感器已广 泛用于获取数字图像。通常情况,图像传感器均 能获得较好的质量,但在特殊场合,受到诸多因 素影响,导致图像质量下降。如图像采集获取过 程中:成像环境、成像距离、传感器形状和大小、 光学系统的误差、空气扰动、物体运动、镜头散 焦的影响。
线性插值的基本思想是:在原始离散信号的 两点A、B间插入若干个点,这些点的灰度值使A、 B之间的灰度值呈线性过渡。其基本思想就是把 目标点附近的原始点的灰度值按一定的权值相加, 其权值一般取为目标点和原始点之间的距离。其 所采用的采样函数是一个三角函数:
线性插值放大产生的图像比最近邻域插值产生的图像平滑, 不会出现灰度值不连续的的情况。由于线性插值具有低通 滤波器的性质,使高频分量受损,当放大倍数增大时,放 大后的图像也会出现明显的块状现象,使图像轮廓一定程 度上变得模糊。具体,对于一个插值像素点,假设通过反 变换得到的浮点坐标为(i +u ,j +v),其中i、j均为非负整数, u、v为[0,1)区间的浮点数,则该像素点的像素值f (i +u ,j +v)可由原始图像中坐标为(i, j)、(i +1,j)、(i ,j+1)、(i +1,j+1)所对应的周围四个像素点值决定,即:
• 超分辨率重建的综述和现状
国外,近20多年来,在众多科研工作者的不断探索与研究 下,形成了几种较为成熟的图像SRR算法理论,研究主要 是在降质过程模型、运动估计、算法性能等方面,图像 SRR也在实际中得到应用。 欧洲航天局的“火星快车”探测器携带的立体照相机拍摄 到了高清晰的火星峡谷图片。 美国宇航局的火星勘测轨道器携带的高分辨率成像科学实 验摄像仪拍摄了数千张火星表面奇特、迷人而又壮观景象 的照片,以供科学研究。下一代火星探测机器人“好奇者” 将于2011年发射升空,总部设在圣地亚哥的马林空间科学 系统(Malin Space Science Systems)正在研制的3D摄 影机,预计将挂载在机器人头顶上。
近年来,根据所观测到的多幅低分辨率的图像, 运用软件技术手段,通过信号处理方法,提高图 像分辨率的技术已成为图像研究领域的热点之一, 显示出极大的现实意义和应用价值。这个信号处 理过程通常包括两个步骤:首先图像配准,即估 计低分辨率图像之间亚像素级别的相对位移;其 次图像融合,将多幅低分辨率图像融合成一幅高 分辨率图像。这种解决图像分辨率提高问题的有 效办法被称为图像超分辨率重建(Superresolution Reconstruction,SRR)。
随机性正则化方法主要有:最大似然估计(ML)、最大 后验概率估计(MAP)等。MAP方法的优点是结合空域 先验信息的能力强,结合有效的最优化方法进行求解利于 扩展和改进,因此得到广泛应用。MAP方法可以加入不同 的图像先验模型,在解中加入先验约束,能够保证解的唯 一存在性。虽然空域方法的缺点是计算量大,代价高。为 减少计算复杂度,又产生了针对空间模糊不变和平移运动 情形的快速SRR算法。 美国加州大学Milanfar等提出了的大量实用超分辨率图像 复原算法,Chan等从总变差正则方面,Nagy等从数学方 法、多帧图像的去卷积和彩色图像的超分辨率增强方面, 对超分辨率图像恢复进行了研究。此外,Rajan和Wood等 分别从物理学和成像透镜散射的角度提出了新的超分辨率 图像恢复方法;韩国Pohang理工大学对各向异性扩散用 于超分辨率。图像超分辨率重建技术的研究如火如荼,带 动了视频超分辨率重建的研究,但是仍然还有许多实际问 题需要有待解决。