图像融合技术中英文对照外文翻译文献

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中英文资料对照外文翻译
使用不变特征的全景图像自动拼接
摘要
本文研究全自动全景图像的拼接问题,尽管一维问题(单一旋转轴)很好研究,但二维或多行拼接却比较困难。

以前的方法使用人工输入或限制图像序列,以建立匹配的图像,在这篇文章中,我们假定拼接是一个多图像匹配问题,并使用不变的局部特征来找到所有图像的匹配特征。

由于以上这些,该方法对输入图像的顺序、方向、尺度和亮度变化都不敏感;它也对不属于全景图一部分的噪声图像不敏感,并可以在一个无序的图像数据集中识别多个全景图。

此外,为了提供更多有关的细节,本文通过引入增益补偿和自动校直步骤延伸了我们以前在该领域的工作。

1. 简介
全景图像拼接已经有了大量的研究文献和一些商业应用。

这个问题的基本几何学很好理解,对于每个图像由一个估计的3×3的摄像机矩阵或对应矩阵组成。

估计处理通常由用户输入近似的校直图像或者一个固定的图像序列来初始化,例如,佳能数码相机内的图像拼接软件需要水平或垂直扫描,或图像的方阵。

在自动定位进行前,第4版的REALVIZ拼接软件有一个用户界面,用鼠标在图像大致定位,而我们的研究是有新意的,因为不需要提供这样的初始化。

根据研究文献,图像自动对齐和拼接的方法大致可分为两类——直接的和基于特征的。

直接的方法有这样的优点,它们使用所有可利用的图像数据,因此可以提供非常准确的定位,但是需要一个只有细微差别的初始化处理。

基于特征的配准不需要初始化,但是缺少不变性的传统的特征匹配方法(例如,Harris角点图像修补的相关性)需要实现任意全景图像序列的可靠匹配。

在本文中,我们描述了一个基于不变特征的方法实现全自动全景图像的拼接,相比以前的方法有以下几个优点。

第一,不变特征的使用实现全景图像序列的可靠匹配,尽管在输入图像中有旋转、缩放和光照变化。

第二,通过假定图像拼接是一个多图像匹配问题,我们可以自动发现这些图像间的匹配关系,并且在无序的数据集中识别出全景图。

第三,通过使用多波段融合呈现无缝输出的全景图,可以产生高质量的结果。

本文通过
引入增益补偿和自动校直步骤延伸了我们以前在该领域的工作,我们还描述了一个高效的捆绑调整实现并展示对任意数量波段的多个重叠图像如何进行多波段融合。

本文其余部分的结构如下。

第二部分说明所研究问题的几何学和我们选择不变特征的原因。

第三部分介绍了图像匹配方法(RANSAC )和验证图像匹配的概率模型。

第四部分中,我们描述了图像对准算法(捆绑调整),即共同优化每个摄像头的参数。

五到七部分描述了处理过程,包括自动校直、增益补偿和多波段融合。

第九部分中,我们给出了结论和对未来工作的展望。

2. 特征匹配
全景识别算法的第一步是在所有图像之间提取和匹配SIFT 特征检测点。

SIFT 特征检测子位于不同尺度空间高斯插值函数的极值点处,对每一个特征点,特征尺度和方向被确定,这为测量提供了一个相似不变的结构。

尽管在这个结构中简单的采样强度值是相似不变的,但是不变描述子实际上是通过对方向直方图的局部梯度值进行累积计算得到的,这样就允许边缘有轻微的移动而不会改变描述子的矢量,对仿射变换提供了一定的鲁棒性。

空间累积计算对平移不变性同样重要,因为感兴趣点位置通常仅在0~3个像素的范围内是精确的。

为了实现亮度不变性可以使用梯度(消除偏差)和对描述子矢量归一化(消除增益)。

由于SIFT 特征在旋转和尺度变化时是不变的,我们可以处理具有变化的方向和大小的图像(见图8)。

值得注意的是,这是传统的特征匹配技术不能实现的,例如Harris 角点图像修补的相关性。

传统的相关性在图像旋转时是变化的,Harris 角点在改变图像尺度时也是变化的。

假设相机绕光学中心旋转,图像的变换群是一个对应矩阵的特殊群。

由一个旋转矢量[]321θθθθ,,=和焦距f 将每个摄像头参数化,就给出了成对的对应矩阵j ij i u H u ~~=,其中
1-=j T j i i ij K R R K H (1)
并且j i u u ~~,是均匀的图像坐标([]1,~i i i u s u =,其中i u 是二维的图像坐标)。

4参数的相机模型定义为:
⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=10000
00i
i
i f f K (2)
对旋转使用指数表示:
[],⨯=i e R i θ[]⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡---=⨯0001213
23i i i i i i i θθθθθθθ (3) 在这个变换群中,理想条件下将会使用不变的图像特征。

可是,在图像坐标中对于
小的变换表示如下:
j u j i i i u u u u u i ∆∂∂+
=00 (4) 或者等价于 j ij i u A u ~~=,其中,
⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡=1002322
21
131211
a a a a a a A ij (5)
是通过一个关于0i u 的对应线性化得到的仿射变换。

这意味着每个小的图像修补经过一次仿射变换,并且合理利用了在仿射变换下局部不变的SIFT 特征。

一旦从所有n 个图像中提取特征点后(线性时间内),需对特征点进行匹配。

由于多个图像可能重叠在一个单一的光线上,在特征空间内每个特征点需和它最近的k 个领域点匹配(k=4),通过使用k-d 树算法找到近似最近的领域点,时间复杂度为O (n n log )。

k-d 树是一种轴对齐的二进制空间划分,它在平均最高方差维递归划分特征空间。

3. 图像匹配
图像匹配的目标是找到所有匹配(例如重叠)图像,稍后图像匹配连通集会成为全景图。

由于每个图像可能和任意其他一个匹配,这个问题一开始就呈现是出图像数的二次方。

为了得到一个好的拼接结果,对于图像几何而言,每个图像只需要和少数重叠的图像来匹配。

从特征匹配这个步骤中,我们已找出图像间有大量匹配点的图像。

对于当前图像,我们将m 幅图像作为可能的匹配图像(m=6),这m 幅图像与当前图像有最大数量的特征匹配点。

首先,使用RANSAC 算法选择一系列和图像间对应矩阵兼容的内点,然后应用概率模型做进一步的验证。

3.1 使用RANSAC 算法的鲁棒对应矩阵估计
RANSAC (随机抽样一致性算法)算法是使用最少的一组随机采样匹配点的一种鲁棒估计过程,用来估计图像变换参数,并找到与数据具有最好一致性的解决方案。

在全景图的情况下,我们选择r=4对匹配特征点,使用直接线性变换(DLT)方法计算图像间的对应矩阵H 。

重复500次试验,选择内点数最大的解决方案(在像素误差范围内,其预测和H 是一致的)。

假设一对匹配图像间的特征匹配点是正确的概率(内点概率)为i p ,n 次试验后找到正确变换的概率为:
H p (is correct )n r i p ))(1(1--= (6)
经过大量试验后,找到正确对应矩阵的概率非常大。

例如,对于内点概率5.0=i p ,在500次试验后,未找到正确对应矩阵的概率为14101-⨯。

RANSAC 算法本质上是一种估计H 的采样方法,如果用对数似然和的最大化代替内点数量的最大化,结果是最大似然估计(MLE )。

此外,如果变换参数的先验值是有效的,可以计算出最大后验概率(MAP )。

这些算法被分别称为MLESAC 和MAPSAC 。

3.2 图像匹配关系验证的概率模型
对两两图像间是否存在匹配关系,我们使用一系列几何一致的特征匹配点(RANSAC 内点)和一系列在重叠区域内,但不一致的特征点(RANSAC 外点)来验证。

验证模型通过比较这些正确匹配产生的一系列内点和错误匹配产生的一系列外点的概率来进行验证。

对于一幅给定的图像,重叠区域内总的匹配特征点数为f n ,内点数为i n 。

图像是否有效匹配通过二进制变量{}1,0∈m 表示。

第i 个匹配特征点(){}1,0∈i f 是否为内点被假定为独立的贝努力分布,以便于内点总数服从贝努力分布:
()()()1:1,;1p n n B m f
p f i n f == (7) ()()()0:1,;0p n n B m f p f i n f == (8) 其中,1p 是可以正确匹配图像时特征点为内点的概率,0p 是不能实现图像匹配时特征点为内点的概率;()f n f :1表示特征匹配点变量的集合(){}f i n i f ,...,2,1,=,内点数()∑==f n i i i f n 1,B(.)是贝努力分布,表示如下:
()()x n p p x n x n p n x B x ---=1!
!!),;( (9) 我们选择6.01=p ,1.00=p ,则可以使用贝叶斯规则(式10、11)计算正确图像匹配的先验概率。

()()()()()
()()f f f n n n f p m p m f p f m p :1:1:1111==== (10)
()()())
1(1)0(011):1(:1====+=m p m f p m p m f p f f n n (11) 如果满足min ):1()1(p f m p f n >= ()()()11
1
0,;1);(min 01,->==<p m p p n n B m p p n n B accept f i f i reject
(12)
我们可以实现图像匹配。

假定610)1(-==m p ,999.0min =p ,进一步得出正确图像匹配的判定条件:
f i n n βα+> (13)
其中0.8=α,3.0=β。

尽管在这我们选择了0p ,1p ,()0=m p ,()1=m p 和min p 的值,但在原理上可以从数据中进一步确定这些值。

例如,可以通过在大的数据集中计算一部分匹配点和正确的对应矩阵相一致来估计1p 。

一旦图像间的匹配点对确定,我们可以找到全景序列作为连接匹配图像集,它可以识别图像集中的多个全景,拒绝不匹配的噪声图像(见图2)。

(a )图一 (b )图二
(c )SIFT 匹配点1 (d )SIFT 匹配点2
(e )RANSAC 内点1 (f )RANSAC 内点2
(g )依据对应矩阵的图像对准
图1,从所有图像中提取SIFT特征点。

使用k-d树匹配所有特征点后,对于一个给定图像,用有最多特征匹配点的m幅图像进行图像匹配。

首先执行RANSAC算法计算出对应矩阵,然后调用概率模型验证基于内点数的图像匹配,在这个例子中,输入图像是517×374像素,有247个正确特征匹配点。

(a)图像匹配点
(b)图像匹配点的连接分量
(c)输出全景图
图2,可识别全景图。

考虑一个特征匹配点的噪声集,我们使用RANSAC算法和概率验证过程找到
一致的图像匹配(a ),每个图像对间的箭头表示在图像对间找到一致的特征匹配点集,图像匹配连接分量被找到(b ),拼接成全景图(c );注意到该算法对不属于全景图的噪声图像不敏感。

4. 捆绑调整
考虑到图像间的几何一致性匹配集,使用捆绑调整解决所有相机参数的问题,这是重要的一个步骤,由于成对对应矩阵拼接将会造成累计误差,忽略图像间的多重约束,如全景图两端应联合起来。

图像一个接一个被添加到捆绑调节器,最佳匹配图像(一致匹配数目最大)在每一步被添加,新图像用与最佳匹配图像具有相同的旋转和焦距长度初始化,然后相机参数使用L-M 算法被更新。

我们使用的目标函数是一种抗差总和平方预测误差。

也就是说,每个特征点被投影到所有与它匹配的图像中,并且平方图像距离的总和依据相机参数最小化。

考虑到对应关系l
j k i u u ↔(k i u 表示在图像i 中第k 个特征点的位置),残差表示为
k ij k i k ij p u r -= (14)
其中对应到k i u 的点k ij p 是对应于k i u 点从图像j 到图像i 的投影
l
j j T j i i k ij u K R R K p ~1~-= (15)
误差函数是所有图像抗差剩余误差的和,表示如下: ()
()()∑∑∑=∈∈=n
i i j j i f k k ij r h e 1,ι (16) 其中n 是总的图像数,I(i )是和图像i 匹配的图像集,),(j i f 是图像i 和图像j 的特征匹配集。

我们使用Huber 鲁棒误差函数,如下所示:
()⎪⎩⎪⎨⎧≥-<=σ
σσσx if x x if x x h 222 (17) 这个误差函数结合将范数2L 的快速收敛性作为内点的优化方案(距离小于σ),和将范数1L 的鲁棒性作为外点的方案(距离大于σ)。

∞=σ作为初始化过程中使用的外点距离,2=σ个像素点作为最终结果。

这是一个我们使用L-M 算法解决的非线性最小二乘问题。

每次迭代的形式如下:
r J C J J T p T 11)(--+=Φλ (18)
其中Φ是所有参数,r 是残差,Φ∂∂=r J 。

在(对角线)协方差矩阵p C 中,我 们先前编码的有关参数改变了,如下所示:
⎥⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡= 2222200000000000000000000θθθ
θσσσσσf p C (19) 这个矩阵中,角度标准偏差是16πθσ=,焦距长度10-=f f σ(-
f 是目前为止焦距长度估计的平均值)。

这有助于选择合适的步长,从而加快收敛,例如,如果用一个球形的协方差矩阵,一弧度的旋转变化将被焦距长度参数中一像素的变化所补偿。

最后,在每一次迭代中,改变参数λ以确保等式(16)的目标函数的确在减小。

通过链式法则导数被分析计算,例如:
1~~1i k
ij k ij k ij i k
ij p p p p θθ∂∂∂∂=∂∂ (20)
其中 [][]⎥⎦⎤⎢⎣⎡--=∂∂=∂∂22~1001z y z z x z z y x z y z x p p k ij k ij
(21) l j j j i i i i k ij
u K R R K p ~11
1~-∂∂=∂∂θθ (22) [][]⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡-=∂∂=∂∂⨯⨯010********i i e e R i i i θθθθ (23) 4.1 通过直接计算线性系统的快速解决方案
由于矩阵J 是稀疏的,J 乘以它的转置T J 是没有用的,事实上,这是捆绑调整中最有价值的步骤,对N M ⨯的矩阵J (M 是测量个数的两倍,N 是参数的个数)所需的时间复杂度为O (2MN )。

由于每个图像通常只匹配其它图像的一小部分,出现了稀疏性,这意味着在实际中矩阵J J T 中每个元素的计算比M 次乘法少的多,如下所示:
()()1,-Φ∈=Φ∂∂Φ∂∂=
∑C r r J J j k ij T j i f k i k
ij ij T
(24)
例如,相机i 和j 间的反向协方差只依赖于i 和j 间的特征匹配残差值。

相似的,r J T 不需要直接计算,可通过下式得到:
()()()k ij T n i i I j j i f k i k ij i
T r r r J ∑∑∑=∈∈Φ∂∂=1, (25)
在两种情况下,如果每个特征点匹配每个单独的图像,每一个和将需要M 次乘法,但在实际中,对于给定的图像,特征匹配点的个数要比这个少的多。

因此,每个捆绑调整迭代的时间复杂度为O ()
3N ,这是解决N N ⨯线性系统的代价。

参数N 的数量是图像数量的4倍,典型的M 值大概是N 的100倍。

5. 自动全景校直
使用第2-4部分步骤的图像配准提供了摄像机间的相对旋转,但是对于选定的世界坐标系而言仍有一个未知的3D 旋转。

对于每一幅图像如果我们简单的假设R=I ,我们通常会发现在输出的全景图中有波状效应,这是因为真正的相机不会是完全水平且没有倾斜的。

我们可以修正这种波形的输出,并且可以通过利用人们通常拍摄全景图方式的启发式算法自动校直全景图。

人们很少相对于视距扭转相机,所以相机的参数X 向量(水平轴)通常位于一个平面(见图4)。

通过找到相机参数X 向量的协方差矩阵的零向量,我们可以找到“向上的向量”u (对包含了相机的中心和视距),如下:
00=⎪⎭
⎫ ⎝⎛∑=u X X T i n i i (26) 对一个垂直向上向量u (在呈现的结构中)进行整体旋转,非常有效的从输出全景图中消除了波状效应,如图4。

图3,寻找向上向量u 。

由于一个好的用于对准波浪形全景图的启发式算法,人们很少相对于视距转动相机,因此,尽管倾斜(如图b )和旋转(如图c) ,相机参数X 向量通常位于一个平面,向上向量(与重力方向相反)是这个平面的法线。

(a )没有使用自动校直图像
(b )使用自动校直图像
图4,自动全景校直。

利用人们很少相对于视距转动相机的启发式算法允许我们通过计算向上向量(垂直于包含相机中心和视距的平面)校直波浪形全景图。

,
6. 增益补偿
在前面的部分中,我们描述了计算相机几何参数(方向和焦距)的方法。

在这一部分中,我们描述了如何解决光度测量参数,即图像间的总增益。

通过相似的方式建立模型,对所有图像定义一个误差函数,误差函数是所有重叠像素的增益归一化强度误差的和,表示如下:
()()()()
211,~
~21∑∑∑===∈-=n i n
j u H u j i R u j j j i i i j IJ i i u I g u I g e (27) 其中i g ,j g 是增益,()j i R ,是图像i 和图像j 的重叠区域。

在实际中,我们通过每个重叠区域的平均值ij I -
来近似()i u I ,如下所示: ()
()()
∑∑∈∈-=j i R u j i R u i i ij i i u I I ,,1 (28)
这简化了计算并给外点提供鲁棒性,这可能是由图像间小的位置不正引起的。

此外,0=g 是这个问题的最佳解决方案,我们添加了一个预先条件来保持增益一致。

因此误差函数可表示如下:
()⎪⎪⎭
⎫ ⎝⎛-+⎪⎭⎫ ⎝⎛-=--==∑∑2222111/21g i N ji j ij i n i n j ij g I g I g N e σσ (29) 其中()j i R N ij ,=与图像i 和图像j 间重叠部分的像素数量相等,参数N σ和g σ分别是归一化强度误差和增益的标准偏差,我们选择{}()25500.10 ∈=I N σ,1.0=g σ。

这是一个增益参数g 的二次目标函数,可以通过在封闭的形式中设置导数趋于0来解决(见图
5)。

(a)完成一半的图像配准
(b)没有增益补偿的图像
(c)有增益补偿的图像
(d)使用增益补偿和多波段混合拼接图像
图5,增益补偿。

如果没有应用增益补偿,如(a)(b),图像间大的亮度变化是可见的;增益补偿后,由于未建模的影响,一些图像边缘仍然可见,例如晕映(图c)。

这些都可以使用多波段混合有效的平滑掉(图d)。

7. 多波段融合
理想情况下,每个图像中沿一条射线的每个样值(像素)会有相同的强度,它们会相交,但现实并非如此。

由于一些未建模的影响,即使在增益补偿后,图像边缘仍然可见,如图像边缘暗淡(朝图像边缘方向强度降低),由于光中心不必要的移动引起的视差效果,摄像头的错误建模、径向畸变等引起的微小的定位误差等。

由于这些,一个好的融合策略是很重要的。

从前面的步骤中,考虑到已知的匹配,有n 幅图像(){}()n i y x I i 1,∈可以被表示在一个共同的(球形)坐标系()φθ,i I 中。

为了从多个图像中合并信息,我们为每个图像分配一个加权函数()()()y x y x W ωω=,,其中()x ω 从中心1到边缘0线性变化。

加权函数在球形坐标系()φθ,i W 内重新采样,拼接的一种简单方法是计算沿着每条射线,使用这些加权函数的图像强度的加权总和。

如下所示:
()()()
()∑∑===n
i i n
i i i linear W W I I 11,,,,φθφθφθφθ (30)
其中,()φθ,linear I 是使用线性融合形成的复合球面图像,可是如果有小的匹配错误,这种方法会引起高频细节模糊(见图7)。

为了防止这种情况,我们使用Burt 和Adelson 的多波段融合算法。

多波段融合的想法是在一个很大的空间范围内融合低频率,在一个小的范围内融合高频频率。

我们通过找到图像i 最有用的点集来初始化每个图像的混合权重,表示如下:
()()()⎩⎨⎧==其它0
,max arg ,1,max φθφθφθj j i i
W ifW W (31) 例如对于()φθ,,()φθ,max i W 为1表示图像i 有最大权值,0表示其它一些图像有较高的权
值。

这些最大权值的映射连续混合形成了每个波段的混合权值。

所呈现图像的高通版本形式如下:
()()()φθφθφθσσ
,,,i i i I I B -= (32) ()()()φθφθφθσσ
,,,g I I i i *= (33) 其中,()φθσ,g 是σ的高斯标准偏差,*操作符表示卷积,()φθσ,B 表示在波长为[]σ,0范围内的空间频率。

我们通过模糊这幅图像的最大权值映射,形成融合权值以融合图像间的该波段,如下:
()()()φθφθφθσσ,,,max
g W W i i *= (34) 其中,()φθσ,i W 为波长为[]σ,0的波段内的融合权值,后续的频段使用低频带通图像和进一步模糊融合权值来融合,例如,对于1≥k ,
()()i k i k i
k I I B σσσ11++-= (35)
()σσσ'+*=g I I i k i
k 1 (36)
()σσσ'*=+g W W i k i
k 1 (37)
其中设置高斯模糊内核的标准偏差为()σσ12+='k ,如后续波段有相同波长的范围。

对每一个波段,使用对应的融合权值线性合并重叠的图像,如下所示: ()()()()
∑∑===n
i i k n
i i k i k multi k W W B I 11,,,,φθφθφθφθσσσσ (38) 这会引起高频段(小于σk )在小范围内融合,而低频段(大于σk )在较大的范围内融合(见图6)。

注意到我们选择呈现的全景图在参数为θ,φ的球面坐标内呈现全景图,原则上从呈现的角度来看,我们可以选择一个表面的任何二维参数。

一个好的选择将会呈现一个三角形球面,在图像平面构造融合权值,这样会有统一处理所有图像的优势,同时易于其它表面(在图形硬件)的重采样。

θ,φ参数设置受极点的奇异性影响。

算法:自动全景拼接
输入:n 个无序图像
1. 从n 幅图像中提取SIFT 特征。

2. 使用k-d 算法为每个特征点找到k 个最邻近的匹
配特征点。

3. 对于每一幅图像:
(1)
选择m 个候选匹配图像,它们与要匹配的图像有最多的特征匹配点; (2)
使用RANSAC 算法找到几何一致的特征匹配来得到图像对间的对应矩阵;
(3) 使用概率模型验证图像匹配。

4. 找到图像匹配的连接分量。

5. 对于每个连接分量:
(1)执行捆绑调整解决所有相机的旋转角1θ,2θ,
3θ和焦距f ;
(2)呈现使用多波段融合拼接的全景图。

输出:全景图像
(a)原始图像和拼接结果
(b)波段1(从0到σ)
(c)波段2(从σ到σ2)
2)
(d)波段3(小于σ
图6,多波段融合。

左边显示的为k=1,2,3的带通图像B(θ, φ),右边为对应的融合权值W(θ, φ)。

最初的融合权值指定为1是每个图像的最大权值。

为了获得每一个融合函数,在空间频率σ中,权值是模糊的,并形成相同空间频率的带通图像。

使用基于融合权值的加权和将带通图像融合在一起
(a)线性融合拼接图像(b)多波段融合拼接图像
图7,线性和多波段融合拼接的比较。

右边的图像使用多波段融合,其中使用了5个波段,, =5个像素。

左边的图像是线性融合拼接。

关于运动中的人的图像匹配会引起图像间小的错误配准,线性融合拼接的结果会导致图像模糊,而多波段融合拼接图像是清晰的。

(a)(b)
图8,具有旋转和缩放的图像拼接。

尽管在输入图像中有旋转、缩放和亮度变化,使用不变特征点可以实现图像拼接。

塔顶和塔底的插像是其它图像尺寸的4倍。

(a) 特征匹配点数随 (b) k=0.5时,两幅图 (c) 先前数据显示未
k 的变化关系 像拼接的例子 配准的细节图像
图9,存在径向畸变的图像拼接。

图像显示了一阶径向畸变()x x k x 21+='对图像拼接的影响(图像的高度归一化为单位长度),其中[]5.0,5.0-∈k 。

注意到径向畸变没有在我们的算法中建模,我们使用了44幅图像序列测试并应用于20个不同k 值的径向畸变图像,畸变图像的例子示于图(d )-(h )中。

为了评估拼接的性能,我们计算了RANSAC 算法后一致匹配点的个数,结果示于图(a )。

虽然在最坏的情况下,每个特征的匹配点数量下降了约三分之一,正确特征匹配点的数量仍然非常高(大约每个图像500个),因此图像仍可正确匹配。

尽管径向畸变在呈现的图像中会引起明显的重影,见图(b )-(c ),但会在捆绑调整和成像阶段修正,这对于高质量全景图拼接非常重要。

8. 结果
图2显示了典型的全景识别算法操作,输入4个全景图像和4个噪声图像。

该算法检测匹配图像和未匹配图像的连接分量,输出4个混合全景图。

图5显示了一个较大的例子,使用相机的自动模式摄取这个图像序列,这将容许改变孔径和曝光时间,并对一些图片使用闪光灯。

尽管亮度改变了,SIFT 特征稳健地匹配和多波段融合策略可以产生一个无缝的全景图。

输出是︒⨯︒100360度,并在球形坐标系()φθ,中呈现。

57个图像完全自动匹配而无用户介入,对于最后的匹配,228574=⨯个参数最优化问题被解决。

17042272⨯像素的输入图像在60秒内匹配和配准,15分钟后呈现了一个25528908⨯(23万像素)的全景图,57秒内,呈现一个5732000⨯像素的预览,该测试在1.6GHz 的奔腾M 上进行。

9. 结论
本文为全自动全景图像拼接提供了一种新的系统。

不变的局部特征的使用和验证图像匹配的概率模型允许我们在无序图像集中识别多个全景图,并实现全自动图像拼接而无用户介入。

这个方法在相机变焦,输入图像的方向,由于闪光灯和曝光/光圈设置引起的亮度改变方面是稳健的。

尽管图像间有亮度差异,多波段融合方案确保图像间的平滑过渡,同时保留了高频细节。

以后的工作:
今后工作的领域可能包括相机和场景中的运动补偿,摄像机几何和光学性能更先进的建模。

摄像机运动:
全景图经常受到光中心微小运动引起的视差错误,这些可通过从一个中心位置重新呈现前,调节相机成像和场景深度来消除。

使用一个好的表示形式可能是一个无穷大的视差平面。

拍摄期间小的运动会导致运动模糊,同时大的相机运动会引起视差。

使用附近聚焦的图像可以改善运动模糊图像,类似的技术也可以用于产生超分辨率图像。

场景运动:
虽然多波段融合策略在很多情况下非常有效,当多个图像间融合时,场景中大动作的对象会引起明显的重叠(见图10)。

另一种方法基于图像间的差异部分自动寻找最佳接缝线。

先进的相机模型:
不包括在投影相机模型(保持直线)中的大多数相机有一个重要的特征,即径向畸变,虽然没有明确的算法建模,在适度的径向畸变下我们已经测试了其性能(见图9)。

在我们的实验中,虽然全景识别和近似校准非常有效,在显示的结果中仍有明显的重叠,因此,高质量的图像拼接应用中需要有径向畸变参数,至少在捆绑调整和成像阶段。

理想的图像拼接应该也支持多个运动模式,例如,关于一点的旋转(如全景图),观察平面(如白板)和欧式变换(如调整扫描图像);也可以呈现多表面类型,如球形,圆柱形,平面。

光度建模:
理论上应尽可能多的估计相机测光参数,暗角(沿图像边缘强度下降)是每个镜头都不可避免的,特别是在色泽均匀区域,如天空;从重叠图像区域也可以获得高动态范围信息,并呈现色调映射或合成曝光图像。

我们已经开发了一个C++实现本文中描述的算法,称为自动缝合,这个方案的演示可以从网站下载,网址为。

图10,一个困难的拼接问题。

这个例子(纽约时代广场)包含许多移动的物体和图像间亮度的巨大变化。

尽管存在这些挑战,我们的方法仍可以找到一致的不变特征集,正确的配准图像。

未来的自动图像拼接器可以检测到移动的物体,并计算出高动态范围场景的辐射地图。

这将使用户重新摄取选择不同曝光设定和移动物体的场景。

相关文档
最新文档