数字图像的透明度提取【开题报告】

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

毕业设计开题报告

计算机科学与技术

数字图像的透明度提取

一、选题的背景与意义

数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展，图像处理和分析逐渐形成了自己的科学体系，新的处理方法层出不穷，尽管其发展历史不长，但却引起各方面人士的广泛关注。首先，视觉是人类最重要的感知手段，图像又是视觉的基础，因此，数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。

数字图像中的透明度提取技术(image matting)是一种提取像素透明度进而用于抠图的技术。通过数字图像的透明度，我们可以将数字图像的前景和背景分别提取出来，从而得到需要的信息。目前这项技术在科学与生产中都得到了大量的应用。例如,在航空航天方面的卫星遥感图像的加工处理，在地质，矿藏探查方面的应用，气象卫星云图等；在生物与医学工程方面的细胞统计，染色分类，以及成像技术都有很好的应用；在工业工程方面对产品质量的检测，无损探伤以及表面缺陷检测等；在军事，公安交通方面，导弹的精确制导，侦察照片的判读，指纹识别，人脸鉴别，调整公路自动识别处理技术等；在文化艺术方面的动画制作，电影物质表现等都有很好的应用。

另外，在电子商务中，透明度处理技术也大有可为，如身份认证、产品防伪、水印技术等。总之，透明度技术在图像处理应用领域相当广泛，已有国家安全、经济发展、日常生活中充当越来重要的角色，对国计民生的作用不可低估。

二、研究的基本内容与拟解决的主要问题：

数字图像中的透明度提取技术(image matting)是一种提取像素透明度进而用于抠图的技术，它的作用主要是为算法提供辅助信息帮助它准确地将图像感兴趣的区域从图像背景中剥离出来，由于算法在提取像素透明度的同时通常也会估计出图像目标中的前景和背景，因此，有时也称该技术为数字抠图技术。通常的图像分割技术都是基于二值的分割技术，难以获得令人满意的效果.为了解决这个问题，研究者们提出利用基于Alpha通道的

像素组合公式 I = αF + (1-α)B 来提取图像中的前景和背景，获得了很多高质量的效果,其中的α通常称为像素的不透明度。

然而，利用图像硬分割技术分割一些前背景过渡区域比较大的图像时，难以得到理想的分割效果。其主要原因是过渡区域中的某些像素难以准确确定它的归属类别。无论是属于前景和背景都不会得到理想的效果。另一方面，当前景中存在大量的空洞时，平常的图像分割技术也难以获得令人满意的结果。为了准确地提取图像的前背景，研究者们采用了一种称为透明度提取的技术。透明度提取技术是一种很有用的图像分割技术，在电影，动画，动漫等领域都有极其广泛的应用，然而，由于它的复杂性和病态性，该问题未能得到很好的解决。本文提出一种融合先验知识的随机游走模型的透明度提取技术，该技术借助于原有模型的空间项并结合新增添的非空间项提取图像的透明度，大大提高了原有模型计算像素透明度的准确率。

三、研究的方法与技术路线：

1. 模型的建立

设当前的图像为I ，每一点的像素为i I ，那么根据图像透明度的定义，设每个像素的不透明度为α，则有：

(1)i i i i i I F B αα=+- (1)

其中，i F ，i B 为当前像素的前，背景成分，i α为当前像素的不透明度。对于RGB 格式的彩色图像而言，每一个像素有三个通道，这样，对每一点，总共可以得到三个方程，七个未知数，显然是一个极度不定问题。如果没有其他辅助条件的帮助，难以得到唯一解。

基于先验知识的随机游走模型是一个解决该问题的比较好的模型，一方面，它可以融合一些先验的知识，帮助模型产生一个比较稳定的结果，另一方面，该模型的求解范围是实数域，与马尔科夫随机场的优化的范围相比，有着较大优势，最后，对于标记集中元素的个数超过2 个的时候，基于马尔科夫随机场的能量函数的优化是一个NP 问题，目前的优化算法只能得到局部极小值，而随机游走不同，它能够得到最优值，而且优化过程通常只需要求解一个线性方程组，速度较快。

在利用模型求解图像每一点的α之前，首先要明确抠图的目标。目前比较流行的做法是对图像预处理，得到图像的Trimap 图，然后针对Trimap 图像中的未知区域提取透明度，进而完成抠图操作，当然为了获取Trimap 图，需要很多用户操作，不过，如果条件合适，我们完全可以借助于原有的图像硬分割技术来获取图像的Trimap 图，从而使用户

从预处理的负担脱离出来。

为了使本模型能够较好地融合图像的先验知识，考虑到像素不透明度的特点，这里采用了一种抽样的技术，对于图像中的每一个像素而言，要得到对应透明度的值，首先要获得该像素的前景和背景，考虑到一般自然图像中前背景的颜色的特点，我们假设图像前景和背景在一个小的局部范围内是连续变化的，因此，可以提取未知α像素附近的已知α像素的前背景，为它估计自身的前背景提供必要的信息。

在提取透明度以前，对于明确的前景像素和背景像素，它们的α值是已知，因此，可以不去管它，对于图像中的每一个未知α的像素p I ，以该像素为中心，R 为半径，画一个圆，将所有已知α的像素归入到一个集合中，不妨记为p H ，这样，可以通过集合p H 中已知α的像素来估计当前像素的α值。对于已知的像素，其相应的前背景也是已知的，然后通过各种标准，从中选出最有可能是当前像素的前景和背景的像素各N 个，然后采用如下的方法来估计p I 的不透明度：

2()()

||||p j i j ij i j I B F B F B α-∙-=- (2)

通常，我们在选择当前像素的前背景的候选值时，考虑两个标准，一是与当前像素在颜色上的距离，而是与当前像素在空间上的距离。我们的模型按照这两个距离的加权乘积作为候选的依据，选出最佳的前背景的估计集合。

考虑到每一个候选像素点距离当前像素p I 越远，则对p I 的影响越小，因此，我们使用权值来平衡各点对估计p I 的不透明度的贡献：

22(,)exp p s s dis dis I I w σ⎧⎫⎪⎪=⎨⎬⎪⎪⎩⎭

(3) 通常，我们在选择当前像素的前背景的候选值时，考虑两个标准，一是与当前像素在颜色上的距离，而是与当前像素在空间上的距离。我们的模型按照这两个距离的加权乘积作为候选的依据，选出最佳的前背景的估计集合。

考虑到每一个候选像素点距离当前像素p I 越远，则对p I 的影响越小，因此，我们使用权值来平衡各点对估计p I 的不透明度的贡献：

2,2()exp p s s dis dis I I w σ⎧⎫⎪⎪=-⎨⎬⎪⎪⎩⎭

(4)