常见的插值方法及其基础原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常见的插值方法及其原理
这一节无可避免要接触一些数学知识,为了让本文通俗易懂,我们尽量绕开讨厌的公式等。
为了进一步的简化难度,我们把讨论从二维图像降到一维上。
首先来看看最简单的‘最临近像素插值’。
A,B是原图上已经有的点,现在我们要知道其中间X位置处的像素值。
我们找出X位置和A,B位置之间的距离d1,d2,如图,d2要小于d1,所以我们就认为X处像素值的大小就等于B处像素值的大小。
显然,这种方法是非常苯的,同时会带来明显的失真。
在A,B中点处的像素值会突然出现一个跳跃,这就是为什么会出现马赛克和锯齿等明显走样的原因。
最临近插值法唯一的优点就是速度快。
图10,最临近法插值原理
接下来是稍微复杂点的‘线性插值’(Linear)
线性插值也很好理解,AB两点的像素值之间,我们认为是直线变化的,要求X点处的值,只需要找到对应位置直线上的一点即可。
换句话说,A,B间任意一点的值只跟A,B有关。
由于插值的结果是连续的,所以视觉上会比最小临近法要好一些。
线性插值速度稍微要慢一点,但是效果要好不少。
如果讲究速度,这是个不错的折衷。
图11,线性插值原理
其他插值方法
立方插值,样条插值等等,他们的目的是试图让插值的曲线显得更平滑,为了达到这个目的,他们不得不利用到周围若干范围内的点,这里的数学原理就不再详述了。
图12,高级的插值原理
如图,要求B,C之间X的值,需要利用B,C周围A,B,C,D四个点的像素值,通过某种计算,得到光滑的曲线,从而算出X的值来。
计算量显然要比前两种大许多。
好了,以上就是基本知识。
所谓两次线性和两次立方实际上就是把刚才的分析拓展到二维空间上,在宽和高方向上作两次插值的意思。
在以上的基础上,有的软件还发展了更复杂的改进的插值方式譬如S-SPline, Turbo Photo等。
他们的目的是使边缘的表现更完美。
插值(Interpolation),有时也称为“重置样本”,是在不生成像素的情况下增加图像像素大小的一种方法,在周围像素色彩的基础上用数学公式计算丢失像素的色彩。
简单地说,插值是根据中心像素点的颜色参数模拟出周边像素值的方法,是数码相机特有的放大数码照片的软件手段。
一、认识插值的算法
“插值”最初是电脑术语,后来引用到数码图像上来。
图像放大时,像素也相应地增加,但这些增加的像素从何而来?这时插值就派上用场了。
插值就是在不生成像素的情况下增加图像像素大小的一种方法,在周围像素色彩的基础上用数学公式计算丢失像素的色彩(也有些相机使用插值,人为地增加图像的分辨率)。
所以在放大图像时,图像看上去会比较平滑、干净。
但必须注意的是插值并不能增加图像信息。
以图1为原图(见图1),以下是经过不同插值算法处理的图片。
1.最近像素插值算法
最近像素插值算法(Nearest Neighbour Interpolation)是最简单的一种插值算法,当图片放大时,缺少的像素通过直接使用与之最接近的原有像素的颜色生成,也就是说照搬旁边的像素,这样做的结果是产生了明显可见的锯齿(见图2)。
2.双线性插值算法
双线性插值算法(Bilinear Interpolation)输出的图像的每个像素都是原
图中四个像素(2×2)运算的结果,这种算法极大程度上消除了锯齿现象(见图3)。
3.双三次插值算法
双三次插值算法(Bicubic Interpolation)是上一种算法的改进算法,它输出图像的每个像素都是原图16个像素(4×4)运算的结果(见图4)。
这种算法是一种很常见的算法,普遍用在图像编辑软件、打印机驱动和数码相机上。
4.分形算法
分形算法(Fractal Interpolation)是Altamira Group提出的一种算法,这种算法得到的图像跟其他算法相比更清晰、更锐利(见图5)。
现在有许多数码相机厂商将插值算法用在了数码相机上,并将通过算法得到的分辨率值大肆宣传,固然他们的算法比双三次插值算法等算法先进很多,但是事实是图像的细节不是凭空造出来的。
因为插值分辨率是数码相机通过自身的内置软件来增加图像的像素,从而达到增大分辨率的效果。
二、插值的影响
使用数码变焦拍出来的照片不清晰,这是数码变焦最遭人垢病的地方,事实上,这只是一种片面的说法。
数码变焦对照片清晰度的影响有多大,取决于数码相机在变焦时,CCD是否进行了插值运算。
在使用高像素的情况下,如果采用数码变焦进行拍摄,则此时CCD并不会有任何插值运算,数码变焦对最终得到的数码照片的清晰度的影响将会因此而变得极其有限。
举个例子,一台CCD像素为520万、最大分辨率为2560×1920的数码相机,如果采用2×的数码变焦来进行拍摄的话,那么成像过程中只会有一半CCD在工作。
换句话说,数码相机并不会使用类似“在一个像素点周围添加八个像素点”的插值算法进行成像,而是通过降低分辨率的方法,即1280×960这个分辨率指标来进行成像。
对于一般的数码照片来说,1280×960这个分辨率指标已经足够优秀了,它与2560×1920分辨率的差别将会因为没有插值运算的参与而变得可以接受。
不过这种现象只限于某些比较高级的数码相机,对于那些千元以下的定焦数码相机来说,使用数码变焦就意味着必然的插值运算,牺牲分辨率的后果使得照片拍摄者只能有两个选择:要么得到一张模糊不清的“全尺寸”照片、要么得到一张质量可以保证但分辨率只有类似320×240这样的“迷你”照片。
图像插值放大的方法有很多,最主要的有二次线性插值和三次线性插值这两种。
这次我把自己的程序中所用的二次线性插值的算法公布给大家,希望对各位要使用VB写类似程序的朋友有所帮助。
程序中用到的API、数据类型、全局变量的定义请参考上一篇:《VB实现图像在数据库的存储与显示》
全局变量定义:
(为了说明算法本身,我们只计算这个图片的红色分量,因为红绿蓝三种颜色的计算方法完全相同)
假设我们有一个很简单的图片,图片只有4个像素(2*2)
现在我们要把这个图片插值到9个像素:3*3
其中大写的字母代表原来的像素,小写字母代表插值得到的新像素。
想必看到这个图,大家心里已经有了这个算法了。
推导:
很简单,对吧,先从一个方向把只涉及两个原始像素的新像素算出来。
我们这里假定先计算水平方向。
而在算垂直方向的插值的时候,因为ab和cd已经在前面算好了,所以abcd 的计算也和计算ac和bd没有任何区别了。
有可能为有朋友已经想到把原来的图像插值到4*4或5*5的方法了。
推导:
以A和B为例,先求出原始像素的差(A-B)再算出每一步的递增量(A-B) / 3;然后每一个新的点就是在前面那个点的值加上这个递增量就是了。
这里我们假设A=100, B=255 放大倍率为3,水平方向插值;先计算出原始像素的差:(B-A) = 255-100 =155
再计算出水平方向每一步的递增量:(A-B) / 3=155 / 3 = 51.7
这里我们用一个变量DRt来记录这个递增量(这里只用红色来做例子)
好了,其实二次线性算法就是这么一个东西,并不复杂。
或许有写朋友会对于我给出的代码产生疑问。
很简单的一个算法为什么要写这么多代码。
其实答案很简单:为了提高速度。
在VB中“+”和“-”永远是最快的,“*”要比“/”和“\”快。
不论是什么类型的变量都是这样的。
下面再来分析一下我的程序。
在我的程序中把两个方向的插值分解成了两个单独的部分。
先把
变成:
再变成:
这两个方向的插值算法完全相同
而Xratio 和Yratio 这两个变量则用来记录水平方向和垂直方向的放大倍率。
所以这个过程也能够让图像缩放不按照原始的纵横比进行。
好了,将这个模块和全局变量添加到上次建立的工程模块中。
把按钮中的代码改成:
DibGet .hdc ,0 , 0 , .scalewidth , .scaleheight
ZoomImage , .scalewidth * 2 , .scaleheight * 2
End With
picture2.AutoRedraw=True
DibPut picture2.hdc
picture2.refresh
end sub
图像是否已经放大到原来的两倍了呢?速度不算很慢吧?什么?很慢?先编译成EXE再运行吧。
下面是效果图:原图:
二次线性插值放大5倍:
关于二次线性插值就说到这里了,下一次将说一些基本的滤镜效果:锐化、柔化、扩散、雕刻。
请大家继续关注。