几种图像的检测和模板匹配方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几种图像的检测和模板匹配方法
图象的分割与检测(识别)实际上是一项非常困难的工作。很难说清楚为什么图象应该分割成这样而不是那样。人类的视觉系统是非常优越的,它不仅包含了双眼,还包括了大脑,可以从很复杂的景物中分开并识别每个物体,甚至可以毫不费力的跟上每秒好几十帧变化的图象。举两个例子来说明一下人类视觉系统的优越性:
图1是单词THE,这一点很容易看出来,但仔细观察一下,就会发现,图中少了很多线条。在我们人类看来很简单的一件事,让计算机来做就很困难了。
图2中尽管没有任何线条,但我们还是可以很容易的看出中间存在着一个白色三角形。计算机却很难发现。
由于人类在观察图象中应用了大量的知识,所以没有任何一台计算机在分割和检测真实图象时,能达到人类视觉系统的水平。正因为如此,对于大部分图象应用来说,自动分割与检测还是一个将来时,目前只有少数的几个领域(如印刷体识别OCR)自动识别达到了实用的水平。假想在一场足球比赛的录象中,我们希望可以输入命令,由计算机自动搜索出所有射门的镜头并显示在屏幕上,但目前,我们能从一幅图象中获得的信息只是每个像素的颜色或灰度值,除此以外别无其它,完成上述功能实在是太困难了。所以说解决图象分割和检测最根本的方法是在编码(成像)时就给予考虑。这也正是MPEG4及未来的视频压缩编码标准的主要工作。
针对上述困难,现在提出了三种算法:投影法,差影法和模板匹配。
1、投影法
怎样从华盛顿纪念碑图中自动检测到水平方向上纪念碑的位置。
仔细观察,不难发现,纪念碑上像素的灰度都差不多而且与众不同,如果我们选取合适的阈值,做削波处理(这里选175到220),将该图二值化,如下图所示:
图1. 削波处理,将图二值化图2. 图4做竖直方向投影
由于纪念碑所在的那几列的白色点比起其他列多很多,如果把该图在竖直方向做投影,如下图所示:其中,黑色线条的高度代表了该列上白色点的个数。图中间的高峰部分就是我们要找的水平方向上纪念碑所在的位置,这就是投影法。
可以看出投影法是一种很自然的想法,有点象灰度直方图。为了得到更好的效果,投影法经常和阈值化一起使用。由于噪声点对投影有一定的影响,所以处理前最好先做一次平滑,去除噪声。
2. 差影法
差影法的原理非常简单:将前后两幅图象相减,得到的差作为结果结果图象。下面的几幅图能够说明差影法的原理。
图3. 前景+背景
图4. 背景
图5. 两者相减的结果
图3是前景图(猫)加背景图(木星),图4是背景图,图3减图4的结果如图5所示,这样就得到了前景(不完全是前景,因为背景的灰度值并不为零,但至少可以得到前景的形状)。
差影法是非常有用的,比如说可以用在监控系统中。在银行金库内,摄像头每隔一小段时间,拍摄一幅图,与上一幅图做差影,如果差别超过了预先设置的阈值,说明有人,这时就应该拉响警报。我们在介绍灰度窗口变换时,曾经提到了电影"阿甘正传"特技中应用了"蓝幕"的技术,其实也包含差影法的原理。
3. 模板匹配
如何在一幅图象中找到已知的物体,比如抓拍到了一张射门的照片,如何在该照片中找到足球的位置。这时就可以采用模板匹配的方法。所谓模板匹配,其实想法很简单:拿已知的模板(在本例中为足球的图象),和原图象中同样大小的一块区域去对。最开始时,模板的左上角点和图象的左上角点是重合的,拿模板和原图象中同样大小的一块区域去对,然后平移到下一个像素,仍然进行同样的操作……所有的位置都对完后,差别最小的那块就是我们要找的物体。
我们用平方误差之和来衡量原图中的块和模板之间的差别。假设模板的大小为m*n(宽*高);图象的大小为Width*Height。模板中的某点坐标为(x0,y0),该点的灰度为U(x0,y0);与之重合的图象中的点坐标为(X0-x0,Y0-y0),该点的灰度为V(X0-x0,Y0-y0),
图6. 模板匹配的公式
全部图象都匹配后,找到最小的即为结果。可以看到模板匹配的运算量是惊人的,每一次匹配都要做m*n次减法,m*n次平方,m*n-1次加法,整个图象要匹配(Width-m+1)*(Height-n+1)次。