深度图像的二值化
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
深度图像的二值化
————————————————————————————————作者:————————————————————————————————日期:
3.2 深度图像二值化
图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术。由于图像二值化过程将会损失原图像的许多有用信息,因此在进行二值化预处理过程中,能否保留原图的主要特征非常关键。在不同的应用中,图像二值化时阈值的选择是不同的。因此,自适应图像阈值的选取方法非常值得研究。研究者对图像二值化方法进行了讨论,在此基础上提出了一个新的图像二值化算法。该算法基于数学形态学理论,较好地保留了图像二值化时原图的边缘特征。本文主要研究二值化及灰度图像二值化方法。
3.2.1.灰度图像与二值图像
数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。一幅数字图像都是由若干个数据点组成的,每个数据点称为像素(pixel)。比如一幅
256×400,就是指该图像是由水平方向上256列像素和垂直方向上400行像素组成的矩形图。每一个像素具有自己的属性,如颜色(color)、灰度(grayscale)等,颜色和灰度是决定一幅图像表现里的关键因素。数字图像又可分为彩色图像、灰度图像、二值图像。
3.2.1.1彩色图像
彩色图像是多光谱图像的一种特殊情况,对应于人类视觉的三基色即红(R)、绿(G)、蓝(B)三个波段,是对人眼的光谱量化性质的近似。彩色图像中的每个像素的颜色有R、G、B三个分量决定,而每个分量有255种值可取,这样一个像素点可以有1600多万的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,一个像素点的变化范围为255种。图1-1为彩色图像。
图1-1
3.2.1.2灰度图像
灰度图像是指只含亮度信息,不含色彩信息的图像。单纯的看,灰度图也是黑白的,就像黑白电视显示的图像一样,但是点与点之间黑的程度是不一样的、这就是深度。如果称不同深度的颜色为一色的话,灰度图像就不止只有黑色和白色两种颜色,一般使用的灰度图为256级灰度图,就是说图像由256种不同灰度级的颜色组成。图像灰度化的效果如图1-2。
图1-2
灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为255种。YUV是编译颜色空间的种类,“Y”表示明亮度“U”表示色度“V”表示浓度,根据YUV的颜色空间,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B 三个颜色分量的对应:
Y=0.3R+0.59G+0.11B (1-1)
以这个亮度值表达图像的灰度值。
3.2.1.3二值图像
二值图像就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,
可以方便地对图像进行布尔逻辑运算等特点。更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征。
在图像相关方面,用二值图像进行相关比用灰度级图像进行相关有更好的相关性能和去噪作用。在用硬件实现时可避免乘法运算,从而提高硬件系统的速度和降低成本。在图像的符号匹配方面,二值图像比灰度级图像更适合于用符号来表达。二值图既保留了原始图像的主要特征,又使信息量得到了极大的压缩。图1-3为二值图像。
图1-3
3.2.2 灰度图像二值化方法研究
图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。
图像的预处理在进行图像二值化操作前要对图像进行预处理,包括彩色图像灰化和增强。由于选取阈值需要参照直方图,因此在图像进行处理后,我们再获取图像的直方图以帮助选取阈值。整个流程如下所示:
读取图像→灰度图像→图像增强→图像直方图→二值化处理
图像二值化是图像数据预处理的重要技术,如果二值化过程中阈值选取不当会损失原图像的许多有用信息。图像二值化处理的方法包括全局阈值法、局部阈值法。
3.2.2.1全局阈值法
3.2.2.2全局阈值法的概念
全局阈值法是指在二值化过程中只使用一个全局阈值T的方法。它将图像的每个像素的灰度值与T进行比较,若大于T,则取为前景色(白色);否则,取为背景色。
根据文本图像的直方图或灰度空间分布确定一个阈值,以此实现灰度文本图像到
二值图像的转化,其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。阈值分割法的结果很大程度上依赖于对阈值的选择,因此该方法的关键是如何选择合适的阈值。
选择不同的初始灰度也会产生不一样的二值化图像,图2—1 所示3 幅图像则是分别采取T=109,T=127,T=155 三种初始值对Lena 进行基本全局门限二值化后的图像。可以看出效果都不一样。因此要获得最佳效果,必须要考虑选择一个好的初始T 值。另外使用迭代法虽然能得到很精确的阈值,但是也占用了大量的时间,即时间复杂度比较高,效率较其他算法低。
图2—1
3.2.2.3全局阈值法的方法
典型的全局阈值法包括Otsu方法、最大熵方法等。全局阈值法算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对于由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像,二值化效果明显变差。下面重点介绍Otsu方法:
Otsu方法是一种全局化的动态二值化方法,又叫大津法,还称为最大类间差发,是基于整幅图像的统计征,实现阈值的自动选取。其原理是把图像直方图用某一灰度值分割成两类,分别计算这两类的像素点数和灰度平均值,然后计算它们的类间方差。当被分割成的两类间方差最大时,此灰度值就作为图像二值化处理的阈值。大津法的使用范围比较广,不论图像的直方图有无明显的双峰,都能得到