毕业设计——数字图像的盲鉴别技术研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像的盲鉴别技术研究
摘要:本文指出了现有数字图像盲鉴别技术存在的优缺点及有待研究的问题。
根据计算机图像和真图像在图像光滑区域和纹理区域的不同特性,提出了一种新的计算机图像盲鉴
别算法,该算法结合颜色距离矩阵、灰度共生矩阵以及Canny边缘检测等图像处理方法设计
出图像的二维特征,最后利用支持向量机进行分类检测。
本文算法与现有计算机盲鉴别算法
相比,计算复杂度较低,仿真实验表明该算法能以较高的正确检测率区分出计算机图像和真
图像。
关键词:计算机图像 Canny边缘检测颜色距离灰度共生矩阵支持向量机
中图分类号;文献标识码:A
An Investigation on the Blind Detection Technologies for the
Digital Images
ZHOU Chun, GAO Hai-ying
(Electronic Technology Institute, PLA Information Engineering University, Zhengzhou,
Henan 450004, China)
Abstract:In this paper, the advantages and disadvantages of the existing blind detection technologies are pointed out, and the problems to be investigated are clear. Based on the different identities in the smooth area and texture area between computer graphics and camera pictures, a new blind distinguishing algorithm to detect computer graphics is proposed, in which a two-dimensional measure of the image is designed according to the color distance matrix, gray level co-occurrence matrix and the Canny edge detecting method. At last, this paper uses the Support Vector Machine for classifying. Compared to the existing blind distinguishing algorithms, this paper’s algorithm has a low computing complexity and the emulation experiments show that it can distinguish the computer graphic and the real picture with a high correct detecting rate.
Key words:Computer graphic, Canny edge detecting method, Color distance, Gray level co-occurrence matrix, Support Vector Machine.
1引言
图像作为一种信息资源,随着信息技术的发展,传统的胶片图像正逐步被数字图像取而代之。
相对于传统的胶片图像,数字图像更容易被计算机生成或改动且难以分辨真伪。
例如,用户可以利用3D 图像生成软件轻易的生成假以成真的计算机图像,利用图像编辑和处理工具可以修改图像内容,并且使得人眼难以辨别修改的痕迹。
因此,对于数字图像的盲鉴定技术已成为信息安全领域中的一个重要课题。
在本文中定义照相机拍摄的图像为真图像,而伪图像有两种:一种是利用图像生成软件绘制的图像,简称为计算机图像;另一种是利用图像编辑和处理工具修改过的真图像,简称为篡改图像。
目前对数字图像的盲鉴定技术的研究,根据伪图像的不同相应地分为计算机图像的盲鉴定技术的研究[1-3]和篡改图像的盲鉴定技术的研究[4-8]。
针对计算机图像的盲鉴定技术,国外早在20世纪90年代就有人开始研究此方面的内容,该技术主要包括图像的特征提取和分类器的设计。
图像的特征提取主要集中在颜色特征,纹理特征,边缘特征,空间特征等。
分类器的设计,有KNN方法,FISHER方法,SVM 方法等。
虽然,该领域的研究起步较早,但已有的研究成果还不够成熟。
目前提出的计算机图像盲鉴别算法存在的不足之处在于:一是图像特征提取精度不高,怎样综合利用真图像和计算机图像的区别,提出精度更高的图像特征,是该领域研究的重点和难点。
二是现有的盲鉴别算法最终都采用机器训练分类的方法区分图像,这种分类方法需要的训练图像数量多,训练得到的分类器不仅与图像数量有关,而且与选取的图像的特点有关,并且分类算法的计算复杂度高。
针对这方面的研究,设计理想的分类器是一个思路,另外直接利用阈值进行判别,将会大大降低鉴别算法的计算复杂度,当然这个思路的研究必须建立在高精度特征值的基础之上。
针对篡改图像的盲鉴别技术主要分为三个等级,第一等级是利用图像中对象之间的关系,例如,美前总统林肯不可能与前总统克林顿一起合影。
第二等级是检查图像内容的一致性,例如,图像中物体的阴影部分是否与物体的大小相匹配等。
第三等级是分析图像的内部特征,例如图像的边缘扩散特性,噪声,JPEG图像中的量化系数的分布特性等。
计算机对于第三等级的研究是有帮助的,而第一、二等级的鉴别则需要人的具体判断。
因此,目前已提出的篡改图像的盲鉴别技术主要属于第三等级的研究,包括基于图像统计特性的鉴别技术和基于数码相机的成像特征的鉴别技术。
这两类技术都具有一定的局限性,将计算机图像的鉴别方法与现有的篡改图像鉴别技术结合寻找新的特征值,提高鉴别的正确率,降低鉴别算法的复杂度,是该技术研究的难点。
2 一种新的计算机图像盲鉴别算法
2.1图像鉴别系统的一般流程
一般的图像鉴别技术的整个流程如图2-1所示。
重点是图像的有效特征的提取,使计算机图像或篡改图像能有效区别于自然图像,并选择性能非常良好的分类器来识别。
图2-1: 计算机图像鉴别的一般流程 针对计算机3D 软件生成的JPEG 图像进行检测,关键是能否找到有效的统计特征来表征计算机生成图像和真图像的区别。
文献[1]概括的几种区别中,第一种区别最为明显,计算机图像的边缘形状较多,形状比较规则,在边缘处一个区域和另外一个区域发生跳跃是在一个像素中进行,变化比较突然;而真图像中,颜色的转变更加柔和。
在计算机图像的一个区域块中,颜色较饱和,颜色块较大;而真图像的颜色块较小,噪声较大,颜色数较多。
此外,计算机图像的纹理分布与真图像的纹理分布有很大不同。
根据这些特征,本文采取下面的策略:
(1) 首先选用检测精度较高的边缘检测算法实现待测图像边缘的有效提取,基于边缘进行分块统计
平均每个分块像素值不变的点,把这种像素点的个数作为一个特征量。
(2)
其次基于灰度共生矩阵确定另一个特征量。
(3)
基于上述两个特征量组成的二维特征向量利用分类器进行识别检测。
(4) 利用MATLAB 软件GUI 设计功能设计计算机图像检测系统。
2.2基于边缘和颜色的特征提取算法
图像的边缘反映了像素值在此处发生跳跃,真图像由于相机没有在边缘处发生聚焦,边缘比较模糊,因而这种跳跃比较舒缓,往往需要多个像素点才能完成跳跃,而计算机图像的这种跳跃比较突然,往往只需要一个像素点就完成了跳跃。
边缘将图像划分成一个个区域,在各区域内,像素值没有发生跳跃,变化很平缓,因此相比真图像,区域内最大颜色距离为0的像素点的个数较多。
本文采用Canny 算子进行边缘特征提取[10-11],理由主要有:高精度的统计特征值需要较高精度的边缘检测算法,而Canny 边缘检测算法是目前所有边缘检测算子中最优的;Canny 边缘检测算子的双阈值法能根据不同类型的图像调节检测精度,具有可控性。
而对于颜色特征,最远距离矩阵是刻画颜色变化较为有效的方法。
为此,本文设计了如下的特征提取算法:
Step 1: 设原始图像I 的大小为M N ⨯,将I 和Canny 边缘算子检测后的图像T 进行相同的分块处理,每个块是一个88⨯的矩阵。
I 分块处理后得到'(
)88M N I ⨯,T 分块处理后得到'()88
M N T ⨯。
(当鉴别系统输出
M 和N 不是8的倍数时,8M 和8
N 取整,分块自图像的右上角开始) Step 2: 令初始值_0zero num =;1,,;1,,,88
N M for k t == 判断'(,)T k t 中是否含有边缘点,若没有,则计算'(,)I k t 的最远距离矩阵,统计矩阵中0的个数m ,__zero num m zero num =+,
循环结束。
Step3__/()88
m n zero num zero num =⋅,将最后得到的_zero num 作为I 的特征值。
2.3纹理特征提取
纹理可以用来探测和辨别不同的物体和区域、推断物体的表面方向、研究物体的形状、辨别各种物体所具有的不同的纹理类型。
本文借助统计分析的方法,利用广泛使用的灰度共生矩阵构造特征,灰度共生矩阵
灰度共生矩阵(GLCM ,Gray Level Co-occurrence Matrix )属于测量纹理的二阶统计特性,灰度共生矩阵GLCM 说明当图像中象素(),i j 处的灰度为k I ,同时与(),i j 沿任意方向相距位移d 的象素(),i j ''处的灰度为e I 的概率。
以下我们将详细讨论共生矩阵的定义[9]。
假设在一个大小为M N ⨯的纹理图像,其灰度共生矩阵的角度和距离函数表示为:
0,(,){[(,),(,)]:
0,||,(,),(,)}
o d P a b k l m n D k m l m d f k l a f m n b =∈-=-=== (2-1) 45,(,)#{[(,),(,)]:(0,,)((,))(,),(,)}
o d P a b k l m n D k m l m d or k m d l m d f k l a f m n b =∈-=-=--=--=== (2-2) 90,(,)#{[(,),(,)]:
||,0,(,),(,)}
o d P a b k l m n D k m d l m f k l a f m n b =∈-=-=== (2-3) 135,(,)#{[(,),(,)]:(,)(,)(,),(,)}o d
P a b k l m n D k m d l m d or k m d l m d f k l a f m n b =∈-=-=-=--=-== (2-4)
#{} 表示同类集的个数,()()D M N M N =⨯⨯⨯,通常d 的取值为1。
例如,A 为一个44⨯的4个灰度值的图像,0,1o P 矩阵由以下组成:0,1(0,0)o P 表示距离为1,方向
045 0135 x y 图2-3:方位角 图2-2:矩阵A 000
90
为0o 两像素值分别为0和0的统计次数。
在A 矩阵中0,1(0,0)4o P =。
0,1(3,2)o P 表示距离为1,方向为0o
两像素值分别为3和2的统计次数。
0,1(3,2)1o P =。
所以有
0,14210240010610012o P ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭ 135,12130121031020
020o P ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭ 下图是当1d =,方向为0o ,灰度等级为256时,计算机图像示例和真图像示例的灰度共生矩阵:
图2-4:计算机图像的灰度共生矩阵举例
图2-5:真图像的灰度共生矩阵举例 2.4特征向量的确定
灰度共生矩阵的能量A : 11200L L ij i j A P --===∑∑
(2-5)
当P 中的各项元素值较为接近时,A 就较小,纹理较细时就会出现这种情况。
而当P 的元素值中大的各项集中在对角线附近时,A 就趋向最大。
举例由图2-4和2-5可以看出,计算机图像灰度共生矩阵中各ij P 的值较为接近,真图像灰度共生矩阵中元素值大的集中在对角线附近。
计算得到计算机图像的灰度共生矩阵能量141784438A =;真图像的灰度共生矩阵能量2587331282A =,这说明所举的例子实验所得的值和理论预测的结果是一致的。
本文将2.2中算法得到的特征值_zero num 和特征值A 组成一个二维特征向量[_,]zero num A ,理论依据主要有:
1. 特征值_zero num 反映的是图像的非纹理特征,而特征值A 反映的是图像的纹理特征,因
此这两个特征的相关度小。
2. 分别求图像的_zero num 和A 的算法实现计算复杂度较小,构成二维向量有利于分类器实
现,所确定特征向量有利于提高整个检测系统的效率。
2.4.1 特征无量纲化处理
由于提取到的图像的特征间物理意义和取值范围不同,要特别注意数据统计的可比性问题,因此在匹配特征向量时需对它们进行内部归一化。
本文通过实验总结,对特征A 进行如下处理:
2'log A (2-6)
处理后新的特征'A 的权重与_zero num 的权重相同,[_,']zero num A 作为特征向量能够有效地输入到分类器进行分类识别。
2.5实验结果与分析
本次实验选择400张JPEG 图片作为原始图像集,其中200张JPEG 计算机图像来自网上几个主要3D 网站,比如: 。
另外200张是用数码相机拍摄得到。
选取100张真图像和100张计算机生成图像作为训练集,100 张真图像和100 张计算机生成图像作为测试集。
利用本文提出的特征向量提取算法提取图像的二维特征,利用LS-SVM 分类器先对训练集所得的二维特征向量进行训练,然后对测试集中每幅图像进行识别测试。
表2-1是本文算法和Farid 算法及文献[3]中的算法在图像检测性能方面的比较。
可以看出采用了本文提出的特征提取算法,计算机生成图像和真图像的所提取的特征值的个数大大减少,而检测精度有了非常大的提高,说明本文算法用于计算机图像的鉴别检测是非常有效的。
表2-1:检测性能对比表
2.6鉴别系统设计与实现
本文采用MATLAB 软件中GUI 设计工具箱实现鉴别系统的功能。
一、系统功能:
对任意一幅输入的计算机图像或真图像,能以较高的概率判断识别其为哪种类型的图像。
二、结果实现:
图2-6:计算机图像鉴别
图2-7:真图像的鉴别
5 结论
数字图像的盲鉴别技术是信息安全领域的重要分支,数字图像的盲鉴别技术研究在军事和侦察领域具有重要意义。
本文提出了一种新的计算机图像盲鉴别算法,该算法提取的图像特征基于空域,即反映了图像的纹理特征,又反映了图像的非纹理特征,最后得到的二维特征借助于分类器进行鉴别,仿真实验验证了所提出算法理论上的正确性。
算法的不足之处在于分类器识别时计算复杂度还是不够理想,设计理想的分类器,直接利用阈值进行判别,就可以大大降低鉴别算法的计算复杂度。
参考文献:
[1]Vassilis Athitsos and Michael J.Swain. Distinguishing Photography and Graphy On the World Wild Web IEEE 1997:10-17.
[2]H.Farid and S.Lyu. Higher-Order Wavelet Statistics and Their Application to Digital Forensics. In IEEE Workshop on
Statistical Analysis in Computer Vision, Madison, Wisconsin, 2003:1-8.
[3]苏波,王玉平,朱彤,李生红.一种改进的计算机生成图像检测算法.网络信息安全.2007,10:42-43.
[4]Alin C. Popescu and Hany Farid. Statistical Tools for Digital Forensics. Information Hiding 2004:128-147.
[5]Sevinc Bayram. Image Manipulation Detect. Journal of Electronic Imaging 2006,15(4):2-10.
[6]Tian-Tsong Ng and Shih-Fu Chang. Blind Detection of Digital Photomontage Using Higher Order Statistics. Advent
technical report #201-2004-1, Columbia University, 2004, 7:23-28.
[7]Shuiming Ye, Qibin Sun, and Ee-Chien Chang. Detecting Digital Image Forgeries by Measuring Inconsistencies of
Blocking Artifact. Multimedia and Expo.2007 IEEE International Conference on. July 2007,7:2-5.
[8]Sevinc Bayram, Ismail Avcibas, Bulent Sankur, Nasir Memon. Image Manipulation Detection with Binary Similarity
Measures.https://.
[9]R. M. Haralick, K. Shanmugam, and I.Dinstein, “Texture features for image classification”, IEEE Trans. Syst. Man Cybern.
V olume: SMC-3, no.6. 1973:610-621.
[10]吕哲,王福利,常玉清.一种改进的Canny边缘检测算法.东北大学学报.2007,28(12):1682-1684.
[11]Jun S.Huang and Dong H.Tseng, “Statistical Theory of Edge Detection,”Computer Vision, Graphics, And Image
Processing, 1988,43:337-346.
[12]Rafael C. Gonzalez, Richard E. Woods, Steven L. Eddins.数字图像处理.MA TLAB版.电子工业出版社.2004:378-422.
[13]陈圭光,毛涛涛,王正林,王玲.精通MA TLAB GUI设计.电子工业出版社.2008:268-322.。