一种基于亮度特征的图形图像分类方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2003-09-27;修订日期:2003-12-12 基金项目:国防十五预研资助项目(413160501) 作者简介:王义峰(1977-),男,河北安国人,硕士研究生,主要研究方向:CG ; 曾平(1956-),男,重庆人,教授,博士生导师,主要研究方
向:
CG 、图形图像输入/输出系统.文章编号:1001-9081(2004)04-0070-02
一种基于亮度特征的图形图像分类方法
王义峰,曾 平
(西安电子科技大学计算机外部设备研究所,陕西西安710071)
(wyf1873@ )
摘 要:
色彩管理中的自适应色域匹配技术,要求对不同渲染目的的图像自动分类。
文中通过对图像的亮度直方图进行统计,提取了亮度级数和亮度直方图包络光滑度两个特征量,实现了一种基于该特征的图形图像分类方法,对自然照片和计算机生成图形这两种不同种类的图像进行了区分。
关键词:图像分类;色彩管理;渲染目的
中图分类号:TN911.73 文献标识码:
A Picture /Graphics Classification Using Intensity Features
WANG Yi-feng,ZENG Ping
(Research Institute of Peripherals,Xidian Uniuersity,Xifan Shaanxi 710071,China)
Abstract:Classification of images with different rendering intents is reguired in the adaptive gamut mapping technics in computer color management.From the statistic of image intensity histogram,this paper presents an picture /graphics classification algorithm based on such image intensity features as intensity levels and intensity histogram smoothness.The algorithm can help to determine whether a image is a natural picture or a synthetic graphic.
Key words:image classification;color management;rendering intent
1 引言
自然照片图像和计算机生成图形之间的差别体现在许多
方面,如视觉效果、图像统计特征等。
因此,许多图像处理算法针对这两种不同类型的图像采取了不同的策略。
图像压缩
编码领域中,
DCT 和Wavelet 算法主要用于自然照片,对于边缘丰富的计算机生成图形,其优势并不明显[1]。
而JBIG 和G3、G4等游程编码技术,对计算机生成图形的压缩,效率明显
优于照片图像[2]。
另外,计算机色彩管理领域,针对不同类型的图像,采用相应的色彩渲染方式,才能达到最优的视觉与实用效果。
通常,我们对计算机生成图,追求色彩的鲜艳、逼真,而对照片图像,则更加重视整体色感觉的自然、和谐。
所以,对计算机生成图和自然照片图像进行准确分类,是许多图像处理过程的第一步骤。
近期,文献[2]
提出了基于纹理能量特征的图像分类算法,但算法局限于扫描图像,对一般图像不适用。
文献[3]对图像文档内容进行了分析,其分类结果受图像分割算法的影响。
笔者对大量照片图和计算机生成图形的亮度信息进行了直方图统计,发现自然照片图像往往含有更多亮度级,其亮度直方图包络更加光滑,于是实现了一种基于亮度特征的分类算法,对自然照片和计算机生成图形进行区分。
该算法简单易实现,适用于所有彩色图像。
2 图像亮度特征的提取
对于一幅RGB 象素格式的彩色图像,按下式提取其亮度通道信号:
Y =0.2989R +0.5870G +0.1140B
图像f (x ,y )的亮度统计直方图定义如下[4]
:p (s k )=n k /n ,k =0,1,…,L -1
(1
)
图1
其中,s k 为图像f (x ,y )的第k 级亮度值,n k 是f (x ,y )中具有亮度值s k 的象素个数,n 是图像象素总数。
因为p (s k )给出了对s k 出现概率的一个估计,所以亮度直方图提供了原图的亮度值分布情况,是一幅图像所有亮度的整体描述。
为了作图实现时的方便,对(1)式调整如下:
p 0(s k )=n k ,
k =0,1,…,L -1第24卷第4期
2004年4月
计算机应用
Computer Applications
Vol.24,No.4Apr.,2004
图1给出了一幅计算机生成图形(电子地图)与一幅自然风景照片及它们的亮度直方图。
从图1的亮度统计直方图中,可以得到如下信息:1)相对于计算机生成图形,照片图像的亮度直方图通常含有较多的亮度级;
2)自然照片图像的亮度直方图包络更加光滑。
于是,笔者试图从图像的亮度统计直方图中,提取特征信息,对这两种图像进行分类。
定义1 亮度级数:nl =
2255
k =0S
(p 0
(s k
)),其中S (x )=0,x =0
1,
x #{0
一幅图像,其亮度级数最多取256级。
定义2 亮度直方图包络光滑度:sl =2254
k =0
p (s k +1)-p (s k )=
2
254
k =0p 0(s k +1)-p 0(s k )
/n sl 表示亮度直方图函数的一阶差分的模值加和,所以sl 值越小,说明图像亮度直方图的包络sl 光滑度越好。
图2
为了确定亮度特征nl 和sl 的值,我们对150幅自然照片图像和150幅计算机生成图形进行了亮度直方图统计,图2为统计结果对比。
统计显示,照片图像的亮度级数一般大于200,nl 最小的一幅,亮度级数为205;而计算机生成图形亮度级数分布范围较广(从18~256),统计的150幅生成图形中,80.7%亮度级数小于200。
因此,取nl =200为分界线,nl <200时,认为是计算机生成图形。
照片图像亮度直方图包络光滑度sl 小于0.36,sl 最大的一幅为0.34247;统计的150幅计算机生成图形中,sl 值大于0.36的占91.75%。
因此,取sl =0.36为分界线,sl >0.36时,认为是计算机生成图形。
3 图形图像分类
对图形图像准确分类,还必须考虑一类特殊图像———数字半调图像。
数字半调,可抽象为一个色调降值和噪声添加的复合过程。
一幅连续色调图像与其半调图的亮度直方图存在很大差别,其亮度特征也会不同(见图3)。
图3
因此,对半调图的分类,首先应该进行图像逆半调处理。
下面给出计算机生成图形和自然照片图像的分类流程:
图4
低通滤波的目的,仅在于图像的逆半调。
图像逆半调的算法很多,简单的低通滤波算法完全可以满足我们的需要。
如果可以确定待分析的图像为连续色调图,低通滤波步骤还可以省略。
4 仿真结果
表1 仿真结果计算机生成图形
自然照片图像
总数160160错分139正确率91.88%
94.38%
总计正确率
93.13%
计算机生成图形由图标组成,自然照片图像中,人物照片占30%,动物照片占30%,风景照片占40。
该分类算法,会将一部分计算机生成图形分为自然照片图像。
观察这部分图形,发现它们在视觉效果上和自然照片几乎没有分别:或者颜色数很多,光照、阴影十分逼真,或者亮度变化缓慢,图像纹理很精致等。
而自然照片错分为图形的原因主要是这些照片拥有大面积的单一亮度区,该问题有待进一步研究解决。
5 结语
针对计算机色彩管理需要,设计实现了一种图形、图像分
1
7第4期王义峰等:一种基于亮度特征的图形图像分类方法
文章编号:1001-9081(2004)04-0072-03
基于H.264编码的运动估计快速搜索算法
智西湖1,智艾娣2
(1.洛阳师范学院计算机科学系,河南洛阳471022;2.洛阳师范学院物理系,河南洛阳471022)
(zhixihu@)
摘要:H.264标准可以获得很高的编码效率,适于低带宽高质量网络视频应用的需要,但由于采用了许多高复杂度的算法,使得软硬件实现起来非常困难。
本文给出一种运动估计搜索算法,对
H.264进行优化,经测试,搜索速度明显提高。
关键词:H.264标准;运动估计;自适应;搜索算法
中图分类号:TP393.04 文献标识码:A
A Method of Movement Estimate Expeditious Search of H.264Coding
Zhi Xi-hu,Zhi Ai-di
(1.Department of Computer Science,Luoyang Normal College,Luoyang Henan471022,China;
2.Department of Physics,Luoyang Normal College,Luoyang Henan471022,China)
Abstract:H.264standard can gain high coding efficiency and meet the needs of H.264coding and high guaiity network video.However,with many very compiex methods adopted,it is difficuit for software or hardware to fit each other.This paper provides an estimating search method of motion which makes H.264optimized.The method has been tested to improve the search speed distinctiy.
Key words:H.264standardg expectation of motiong seif adaptationg searching method
1 引言
H.264是ITU-T和MPEG组成联合专家组JVT制定的目前最新的视频编码标准,这一编码标准可以获得很高的编码效率,尤其在低码率视频编码方面比MPEG-4有明显提高,非常适于低带宽高质量网络视频应用的需要。
但是,H.264为了提高编码效率,采用了许多高计算复杂度的算法,使得编解码计算量很大,很难用软件方式进行实时编解码,为硬件实现编解码也增加了难度。
为了使H.264能比较容易地在低码率高实时性的应用系统中实现,必须对其编码算法进行优化。
对H.264编码器各个算法模块进行分析可以看出,运动估计模块的计算量占整个编码器运算量的80%以上。
因此,若对整个编码器进行优化,运动估计模块应作为首选。
H.264在进行运动估计时,首先进行运动向量预测,经预测获得初始运动向量以后,把这个初始的运动向量作为搜索中心进行块匹配搜索,搜索时采用全搜索算法,即给出搜索中心周围的一个范围,对该范围内的矩形区域内的所有的点,都要计算一次匹配结果,从中选出最佳匹配点作为整象素搜索的结果。
H.264的全搜索算法,优点是可以找到限定范围内的全局最优匹配结果,运动估计精度很高。
其不足在于算法的复杂度太高,成为整个编码体系中最为耗时的一部分,因此,在尽可能小的质量损失的前提下,提高运动估计搜索速度,是对H.264进行优化的着眼点。
2 已有的搜索算法
运动估计时间的长短取决于搜索点数的多少,对H.264进行优化,就是在保证搜索准确性的前提下,减少搜索点数以
收稿日期:2003-10-13;修订日期:2003-12-21
作者简介:智西湖(1957-),男,河南洛阳人,副教授,主要研究方向:多媒体技术、数据压缩;智艾娣(1957-),女,河南洛阳人,高级工程师,主要研究方向:计算机辅助设计、图形图像处理.
类算法。
因为自然照片图像含有更多的亮度级,其亮度变化相对柔和,我们将图像彩色信息转换为亮度信号,通过对亮度统计直方图的研究,提取了亮度级数和亮度直方图包络光滑度这两个特征,进而实现了图形、图像的快速分类算法。
算法中的特征值通过事先训练大量样本产生。
其不足是还不能完全将图像、图形自动分类,更有效的算法有待进一步研究。
参考文献
[1]Specification ICC.1.Fiie Format for Coior Profiies[Z].2001.
[2]Fan Z,Baia R.Picture/Graphics Ciassification Using Texture Fea-
tures[A].Coior Imaging:Device-Independent Coior,Coior Hard-copy,and Appiication VII[C].San Jose,CA,USA:SPIE,2002, 4663.81-85.
[3]Revanka S,Fan Z.Picture,Graphics,and Text Ciassification of Doc-
ument Image Regions[A].Proceedings IS&T/SPIE Symposium on Eietronic Imaging Science and Technoiogy[C].San Jose,CA:SPIE, 2001,4311.
[4]Zhu XO,Zhang YJ,Liu WJ.IP&A-Web:An Oniine Course of Image
Processing and Anaiysis[EB/OL]./~ zhuxg/ICCE_ipa_web.pdf,2003-09.
第24卷第4期2004年4月
计算机应用
Computer Appiications
Voi.24,No.4
Apr.,2004。