文献综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业设计(论文)文献综述

课题名称:复杂行车环境中障碍物检测的方法研究学院:计算机科学与工程学院

专业:网络工程

指导教师:杨健

学生姓名:李翔

学号: 0906840322

2013年3月1 日

前言

由于越野智能车在军事和民用方面的巨大潜在的应用,这些年来已经成为了一个研究热点。越野环境非常复杂,障碍物检测成为最大难题之一[1]。之前人们对结构化和半结构化道路环境下的障碍物检测做了大量的研究,提出了很多基于不同传感器的障碍检测方法。但是越野环境和上面的又有很大的不同:越野环境障碍众多,除了凸出地面的,还有凹陷的以及水面、山坡等危险地形。而结构化的道路环境通常只考虑凸出的障碍物。美国喷气动力实验室的Matthies等人利用多传感信息融合来检测越野障碍方面做了大量的研究,融合了CCD 立体视觉以及激光雷达来检测水面和凸起障碍物并根据颜色信息对地形分类做了初步探索,用红外摄像机检测坑洞,并用理论计算证明了凹陷类障碍物从远处检测的困难。

视觉显著性的产生是由于视觉对象与外界通过某种对比形成了能够引起观察者注意的新异刺激,让观察者将目光更多的停留在该区域,以便对其进行更精细的观察和分析。对于低层特征来说,显著区域的产生是由图像某区域的特征和其他区域的特征的不协调造成的。其中图像的特征包括颜色、纹理、亮度等。特征的不协调能够产生刺激,引起观察者的注意,从而这部分区域就产生视觉显著性。对于高层语义特征来说,在一些杂乱的区域映衬下,含有高层语义的区域更能引起人们的注意,其显著性较高。但是,需要注意的是,并不是所有的图像都有显著区域,例如一张纯色的图片没有显著区域,杂乱无章的背景也没有显著区域。显著区域引起观察者注意的并不是因为具体的颜色,也就是说并不是由于黄色比较扎眼就能引起我们的注意,而是通过各种特征(包括颜色、方向等)相互之间的竞争引起观察者的注意。因此,某区域首先引起我们的注意,是因为该区域与周边区域差异较大。综上,在越野环境数据库中,那些凹凸障碍物在一定程度上也就成为了图像的显著区域,而我们就可以将基于显著图(saliency map)的图像显著区域检测方法应用于凸凹障碍物检测。

显著性国内外研究综述

无论是国内还是国外,有关视觉显著性检测技术的研究是由认知心理学的研究者首先展开的。二十世纪九十年代末,基于生物感知的图像显著性分析开始兴起,并逐渐成为视觉感知领域研究的焦点。显著性检测模型之间最大的不同主要是测量显著性原理的不同。大多数图像显著性提取模型[2][3][4]是基于人类视觉注意力机制,结合心理学和神经生物学[5]的研究成果构建合理的生物学机制。

视觉显著性划分为两种类型:一种是基于低层视觉,由数据驱动的自底向上的视觉显著性(bottom-up saliency)。另一种是基于高层视觉,由知识驱动的自顶向下的视觉显著性(top-down saliency)。

1998年,Itti和Koch等人提出的视觉注意力模型[6]是最早、最具有代表性的模型。Itti 模型的框架如图1所示,输入的原始图像通过中央-周边(Center-Surround)算子计算图像的颜色(color)、亮度(intensity)和方向(orientation)的局部特征对比,生成一系列特征图,再把这些特征图归一化融合为显著图,然后将图像某位置的显著值与固定值比较,最终得到显著区域的范围。

图1

不少方法类似于Itti模型,自底向上分析图像的低层特征(颜色、纹理、形状等),对图像进行局部处理,得到最终的显著图。这种视觉显著性模型与图像的具体内容无关,只是取决于图像特征自身的视觉反差,反差越大的区域显著性越明显。而自顶向下的视觉注意力模型是利用高层语义特征计算图像的显著性。高层语义特征指的是图像中的对象级别的特征,利用这种特征进行的自顶向下的计算模型复杂度较高,检测效果更接近人类的视觉系统。目前也有些研究[8][9][10]结合自底向上和自顶向下两种方法,吸取两者的优点,缩短了用户查询意图与图像低层特征间的鸿沟,提取出来的感兴趣区域更符合人类的观察效果。

在图像显著性检测研究的过程中虽然有些方法可能是生物合理的,但是在计算机视觉上并不是最优的。Le Meur等人提出利用一种一致的计算方法模仿自底向上的视觉注意力。将心理视觉空间与视觉特征相结合,使用对比敏感度函数来计算显著性,而且通过交互信息的中央-周边假设判别式[7]计算显著性。每个点的显著值本质上就是一个或多个特征的局部对比度。这种模型的显著图过多依赖图像的局部信息,并没有充分的考虑整幅图像的全局信息,从而产生局部效应,检测结果不准确。“虽然这种方法可能是生物学上较为合理的,但是在计算机视觉上不是最佳的”。Yan Junchi针对数据显著性检测提出一种简单的基于特征的模型,主要包括两歩:首先,使用超完备学习稀疏成分表示图像块,然后,通过直接的低秩和稀疏矩阵分解评估显著信息。具体来说,该模型根据稀疏先验学习图像块的过完备词典。输入图像划分为多个块,这些图像块进一步通过词典进行分解。因此,图像可以通过词典分片表示。这种表示方法包含矩阵的自然形式,每一行表示图像的特征,每一列表示一个图像块。矩阵可以认为是两部分的和:由低秩矩阵表示的冗余部分和稀疏矩阵表示的显著部分。该模型明显不同于

先前的大多数方法:首先,因为合理的图像信息描述,着重于通过直接矩阵分解来求得显著元素。其次,提出了通过能描述大脑图像块的过完备稀疏成分的一种基于特征的模型。最后,求解目标显著性转换为一个计算可靠和有效的最优化过程。与此类方法相关类似的文献可参考[11][12][13]。

参考文献

[1]项志宇,“针对越野自主导航的障碍物检测”,东南大学学报(自然科学版),vol.35, pp71-74, 2005

[2] L. Itti, C. Koch, and E. Niebur. A model of saliency-based visual attention for rapid scene analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(1 l):pp.1254-1259. 1998.

[3] J. Tsotsos, S. Culhane, W. Wai, Y. Lai, and N. Davis. Modelling visual attention via selective tuning. Artificial Intelligence. 78(1): pp. 507-545. 1995.

[4] O. Meur, P. Callet, D. Barba, and D. Thoreau. A coherent computational approach to model bottom-up visual attention. IEEE Transactions on Pattern Analysis and Machine Intelligence.28(5): pp. 802-817. 2006.

[5] A. Treisman and G Gelade. A feature-integration theory of attention. Cognitive Psychology,12(1); pp. 97-136. 1980.

[6] L. Itti, C. Koch and E- Niebur. A Model of Saliency-based Visual Attention for Rapid Scene Analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence. 01(20): pp.1254-1259. 1998.

[7] D. Gao and N. Vasconcelos. Bottom-up saliency is a discriminant process. IEEE International Conference on Computer Vision, pp. 1-6. 2007.

[8] V. Navalpakkam and L. Itti. An Integrated Model of Top-down and Bottom up Attention for Optimizing Detection Speed In Proc. IEEE of Computer Vision and Pattern Recognition(CVPR 06). New York. 01(2): pp. 2049-2056. 2006.

[9] R. J. Peters and L. Itti. Beyond Bottom-up: Incorporating Task-dependent Influences into a Computational Model of Spatial Attention. In Proc. IEEE of Computer Vision and Pattern Recognition (CVPR 07), Minneapolis, pp. 1-8. June 2007.

[10] Wei Zhang, Wu Q. MJ. and Guanghui Wang. Adaptive Semantic Bayesian Framework for Image Attention Pattern Recognition. ICPR08, Tampa FL, Dec. pp. 1-4. 2008.

[11] Liu et al. Robust Subspace Segmentation by Low-Rank Representation, ICML 2010.

[12] Liu et al., Robust Recovery of Subspace Structures by Low-Rank Representation, TPAMI 2012.

[13] Lang et al. Saliency Detection by Multitask Sparsity Pursuit. IEEE TIP 2012.

相关文档
最新文档