图像理解与计算机视觉
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参考资料 – Google 讨论组 • Image Processing and Computer Vision – /group/ipcv – Google Scholar • – Google Search Engine – IEEE explorer – CVPR papers on the Web – ICCV papers on the Web – ECCV papers on the Web
– /watch?v=xMNIxKy3MG0
• ―UTokyo's e-Heritage Project: 3D Modeling of Heritage Sites‖
– /watch?v=DPiMJkZ0YKI
一、教学目标与要求
目标:
《图像理解与计算机视觉》是一门涉及多个交叉学科领域的 课程。本课程侧重于图像理解和计算机视觉中的基本理论,课程 主要侧重对图像处理、目标识别以及计算机视觉方面的理论和应 用进行系统介绍。目标是使学生学习了本课程之后,对图像理解 和计算机视觉的基本理论,尤其是图像处理的概念、基本原理以 及解决问题的基本思想方法有一个较为全面的了解和领会;学习 计算机视觉的基本理论和技术,了解各种智能图像处理与计算机 视觉技术的相关应用;具备解决智能化检测与识别等应用问题的 初步能力,为以后从事模式识别、计算机视觉、测绘科学、多媒 体技术等领域的研究与工程建设打下扎实的基础
参考资料 – International Journal of Computer Vision (IJCV) – IEEE Transaction on Pattern Analysis and Machine Intelligence (TPAMI) – IEEE International Conference on Computer Vision and Pattern Recognition (CVPR) – IEEE Computer Society International Conference on Computer Vision (ICCV) – 其他国际期刊和会议论文: • Computer Vision and Image Understanding (CVIU) • Pattern Recognition Letters (PRL) • ECCV • ……
C O N TE N T S
课程简介
– 课程设置情况 -教学目标与要求 -课程内容与学时分配 -教材 – 参考资料 – 相关课程 – 课程网址 – 成绩评定 – 实验平台与开发工具 -图像理解 -图像分析
课程介绍
•课程编号:1020299 •课程名称:图像理解与计算机视觉 •英文名称:Image Understanding & Computer Vision • •开课单位:测绘与地理信息学院 开课学期:2016-2017年第一学期 •课内学时:36学时 教学方式:讲课与自学 •适用专业: 测绘科学与技术 考核方式:课程报告 •预修课程:数字摄影测量与遥感信息处理、数字图像处理、计算机图形学
参考资料
– VideBiblioteka lecture on web • ―Computer Vision‖, by Andrew Blake, Microsoft Research
– /mlas06_li_gmvoo/
• ―Generative Models for Visual Objects and Object Recognition via Bayesian Inference‖ by Fei-Fei Li, Princeton University • ―Machine Learning in Vision‖, by Bill Triggs, Laboratoire Jean Kuntzmann – Youtube - Google tech talk • ―IM2GPS: estimating geographic information from a single image‖, CVPR2008
二、课程内容与学时分配
1.绪论(2学时) 介绍课程、图像处理的基本概念和图像理解的基本内容和内涵。 2.图像与视觉系统(2学时) 人类视觉系统基本构造和模型,亮度视觉与颜色视觉的基本概念、 模型及视觉特性。 3.图像分析出和图像变换(4学时) 图像信号的数学表示,图像的采样和量化,图像像素的基本概念 及相关概念,基本图像运算,图像的线性系统理论,二维傅立叶 变换及其基本性质,快速傅立叶变换,离散余弦变换,离散沃尔 什变换,K-L变换,离散小波变换以及其他的二维正交变换。 4.图像增强与恢复(4学时) 图像的空域增强技术,频域增强技术,图像退化的基本模型及图 像恢复的基本思想,图像恢复的基本技术。 5.彩色和多光谱图像处理(2学时) 彩色图像处理(增强和复原等),基于颜色特征的图像检索,多 光谱图像处理,影像融合,遥感超光谱图像处理
五、实验平台与开发工具:
– Matlab – OpenCV • /projects/opencvlibrary/ • 中文网站 • OpenCV是Intel发起的开源计算机视觉库,直至OpenCV1.0发 布, 现在由Willow Garage提供支持 (/documentation/index.html)。 • 它由C / C++实现,支持跨平台( Linux, Windows),提供了 图像处理、计算机视觉和模式识别等方面的很多通用算法 • OpenCV 拥有包括 300 多个C函数的跨平台的中、高层 API。它 不依赖于其它的外部库——尽管也可以使用某些外部库。 • OpenCV 对非商业应用和商业应用都是免费( FREE)的。 • 最新版本: OpenCV_2.0.0a • 应用例子: – 人脸检测
一、教学目标与要求
要求: 1. 理解图像分析与图像理解的基本概念与基本内容; 2. 2. 了解人类视觉系统基本构造,熟练掌握视网膜的构造和功能以 及人类视觉模型; 3. 了解人类视觉的认知模式(模板匹配、特征分析、结构描述 等); 4. 熟练掌握基于边界和区域的基本图像分割技术以及图像分割的 评价方法和测度。 5. 掌握纹理分析统计方法和从纹理恢复形状。 6. 熟练掌握图像目标的边界、区域特征的表达、测量及描述方法 和图像分类识别的不 同方法。 7. 掌握计算机视觉计算理论,了解计算机视觉信息系统模型;了 解具体的智能图像信 息分析系统。
– /watch?v=dgif39IKT9A
• ―Machine Learning (Stanford)‖
– /watch?v=UzxYlbK2c7E&feature=related
• ―Looking at People‖, by David Forsyth
推荐教材《图像工程(第3版)》 《图像工程(下册):图像理解(第3版)》 《图像处理、分析与机器视觉(第3版)》 《计算机视觉:一种现代方法(第2版)(英文版)》 《学习OpenCV》 《数字图像处理与机器视觉:Visual C++与Matlab实现》 《特征提取与图像处理(第2版)》 《数字图像处理(第3版) 》
图像理解(image understanding,IU)
就是对图像的语义理解。它是以图像为对象,知识为核心, 研究图像中有什么目标、目标之间的相互关系、图像是什么场景 以及如何应用场景的一门学科。 图像理解属于数字图像处理的研究内容之一,属于高层操作。 其重点是在图像分析的基础上进一步研究图像中各目标的性质及 其相互关系,并得出对图像内容含义的理解以及对原来客观场景 的解释,进而指导和规划行为。图像理解所操作的对象是从描述 中抽象出来的符号,其处理过程和方法与人类的思维推理有许多 相似之处。
图像理解(image understanding,IU)
就是对图像的语义理解。它是以图像为对象,知识为核心, 研究图像中有什么目标、目标之间的相互关系、图像是什么场景 以及如何应用场景的一门学科。 图像理解属于数字图像处理的研究内容之一,属于高层操作。 其重点是在图像分析的基础上进一步研究图像中各目标的性质及 其相互关系,并得出对图像内容含义的理解以及对原来客观场景 的解释,进而指导和规划行为。图像理解所操作的对象是从描述 中抽象出来的符号,其处理过程和方法与人类的思维推理有许多 相似之处。
三、教材
【1】Milan Sonka(美)等著,艾海舟等译. 图像处理分析与机器 视觉(第二版). 北京:人民邮电出版社. 2003. 【2】R. C. Gonzales(美). 阮秋琦等译. 数字图像处理.北京:电 子工业出版社,2004. 【3】R. C. Gonzales(美). 阮秋琦等译. 数字图像处理(MATLAB 版). 北京:电子工业出版社,2004. 【4】章毓晋著. 图像工程(下册). 北京:清华大学出版社. 2006.
参考资料
– Emanuele Trucco, Alessandro Verri, "Introductory Techniques for 3-D Computer Vision", Prentice Hall, 1998. – Mubarak Shah, "Fundamentals of Computer Vision ", /courses/cap6411/book.pdf – Olivier Faugeras, "Three Dimensional Computer Vision", MIT Press, 1993 – Richard Szeliski, ‖Computer Vision: Algorithms and Applications‖, 2009, /en-us/um/people/szeliski/Book/ – ―Pattern Classification (2nd Edition)‖, by R.O. Duda, P.E. Hart, and D.G. Stork, Wiley-Interscience, 2000. – ―Pattern Recognition and Machine Learning‖, by Christopher M. Bishop, 2006 – Michael I. Jordan, ―An Introduction to Probabilistic Graphical Models‖
二、课程内容与学时分配
6.图像分割(4学时) 视觉认知模式,基于边缘的图像分割技术,基于区域的图像分割 技术,图像分割评价。 7.纹理分析(4学时) 纹理分析统计方法,有序纹理的结构分析,基于模型的纹理分析, 从纹理恢复形状。 8. 图像识别(4学时) 图像目标特征的提取与表达,图像目标特征的描述,图像目标的 分类和估计。 9.图像识别应用(2学时) 图像特征分析、分割与识别,雷达图像处理与识别,地学遥感图 像分析与识别。 10.计算机视觉的高层感知 (6学时) 计算机视觉计算理论、计算机视觉的基本概念;Marr视觉计算理 论;计算机视觉的应用;计算机视觉的研究内容与面临的困难、 与其它学科的关系。
• ―Learning and Recognizing Visual Object Categories‖, by Dan Huttenlocher – Free University Lectures • Vision Algorithms:
四、其他
成绩评定
——平时作业( 50%): • 4~5个编程练习 • 每次作业在一周内提交 ——期末课程项目( Project)和报告( 50%): • 根据讲课内容完成一个project,提交项目报告、实验程序、实 验结果和演示等。 • 课程项目和报告在课程结束后一周内提交。