计算机视觉
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-7-29
2013-7-29
你的眼睛是否欺骗了你?
静?
动?
2013-7-29
你的眼睛是否欺骗了你?
你动?
它动?
2013-7-29
你的眼睛是否欺骗了你?
头晕!!!
2013-7-29
你的眼睛是否欺骗了你?
到底 它是 什么 颜色 的?
2013-7-29
你的眼睛是否欺骗了你?
有 几 个 黑 点 ?
2013-7-29
主要参考资料
《计算机视觉》
(美国)夏皮罗 (美国)斯托克曼 赵清杰 等译
机械工业出版社
《计算机视觉:计算理论与算法基础》
马德颂
《机器视觉算法与应用》
(德)斯蒂格 (德)尤里奇 (德)威德曼著 杨少荣等译
2013-7-29
一. 视觉原理
了解人类视觉 的构成、信息 处理过程,对 机器视觉研究 人员来讲是非 常具有启发性 和吸引力的。
2013-7-29
视觉通路
到达视网膜的光线经杆体和 锥体细胞转换为神经信号, 并经视网膜中的神经节细胞 加工,传出视网膜.经神经 节细胞加工的神经信号,经 过视交叉部分地交换神经纤 维后,再形成视束,传到中 枢的许多部位,神经节细胞 轴突在外膝体换神经元后, 由外膝体神经元直接经放射 到视皮层,称为视觉的第一 视通路
2013-7-29
需要解决的几个经典问题
运动
自体运动:摄像机/成像设备的三维刚性运动 (3D成像演示7、27、28 ) 图像跟踪:跟踪运动的物体。(车辆轨迹跟踪(8) 、 人员计数演示(9) )
2013-7-29
需要解决的几个经典问题
场景重建
给定一个场景的二或多幅图像或者一段录像,场 景重建寻求为该场景建立一个计算机模型/三维模 型。 (故宫三维场景(10) )
2013-7-29
存在问题
人可通过视觉和听觉,语言与外界交换信息,而 目前的计算机却要求严格按照各种程序语言来编 写程序,只有这样计算机才能运行。 必须改变过去的那种让人来适应计算机,来死记 硬背计算机的使用规则的情况,而是反过来让计 算机来适应人的习惯和要求,以人所习惯的方式 与人进行信息交换29。 让计算机具有视觉、听觉和说话等能力。这时计 算机必须具有逻辑推理和决策的能力。具有上述 能力的计算机就是智能计算机。
2013-7-29
相关学科
神经生物学(生物视觉)
在整个20世纪中,人类对各种动物的眼睛、神经 元、以及与视觉刺激相关的脑部组织都进行了广 泛研究,这些研究得出了一些有关“天然的”视 觉系统如何运作的描述(尽管仍略嫌粗略),这 也形成了计算机视觉中的一个子领域——人们试 图建立人工系统,使之在不同的复杂程度上模拟 生物的视觉运作。同时计算机视觉领域中,一些 基于机器学习的方法也有参考部分生物机制。
2013-7-29
顺时针的话,属于是用右脑较多的类型 逆时针属于是用左脑较多的类型 逆时针转动的,突然变成顺时针,IQ160以上!
左脑人的概念---心理学家发现,人的左右脑是 有严格的分工的,左脑属于逻辑的、理性的、 功力的、分析的、算计的大脑,要想成功就必 须充分利用好左脑。长期奔命于工作、事业、 追求功名利禄而忽视娱乐、生活的人被称为 “左脑人”
2013-7-29
二值图象的特点
a. 假定二值图像大小为m x n,其中物体像素 值为1,背景像素值为0; b. 二值图像处理的算法简单,易于理解和实现, 计算速度快(工厂识别); c. 二值视觉所需的内存小,对计算设备要求低; d.二值视觉系统技术可用于灰度图像视觉系统 。
2013-7-29
颜色原理
猴和人的视网膜中,含有三种不 同的锥体细胞,每一种锥体细胞 对不同的光谱,其敏感性也是不 同的.三种锥体细胞对光谱的敏 感峰值分别在430纳米,540纳米 和570纳米.这三个峰值段正对 应着光谱中的红、绿、蓝区 域.实验进一步表明,当三种颜 色按一定比例同时刺激人眼时, 会产生各种颜色感觉.其中有一 种比例会使得颜色感觉完全消失, 只有亮度感觉.说明颜色只取决 于三个基本的输入量,这也是色 觉三基色原理的基础.
制造业(2)、检验识别28、 25 、文档分析 (3) 、医疗 诊断、军事、智能电网等领域中各种智能系统中 不可分割的一部分。 美国把对计算机视觉的研究列为对经济和科学有 广泛影响的科学和工程中的重大基本问题,即所 谓的重大挑战(grand challenge)。 为计算机和机器人开发具有与人类水平相当的视 觉能力 。
2013-7-29
相关学科
物理学、光学
计算机视觉关注的目标在于充分理解电磁波,主 要是可见光与红外线部分,遇到物体表面被反射 所形成的图像,而这一过程便是基于光学物理和 固态物理,一些尖端的图像感知系统甚至会应用 到量子力学理论,来解析影像所表示的真实世界。 由此,计算机视觉同样可以被看作是物理学的拓 展。(隧道扫描演示(5-1-2) )
Computer vision
计算机视觉
主讲: 陈 志 翔 计算机科学与工程系 Email:zxchenphd@163.com
考核成绩
1. 2.
3.
4.
20%课堂表现 30%作业 20%小测 30%课程报告
2013-7-29
引入
你的眼睛是否欺骗了你?
何处多出1人?
2013-7-29
64=65?
2013-7-29
颜色原理
(2^8)^3=16 777 216色
2013-7-29
二. 二值图像Binary Image
称为黑白照片吗?
2013-7-29
彩色图像
2013-7-29
灰度图像
2013-7-29
二值图像
2013-7-29
为什么引入二值图像?
一副图像是一个二维阵列,阵列元素值为 灰度值或者亮度值,场景信息就包含其中。 亮度通常被量化,常用的有256个灰度级, 医疗领域高达4096个灰度值,很明显,灰度 级越多,图像质量越好,但需要的内存也 越大。
2013-7-29
相关学科
信号分析与处理 数学:统计,最优理论,几何,粒度…… 心理学 美学 集成电路
……
2013-7-29
需要解决的几个经典问题
识别(识别,鉴别,监测)
判定一组图像数据中是否包含某个特定的物体, 图像特征或运动状态。 到目前为止,还没有某个单一的方法能够广泛的 对各种情况进行判定:在任意环境中识别任意物 体。现有技术能够也只能够很好地解决特定目标 的识别,比如简单几何图形识别,人脸识别26 , 印刷或手写文件识别或者车辆识别。而且这些识 别需要在特定的环境中,具有指定的光照,背景 和目标姿态要求。 (乐高演示30车牌识别演示(6))
2013-7-29
计算机视觉 computer vision
计算机视觉是一门研究如何使机器“看” 的科学,更进一步的说,就是是指用摄影 机和电脑代替人眼对目标进行识别 、跟踪 和测量等,并进一步做图形处理,用电脑 处理成为更适合人眼观察或传送给仪器检 测的图像。
2013-7-29
应用广泛
约有1亿个.
2013-7-29
视网膜可分为以视轴为中心直径约 6毫米的中央区和周边区.中央区 有一直径约2毫米(折合6度视角)呈 黄色区域,称为黄斑.黄斑中央有 一小凹,叫做中央凹(fovea),面积 约1平方毫米.人类视觉的中央凹 没有杆体细胞,只有锥体细胞,其 密度高达每平方毫米150,000.离 开中央凹,锥体细胞急剧减少,而 杆体细胞急剧增多,在离开中央凹 20度的地方,杆体细胞最多.中央 凹的锥体细胞密度很高,是产生最 清晰视觉的地方.杆体细胞主要是 在黑暗的条件下起作用,同时还负 责察觉物体的运动.因此,常将锥 体细胞称为明视觉细胞,将杆体细 胞称为暗视觉细胞.
2013-7-29
模糊与锐化
2013-7-29
加噪
对比度
2013-7-29
相关学科
模式识别 根据从图像中抽取的统计特性或结构信息, 把图像分成预定的类别。例如,文字识别 或指纹识别。在计算机视觉中模式识别技 术经常用于对图像中的某些部分,例如分 割区域的识别和分类。(数字识别演示(4) )
红外线:遥感卫星
微波:雷达等(任何范围 时间气候光照条件下 收集数据,使用天线 和计算机记录图像、 微波辐射) 无线电波:医学和天文学 (MRI) (人眼看不到的光13 )
2013-7-29
人的眼睛是一个前后直 径大约23毫米的近似球 状体 。视网膜由锥体细 胞(cone cell)和杆体细胞 (rod cell)两种感光细胞 组成,其中,锥体细胞 约有650万个,杆体细胞
2013-7-29
需要解决的几个经典问题
图像恢复
图像恢复的目标在于移除图像中的噪声,例如仪 器噪声,模糊等。 图像修复。
2013-7-29
2013-7-29
2013-7-29
2013-7-29
主要参考资料
International Conference on Computer Vision,国际计算机视觉大会 International Conference on Computer Vision and Pattern Recognition,国际计算 机视觉与模式识别大会 International Conference on Image Processing,国际图像处理大会
右脑人的概念---人的右脑是属于灵感的、直觉 的、音乐的、艺术的,可以令人产生美感和喜 悦。
左脑能使人感觉和享受到成功,却无法使人享 受到长久的幸福感。
而善于使用右脑的人可以使人脑分泌更多的内 啡肽,从而使人能产生充分的幸福和满足感。
2013-7-29
2013-7-29
2013-7-29
生活中的视觉
2013-7-29
代替?模仿?--走自己的路
计算机视觉系统中计算机起代替人脑的作 用,但并不意味着计算机必须按人类视觉 的方法完成视觉信息的处理。计算机视觉 可以而且应该根据计算机系统的特点来进 行视觉信息的处理。(咖啡伴侣的启示)
2013-7-29
相关学科
图像处理与图像分析 研究对象主要是二维图像,实现图像的转 化,尤其针对像素级的操作,例如提高图 像对比度,边缘提取,去噪声和几何变换 如图像旋转。这一特征表明无论是图像处 理还是图像分析其研究内容都和图像的具 体内容无关。
(模拟眼球演示(12))
2013-7-29
伽马射线: 核医学和天文观察 在核医学中,将放射 性同位素注射到病人 体内,当这种物质衰 变时放射出伽马射 线,利用检测器收集 到的放射物产生图像。 可以确定骨骼病理、 感染或肿瘤等。
2013-7-29
X射线:医学诊断等 紫外线:荧光显微镜
2013-7-29
“从门缝里看人——把人看扁了”(有道理 吗?) 海市蜃楼(真实?虚幻?) 足球射门(门会变化?) 日有所思,夜有所梦(和心理有关) 魔术师(亦真亦假) 电视节目(隔行逐行)
2013-7-29
所见即所得? 我思故我在?
我们的眼睛也不是万能的,它也有自己的 不足与缺陷。因为眼睛的可视光波长度范 围是380到760毫微米,也就是说只有在这个 波长范围内的光线才可以穿过眼角膜,在 视网膜上成像。如果超出了这个长度范围 外,我们就无法看到了。由此看来,尽管 眼睛欺骗了你,但它也不是有意的,也该 得到原谅吧 !
2013-7-29
主要参考资料
Байду номын сангаас
IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE 模式分析与机器智 能杂志 International Journal on Computer Vision,国际 计算机视觉杂志 Computer Vision and Image Understanding,计 算机视觉与图像理解 Pattern Recognition Letters,模式识别快报
2013-7-29
你的眼睛是否欺骗了你? 谁 动 了 你 的 方 块 ?
2013-7-29
眼见为实,耳听为虚
?
曾几何时,我们认为地球是方的,天空是圆的,地球就群 星环绕的宇宙的中心。可是随着对宇宙的了解不断加深, 我们知道了地球只是太阳系中的一颗行星而已,它也是圆 的。突然间人类豁然开朗,原来眼见也不一定为实。 由于种种客观原因,眼睛常常欺骗我们。但是它们是怎么 欺骗我们的呢?为什么它们竟能遮蔽人类那百转千回的大 脑的智慧曙光呢?还认为眼睛是你最忠诚的仆人吗?还认 为它们从来不会欺骗你吗?(1黑白视觉演示)