11第二讲-视觉系统基础.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上节回顾 计算机视觉:人工智能
的延伸
信号处理、模式识别、
认知等
Marr的三层表象计算理
论
视觉测量(Vision/Visual Measure):根据摄像机获得的视觉信息对目标的位置和姿态进行测量。
视觉控制(Vision/Visual Control):根据视觉测量获得目标的位置和姿态,将其作为给定或者反馈对机器人的位置和姿态进行控制。
视觉伺服(Visual Servo/Servoing):利用视觉信息对机器人进行的伺服控制。(视觉控制的一种)
平面视觉(Planar Vision):被测对象处在平面内,只对目标在平面内的信息进行测量的视觉测量与控制。
立体视觉(Stereo Vision):对目标在三维笛卡尔空间(Cartesian Space)内的信息进行测量。
结构光视觉(Structured Light Vision):利用特定光源照射目标,形成人工特征,由摄影机采集这些特征进行测量。
主动视觉(Active Vision):对目标主动照明或者主动改变摄像机参数的系统。
被动视觉(Passive Vision):采用自然测量。如双目视觉。
机器人视觉控制的作用
视觉:机器人的眼睛
工业机器人领域
用于目标和机器人末端位姿的测量以及机器人末端位姿的控制。
典型应用:焊接、喷涂、装配、搬运等。
移动机器人领域
用于环境中的目标位姿测量
典型应用:机器人视觉定位、目标跟踪、视觉避障等。
机器人视觉控制的研究内容 摄影机标定
视觉测量
视觉控制的结构和算法
计算机视觉
❝研究内容
◦视觉信息处理
◦视觉表示与计算
◦基于特征的计算
◦特征建模的算法
❝视听觉信息的认知计算(2009年重大研究计划)三个重大问题
◦感知特征提取、表达与整合
◦感知数据的机器学习与理解
◦多模态信息协同计算
如何处理一个视觉任务 辨别任务特征
确定方法
实验和分析
图像
表象以外的信息
1883年8月15日,美国著名物理学家、美国物理学会第一任会长亨利·奥古斯特·罗兰在美国科学促进会AAAS)年会上做了题为“为纯科学呼吁”的演讲。该演讲的文字后发表在1883年8月24日出版的Science杂志上,并被誉为“美国科学的独立宣言”。
假如我们停止科学的进步而只留意科学的应用,我们很快就会退化成中国人那样,多少代人以来他们(在科学上)都没有什么进步,因为他们只满足于科学的应用,却从来没有追问过他们所做事情中的原理。这些原理就构成了纯科学。中国人知道火药的应用已经若干世纪,如果他们用正确的方法探索其特殊应用的原理,他们就会在获得众多应用的同时发展出化学,甚至物理学。因为只满足于火药能爆炸的事实,而没有寻根问底,中国人已经远远落后于世界的进步。我们现在只是将这个所有民族中最古老、人口最多的民族当成野蛮人。
良心和道德
学术道德:不盲目追求指标,坐十年冷板凳。
工作道德:良心和实干
高薪和个人发展的平衡。
个人兴趣和社会发展。
80、90后的创业
社会良心:小悦悦事件
数字图像处理基本知识
图像处理技术的分类
模拟图像处理:光学处理和电子处理。
数字图像处理:计算机图像处理
数字图像处理的特点
信息量大
处理技术综合性强
图像信息理论与通信理论密切相关
数字图像处理的主要方法及内容
图像处理主要方法有空域法和变换域法
空域法:
图像看作是平面中各像素的集合,用二维函数表
示。有邻域处理运算和点运算。
变换域法:
对图像进行正交变换后再对变换域系数进行处理,如滤波、数据压缩、特征提取等。
图像处理主要内容图像获取及输入
图像存储系统图像处理与
分析系统图像输出系统
图像获取及输入
图像输入设备
统一的采样和量化 非统一的采样和量化
基于CCD光电耦器件的输入设备 摄像机、数字摄像机
数字相机
平板扫描仪
基于光电倍增管的输入设备 滚筒扫描仪
扫描仪分辨率与扫描图像的大小
分辨率:单位长度上采样的像素个数:
DPI(dot/inch)
1000DPI 1600DPI 1000像素1600像素
1英寸
原稿
为了计算机处理,图像函数f(x,y)在空间和取值上必须数字化
▪图像的采样
–空间坐标(x,y)的数字化被称为图像采样
–确定水平和垂直方向上的像素个数N 、M
M
N
图像采样的形式化定义
设Z表示整数集合
采样处理:将xy平面分配到一个网格上,且每一个网格中心的坐标是一个笛卡儿乘积ZxZ的元素对,即所
有有序元素对(a,b)的集合,其中a和b属于整数集合Z
xy平面
(a,b)
▪图像的量化
–取值的数字化被称为图像灰度级量化
–量化处理:将f 映射到Z的处理
–Z的最大取值,确定像素的灰度级数G = 2m,如256 f
图像的形式化定义
设Z表示整数集合,R表示实数集合
f(x,y)是数字图像:
(1)仅当(x,y) 是ZxZ中的整数,
(2)并且f是给每一个坐标对(x,y)分配了一个灰度值(该值出于R)的函数