(完整版)第五章智能机器人的视觉
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 0
0 cos
0 0
0 0
0 1
0
0
0
1
cos sin 0 0
Tz
sin 0
cos 0
0 1
0 0
0
0 0 1
2) 平移变换
空间内物体在x、y、z方向平移(h,k,l),对应的变换 矩阵Ti可表示为:
1 0 0 0
Tt
0 0
4.大数据
灰度图像、彩色图像、高清图像、深度图像、图像序列的 信息量会非常大,需要很大的存贮空间和计算处理能力。
5.2 成像几何基础
成像系统即是将三维场景变换成二维灰度或彩色图像。这 种变换可以用一个从三维空间到二维空间的映射来表示:
f : R3 R2
(x, y, z) (x, y)
5.2.1 基本术语
5.3.1成像模型
成像系统的建模是建立摄像机成像面坐标与客观三维场景 的对应关系。
1. 成像坐标变换
1) 图像坐标系
摄像机采集的图像以 M x N的二维数组存储的。如图所示, 在图像上定义的直角坐标系中,坐标系原点位于图像的左上 角,图像坐标系的坐标( u , v )是以像素为单位的坐标。
2) 成像平面坐标系
简单的三维图形获取过程如图所示。
1. 投影
平面几何投影的分类如图所示。
2. 投影中心
3. 投影线与投影面
投影线
投影中心
投影面
4. 投影变换
透视投影和平行投影分别如图所示。
5.2.2 透视投影
1. 透视现象
2. 透视投影成像模型
图像平面
y
x F
z (x',y')
y'
物体点 (x,y,z)
z
5.2.5 射影变换
三维空间中,以某一个视点为中心往二维平面上投影的过 程称为透视变换。如图所示,这种将平面π上的图形投影到 另一图像平面μ上这一过程称作“配景映射”。
三维空间的坐标系规定为现实世界坐标,称为实坐标或者
世界坐标。三维空间中,三维物体的投影和图像化过程如图 所示。
5.3 图像的获取和处理
1 0
0 1
0 0
h k l 1
3) 扩大、缩小变换
空间内物体以原点为中心,在x、y、z轴方向扩大或者缩 小 mx、my、mz倍,或者全体的1/mw 倍,则对应的变换矩阵Ti 可表示为:
mx 0 0 0
Tm
0 0
0
my 0 0
0 mz 0
0
0
m
1. 图像多义性
不同形状的三维物体投影在图像平面上可能产生相同图像。 不同形状的三维物体投影在图像平面上可能产生相同图像, 如图所示。
2. 环境因素影响
照明、物体形状、表面颜色、摄像机以及空间关系变化都 会对获取的图像有影响,几个立方体构成的多义性图像如图 所示。
3. 知识导引
同样的图像在不同的知识导引下,将会产生不同的识别结 果。不同的知识导引也可能产生不同的空间关系。
5.2.3 平行投影
平行投影也称为正交投影,是指用平行于光轴的光将场景 投射到图像平面上。
5.2.4 视觉系统坐标变换
1. 坐标系
(1)像素坐标 (2)图像平面坐标 (3)摄象机坐标 (4)场景坐标
2. 齐次坐标
考虑对笛卡尔空间内点P分别进行旋转、平行移动、放大、 缩小,对应的射影空间内P[p]→P’[p’]的变换操作可用4×4矩 阵 来作为P的齐次坐标的线性变换:
4. 摄像机的标定
1) 传统标定方法 传统的标定方法采用一个标定块(高精度的几何物体)的
精确数据与摄像机获得的标定块图像数据进行匹配,求取摄 像机的内部参数。
2) 自标定方法 相机自标定是指仅通过相机运动所获取的图像序列来标定
内部参数,而不需要知道场景中物体的几何数据。
1 1
2. 摄像机小孔成像模型
实际成像系统应采用透镜成像原理,物距u、透镜焦距f、 象距v三者满足如下关系:
1 11
f u v
3. 摄像机非线性成像模型
由于实际成像系统中存在着各种误差因素,如透镜像差和 成像平面与光轴不垂直等,这样像点,光心和物点只同一条 直线上的前提假设不再成立,这表明实际成像模型并不满足 线性关系,而是一种非线性关系。尤其在使用广角镜头时, 在远离图像中心处会有较大的畸变,如图所示。像点不再是 点P和O的连线与图像平面的交点,而是有了一定的偏移,这 种偏移实际上就是镜头畸变。
yw , zw , 1]T,在摄像机坐标系下的齐次坐标为[ xc , yc , zc , 1] T, 则摄像机坐标系与世界坐标系的关系:
Xc
Yc
Z
c
R 0T
1
Xw
Xw
t 1
Yw
Z
w
M1
Yw
Z
w
(2) 表达与算法层是要进一步回答如何表达视觉系统各 部分的输入、输出和内部的信息,以及实现计算理论 所规定目标的算法。
(3) 硬件实现层要回答的是“如何用硬件实现各种算 法”。
机器视觉研究可以分为如下五大研究内容:
1、低层视觉 2、中层视觉 3、高层视觉 4、输入设备 5、体系结构
5.1.2 关键问题
5 智能机器人的视觉
机器人的视觉功能在于识别环境、理解人的意图并完 成工作任务。
机器人的视觉技术包括:给定图像的检测与跟踪、多 目视觉与距离测量、时序图像检测运动并跟踪、主动 视觉等。
5.1 机器视觉基础理论
5.1.1 理论体系
(1) 计算理论层是视觉信息处理的最高层次是抽象的计 算理论层次,它回答系统各个部分的计算目的和计算 策略。
p’= p Ti 式中P’[p’]表示P点变换后,对应在射影空间内的点。
1) 旋转变换
空间内物体绕x、y、z轴旋转角度θ,对应的变换矩阵Ti可 表示为:
1 0
0 0
cos 0 sin 0
Tx
0 0
cos sin
s in cos
0 0
Ty
0
Leabharlann Baidus in
若原点q在uv坐标系中的坐标为(u0, v0),每一个像素在x轴
与y轴方向上的物理尺寸为dx, dy,则图像中任意一个像素在
两个坐标系下的坐标关系:
u
x dx
u0
v
y dy
v0
3) 摄像机坐标系
摄像机坐标系是以摄像机为中心制定的坐标系。摄像机成 像几何关系如图所示:
4) 世界坐标系 设三维空间中任意一点P在世界坐标系的齐次坐标为 [xw ,