3D视觉传感技术研究进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3D视觉传感技术研究进展
1 引言
毫无疑问,视觉是人获取信息的主要器官。在当前的视觉系统中,3D立体成像成为研究热点,无需配戴立体眼镜就能观看立体图像成为视觉系统的发展方向。目前所谓的3D游戏和电影,实际上并非真正的3D影像。这是因为拍摄电影时使用的是单镜头的摄像机,制作的游戏使用的是3D软件技术,并且目前显示的屏幕是2D,因此从制作到显示都是平面的。3D图像信息的获取都是基于某种图像传感器获取、量化图像信息,这些图像传感器有直接获取可见光的图像,也有间接通过检测辐射、红外线、X射线、或者超声波来获取图像信息。不同的传感器技术有不同的分辨率、精度和噪声,因此从图像传感器获取的信息中提取有用信号进行分析成为广大科技工作者的研究课题。
3D视觉传感器具有广泛的用途,比如多媒体手机、网络摄像、数码相机、机器人视觉导航、汽车安全系统、生物医学图像分析、人机界面、虚拟现实、监控、工业检测、无线远距离传感、显微镜技术、天文观察、海洋自主导航、科学仪器等等。这些不同的应用均是基于3D视觉图像传感器技术。特别是3D影像技术在工业控制、汽车自动导航中具有急迫的应用。
通过分析发现,发现目前研究3D影像技术主要集中在基于CCD或者CMOS 图像传感器的3D实现方法、图像处理和显示的研究,真正开展3D视觉传感器研究的很少。
本文在分析各种3D影像技术的方法上,提出一种新的3D视觉传感器新技术,并重点讨论3D新影像技术的关键技术之一的视觉图像摄取器件的原理和实现方法。与传统的3D视觉传感器技术相比,具有结构简单、实现方便、价格低廉的优点,便于便携式多媒体设备的应用。
2 3D立体成像原理
3D信号是一个三维坐标的空间信号。在一个精确视觉的定义中,3D影像应该是一个拥有三个空间分量的图像。但是,从广义上讲,视频信号序列可以考虑作为一个3D信号,其中包括两维的空间变量和一个一维的时间分量。在真正的3D视频信号中,其图像是一个拥有三个空间分量的影像;有时,广义上讲3D视频信号可以看作是4维空间信号,拥有三个空间分量和一个时间分量。
图1表示人的眼睛3D成像原理。人的眼睛看到的景象是一种具有层次和深度的立体影像。人两眼水平分开在两个不同的位置上,当人眼在观察一个三维物体的时候,两个眼睛观察的物体图像是不一样的,存在一个像差,两幅图像传输到大脑,通过大脑的合成处理,人就感觉到一个三维世界的深度立体变化。其基
本原理是利用两眼的视觉像差和光学折射原理形成三维图像。一些鸟类的大脑没有三维影像合成的功能,比如公鸡,公鸡通过异步前后移动头脑来获得3D的影像。
图1 人的眼睛3D成像原理
一般情况下,在三维空间里,物体反射光的密度会不一样,通过监测物体上反射光的密度可以决定物体的三维影像。目前3D的图像可以通过适当的工作方式从固体图像传感器(比如CCD或者CMOS图像传感器)检测物体反射光的密度来获得。
3 光电3D影像技术的发展
根据获取图像信息方法的不同,光电3D影像技术分为有源和无源两种技术,无源技术主要是接受物体的辐射或者环境的发射,有源技术是通过投射一束调制的或未调制的光到物体上通过检测物体反射的光来形成3D图像。
以前大多数技术研究集中在无源3D技术上,利用三角测量原理,通过两台相距一定距离的照相机,左边照相机产生的图像表示深度信息,右边照相机产生差异的二维图像。关键是产生深度信息的照相机需要分离出深度信息。无源3D 影像技术需要拍摄的物体具有突出的轮廓特点,比如边缘、角、线等。其优点是不需要特殊的硬件条件,并成功使用在好几个方面。这种技术的缺点是需要两台或者更多的高质量的照相机、图像处理软件。图像质量、拍照速度、数据传输等都是这种机制能否被广泛应用的限制因素。
有源3D光电图像方法是投射一束有规律的空间分布的线状光到物体上从而产生一个网状格的深度。广泛使用的有源光方法是飞行时间(time off light)方法,最近几年,市场上出现的3D照相机都是基于飞行时间方法,这些3D照相机主要应用于工业控制。SwissRanger3000照相机是最近应用这种技术的产品,通过飞行时间方法检测相位来实现3D影像。一束几十兆赫兹被调制的近红外光照射到物体上,物体反射的光进入3D照相机,由于立体物体的远近距
离不同,反射光的相位存在一个延迟,通过检测原始光束以及反射光束的相位延迟从而检测出物体的景深,从而实现3D图像。这种3D图像传感器的制作由ZMD 公司完成,ZMD公司根据3D图像传感器需要高速的特点从噪声和速度进行工艺优化,响应速度可以到100MHz以上。
4 一种新的3D视觉图像传感器技术
不管是多个照相机形成的3D无源影像技术,还是以飞行时间方为原理的有源3D影像技术,整个系统的价格都很高、功耗大、需要复杂的校正软件。在有源3D影像技术中可以获得高精度的3D图像,但是要求传感器的工作响应速度很高,在现有技术情况下,不得不降低图像的分辨率。目前研究3D影像技术主要集中在基于CCD或者CMOS图像传感器的3D实现方法、图像处理和显示的研究,真正开展视觉传感器研究的很少。
本文提出一种新的3D视觉图像传感器技术,可以单芯片实现3D拍照的功能,同时可以输出2D的影像,并输出高分辨率的3D图像。这种图像传感器技术并不需要额外的有源光照,通过电子快门控制曝光时间,获得高速的视频图像,通过自动对焦处理,形成景深影像。这种3D传感器技术很适合于低价格、小型化的视觉应用系统,比如手机等多媒体应用。
该系统由两部分构成,3DCMOS图像传感器以及可变焦的液体镜头两部分构成,其中3DCMOS图像传感器集成光电转变电路、低噪声读出电路、噪声抑制电路、可编程放大电路、模数转换器电路、曝光控制电路、坏像素纠正电路、彩色空间转换电路、自动白平衡电路以及多媒体图像信号处理电路等功能。
图2是传统2D与提出的3D拍照图像传感器芯片与系统,图2(a)是传统2D 拍照图像传感器芯片与系统,图中主要包括2DCMOS图像传感器芯片和定焦镜头,当拍照的时候,物体上所有的像素点都映射到AA'平面上,因此系统拍照得到的是一个2维图像。图2(b)是提出的3D拍照图像传感器芯片与系统,图中主要包括3DCMOS图像传感器芯片和液体变焦镜头。其中3DCMOS图像传感器芯片的特点是响应速度快、动态范围高、具有焦距判断、输出控制信号改变液态镜头的功能。液态变焦镜头是近两年发展起来的新型变焦镜头,通过改变施加在液体上的电压而改变焦距,比如拍照AA'平面时,液体变焦镜头的形状如图中的实线所示,如果拍照BB'平面时,液体变焦镜头的形状如图中的虚线所示,在AA'与BB'平面之间可以拍照多幅图像,分析这些图像的轮廓并合成这些图像的边缘,就可以得到一幅完整的3D图像。这种3D拍照图像传感器系统具有分辨率高,根据预设拍照的照片个数的多少而得到更精确的景深照片。与传统的光学变焦镜头相比,这种液体变焦镜头的优势是响应快、变焦快,适合于快速变焦的应用场合。