正多边形剖分球面投影及其应用(人体重构)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正多边形剖分球面投影及其应用
李振波1,2,3,李华1,2
1.中国科学院计算技术研究所智能信息处理重点实验室, 北京100080;
2.中国科学院计算技术研究所国家智能计算机研究开发中心, 北京100080;
3.中国科学院研究生院北京100039
摘要:提出了利用正多面体顶点分布来剖分球面,得到球面上物体的投影点,利用这些投影点得到物体的二维投影。

这种二维投影的获取方式具有投影点分布均匀的特点,并且可以根据三维物体的特点对特定区域的投影点进行加密,以获取更多的二维投影信息。

本文方法已经应用到三维模型及三维动作的识别中,取得了良好的效果。

关键词:正多边形,三维模型,投影
Spherical Surface Projection Subdivided
By Equilateral Polygon and Its Application
Zhenbo Li1,2,3, Hua Li1,2
1. Key Lab. of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing, 100080;
2. National Research Center for Intelligent Computing Systems, Institute of Computing Technology,
Chinese Academy of Sciences, Beijing, 100080;
3. Graduate School of the Chinese Academy of Sciences, Beijing, P.R.China, 100039
【Abstract】—In this paper, we proposed the method of using equilateral polygon to subdivide the surrounded spherical surface, obtaining the projection point, and getting the two-dimensional projections of 3D models. This method can gain even projection point, and can carry on the encryption process to the specific region according to the 3D model’s characteristic, so as to gain more two-dimensional projections information. The method proposed in this paper has already applied in our 3D model recognition and 3D motion recognition work, and obtained good result.
【Keywords】—equilateral polygon, 3D model, projection
1.引言
在自动监控过程中,三维物体的形态数据由于获取困难,数据量大,往往很难做到实时的应用。

另一方面由于计算机图形学和计算机视觉的发展,二维图形和图像的处理算法已经比较成熟。

三维物体形态,物体运动状态,三维空间中的智能监控等信息处理的一个直接的方法是通过空间的降维将三维空间的信息转化到二维空间来处理。

因此如何有效的获取三维物体的二维投影信息对于在二维空间进行信息的处理具有重要的意义。

此外,在计算机视觉的许多应用中合理的分布相机或者光源位置的问题已经引起广大研究人员的重视,这类问题的研究也可归结到投影点的选取上。

在计算机图形学中基于图像的绘制方法(IBR)[1][2],以及从图像中获取物体三维几何特征的方法如Visual Hull[3][4] 等,这些算法的效果很大程度上也依赖于所获取的投影图像的位置分布及图像质量。

本文提出了一种利用正八面体结构剖分球面获取三维空间投影点的方法,该方法具有投影点均匀,并可根据需要进行投影点的局部加密等优点,该方法已经应用到了
基金项目:国家自然科学基金项目(60573154)
作者简介:李振波(1978-),男,博士生,主要研究方向为计算机图形学,可视化;李华,研究员、博导
E-mail: zbli@
三维模型以及三维人体运动的识别中,被证明是一种有效的方法。

本文第二部分将介绍相关工作,第三部分介绍投影点的获取方法,第四部分给出本文方法在三维模型检索和人体运动识别中的应用,最后对本文的方法进行总结。

2.相关工作
在计算机视觉中,三维模型进行二维投影的过程中投影点的选择和计算机视觉中摄像机位置的选择具有相关性。

Carranza[5]等从视频重建人体运动的工作中采用了八个分布在屋顶四周的摄像机来获取人体运动的视频数据,这些摄像机的方向汇聚于场景的中心。

在Liu Ren[6]等运动检索的工作中采用了三个摄像机位置用于获取运动数据。

同样的在陈睿[7]等的工作中使用了3个相机从不同视角拍摄人的运动来记录人体运动,进行运动的跟踪和重建。

Narayanand[8]等提出在一个圆屋顶架设51个相机位置,通过立体深度的方法来重建场景几何体。

Debevec[9]的虚拟场景合成工作中采用正二十面体划分球体的方法,得到球面上的42个顶点,120条边和80个面.将光源分布在每个顶点和每条边的中点位置这样在球面上得到162个光源点的位置,从而来控制场景中光照的变化。

此外,在智能监控方面,通过建立场景中物体的多角度投影,建立场景数据库。

场景中模型的识别或者运动的识别控制可以通过在二维空间进行图像的各种检索匹配来进行[10],通过降低维数减少了控制的难度,减少了数据量,提高了处理速度。

在这些工作中,相机或者光源点的数目以及位置的选择能够满足各自应用的需要,但是对于投影点的位置和投影点的数目的多少能够满足实际需要还没有见到一个统一的标准和方法来判断。

3.正多面体剖分球面投影
在三维场景中建立三维运动姿态后,我们可以得到场景中物体任意角度的投影,但是如何得到一个合理的分布投影的摄像机是一个值得关注的问题,太多的摄像机位置会造成数据的大量冗余,太少的话可能会有信息的缺失。

在空间投影点的获取中,由于正多面体对空间分割的均匀性,采用正多面体的空间分割方法可以保证在进行投影时投影点分布的均匀性。

正多面体是每个面都是有相同边数的正多边形,且以每个顶点为其一端都有相同数目的棱的图,正多面体只有五种:正四面体,正六面体,正八面体,正十二面体,正二十面体。

本文采用正八面体剖分的方法,将八面体剖分后的点坐标映射到半球体上来确定进行投影的摄像机的位置。

使摄像机获得尽可能均匀的空间信息
3.1 正八面体模型
正八面体是五个柏拉图立体之一,共有六个顶点、十二条边和八个面,而每一个面皆是等边三角形,正八面体有八个完全相同的面,如图1所示,每个面都是正三角形;另外正八面体有六个顶点,十二条棱。

从拓扑上说正八面体每个顶点在空间是完全等价的,
图1 正八面体结构示意图
3.2 投影模型
在投影过程中,投影点的选择上我们以正八面体的顶点作为分割的起始点。

初始条件为6个顶点12条边8个三角形,分割算法如下:
1设定分割的次数N。

2.对正八面体的每个三角形取其边的中点作为分割点,完成一次分割,分割点的坐标为(Xi,Yi,Zi)。

3.连接每个三角形上新增加的分割点,这样每个三角形被分割成四个等边三角形。

4.如果分割次数小于N,继续执行2,3步。

5.分割次数等于N,分割过程结束。

在分割过程中,分割次数N和分割顶点数V的关系为:
由三维空间欧拉公式:V+F-E=2,(V、E、F分别代表多面体的顶点、棱和面的数目)得到投影点的个数:
2
V E F
=+-(1)由于每次分割得到的都是正三角形,对于第N次分割后多边形的棱的数目为:(4N*8*3)/2, 多边形的面数为
4N *8,带入公式1得:
1
42N V +=+ (2) 即初始为6个顶点,第一次分割后为18个顶点,第二次分割后为66个顶点,依次类推。

图2为空间正八面体上半部分(金字塔模型)进行2次分割后分割点的位置分布示意图。

图2 金字塔模型示意图
我们定义三维空间的坐标系为坐标原点为正八面体的中心O (X0, Y0,Z0),X 轴指向O 1方向,Y 轴垂直底面向上,Z 轴按右手法则确定。

将正八面体的中心点O (X0, Y0,Z0)和通过分割获得分割点(Xi, Yi, Zi)进行连线,将分割点的坐标投影到正八面体的包围球上,得球面坐标为(Xis, Yis, Zis) ,球面坐标即我们要获得的摄像机
的位置坐标。

摄像机的投影方向为正八面体的中心也即包围球的球心O (X0, Y0,Z0)。

为了计算方便在实际计算投影点坐标时我们可以用
球面坐标
来表示。

在图2的2次分割中投影点1的球面坐标为(0,0),投影点2的球面坐标为(0, ),
投影点3的球面坐标为(0, ),依次类推。

图3为我们用金字塔模型得到的三维人体模型的41个投影的投影图像。

其中在进行投影时,投影物体的底面中心和正八面体的中心重合。

图3 和图2的41个摄像机位置对应的人体投影轮廓图
由于投影物体的结构不同,不同的投影点之间特征结构的变化程度也不相同,如在运动人体的正八面体的
投影中,由于人体正面的投影点的特征变化往往较小而人体侧面投影点的特征变化比较剧烈。

我们可以根据要 投影物体的特点,从剖分得到的分割点中选取投影点。

并且由于正八面体进行分割后得到的三角形依然是正三
角形,我们对投影特征变化剧烈的地方进行的投影点按照相同的分割方法进一步的细分(加密)。

图4为对三角形(4,5,20)区域进行细分的示意图,其中红色星号为新增加的投影点即每条边的中点。

图 4 投影点局部细分示意图
采用正多边形结构剖分球体获取投影点具有计算简单,投影点均匀的特点,并且适宜加密,能够根据需要全局或者局部增加投影点的个数。

4.应用
自动监控过程中很重要的一步是建立机器的学习

4
4
p
8p
(,)q f
制,包括对场景中物体的识别,物体运动状态的识别等。

本文方法可以建立用于机器学习的知识库,通过对知识库的学习提高自动化的程度。

另一方面,由于现在视频捕捉技术和像三维扫描设备等三维获取技术的不断发展,二维的视频数据和三维的模型数据及三维空间的运动数据的数据量越来越多,为了提高这些数据的利用率,数据的检索变得越来越重要。

本文的方法可以用于二维图像的识别或者将三维空间的几何模型数据或者运动数据投影到二维空间,将三维空间的检索过程转化成二维空间的检索。

图5是利用本文方法从三维运动数据库中进行运动检索的结果图示。

图5 三维动作识别(举重动作)
本文方法还可用于摄像机位置的判别,在我们的方法中,由于摄像机的空间坐标是我们事先设定的,利用任意位置的摄像机所获取的图像通过检索方法我们可以得知拍摄图像的相机的大概位置。

图6是用本文方法,利用图3的投影数据库,来判断相机的位置的结果图,从结果中我们得知此时相机的位置接近投影点1。

图6 利用投影图像判断相机位置5.结论
在计算机视觉的许多应用中,投影图像的获取质量对于后面的应用往往起着非常重要的作用,获取的数据充分可以减轻后续处理的工作量。

本文提出的利用正多面体剖分球体来获取投影点的方法可以比较好的解决投影点选择的问题,具有计算简单,容易扩展的优点。

未来工作是如何在本文方法的基础上能够通过获取投影物体的特征分布,自动的计算细化的投影点,使得物体的特征能均匀的分布在投影图像中,另外投影数据库的建立和组织也是未来的工作之一。

参考文献
[1] M. Levoy and P. Hanrahan. Light field rendering. Comput. Graph. (SIGGRAPH ’96), pp:31–42, 1996.
[2] DEBEVEC,P.,YU,Y.,AND BORSHUKOV, G. Efficient
View-Dependent ImageBased Rendering with Projective
Texture-Mapping. In 9th Eurographics Workshop on Rendering, (1998), pp: 105-116.
[3] A. Laurentini. The Visual Hull Concept for Silhouette-Based Image Understanding. IEEE Transactions on PAMI,16(2):150.162, February 1994.
[4] S. Lazebnik, E. Boyer, and J. Ponce. On How to Compute Exact Visual Hulls of Object Bounded by Smooth Surfaces. In CVPR'01, volume I, pp: 156-161.
[5] J. Carranza, C. Theobalt. M. Magnor, H.P. Seidel,
Free-Viewpoint Video of Human Actors. in Proc. of ACM SIGGRAPH 2003, pp:569-577, San Diego, CA.
[6] Liu Ren, Gregory Shakhnarovich, Jessica Hodgins, Hanspeter Pfister and Paul Viola, "Learning Silhouette Features for Control
of Human Motion", In Proceedings of the SIGGRAPH 2004 Conference on Sketches & Applications. ACM Press, August 2004 [7] 陈睿,刘国翌,赵国英,张俊,李华“基于序列蒙特卡罗方法的3D人体运动跟踪”,计算机辅助设计与图形学学报,卷17(1),pp:85-92,2005
[8] Narayanan, P., Rander, P., AND Kanade, T. 1998. Constructing virtual worlds using dense stereo. In Proc. of ICCV 98, pp:3 – 10. [9] Paul Debevec, Andreas Wenger, Chris Tchou, Andrew Gardner, Jamie Waese, and Tim Hawkins. A Lighting Reproduction Approach to Live-Action Compositing, ACM Transactions on Graphics (SIGGRAPH 2002). 21(3), pp. 547-556
[10] 刘玉杰,赵国英,李宗民,李华. 基于逻辑运算的二值图像检索, 计算机应用, 2004 V ol.24 No.10 pp: 72-74。

相关文档
最新文档