论文二稿
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
0引言 (2)
1三维模型检索技术概述 (3)
1.1二维图像检索到三维模型检索 (3)
1.2三维模型检索 (3)
1.3三维模型预处理 (4)
1.4三维模型特征提取 (4)
2三维模型特征提取的研究 (5)
2.1三维模型预处理 (5)
2.2 3D模型检索方法可大致的分为3类 (5)
2.2.1基于外形的方法 (5)
2.2.2基于结构的特征提取方法 (6)
2.2.3基于视角的特征提取方法 (7)
2.2.4其他提取方法 (7)
2.3几种特征提取方法的比较 (8)
3基于二维投影的三维模型检索 (8)
3.1模型预处理 (8)
3.2特征表述[7] (10)
3.3旋转不变性 (12)
3.4相似性计算 (12)
3.5实验结果分析 (13)
4实验对于数据库l的实验 (14)
5总结 (18)
参考文献 (20)
基于二维投影的三维模型检索方法研究
作者:刘军凯
指导教师:梁晶晶
摘要:本篇论文提出了一种基于二维投影的三维模型检索方法,用以3D模型检索。
此方法是以常量去转化并评价3D模型,并且它对于旋转是稳定的。
实验数据显示,对于一些类型的三维模型,提出的基于二维投影的方法有着良好的查全率和查准率,是行之有效的方法之一。
关键词:三维模型检索;基于二维投影;特征提取;相似度计算
0引言
我们处在一个三维世界里,一切被我们感知的物体都以三维的形式存在,人类的视觉不仅能够感知二维平面的信息,且具有立体三维的特性。
与二维图像相比,三维的模型所提供的视觉感知细节更多、更丰富,能够给人们带来更加详细的信息。
三维模型的研究成为了一个热点话题,是因为:
(1)随着三维数据获取,如数字摄像机、扫描仪、核磁共振和3D激光扫描仪设备的功能越来越强,使用越来越方便,技术手段不断进步和成熟,使三维信息获取和表达变得越来越容易;
(2)众多三维建模软件和工具(如3DMax,AutoCAD,Poser,Core3D等)使得三维模型的设计变得简单;
(3)三维模型建模的专业需求越来越强,分子工程、地貌气象分析、工业产品设计、医学建模、虚拟军事行动等,都广泛使用了三维技术。
构建数字化模型,可帮助科研人员更加直观、精确地处理各自领域问题;
(4)在娱乐领域,游戏、电影产业的发展,使人们已经不满足于二维画面,传统的制作方法已经成为历史,精美绚丽的三维动画随处可见。
而三维建模本身,也成为了一门艺术门派;
(5)计算机图形学技术发展迅速,三维图形处理硬件和CPU的速度已足够快,而且价格便宜,使得三维数据能在微机上快速处理和显示;
(6)蓬勃发展的互联网技术也使人们对信息共享和处理的方式发生了根本性的改变,网络已经成为人们获取信息的重要途径。
互联网的普及,使三维模型被更广泛地转播和共享。
(7)各软件,各版本的三维数据兼容化、共享化趋势,加速了模型的标
准化进程。
因此,为了从浩如烟海的信息中快速准确地找到需要的内容,人们存在着对三维模型进行检索的迫切需求。
1三维模型检索技术概述
1.1二维图像检索到三维模型检索
物体之间形状相似性的比较,可以追溯到早期基于形状的图像检索:提取图像中感兴趣物体的轮廓或区域,采用不同方法描述其形状特征,将问题简化为形状特征的比较。
借助于计算机视觉技术,人们可以定义多种二维形状表示方法和相似性度量[1]。
上述形状描述方法无法直接扩展应用在三维模型上,主要原因是他们要求为连续曲线(或平面上区域的边界)存在标准参数化表示。
对于任意三维曲面,需要根据具体应用,恢复成一致曲面或流形曲面,得到相应曲面的参数,这样才能采取扩展的三维形状描述。
在重建过程中,需要引入人工干预,以消除模型二义性。
1.2三维模型检索
如何在浩如烟海的三维模型数据库和网格中快速有效的搜索有用的、同主题的模型,构成了三维模型检索的主要目标。
与二维图像相比,三维模型有其独特的性质。
首先,三维模型空间中一个简单的物体,即可以用多边形面片、也可以用点、线和体素,还可以由基元物体的几何操作和布尔操作表示。
任意的三维曲面不存在类似二维空间上弧长公式的直接参数化方法,因此无法对物体空间定义规则的、标准的类似二维图像的采样方式。
这种内在的不规则采样和三维表面存在任意的拓扑关系,使得经典的信号处理技术,无法直接扩展应用到三维。
其次,空间维数大小直接影响模型特征对应、参数匹配,分类其构造,优化路径搜索等问题,其复杂度与处理时间随之显著增加。
可能的模型退化现象使得常用的几何形状特征,如面积、体积、曲率等难以计算。
另一方面,三维模型检索与相机配置、光源设置和场景语义无关,且不包含反射、阴影、遮挡、透射等效果,不需要考虑环境光照条件、相机参数、镜头校准、自遮挡等现象,极大地简化了匹配相似物体的过程,或
因为投影到地面变为两个人,或者由于周围场景的迷惑性而凭空消失。
综上所述,三维模型特征的选取,需要考虑以下三个方面:第一,特征要能够反映物体的内在基本特性。
第二,三维模型在空间中的位置、朝向和大小是任意的,因此,所提取的特征应该与模型的平移、旋转、放缩等刚体变换无关。
第三,即便对于退化的三维模型,特征也必须是确定的。
以下对三维模型检索系统中涉及到的几个关键技术作简单的介绍:三维模型检索首先从模型数据中自动计算并提取三维模型的特征,如形状空间关系、材质的颜色及纹理等,建立三维模型的多维信息索引,然后在多维特征空间中计算待查询模型与目标模型之间的相似程度,实现对三维模型数据库的浏览和检索畸,。
三维模型检索技术通过对视觉特征的相似性匹配来查找用户所要求的三维模型,这更贴近于人们在现实生活中靠直觉印象使用信息的方式。
如何提取模型的特征是三维模型检索首先需要解决的关键技术,也是目前研究比较多的一个方面。
1.3三维模型预处理
要真正实现基于内容的三维模型检索,非常关键的一点就是要求所提取的三维模型特征描述具有针对平移、旋转、尺度大小以及方位变换的不变性[2]。
目前,实现特征描述不变性的方法主要有三种
(1)使用主成分分析印方法对三维模型坐标进行标准化,计算其标准化的坐标框架.然后,在此标准化坐标系内提取相应的特征:
(2)将所有待比较的三维模型两两之间进行坐标对齐。
这种方法由于极为费时而很少被采用;
(3)定义并提取本身具有不变特性的特征描述。
但实际上,这些特征描述所具有的不变性往往是不全面的,而且,大多数这类特征的计算有时也需要在一个归一化的坐标系内完成。
因此,为了进一步提高检索的准确性,往往也需要进行模型坐标标准化。
1.4三维模型特征提取
3D模型检索技术的关键是提取特征,在提取特征时有如下一些基本要求:
(1)平移不变在平移变换前后,3D模型的特征要保证不变;
(2)旋转不变在旋转变换前后,3D模型的特征要保证不变;
(3)缩放不变在缩放变换前后,3D模型的特征要保证不变;
从计算机图形学发展的初期开始,多边形网格就是通用的三维模型的表示方法。
尽管后来出现了更多的描述方法,但由于多边形具有形状简单、便于计算和处理等特点,使得三维模型检索的研究者们更多以多边形网格模型作为研究对象。
目前,三维模型特征提取方法主要分为三大类:基于外形的低层方法;基于结构的高层方法;基于视角的方法。
2三维模型特征提取的研究
2.1三维模型预处理
对三维模型规范化的目的是使所有的模型满足(1)平移不变性:(2)旋转不变性:(3)缩放不变性。
也就是对于任何三维模型不管进行了什么样的平移变换,旋转变换,缩放变换,只要对其进行规范化预处理后,那么最终的大小,原点坐标,方向都一样,因此不影响特征的提取。
2.2 3D模型检索方法可大致的分为3类
基于外形的低层方法;基于结构的高层方法:基于视角的方法。
2.2.1基于外形的方法
基于外形的方法[3]尝试通过几何和拓扑的属性描述3D模型的形状,外形可以是由单独向量组成的一些外形参数的固定数值或~系列外形参数的分布范围:基于结构的高层方法尝试把3D模型分解成一系列关键部分,并提炼出这些部分的几何关系;基于视角的方法通过一系列从不同角度的二维射影来得出三维模型的外观。
在3D模型表述系统中,基于外形的下层方法描述通常3D模型的几何属性,空间属性,形状分布范围。
两个模型的相似处可通过比较外形来测量。
Zhang和Chen例提出了通过网格描述,来有效计算面积、体积、对称轴傅立叶变幻系数的方法[4]。
Paquet等人使用对称轴来描述三维物体的对称性基于套锁来描述形状信心的细微细节,并用小波变换来描述不透明度分布。
这种方法,需要摆
好标准化的姿势用于旋转[5]。
先对三维模型进行PCA和体素化处理[7],然后再在三个轴向上进行小波变换,得到小波系数。
一种改进的,不需要摆好姿势的基于球形调和的形状描述法被Funkhouser等人提出。
首先,3D模型通过与其相交的不同半径的同心圆[7]来分解成一系列圆形函数的聚集。
每个圆形函数被分解为一系列不同频率的谐波。
在每个半径圆上,每个频率部分的范数和组成了形状的表述。
这种表述是旋转常量,原因是,旋转一个圆状函数不改变每个频率部分的能量。
2.2.2基于结构的特征提取方法
基于形状的方法之考虑三维模型的几何、拓扑属性。
而高层基于结构的方法[8],描述的是模型各部分问的关系。
Hilaga等人用多分解Reeb图来描述三维模型的概略结构。
(如图1所示)
图1 三维模型和对应的Reeb图
精确地说,Reeb图被定义为图的商数空间和商数函数。
Hilaga等人所用的Reeb图是基于完整的测疑距离所定义的商函数,利用测地距离由i维物体的形状计算出多分辨率Reeb图,然后给出了拓扑图相似度的定义,并依此进行模型相似度的计算。
多分辨率Reeb图的基本思想是在物体细节的各个层次上建立一系列Reeb图。
为在某一层次上构造Reeb图,物体由连续函数分为若干区域,一个Reeb图的节点表示一个特殊区域的连通部分,如果物体的两个连通部分是相邻接的,则对应的节点相连。
继续分解每个区域可以得到更精细的Reeb图。
图2 多分辨率Reeb图
基于骨架信息能很好地进行细节层次的控制,可以实现多层次的三维模型表示。
以基于两点间测地距离的计算函数作为生成Reeb图的连续函数,从而构造一种Reeb图的多分辨率扩展结构,作为三维模型检索的特征表示。
(如图2所示)
2.2.3基于视角的特征提取方法
基于视角方法[9]的大意是用一些二进制的图像来描述3D模型。
因此,
一系列二维图像被用于索引相似的3D模型。
每一个二值图像从三维模型不同视角的边界轮廓获得。
几种方法给基于视角的三维模型检索提供了帮助。
(如图3 所示)
图3 三维模型的轮廓图
2.2.4其他提取方法
除了形状特征以外,还可以利用三维模型的表面属性,包括颜色、反射系数和纹理等进行检索。
2.3几种特征提取方法的比较
现在,对于各种形状特征提取方法,还无法从理论上验证它们对模型特征描述的精确度,更多的是从实验的结果,通过查准率和查全率来判断其优劣。
总体来看,基于外形的方法速度较快,对模型的内部构造描述较好,但对细节表述不够具体;基于结构的方法对模型的整体框架描述较好,尤其适合运动的物体,但计算很费时,并且它对于3D模型的精细部分非常敏感;基于视角的方法原理清晰,更符合人类判别三维物体相似性的基本原理,速度也较快,可是对物体内部的构造描述不够,不适用于较精密的三维模型识别领域。
3基于二维投影的三维模型检索
上章我们介绍了,基于内容的三维模型检索方法。
其中基于二维投影的三维模型特征识别的根本原理为:如果两个三维物体多个视角的二维投影看起来相似,那么它们在三维上也是相似的。
在此章节,从六个不同视角的二维投影中提取了特征,那么只要一个寻找相似性的匹配方法,就可以尽可能高效的用于寻找输出模型的最佳匹配。
3.1模型预处理
首先,画一个简单的包围3D模型的边界框(如图4 a),将边界框分成2L×2L×2L三维像素格(如图4 b)。
如多边形表面位于一个像素格里,我们认为这个在(m,n,h)中的像素格是不透明的,标记为。
反之,这个像素格被认为是透明的,标记为.基于此种分解方式,重荷区域问题被大大的减轻了。
因为每个不透明像素格的权值都相等,而不用考虑其中具体
点的数量。
图4 三维模型的预处理
其次,模型的质心移到了,并且所有不透明像素格到质心的平均距离时成线性比例的,即使我们把质心变为L/2。
所以,该表述法对于变形和旋转是不变量(如图4 )。
此文中,L定为32,以保证对待识别物体足够分解和对细节噪音的筛选[10]。
再次,六个表示的信息来自六个不同角度:前,顶,右,后,底,左。
每个高度用灰度级图像表示高度信息。
把这六个角度标记为E,k=1,2,…,6。
(如图5所示)则这些高度的灰度值像素定义为:
前:
其中,
顶:其中,1≤m,n≤64
右:其中,1≤m,n≤64
后:其中,1≤m,n≤64
底:其中,1≤m,n≤64
左:其中,1≤m,n≤64
图5 所示
3.2特征表述[7]
从前、后、左、右、上、底6个视角表示该三维模型,每个视角的二维投影被分解为圆心在中点的L个同心圆(如图6 )。
图6 把二维投影用同心圆分解
在第j个同心圆内的区域标记为Cj
其中j=1,2,3 (32)
对于第k个高度(第k个视角),在第j个圆里的所有像素灰度值为:
使其值为0(第0个同心圆),推出两个相邻同心圆的灰度值和之间的差值:
此外,使用下面等式使每个值标准化
其中,D(k)是第k个高度(视角)的相邻同心圆之间高度差值的总和。
用X表示,则
图7展现了三个三维模型使用该特征描述法的函数。
显然,两个吉普车模型显现了相似的曲线,而吉普车和船之间却完全不同。
图7 三个三维模型的特征函数
3.3旋转不变性
通常,如果一个3D模型旋转一个小角度,该提出方法是比较不敏感的。
假设一个三维模型转了一个小角度(如图8),在半径上的三维像素高度值的增量(减量) [11]
图8 旋转了一个小角度的三维模型
相反的,另一边的三维图像高度值会减少(增加)同样的△n,平均起来,旋转后,第/个同心圆灰度值的和是和原来相近的。
3.4相似性计算
当每个3D模型用6个视角表示,计算两个模型的相似性[12],需要720次(6!)
高度匹配操做。
为了减少匹配时间,去寻找给出查询模型的最佳匹配,提出了一种有效的相似性计算方法。
如果把相对的位置约去,匹配操作可被大大简化。
前视图El和后视图E4是相对的;同样,右视图E3和左视图E6是相对的,顶视图E2和底视图E5也是相对的。
如查询模型为q,它的6个高度匹配模型S分别为和,则查询模型q的
六个高度可分为3组:。
同理,匹配模型也可分为3组:。
计算q,S之间的差,如匹配,则根据与之间的拓扑关系,必须匹配。
这样一来,高度匹配操作需要执行3!×23=48次,取代了原有的720次。
对于第i个排列,会去匹配
使和,标记q和S的函数。
对于第i个排列的相应匹配操作,x,y的距离为:
是标记第i个排列的第个值,1≤k≤6。
查询模型q和匹配模型S间的差值为:
那么,q和S之间的相似度量应为其倒数
注意,相似度值越大,与要查询的模型就越相近。
因此,决定匹配模型应选择与被查询模型相似度值最大的那个。
3.5实验结果分析
为了证明ED对于不同模型的有效性,对于两个测试数据库进行了实验。
三种其它的方法(包括SH、MPEG一7 3D SSD和D2)给检索结果提供了比较。
对用户而言,评判一个检索系统的性能,关键是考察检索结果是否与人的期望相接近,该系统是否满足用户的需要。
但对一个检索系统的性能做出所谓正确的评价是一件不容易的事情。
一个主要的原因是检索本身具有的主观性,这种主观性使得建立一个标准来排列从模型数据库中提取出来的模型非常困难。
例如对两个用户来说,他们对同一组模型会有不同的排列,甚至对同一个用户,他在不
同时刻对同一组模型的排列也会不同。
也就是说,对系统检索性能的评价主要根据的是主观的要求而不是客观的指标。
另外一个原因是对检索性能评价时,“相关结果"这个概念常常定义得并不明确,在很多情况下,所谓“相关结果”本身并没有明确的定义,而且它的存在也只是假定的。
总之,不同的检索系统在查询机制、视觉特征的选择、以及应用领域等方面都各有特点,目前还缺乏比较系统和有效的评价准则。
事实上,影响检索性能评价的相似度既与客观的应用有关,也与主观的判断相关,这也给系统性能的评价增加了复杂性。
目前人们常以查全率和查准率的统计数据或曲线来进
行系统性能或相似性匹配方法的评价,如下述两个公式[12]所示:
查全率:查准率:
其中,n是适合检索的模型数量,T是数据库中所有模型的数量,k是所有检索模型数量。
4实验对于数据库l的实验
为了测试模型变形时,提出算法的不变性、衡常性,而建立了数据库l[13]。
数据库l由20个种子模型组成,每个种子模型含14种变换,包括4个几何变换,2个比例变换,3个旋转,5个不同的多边形分解变换(如图9)。
因此,在数据库1中共有300个模型。
图9显示了一些三维模型和它们的变换(包括4种)
图9同时也给出了本算法的函数曲线。
这些模型组的相似性值分别为O.9702,0.9304,O.9999,0.9601。
我们看到,即使模型变形,相似值仍然足够大。
图10 几种方法查全率的平均值
在我们的实验中,数据库1的模型都被拿出来作为一次查询模型。
下表呈现对所有查询模型应用ED[14](本文提出的方法):SH、3D SSD和D2。
ED 的平均差准率值优于其它方法。
图10详细的比较了这几种方法查全率的平均值。
对于绝大多数模型类,本方法都有着好的表现。
如想知道哪种变换明显的影响了检索结果,图11给出了各种方法对于5种变换的详细较。
图11 对于模型各种变换,几种方法的性能比较
5总结
随着计算机制图和计算机动画的发展,3D模型的数量几乎也可与图形视频文件等量齐观。
对于基于内容的3D模型检索系统,最根本的问题是选取恰当的特征来区别不同的形状,以用来有效的索引相似的文件数据。
三维模型的特征提取是三维模型检索研究中首要解决的最基本的问题,也是最关键的问题。
模型特征的定义和匹配的目的密切相关,试图提取一个能适应所有应用的特征是非常难的。
本文首先阐述了三维模型检索研究的意义,描述了检索系统的组成部分,并对现有模型特征提取技术进行了总结和分析,指出了一些目前大多数方法的优势和不足,在此基础上,本文提出了基于二维投影的三维模型的特征提取技术。
研究包括两部分:第一部分是关于基于二维投影的三维模型特征提取的技术和相似性度量,第二部分是关于对提取的特征进行尽可能简化,从而减少运算负担,希望在查询准确性和查询的速度方面取得平衡。
本文的工作主要集中在对三维模型的特征提取。
对于基于内容的三维模型检索方法,可大致分为基于外形的方法;基于结构的方法和基于视角的方法。
文中提出了一种用于三维模型检索的新方法。
把三维模型由6个视角产生的二维投影的灰度图像表示。
有了这6个二维图像,便可以使用一种高效的相似性匹配方法去寻找最佳匹配。
基本的原理支持在于:两个三维模型如果在不同的视角看起来相似,那么它们二者便是相似的。
由于三维模型所包含信息的复杂性以及人类主观感知的不确定性,还有许多问题有待更深入的研究:
(1)不需要进行模型坐标标准化的三维形状特征提取问题。
模型坐标标准化处理容易造成误差,还导致特征提取效率不高、运行开销大等问题。
为了解决这些问题,有必要研究新的形状特征描述方法,使其不需要进行模型坐标标准化,仍能准确地区分模型之间的形状差异。
(2)三维模型的局部形状特征提取问题。
现有的形状特征描述,往往以三维模型整体为考察对象,但在实际情况中,需要形状特征具有描述局部细节的能力。
此外,为实现不同的检索要求,需要同时提供一个包含多种形状特征的特征集,如何综合运用这些形状特征以实现更精确的检索效果,也是未来的发展方向之一。
(3)三维模型的非形状特征表示方法。
如材质颜色、纹理及拓扑特性等特表示方法,以及结合人类主观认知特性的语义特征表示方法的研究。
由于本人所学知识有限,本文还存在很多不足和一定的缺陷,例如,实验的详细进行以及很多专业公式的计算,有待进一步学习。
在完成该论文过程中,我学会了很多的东西,体验了如何独自完成一篇论文的编写过程,提高了分析问题和解决问题的能力。
参考文献
[1] Del Bimbo.Visual Information Retrieval\[J].Morgan Kaufrnann,1999:208
—211
[2]Cyr C.,KiⅢia B. 3d object recognition using shape sinu;Aarity based aspect
graph\[J].Roceedings of IEEE International Conference on Computer Vision,Vabcouver, Canada, 200l, 254—261.
[3] 潘翔.三维模型形状分析和检索[J].浙江大学. 计算机学报.2005年8期:23-26.
[4] 杨育彬,林珲,朱庆.基于内容的三维模型检索综述[J].计算机学报.2004年10期:
10-14.
[5] 周继来.三维模型检索技术研究及系统实现[J].西北大学. 计算机辅助设计与图形
学学报.2005年8期:21-25.
[6] 崔晨旸.三维模型检索中关键技术的研究[J].浙江大学. 计算机学报.2005年10
期:35-40.
[7] 胡斌.费耀平.李敏.基于同心球壳划分的三维模型检索[J].第十四届全国图象图形
学学术会议论文集[M].2008年:25-33.
[8] 刘玉杰.基于形状的三维模型检索若干关键技术研究[J].中国科学院研究生院(计
算技术研究所). 计算机辅助设计与图形学学报.2006年7期:20-25.
[9] 黄元元.基于视觉特征的图像检索技术研究[J].南京理工大学. 计算机学报.2003
年3期:35-38.
[10] /downloads153/doc/676483/XML_MODE_LOC.pdf
[11] 王亮申.图像特征提取及基于内容图像数据库检索理论和方法研究[J].大连理工
大学. 计算机辅助设计与图形学学报.2002年9期:27-31.
[12] 章志勇.三维模型几何相似性比较的研究[J].浙江大学. 计算机学报.2005年10
期:23-26.
[13]戴冕.基于二维投影的三维检索系统研究[J].东北师范大学.计算机学报.2008年5
期:32-36.
[14] 郑伯川,彭维,张引,叶修梓,张三元.3D模型检索技术综述[J].计算机辅助设计与
图形学学报.2004年07期:35-40.
参考网站:中国知网. /
万方数据./
世纪论文网.
http://www.cs.uu.nl/centers/give/imaging/Drecog/3Dmatching.html
The methods of three-dimensional model retrieval based on two-dimensional projection
Junesking-Lau。