一种基于八叉树表示的三维物体分类算法实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

点袁 用节点的数值表示与之相对应的八叉树中的节
点是否存在子节点遥 0 表示对应的节点不存在子节
点袁1 表示对应的节点存在子节点遥
为了将每一个满八叉树的叶子节点与欧几里得
空间中的网格对应起来袁需进行编码袁其采用的方法
为洗牌编码咱4暂遥 具体的方法如下院给定一个欧几里得
空间坐标渊x袁y袁z冤的网格袁设其三个维度坐标的二进
寅R 伊 H 伊 C渊in冤
D伊W 伊H
伊 C渊out冤
可以被包装成g軇院庄渊Cin冤寅O渊Cout冤遥 这两个转换函数分别 是 t院RD 伊 W 伊H 伊 C寅庄渊C冤与 t原1院O渊C冤寅RD 伊 W 伊 H 伊 C袁并且满足
g軇= t原1 o g o t遥 通常来说 t 与 t-1 应该需要满足互为逆 函数遥
论文选粹
2019 年 第 4 期
一种基于八叉树表示的三维物体分类算法实现
易 康袁 赵玉婷袁 潘 健
渊中国人民解放军国防科技大学信息通信学院袁 陕西省西安市 710106冤
摘 要 针对三维空间内物体进行分类的需求袁考虑到八叉树在三维空间细分时的层次 化优势袁提出一种基于八叉树表示的三维物体分类算法遥 首先讨论如何用基于八叉树空 间表示的野比特表示法冶进行欧几里得空间卷积袁然后提出深度卷积网络的结构形式和主 要参数袁 最后分别利用 ModelNet10 与 ModelNet40 数据集训练网络并进行物体分类实 验遥 实验结果表明袁该算法对三维物体分类的正确率达到 85%以上袁同时袁该算法与基于 立体像素的三维物体分类算法相比较袁在分辨率为 2563 时袁卷积运算对计算资源与内存 的使用量下降了近 80%遥 关键词 三维计算机视觉曰 卷积神经网络曰 八叉树曰 三维物体分类
在三维视觉领域袁P. Wang 等人提出的 O-CNN 渊基于八叉树的卷积神经网络冤咱2暂使用八叉树表示数 据袁并用特殊构造的索引函数对数据进行索引遥利用 八叉树编码数据袁在欧几里得空间进行卷积袁然后完 成分类等视觉任务遥 O-CNN 是一种基于八叉树的卷 积神经网络袁支持各种卷积神经网络结构袁适合不同 形式的三维形状袁 可以有效地完成高分辨率中的视 觉任务袁如物体分类或场景语义分割等遥
理器冤的通用并行计算架构 CUDA渊计算统一设备架 构冤编写遥 利用 Torch 71 科学计算框架作为计算前 端袁GPU 编写的操作作为计算后端袁 分别在一台工 作站中与一台桌面级个人电脑中进行计算遥 实验将 依托普林斯顿大学 ModelNet 项目咱5暂的数据进行测 试袁 同时也将比特八叉树实现的卷积神经网络与其 他算法在 ModelNet10 数 据集 与 ModelNet40 数据 集中的表现进行对比遥 神经网络训练软硬件环境见 表 1遥
使用八叉树作为优化的方式袁 使得三维稀疏数 据能较好地被用于学习三维空间特征遥 大致思路有 两个要要要野进行欧几里得空间卷积冶和野进行非欧几 里得空间卷积冶遥 对于前者袁是利用了八叉树编码可 以节省空间袁 同时对应优化卷积操作来达到优化目 的遥 对于后者袁八叉树编码还保留了空间中的信息遥 空间在用八叉树编码之后袁 还可以由八叉树还原得 到原先的空间中的数据袁 因此欧几里得空间与八叉 树空间在某种意义上是同构的遥本文将采用野进行欧 几里得空间卷积冶的思路遥
G. Riegler 等人提出的 OctNet咱3暂与 O-CNN 相类 似袁OctNet 与 O-CNN 的核心区别在于对八叉树编 码的数据索引遥 OctNet 同样利用八叉树进行分类尧 语义分割袁 也是能够实现深度与高分辨率的三维卷 积神经网络遥
2019 年 第 4 期
论文选粹
2 比特表示法
比特表示法是 G. Rigler 等人提出的 OctNet咱3暂
1 八叉树模型
八叉树在计算机视觉与图像方面的应用袁 最早 是由 Meagher 等人于 1982 年提出来的咱1暂遥 八叉树表 示的最主要优点在于它解决了空间的问题遥 与霍夫 曼树的不定长编码有着异曲同工之妙袁 八叉树的每 个节点对应欧几里得空间的大小是不固定的袁 这使 得多个相同的 野像素冶 可以由一个八叉树的节点表 示袁从而节省了空间遥
0 引言
二维计算机视觉的研究领域袁 已经逐渐迈入成 熟袁 从简单的语义分割到使用深度神经网络去识别 图像中的野主冶野谓冶野宾冶袁都已经变得容易而触手可 及遥 但是对于三维视觉袁 并没有太多对应的解决方 法遥相对于二维视觉数据的野密集冶数据袁三维空间数 据是稀疏的遥 直接使用二维视觉所使用的卷积等操 作会浪费计算资源袁同时计算所需的时间大大增加遥 为解决这一问题袁基于八叉树渊Octree冤空间表示的 神经卷积算法被提出来了袁 成为解决三维空间视觉 分类尧语义分割等任务袁避免过多占用计算资源的一 种方法遥 本文讨论了基于八叉树表示的三维物体分 类算法袁并给出进行三维物体分类实验的结果遥
模型中的表示方法袁 利用比特串表示八叉树的每一
个节点是否有子节点袁 然后通过一定的计算获得子
节点的位置遥
比特八叉树是一个用比特表示的完全八叉树袁
与之对应的是混合八叉树遥混合八叉树渊下文中简称
八叉树冤则是不完全的八叉树袁每一个节点表示立体
空间中的一个或者多个立体像素遥 这里用多个比特
位表示一个完全的比特八叉树袁 每个位代表一个节
一般的来讲袁有 t渊窑冤与 t-1渊窑冤的定义如下院
渊1冤
渊2冤
其中院
表示与渊i袁j袁k冤拥有相同的浊軒渊窑冤的
结果遥 此外袁池化所使用的函数 f 应该能满足可逆的
特征袁或者说用池化结果填充张量袁然后再次池化袁
其结果应该保持不变遥
使用的欧几里得空间卷积的公式如下院
渊3冤
渊4冤
公式渊3冤是将一个八叉树中节点对应的欧几里 得空间中的网格的所有计算结果进行池化得到一个 值的方法遥公式渊4冤则是计算一个八叉树节点所对应 的所有的欧几里得空间的卷积结果遥
池化的函数可以表示为院
渊5冤 其中院d 是表示八叉树的深度袁d渊窑冤是计算八叉 树节点的深度袁条件渊O渊in冤咱i袁j袁k暂冤<d 要求公式渊5冤只 处理最底层的节点渊深度为 d冤遥 因此袁通过八叉树可 以获得更加优化的算法袁 因为它只针对底层节点进 行计算遥
3 算法实现与实验验证
3.1 测试环境 算法使用 Nvidia 公司编制的基于 GPU渊图形处
Biblioteka Baidu
制 数 值 分 别 为 x1x2x3 噎噎 尧 y1y2y3 噎噎 与 z1z2z3
噎噎 袁 现 重 新 调 整 编 码 顺 序 为 二 进 制 数 值
x1y1z1x2y2z2噎噎遥
在用八叉树表示数据的同时袁 可以直接使用一
般的欧几里得空间中的算法遥 但需要定义两个转换
函数袁使得一般的函数
g院RD 伊 W
相关文档
最新文档