作者: Tianrui Guan, Aswath Muthuselvam, Montana Hoover, Xijun Wang, Jing Liang, Adarsh Jagan Sathyamoorthy, Damon Conover, Dinesh Manocha
提交/修订日期: 2023年3月31日提交,2023年9月29日修订(版本v2)
主题/分类: 计算机视觉与模式识别 (cs.CV)
摘要:
本文提出了 CrossLoc3D,一种新颖的三维场景识别方法,旨在解决跨源设置下的大规模点云匹配问题。跨源点云数据指的是由不同精度、不同距离或不同视角的深度传感器捕获的点集。我们致力于开发能够处理不同来源点云之间表征差距的三维场景识别方法。我们的方法通过利用多粒度特征,并选择与最显著特征相对应的卷积核大小来处理跨源数据。受扩散模型的启发,我们的方法采用了一种新颖的迭代精炼过程,逐步将来自不同来源的嵌入空间转移到一个单一的规范空间,以实现更好的度量学习。此外,我们提出了 CS-Campus3D,这是第一个由空中和地面激光雷达扫描点云数据组成的三维空地跨源数据集。CS-Campus3D 中的点云具有表征差距以及其他特征,如不同视角、点密度和噪声模式。实验表明,我们的 CrossLoc3D 算法在 CS-Campus3D 基准测试上,Top-1 平均召回率提升了 4.74% - 15.37%,并且在 Oxford RobotCar 数据集上达到了与最先进三维场景识别方法相当的性能。代码和 CS-CAMPUS3D 基准测试将在 github.com/rayguan97/crossloc3d 上提供。