哈工大刘贤明教授团队提出新型的6D物体位姿快速精准优化方法

发布时间:2025-05-19 浏览次数:43

哈工大全媒体(阚思邈 刘贤明/文 刘贤明/图)近日,计算学部刘贤明教授团队在具身智能领域取得重要进展,提出了一种基于隐式神经网络的6D物体位姿优化方法,显著提升了物体定位的精度与效率。相关研究成果以《基于隐式表面优化的快速而精确的6D物体姿态修正方法》(Fast and Accurate 6D Object Pose Refinement via Implicit Surface Optimization)为题,发表于《IEEE机器人汇刊》(IEEE Transactions on Robotics)。

6D位姿估计(包含3D旋转和3D平移)是机器人抓取、增强现实等应用的核心技术。传统方法依赖迭代最近点(ICP)算法进行位姿优化,但迭代最近点(ICP)需要显式建立点云与3D模型的一一对应关系,易陷入局部最优且对噪声和遮挡敏感。

针对这一问题,研究团队提出了一种基于隐式神经网络的优化框架,通过将目标物体的3D模型编码为符号距离场(SDF),直接优化点云与模型表面的距离,无需显式匹配对应点。该方法具有多种优势:一是高效性,离线训练仅需4-5分钟,在线优化实时完成;二是鲁棒性,对初始位姿偏差大、噪声、尺度变化及遮挡等复杂场景表现优异;三是通用性,可无缝集成至现有位姿估计流程,无需额外标注数据。

系统框图

研究团队在合成与真实数据集(如LINEMOD、YCB-V、T-LESS)上进行了广泛测试。实验表明,该方法在ADD(-S)和VSD等指标上显著优于传统ICP及其变体。例如,在遮挡严重的Occluded LINEMOD数据集上,结合通用位姿估计器OVE6D,准确率从55.3%提升至71.5%。该技术可广泛应用于工业机器人精准抓取、自动驾驶环境感知、AR/VR交互等领域。

哈工大为论文第一单位。计算学部刘贤明教授为论文通讯作者,博士研究生庞博为论文第一作者。该研究工作受到国家自然科学基金重大研究计划等项目资助。

团队已开源代码:https://github.com/pangbo1997/SDFR

论文链接:https://ieeexplore.ieee.org/document/10970084

责任编辑:商艳凯

审核:宋玲 李守斌