透明物体在我们的日常生活中很常见,但机器人很难对这些物体进行姿态估计。使用常用的深度传感器获取透明物体的高质量深度图具有挑战性,并且RGB数据经常表现出由透明材料引起的严重内容混叠。
arXiv.org上最近发表的一篇论文介绍了StereoPose,这是一种用于类别级6D透明物体姿态估计的新型立体图像框架。
这种新颖的方法利用立体图像来隐式地建模对象形状信息,而不是显式地使用对象点云。研究人员在归一化对象坐标空间(NOCS)映射中为透明对象定义后视图。它减少了图像内容混叠对透明物体姿态估计的负面影响。
大量实验表明,与其他现有方法相比,Stereo-Pose实现了显着的性能改进。
大多数现有的类别级姿态估计方法都依赖于对象点云。然而,当考虑透明物体时,深度相机通常无法捕获有意义的数据,从而导致点云具有严重的伪影。没有高质量的点云,现有方法不适用于具有挑战性的透明物体。为了解决这个问题,我们提出了StereoPose,这是一种用于类别级对象姿态估计的新型立体图像框架,非常适合透明对象。为了从纯立体图像中进行稳健估计,我们开发了一个管道,将类别级姿态估计解耦为对象大小估计、初始姿态估计和姿态细化。然后,StereoPose基于归一化对象坐标空间~(NOCS)中的表示来估计对象姿态。为了解决图像内容混叠的问题,我们进一步为透明对象定义了一个后视图NOCS映射。后视NOCS旨在减少由内容混叠引起的网络学习歧义,并利用透明物体背面的信息线索进行更准确的姿势估计。为了进一步提高立体框架的性能,StereoPose配备了用于立体特征融合的视差注意模块和用于提高网络预测的立体视图一致性的对极损失。在公共TOD数据集上进行的大量实验证明了所提出的StereoPose框架在类别级6D透明物体姿态估计方面的优越性。后视NOCS旨在减少由内容混叠引起的网络学习歧义,并利用透明物体背面的信息线索进行更准确的姿势估计。为了进一步提高立体框架的性能,StereoPose配备了用于立体特征融合的视差注意模块和用于提高网络预测的立体视图一致性的对极损失。在公共TOD数据集上进行的大量实验证明了所提出的StereoPose框架在类别级6D透明物体姿态估计方面的优越性。后视NOCS旨在减少由内容混叠引起的网络学习歧义,并利用透明物体背面的信息线索进行更准确的姿势估计。为了进一步提高立体框架的性能,StereoPose配备了用于立体特征融合的视差注意模块和用于提高网络预测的立体视图一致性的对极损失。在公共TOD数据集上进行的大量实验证明了所提出的StereoPose框架在类别级6D透明物体姿态估计方面的优越性。StereoPose配备了用于立体特征融合的视差注意模块和用于提高网络预测的立体视图一致性的对极损失。在公共TOD数据集上进行的大量实验证明了所提出的StereoPose框架在类别级6D透明物体姿态估计方面的优越性。StereoPose配备了用于立体特征融合的视差注意模块和用于提高网络预测的立体视图一致性的对极损失。在公共TOD数据集上进行的大量实验证明了所提出的StereoPose框架在类别级6D透明物体姿态估计方面的优越性。