您所在的位置: 成果库 一种基于频域和语义的动态视觉SLAM方法

一种基于频域和语义的动态视觉SLAM方法

成果类型:: 发明专利

发布时间: 2023-11-08 10:12:20

科技成果产业化落地方案
方案提交机构:成果发布人| 涂媛 | 2023-11-08 10:12:20

本发明公开了一种基于频域和语义的动态SLAM方法,完成在高动态与复杂光照环境中的定位与建图任务。首先,为精确获得物体的运动区域,采用傅里叶梅林算法在频域对图像进行配准以补偿相机运动,随后应用帧间差分算法获得图像的运动掩膜。同时,图像通过短时密集连接(STDC)网络进行语义分割得到潜在运动物体掩膜。将运动掩膜与物体掩膜相结合,获得最终的物体运动区域,对落在该区域的特征点进行剔除。最后,依据稳定的静态特征点跟踪优化,提升位姿精度。在公开数据集与现实环境中的测试结果表明,本方法在复杂动态场景下具有良好的定位精度与鲁棒性,能够有效的降低运动模糊与光照变化对于运动检测的影响。

本发明利用傅里叶梅林变换在图像配准方面的独特优势结合帧间差分(Temporal Difference,TD)算法,实现了一个高鲁棒的运动检测算法,结合可视化ORB‑SLAM2和STDC语义分割网络,提出了一种在动态场景下基于傅里叶梅林变换的视觉SLAM算法。首先,为精确获得物体的运动区域,采用傅里叶梅林算法进行配准以补偿相机运动,随后应用帧间差分算法得到运动掩膜。同时,图像经过STDC语义分割网络得到潜在运动物体掩膜。将运动掩膜与物体掩膜相结合,得到最终的物体运动区域,对落在该区域的特征点进行剔除。最后,通过稳定的静态特征点进行跟踪优化提升位姿的精度。

同步定位与地图构建技术(simultaneous location and mapping,SLAM)是指在没有任何先验知识的情况下,根据传感器数据实时构建周围环境地图,同时根据这个地图推测自身的定位。基于视觉传感器的SLAM技术称为视觉同步定位与地图创建(VSLAM)技术。在拥有采集速度快、采集信息丰富、价格相对低廉的RGB‑D相机之后,VSLAM已经被广泛应用于多个领域。

在过去的30多年中,许多学者对SLAM进行了研究并取得了突出效果,如ORB‑SLAM2、RGBD‑SLAM‑V2等。但是,传统的SLAM工作大都是基于静态环境的假设,但是SLAM的真实工作环境中不可避免的存在动态对象,这些对象的特征点是不稳定的,因此会对SLAM产生干扰并造成性能下降。在基于特征点的SLAM系统中,当跟踪到不稳定的特征点时,会严重影响位姿估计,导致较大的轨迹误差甚至系统崩溃。因此,在动态场景中性能下降与缺乏鲁棒性已经成为其实际应用中的主要障碍。

此技术研发人是哈尔滨理工大学孙明晓,承担本专科及研究生层次普通高等学历教育工作承担科学技术研究工作并为社会提供相关服务

与现有技术相比,本发明具有如下的有益效果:

(1)本发明通过改进的傅里叶梅林变换对图像进行配准以实现运动补偿,使用帧间差分获得运动掩膜,降低了运动模糊与光照变化对运动检测的影响;

(2)本发明结合运动检测与语义分割,提出了一种动态特征点过滤方法,可以有效地剔除动态对象对位姿估计与建图的干扰;

(3)本发明相较于传统动态SLAM在高动态的环境下可以取得更好的效果。在高动态序列中,本发明的绝对轨迹误差相比于ORB‑SLAM2平均减少了95%以上,相比于DS‑SLAM平均减少了30%以上,表明了本发明在动态环境下具有较高的准确性与鲁棒性。

技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接此项目。。