服务机器人自动导航算法技术
发布时间: 2021-12-29
来源: 试点城市(园区)
基本信息
服务机器人自动导航算法技术分为语音人机交互与自主寻路避障两个部分。语音人机交互部分通过拾音器实时获取用户的语音信号,基于Win-ROS 中的消息传输机制结合科大讯飞的语音识别 API 接口,实现 STT(SpeechToText)功能。然后根据服务场景,设计特定的语音识别控制策略,对获取的文本命令进行分类处理,完成数据库的调用和触发机器人后续功能,同时通过动态代理技术调用图灵 API 接口,整合 TTS(TextToSpeech)功能,最终实现基于语音的友好人机交互功能。自主寻路避障算法分为三部分:基于视觉的多目标跟踪、未知环境下移动机器人 SLAM 和动态环境下的移动机器人避障。在基于视觉的多目标跟踪方面,设计了直方图缓存算法:首先使用 Facebook 开源的 Detectron 项目下的 Mask-RCNN 对视频流中的人进行识别,得到人在图片中以矩形的四个角点描述的像素坐标与人体识别的置信度;然后提取在矩形框中人体的 RGB 图像直方图信息并以一维向量的形式表示,通过对视频流中相邻两帧间的人以向量余弦相似度的比较,从而实现相邻两帧间不同人 ID 的对应关系。其中,通过直方图缓存的方法,解决了视频流中人体间遮挡与人消失后重现的问题;通过匈牙利算法加速了余弦相似度比较环节的计算。在未知环境下移动机器人 SLAM 方面在 VIORB 算法基础上,设计了一种基于 EPnP 的位姿估计优化算法,通过将由 EPnP 算法得到的关于相机位姿的估计与空间点的坐标作为优化变量,结合相机的观测数据一同构建关于位姿的最小二乘优化问题后,再通过 BA 捆级优化,从而实现SLAM 算法精度上的提升。在移动机器人避障方面,提出了带时间戳的DW-VG 算法,首先在机器人周围均匀建立多个虚拟目标点来替代原先的真实目标点,并用评价函数选出最优虚拟目标点;然后通过动态窗口 DW法,生成机器人带时间戳的动态窗口并通过评价函数在动态窗口中选择下一时间机器人运动的最优控制指令;最后通过不断迭代此过程,直至机器人到达目标位置。