基于深度强化学习的机器人无地图路径规划方法及系统

专利信息

专利权人:山东大学

第一发明人:宋勇

专利号:ZL202211014749.2

授权日:2024-4-26

专利类型:发明

国别:中国

专利简介

专利权人 山东大学 第一发明人 宋勇
专利号 ZL202211014749.2 授权日 2024-4-26
专利类型 发明 国别 中国
所属领域 开放许可开始日期
开放许可截止日期 单次许可期限
许可费支付方式
本公开提供了一种基于深度强化学习的机器人无地图路径规划方法及系统,其属于机器人无地图路径规划技术领域,包括:预先构建深度强化学习算法的状态空间和动作空间,并构建具有启发性知识的连续性奖励函数;构建基于LSTM网络及深度学习网络的估计值网络和目标网络的双网络架构,并以最大化奖励收益为目标,基于经验池内的状态数据样本进行所述估计值网络和目标网络的训练,其中,所述估计值网络的输入为机器人当前状态信息,所述目标网络的输入为机器人下一次状态信息;所述奖励收益的计算基于所述具有启发性知识的连续性奖励函数;基于机器人当前状态信息,利用训练好的估计值网络获得下一步的最优移动动作,实现机器人的无地图路径规划。