看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于虚拟目标制导的自适应Q学习路径规划算法 收藏
基于虚拟目标制导的自适应Q学习路径规划算法

基于虚拟目标制导的自适应Q学习路径规划算法

作     者:李子怡 胡祥涛 张勇乐 许建军 LI Ziyi;HU Xiangtao;ZHANG Yongle;XU Jianjun

作者机构:安徽大学电气工程与自动化学院安徽合肥230601 

基  金:国家自然科学基金资助项目(52175210) 

出 版 物:《计算机集成制造系统》 (Computer Integrated Manufacturing Systems)

年 卷 期:2024年第30卷第2期

页      码:553-568页

摘      要:针对经典强化学习算法用于未知环境下机器人路径规划问题时,存在探索效率低、收敛速度慢、易陷入地形陷阱,以及学习过程缺少中间态导致探索盲目性等问题,设计了双重记忆机制、虚拟目标引导方法、自适应贪婪因子,提出基于虚拟目标引导的自适应Q学习算法。设计了4种环境地图,同其他改进算法进行了对比仿真实验,并通过四驱麦克纳姆轮机器人虚拟仿真实验验证算法性能。实验结果表明,新算法显著减少了迭代次数,提高了强化学习收敛速度,且对复杂环境具有较好的鲁棒性,能够有效避免地形陷阱,提高移动机器人导航系统性能,为移动机器人自主路径规划提供了参考。

主 题 词:Q学习 路径规划 强化学习 移动机器人 

学科分类:080202[080202] 08[工学] 0804[工学-材料学] 0802[工学-机械学] 

核心收录:

D O I:10.13196/j.cims.2022.0733

馆 藏 号:203126129...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分