看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于MADDPG的多AGVs路径规划算法 收藏
基于MADDPG的多AGVs路径规划算法

基于MADDPG的多AGVs路径规划算法

作     者:尹华一 尤雅丽 黄新栋 段青娜 YIN Huayi;YOU Yali;HUANG Xindong;DUAN Qingna

作者机构:厦门理工学院计算机与信息工程学院福建厦门361024 厦门理工学院光电与通信工程学院福建厦门361024 红云红河烟草(集团)有限责任公司云南昆明650000 

基  金:国家自然科学基金项目(61503316,62372392) 福建省自然科学基金项目(2021J011182,2021J011191,2022J011275) 厦门市科技局高校产学研项目(2022CXY0401) 

出 版 物:《厦门理工学院学报》 (Journal of Xiamen University of Technology)

年 卷 期:2024年第32卷第1期

页      码:37-46页

摘      要:针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函数和网络结构重新设计MADDPG算法的模型结构,通过OpenAI Gym接口搭建二维仿真环境用作多AGVs (agents)的训练平台。实验结果表明,相比于深度确定性策略梯度(DDPG)算法和双延迟深度确定性策略梯度(TD3)算法,基于MADDPG的多AGVs路径规划算法在智能仓储仿真环境下,多AGVs碰到货架的次数分别减少了21.49%、11.63%,碰到障碍物的次数分别减少了14.69%、10.12%,全部AGVs到达货物装卸点的成功率分别高出了17.22%、10.53%,表明学习后的AGV具有更高效的在线决策能力和自适应能力,能够找到较优的路径。

主 题 词:自动导引车系统(AGVs) 路径规划 多智能体深度确定性策略梯度(MADDPG)算法 深度强化学习 多智能体 

学科分类:1305[艺术学-设计学类] 13[艺术学] 08[工学] 081104[081104] 0804[工学-材料学] 081101[081101] 0811[工学-水利类] 

D O I:10.19697/j.cnki.1673-4432.202401006

馆 藏 号:203127273...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分