看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度强化学习的多配送中心车辆路径规划 收藏
基于深度强化学习的多配送中心车辆路径规划

基于深度强化学习的多配送中心车辆路径规划

作     者:王万良 陈浩立 李国庆 冷龙龙 赵燕伟 WANG Wan-liang;CHEN Hao-li;LI Guo-qing;LENG Long-long;ZHAO Yan-wei

作者机构:浙江工业大学计算机科学与技术学院杭州310023 

基  金:国家自然科学基金项目(61873240) 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2022年第37卷第8期

页      码:2101-2109页

摘      要:多配送中心车辆路径规划(multi-depot vehicle routing problem,MDVRP)是现阶段供应链应用较为广泛的问题模型,现有算法多采用启发式方法,其求解速度慢且无法保证解的质量,因此研究快速且有效的求解算法具有重要的学术意义和应用价值.以最小化总车辆路径距离为目标,提出一种基于多智能体深度强化学习的求解模型.首先,定义多配送中心车辆路径问题的多智能体强化学习形式,包括状态、动作、回报以及状态转移函数,使模型能够利用多智能体强化学习训练;然后通过对MDVRP的节点邻居及遮掩机制的定义,基于注意力机制设计由多个智能体网络构成的策略网络模型,并利用策略梯度算法进行训练以获得能够快速求解的模型;接着,利用2-opt局部搜索策略和采样搜索策略改进解的质量;最后,通过对不同规模问题仿真实验以及与其他算法进行对比,验证所提出的多智能体深度强化学习模型及其与搜索策略的结合能够快速获得高质量的解.

主 题 词:多配送中心车辆路径规划 强化学习 多智能体 注意力机制 策略梯度 局部搜索 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.13195/j.kzyjc.2021.1381

馆 藏 号:203112377...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分