看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度强化学习的模糊作业车间调度问题 收藏
基于深度强化学习的模糊作业车间调度问题

基于深度强化学习的模糊作业车间调度问题

作     者:朱家政 张宏立 王聪 李新凯 董颖超 ZHU Jia-zheng;ZHANG Hong-li;WANG Cong;LI Xin-kai;DONG Ying-chao

作者机构:新疆大学电气工程学院乌鲁木齐830047 

基  金:国家自然科学基金项目(51967019 52065064) 

出 版 物:《控制与决策》 (Control and Decision)

年 卷 期:2024年第39卷第2期

页      码:595-603页

摘      要:针对具有模糊加工时间和模糊交货期的作业车间调度问题,以最小化最大完工时间为目标,以近端策略优化(PPO)算法为基本优化框架,提出一种LSTM-PPO(proximal policy optimization with Long short-term memory)算法进行求解.首先,设计一种新的状态特征对调度问题进行建模,并且依据建模后的状态特征直接对工件工序进行选取,更加贴近实际环境下的调度决策过程;其次,将长短期记忆(LSTM)网络应用于PPO算法的行动者-评论者框架中,以解决传统模型在问题规模发生变化时难以扩展的问题,使智能体能够在工件、工序、机器数目发生变化时,仍然能够获得最终的调度解.在所选取的模糊作业车间调度的问题集上,通过实验验证了该算法能够取得更好的性能.

主 题 词:深度学习 强化学习 近端策略优化算法 模糊作业车间调度 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.13195/j.kzyjc.2022.1345

馆 藏 号:203125433...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分