看过本文的还看了

相关文献

该作者的其他文献

文献详情 >自记忆的深度强化学习模型求解多维背包问题 收藏
自记忆的深度强化学习模型求解多维背包问题

自记忆的深度强化学习模型求解多维背包问题

作     者:盛佳浩 马良 刘勇 SHENG Jiahao;MA Liang;LIU Yong

作者机构:上海理工大学管理学院上海200093 

基  金:上海市哲学社会科学规划课题项目(2019BGL014)资助 教育部人文社会科学研究青年基金项目(21YJC630087)资助 

出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)

年 卷 期:2024年第45卷第9期

页      码:2137-2148页

摘      要:本文针对多维背包问题维度高,约束强的特点提出了自记忆的学习优化模型(self memorized learn to improve,SML2I),通过深度强化学习的学习机制选择迭代搜索过程中的算子即模型学习当前的解以及历史搜索过程中的解,判断对当前解采用提升策略或者是扰动策略,在此基础上,进一步提出了哈希表与设计了2种有效的基于价值密度的扰动算子.使用哈希表记录历史搜索过程中的解,防止模型重复探索相同的解,基于价值密度的扰动策略生成的新解与之前的解决方案完全不同,因此针对扰动后的解再次采用提升策略同样有效,通过测试89个MKP数据集并与其他文献中先进的求解方法进行对比,实验结果验证了SML2I模型求解MKP问题的可行性与有效性.

主 题 词:多维背包问题 深度强化学习 多哈希 邻域算子 策略梯度 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.20009/j.cnki.21-1106/TP.2023-0170

馆 藏 号:203122451...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分