看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于参数逼近的多智能体强化学习算法 收藏
基于参数逼近的多智能体强化学习算法

基于参数逼近的多智能体强化学习算法

作     者:赵高长 刘豪 苏军 ZHAO Gao-chang;LIU Hao;SU Jun

作者机构:西安科技大学理学院陕西西安710054 

基  金:国家自然科学基金项目(41271518) 陕西省自然科学基金项目(2018JM1047) 

出 版 物:《计算机工程与设计》 (Computer Engineering and Design)

年 卷 期:2020年第41卷第3期

页      码:862-866页

摘      要:为改善多智能体纳什Q学习算法适应性差、条件苛刻、运算复杂,且没有通用方法更新策略价值等问题,提出基于参数的算法改进思路。引入联合动作向量简化算法,引入参数,通过参数近似控制状态-行为值函数,转化训练目标,给出参数逼近的值函数更新方程,理论分析算法的收敛性及可行性。仿真结果表明,基于参数逼近的多智能体强化学习算法,能够使智能体100%达到纳什均衡,提高算法性能,简化算法复杂性,相比传统纳什Q学习算法能够较快收敛。

主 题 词:智能体系统 强化学习 马尔科夫博弈 Q学习 纳什均衡 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.16208/j.issn1000-7024.2020.03.042

馆 藏 号:203906778...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分