文献详情 >基于Q学习的异构多智能体系统最优一致性收藏

基于Q学习的异构多智能体系统最优一致性

作者：程薇燃李金娜 Cheng Weiran;Li Jinna

基　　金：国家自然科学基金项目(62073158) 辽宁省重点领域联合开放基金项目(2019-KF-03-06) 辽宁省教育厅基本科研项目(LJKZ0401) 辽宁石油化工大学研究基金项目(2018XJJ-005)

出版物：《辽宁石油化工大学学报》 (Journal of Liaoning Petrochemical University)

年卷期：2022年第42卷第4期

页码：59-67页

摘要：对有领导者的异构离散多智能体系统的最优一致性问题,提出了一种无模型的基于非策略强化学习的控制协议设计方法。由于异构多智能体系统的状态矩阵不同,其局部邻居误差的动态表达式比较复杂。与现有的多智能体系统分布式控制方案相比,所提算法减少了计算的复杂性。首先,建立由增广变量构造的多智能体系统全局邻居误差动态表达式。其次,通过二次型形式的值函数得到耦合贝尔曼方程和Hamilton-Jacobi-Bellman(HJB)方程。再次,求解耦合HJB方程的最优解,得到多智能体最优一致性的纳什均衡解,并给出纳什均衡证明。从次,基于无模型的非策略Q学习算法,求解多智能体最优一致性的纳什均衡解。最后,利用批判神经网络结构,结合梯度下降法实现了所提出的算法,并通过仿真实例验证了算法的有效性。

主题词：多智能体系统神经网络强化学习最优一致性

学科分类：0711[理学-心理学类] 07[理学] 08[工学] 081101[081101] 0811[工学-水利类] 071102[071102] 081103[081103]

D　O　I：10.3969/j.issn.1672-6952.2022.04.011

馆藏号：203114478...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于Q学习的异构多智能体系统最优一致性

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于Q学习的异构多智能体系统最优一致性

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：