文献详情 >基于个体-协同触发强化学习的多机器人行为决策方法收藏

基于个体-协同触发强化学习的多机器人行为决策方法

作者：徐雪松曾智邵红燕杨胜杰李想 Xu Xuesong;Zeng Zhi;Shao Hongyan;Yang Shengjie;Li Xiang

作者机构：湖南工商大学计算机与信息工程学院长沙410205 新零售虚拟现实技术湖南省重点实验室长沙410205

基　　金：国家自然科学基金重大项目(71991463,71790615) 国家自然科学基金重大研究计划集成项目(91846301) 湖南省教育厅科学研究重点项目(18A303) 湖南社科基金项目(18YBA272) 湖南省社科评审委员会项目(XSP18YBZ123) 湖南省重点实验室开放研究基金项目(18-07)资助

出版物：《仪器仪表学报》 (Chinese Journal of Scientific Instrument)

年卷期：2020年第41卷第5期

页码：66-75页

摘要：为了提高多机器人行为最优决策控制中强化学习的效率和收敛速度,研究了多机器人的分布式马尔科夫建模与控制策略。根据机器人有限感知能力设计了个体-协同感知触发函数,机器人个体从环境观测结果计算个体-协同触发响应概率,定义一次触发过程后开始计算联合策略,减少机器人间通讯量和计算资源。引入双学习率改进Q学习算法,并将该算法应用于机器人行为决策。仿真实验结果表明,当机器人群组数量在20左右时,本文算法的协同效率较高,单位时步比为1.0850。同时距离调节参数η对机器人协同搜索效率有影响,当η=0.008时,所需的移动时步比和平均移动距离都能达到最小值。通过双学习率的引入,该算法较基于环境模型的强化学习算法具有更高的学习效率和适用性,平均性能提升35%,对于提高多机器人自主协同能力具有较高的理论意义及应用价值。

主题词：多机器人强化学习个体-协同触发行为决策

学科分类：080202[080202] 08[工学] 0804[工学-材料学] 0703[理学-化学类] 0802[工学-机械学]

核心收录：

D　O　I：10.19650/j.cnki.cjsi.J2006140

馆藏号：203956324...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于个体-协同触发强化学习的多机器人行为决策方法

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于个体-协同触发强化学习的多机器人行为决策方法

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：