文献详情 >复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策收藏

复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策

作者：殷辰堃纪宏萱张严心 YIN Chenkun;JI Hongxuan;ZHANG Yanxin

基　　金：国家自然科学基金面上资助项目(62273028 62073025 62073026)

出版物：《北京工业大学学报》 (Journal of Beijing University of Technology)

年卷期：2023年第49卷第4期

页码：403-414页

摘要：机器人在搜救任务中的自主决策能力对降低救援人员的风险具有重大意义.为了使机器人在面对复杂多解的搜救任务时能自主形成决策和合理的路径规划,设计了一种异策略分层强化学习算法.该算法由两层Soft Actor-Critic(SAC)智能体组成,高层智能体可以自动生成低层智能体所需的目标并提供内在奖励指导其直接与环境进行交互.在分层强化学习的框架下,首先将复杂可交互场景下的机器人搜救任务描述为高层半马尔可夫决策过程与低层马尔可夫决策过程的双层结构,并针对不同层级设计不同的状态空间、动作空间与奖励函数等.其次,针对传统强化学习算法中目标与奖励函数需要人工设计且缺乏通用性的问题,应用基于SAC的异策略分层强化学习算法训练双足移动机器人与复杂场景交互,通过数据的高效利用和目标空间的调整实现救援机器人的自主决策.仿真结果验证了所设计的算法在解决复杂多路径搜救任务中的有效性和通用性.

主题词：分层强化学习 Soft Actor-Critic算法搜索救援任务双足移动机器人自主决策交互场景

学科分类：0810[工学-土木类] 08[工学] 082304[082304] 080204[080204] 0805[工学-能源动力学] 0802[工学-机械学] 0812[工学-测绘类] 0823[工学-农业工程类]

核心收录：

D　O　I：10.11936/bjutxb2022090006

馆藏号：203121006...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：