限定检索结果

检索条件"主题词=DE-MADDPG"
2 条 记 录,以下是1-10 订阅
视图:
排序:
基于de-maddpg的多无人机协同追捕策略
收藏 引用
《航空学报》2022年 第5期43卷 522-535页
作者:符小卫 王辉 徐哲西北工业大学电子信息学院西安710129 
针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法de-maddpg研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,...
来源:详细信息评论
基于de-maddpg多智能体强化学习机械臂装配
收藏 引用
《组合机床与自动化加工技术》2023年 第12期 183-187,192页
作者:王晶 苏工兵 袁梦 曾文豪 于楚飞武汉纺织大学机械工程与自动化学院武汉430200 武汉纺织大学湖北省数字纺织装备重点实验室武汉430200 
为了提高机械臂在复杂装配任务中智能程度,提出了一种基于深度强化学习的多智能体装配策略。以六自由度机械臂Pieper准则构型为基础,将末端的位置和姿态分开独立控制,应用解耦多智能体深度确定性策略梯度算法(de-maddpg),依据其不同的...
来源:详细信息评论
聚类工具 回到顶部