文献检索-宁波市创意产业特色资源库

限定检索结果

检索条件"主题词=DE-MADDPG"

共 2 条记录，以下是1-10 订阅

全选清除本页清除全部题录导出标记到"检索档案"

视图：

排序：

基于de-maddpg的多无人机协同追捕策略: 收藏
分享
引用; 《航空学报》2022年第5期43卷 522-535页; 作者：符小卫王辉徐哲西北工业大学电子信息学院西安710129; 针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法de-maddpg研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,...; 针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法de-maddpg研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,训练后的多无人机能够有效地执行协同追捕任务。通过设置快速目标的多种逃逸控制策略,仿真验证了所设计的方法能够利用追捕无人机的数量优势,通过协作完成对快速目标的协同围捕,并且通过比较,验证本文所提出的算法相比maddpg算法更快地取得了收敛效果。; 来源：详细信息评论

基于de-maddpg多智能体强化学习机械臂装配: 收藏
分享
引用; 《组合机床与自动化加工技术》2023年第12期 183-187,192页; 作者：王晶苏工兵袁梦曾文豪于楚飞武汉纺织大学机械工程与自动化学院武汉430200 武汉纺织大学湖北省数字纺织装备重点实验室武汉430200; 为了提高机械臂在复杂装配任务中智能程度,提出了一种基于深度强化学习的多智能体装配策略。以六自由度机械臂Pieper准则构型为基础,将末端的位置和姿态分开独立控制,应用解耦多智能体深度确定性策略梯度算法(de-maddpg),依据其不同的...; 为了提高机械臂在复杂装配任务中智能程度,提出了一种基于深度强化学习的多智能体装配策略。以六自由度机械臂Pieper准则构型为基础,将末端的位置和姿态分开独立控制,应用解耦多智能体深度确定性策略梯度算法(de-maddpg),依据其不同的结构装配特性设计了全局奖励函数和局部奖励函数,并在Gezebo仿真平台上进行了圆孔和方孔装配的仿真实验,同时对DDPG算法和maddpg算法进行对比实验。结果表明de-maddpg算法比DDPG提升了13.2%的装配效率,比maddpg装配更加稳定。通过搭建装配实验平台,验证了该算法在实体装配过程中具有可行性和较强的泛化能力。; 来源：详细信息评论

全选清除本页清除全部题录导出标记到“检索档案”

共1页<< <1> >>

聚类工具回到顶部