看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进深度强化学习的无人机自主导航方法 收藏
基于改进深度强化学习的无人机自主导航方法

基于改进深度强化学习的无人机自主导航方法

作     者:郭子恒 蔡晨晓 GUO Ziheng;CAI Chenxiao

作者机构:南京理工大学自动化学院江苏南京210094 

基  金:国家自然科学基金(61973164) 

出 版 物:《信息与控制》 (Information and Control)

年 卷 期:2023年第52卷第6期

页      码:736-746,772页

摘      要:深度强化学习算法在实现无人机(unmanned aerial vehicle,UAV)导航任务的应用越来越广泛。然而,利用融合先验策略的训练过程中,由于其占比线性衰减,导致模型训练速度缓慢,导航成功率下降。针对以上问题,本文提出一种UAV导航算法。首先,搭建虚拟UAV环境模型,构造动作空间。其次,依据稀疏化思想,设计奖励函数,根据UAV的学习状态设计自适应衰减因子,改进不同学习状态下先验策略的比重,训练网络模型。最后,依据训练好的网络模型实现UAV导航决策。仿真结果显示,所提算法导航成功率稳定处于较高水平时的训练时间比原型算法缩短了大约20%,大幅度提升了网络训练效率,降低时间成本,同时由于先验策略比重更加贴合当时的学习能力,UAV导航质量与成功率也有了一定提高,为推动深度强化学习在UAV导航的实际应用提供了新的思路。

主 题 词:深度强化学习 无人机导航 先验策略 自适应衰减 

学科分类:08[工学] 0825[工学-环境科学与工程类] 

核心收录:

D O I:10.13976/j.cnki.xk.2022.0447

馆 藏 号:203125201...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分