限定检索结果

检索条件"主题词=分层强化学习"
18 条 记 录,以下是11-20 订阅
视图:
排序:
基于分层强化学习的无人机空战多维决策
收藏 引用
《兵工学报》2023年 第6期44卷 1547-1563页
作者:张建东 王鼎涵 杨啟明 史国庆 陆屹 张耀中西北工业大学电子信息学院陕西西安710072 沈阳飞机设计研究所辽宁沈阳110035 
针对无人机空战过程中面临的智能决策问题,基于分层强化学习架构建立无人机智能空战的多维决策模型。将空战自主决策由单一维度的机动决策扩展到雷达开关、主动干扰、队形转换、目标探测、目标追踪、干扰规避、武器选择等多个维度,实现...
来源:详细信息评论
基于MAXQ分层强化学习的有人机/无人机协同路径规划研究
收藏 引用
《信息化研究》2020年 第1期46卷 13-19页
作者:程先峰 严勇杰南京莱斯信息技术股份有限公司南京210007 空中交通管理系统与技术国家重点实验室南京210014 
针对有人机/无人机混合运行的复杂任务和环境下,很难为无人机协调行为设计合适的控制策略和控制参数的问题,文章设计了基于对策论的无人机强化学习模型与算法。针对无人机/有人机协调的特点,结合MAXQ分层强化学习和Multi-agent的优点,...
来源:详细信息评论
基于启发式奖赏塑形方法的智能化攻击路径发现
收藏 引用
《信息安全学报》2024年 第3期9卷 44-58页
作者:曾庆伟 张国敏 邢长友 宋丽华陆军工程大学指挥控制工程学院南京210007 
渗透测试作为一种评估网络系统安全性能的重要手段,是以攻击者的角度模拟真实的网络攻击,找出网络系统中的脆弱点。而自动化渗透测试则是利用各种智能化方法实现渗透测试过程的自动化,从而大幅降低渗透测试的成本。攻击路径发现作为自...
来源:详细信息评论
海空跨域协同兵棋AI架构设计及关键技术分析
收藏 引用
《指挥控制与仿真》2024年 第2期46卷 35-43页
作者:苏炯铭 罗俊仁 陈少飞 项凤涛国防科技大学智能科学学院湖南长沙410073 
以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈...
来源:详细信息评论
一种基于PSO的分层策略搜索算法
收藏 引用
《模式识别与人工智能》2008年 第1期21卷 98-103页
作者:彭志平 李绍平茂名学院计算机科学与技术系茂名525000 
针对分层策略梯度强化学习算法(HPGRL)易陷入局部最优点等问题,提出一种分层策略搜索算法(PSO-HPS).首先由设计者按照经典分层强化学习MAXQ方法的思想构建子任务分层结构,通过与环境的直接交互,PSO-HPS利用具有较强全局搜索能力的粒子...
来源:详细信息评论
分层决策多机空战对抗方法
收藏 引用
《中国科学:信息科学》2022年 第12期52卷 2225-2238页
作者:王欢 周旭 邓亦敏 刘小峰河海大学物联网工程学院常州213022 北京航空航天大学自动化科学与电气工程学院北京100191 江苏省特种机器人技术高校重点实验室常州213022 
在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练...
来源:详细信息评论
两轮机器人自平衡稳定性控制仿真研究
收藏 引用
《计算机仿真》2016年 第7期33卷 383-387页
作者:闫娟 杨慧斌 程武山上海工程技术大学机械工程学院上海201620 
两轮机器人自平衡控制的难点在于提高机器人达到平衡的快速性和稳定性的能力。为解决传统强化学习算法收敛速度慢,系统易发散的问题,提出一种分层强化学习算法。将目标任务分解为若干个子任务,为每个子任务寻找最优策略,当所有的子目标...
来源:详细信息评论
MAXQ方法在出租车问题中的应用
收藏 引用
《茂名学院学报》2007年 第1期17卷 56-59页
作者:安岭丽 彭志平 李铁鹰茂名学院计算机与电子信息学院广东茂名525000 太原理工大学信息工程学院山西太原030024 
分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中解决问题。针对MAXQ方法。首先介绍其基本原理,然后介绍MAXQ方法在出租车问题中的应用,包括任务分解以及...
来源:详细信息评论
聚类工具 回到顶部