看过本文的还看了

相关文献

该作者的其他文献

文献详情 >水面无人艇自适应危险规避决策过程收敛性分析 收藏
水面无人艇自适应危险规避决策过程收敛性分析

水面无人艇自适应危险规避决策过程收敛性分析

作     者:张汝波 唐平鹏 杨歌 李雪耀 史长亭 Zhang Rubo;Tang Pingpeng;Yang Ge;Li Xueyao;Shi Changting

作者机构:哈尔滨工程大学计算机科学与技术学院哈尔滨150001 大连民族学院机电信息学院辽宁大连116600 武汉第二船舶设计研究所武汉430064 

基  金:国家自然科学基金项目(60975071 61100005 60975019) 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2014年第51卷第12期

页      码:2644-2652页

摘      要:水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法为基础,提出了USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了USV自适应危险规避决策过程能够以概率1收敛到最优行为策略.论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的.

主 题 词:水面无人艇 复杂海况 Sarsa在线策略强化学习 自适应危险规避决策过程 渐进贪心策略 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 0835[0835] 0811[工学-水利类] 0812[工学-测绘类] 

核心收录:

D O I:10.7544/issn1000-1239.2014.20131011

馆 藏 号:203643584...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分