看过本文的还看了

相关文献

该作者的其他文献

文献详情 >强化学习算法在高速铁路运营调度中的应用 收藏
强化学习算法在高速铁路运营调度中的应用

强化学习算法在高速铁路运营调度中的应用

作     者:吴越 袁志明 代学武 崔东亮 程丽娟 岳鹏 WU Yue;YUAN Zhiming;DAI Xuewu;CUI Dongliang;CHENG Lijuan;YUE Peng

作者机构:东北大学流程工业综合自动化国家重点实验室沈阳110819 中国铁道科学研究院集团有限公司通信信号研究所北京100081 

基  金:国家自然科学基金项目(61790574,U1834211) 辽宁省自然科学基金(2020-MS-093) 

出 版 物:《铁路计算机应用》 (Railway Computer Application)

年 卷 期:2022年第31卷第7期

页      码:92-98页

摘      要:随着我国高速铁路(简称:高铁)通达范围和行车密度的不断提高,运行计划调整日趋复杂,利用计算机和人工智能等技术手段辅助调度员制定阶段调整计划是高铁智能调度的发展趋势。高铁运行计划调整问题是一个多阶段决策问题,具有决策链长、规模大、约束多等特点,导致传统的强化学习方法Q学习算法的学习效率低、收敛缓慢。文章提出一种基于Q(λ)学习的高铁运行计划智能调整算法,采用累积式资格迹设计多步奖励更新机制,有效解决稀疏奖励下收敛慢的问题,目标函数设计中充分考虑了股道运用计划,更适合反应行车密度增大时到发线的使用情况。仿真实验表明,Q(λ)学习算法在学习效率、收敛速度和收敛结果上均优于传统的Q学习算法。

主 题 词:高速铁路 调度算法 股道运用计划 资格迹 Q(λ)学习 

学科分类:08[工学] 081203[081203] 0835[0835] 0814[工学-地质类] 082302[082302] 0823[工学-农业工程类] 082301[082301] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1005-8451.2022.07.17

馆 藏 号:203113757...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分