文献详情 >强化学习算法在高速铁路运营调度中的应用收藏

强化学习算法在高速铁路运营调度中的应用

作者：吴越袁志明代学武崔东亮程丽娟岳鹏 WU Yue;YUAN Zhiming;DAI Xuewu;CUI Dongliang;CHENG Lijuan;YUE Peng

作者机构：东北大学流程工业综合自动化国家重点实验室沈阳110819 中国铁道科学研究院集团有限公司通信信号研究所北京100081

基　　金：国家自然科学基金项目(61790574,U1834211) 辽宁省自然科学基金(2020-MS-093)

出版物：《铁路计算机应用》 (Railway Computer Application)

年卷期：2022年第31卷第7期

页码：92-98页

摘要：随着我国高速铁路(简称:高铁)通达范围和行车密度的不断提高,运行计划调整日趋复杂,利用计算机和人工智能等技术手段辅助调度员制定阶段调整计划是高铁智能调度的发展趋势。高铁运行计划调整问题是一个多阶段决策问题,具有决策链长、规模大、约束多等特点,导致传统的强化学习方法Q学习算法的学习效率低、收敛缓慢。文章提出一种基于Q(λ)学习的高铁运行计划智能调整算法,采用累积式资格迹设计多步奖励更新机制,有效解决稀疏奖励下收敛慢的问题,目标函数设计中充分考虑了股道运用计划,更适合反应行车密度增大时到发线的使用情况。仿真实验表明,Q(λ)学习算法在学习效率、收敛速度和收敛结果上均优于传统的Q学习算法。

主题词：高速铁路调度算法股道运用计划资格迹 Q(λ)学习

学科分类：08[工学] 081203[081203] 0835[0835] 0814[工学-地质类] 082302[082302] 0823[工学-农业工程类] 082301[082301] 0812[工学-测绘类]

D　O　I：10.3969/j.issn.1005-8451.2022.07.17

馆藏号：203113757...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

强化学习算法在高速铁路运营调度中的应用

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

强化学习算法在高速铁路运营调度中的应用

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：