看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于可解释机器学习框架的列车乘车区段客流分布预测方法 收藏
基于可解释机器学习框架的列车乘车区段客流分布预测方法

基于可解释机器学习框架的列车乘车区段客流分布预测方法

作     者:孙国锋 景云 李和壁 田志强 田小鹏 SUN Guofeng;JING Yun;LI Hebi;TIAN Zhiqiang;TIAN Xiaopeng

作者机构:北京交通大学交通运输学院北京100044 北京交通大学智慧高速铁路系统前沿科学中心北京100044 中国铁道科学研究院集团有限公司铁道科学技术研究发展中心北京100081 兰州交通大学交通运输学院兰州730070 兰州交通大学高原铁路运输智慧管控铁路行业重点实验室兰州730070 

基  金:国家自然科学基金(52372300,72161023) 中央高校基本科研业务费专项资金(2023YJS146) 

出 版 物:《交通运输系统工程与信息》 (Journal of Transportation Systems Engineering and Information Technology)

年 卷 期:2024年第24卷第2期

页      码:249-262页

摘      要:为解释客运产品特征对列车乘车区段客流分布预测的影响,本文提出一种基于可解释机器学习框架的高速铁路列车乘车区段客流分布预测方法。首先,提出基于梯度提升树模型的高速铁路列车乘车区段客流分布预测框架,构建不同梯度提升树模型(GBDT、XGBoost、LightGBM及CatBoost)的高速铁路列车乘车区段客流分布预测模型;其次,计算特征贡献重要度,基于SHAP(SHapley Additive exPlanations)方法实现特征变量优化,揭示单一特征和交互特征与列车乘车区段客流分布预测的非线性关系。北京南—上海虹桥间列车客流分布预测结果表明:4种模型可精准预测客流分布结果,GBDT,XGBoost,LightGBM及CatBoost在测试集的决定系数分别为0.9664,0.9601,0.9680及0.9715;特征优化后,按贡献重要度排序依次为标杆车,票价,旅行时间,日期,星期,车次及出发时间;特征优化后,CatBoost-7模型在验证集中的决定系数为0.9458;日期和标杆车对客流分布预测呈现非线性正相关,旅行时间对客流分布预测呈现非线性负相关,低旅行时间、高票价及出发时间整点的标杆车对客流分布预测产生正向影响。本文研究结果能够为高速铁路客运产品设计提供一定参考价值。

主 题 词:铁路运输 客流分布预测 可解释机器学习 列车乘车区段 非线性关系 

学科分类:08[工学] 082303[082303] 0823[工学-农业工程类] 

核心收录:

D O I:10.16097/j.cnki.1009-6744.2024.02.025

馆 藏 号:203127486...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分