看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于生成对抗网络的追尾事故数据填补方法研究 收藏
基于生成对抗网络的追尾事故数据填补方法研究

基于生成对抗网络的追尾事故数据填补方法研究

作     者:周备 张莹 张生瑞 周千喜 汪琴 ZHOU Bei;ZHANG Ying;ZHANG Shengrui;ZHOU Qianxi;WANG Qin

作者机构:长安大学运输工程学院西安710064 北京清华同衡规划设计研究院有限公司北京100085 

基  金:国家自然科学基金青年科学基金(52102404) 中央高校基本科研业务费专项资金(300102343204) 

出 版 物:《交通运输系统工程与信息》 (Journal of Transportation Systems Engineering and Information Technology)

年 卷 期:2024年第24卷第1期

页      码:132-137,198页

摘      要:深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追尾事故数据为研究对象,将原始数据按照7∶3随机分为训练集和测试集。在训练集数据上,利用生成式插补网络(Generative Adversarial Imputation Network,GAIN)实现对缺失数据的填补。为对比不同数据填补方法的效果,同时选择多重插补(Multiple Imputation by Chained Equations,MICE)算法、期望最大化(Expectation Maximization,EM)填充算法、缺失森林(MissForest)算法和K最近邻(K-Nearest Neighbor,KNN)算法对同一数据集进行数据填补,并基于填补前后变量方差变化比较不同填补算法对数据变异性的影响。在完成数据填补的基础上,构建LightGBM三分类事故严重程度影响因素分析模型。使用原始训练集数据,以及填补后的训练集数据分别训练模型,并使用未经填补的测试集数据检验模型预测效果。结果表明,经缺失值填补后,模型性能得到一定改善,使用GAIN填补数据集训练的模型,相较于原始数据训练的模型,准确率提高了6.84%,F1提高了4.61%,AUC(Area Under the Curve)提高了10.09%,且改善效果优于其他4种填补方法。

主 题 词:城市交通 数据填补 生成对抗网络 追尾事故 LightGBM模型 

学科分类:03[法学] 08[工学] 0838[0838] 0306[法学-公安学类] 

核心收录:

D O I:10.16097/j.cnki.1009-6744.2024.01.013

馆 藏 号:203126101...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分