摘要近年来,随着轨道交通的不断发展,地铁出行成为居民出行的主要交通方式.随着地铁线路的不断完善发展,地铁客流量不断增加,这也容易造成地铁站客流拥堵,不利于居民出行及地铁运营管理.因此实现对站点客流量的短期预测能够帮助优化地铁运营管理,保障市民安全出行.本文通过收集杭州市 AFC 系统的所有地铁站刷卡数据信息,对数据进行处理后建立短期客流量预测模型.本文首先进行数据处理,将原始数据转化为各站点每十分钟客流量数据,从站点和时间两个方面对客流量数据特征进行分析.一方面分析不同站点的客流量分布特征,将站点划分为五类并具体分析每类站点的客流量分布. 另一方面分析工作日和节假日客流量的特征,总结得出工作日客流量均呈现不同程度的高峰,而周末的客流相对来说更复杂,受随机因素影响较大.本文对工作日和周末分别建立客流量 LightGBM 预测模型,以金沙湖站为例分别度量工作日和周末客流量的特征重要性并利用网格搜索算法对模型参数进行了优化,最后以 RMSE 为评价指标对客流量预测结果进行评估.RMSE 结果显示LightGBM 模型对工作日预测效果颇佳,进出站客流量预测 RMSE 值分别为18.26、13.67,而对周末客流量预测效果与工作日相比较差,进出站 RMSE 值分别为 23.36、28.14。为了对周末客流量预测模型进行优化,本文使用树模型和神经网络模型加权融合的创新方法,建立 LSTM 模型对周末客流量进行预测,并将 LightGBM 模型和 LSTM 模型进行加权融合,融合后进出站 RMSE 值分别为 19.46、25.97,周末客流量预测精度得到提升.关键词: 地铁客流量短期预测;LightGBM 模型;LSTM 模型;模型融合AbstractIn recent years, Rail transport has become the main ways of travelling for residents. With the continuous development of metro lines , passenger flow of subway is increasing,leading to subway congestion easily, and making it difficult for residents to travel and manager to make decision. Therefore, achieveing short-term forecast of passenger flows can help optimizing subway operation management and ensure the safety of passengers, which is of great significance.In this paper, through collecting the card swiping data of all metro stations in Hangzhou AFC system...