本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Zhiqiang Guo、Xin Zhao、Yaxin Chen、Wei Wu和Jie Yang共同完成,他们均来自武汉理工大学的湖北省宽带无线通信与传感器网络重点实验室。该研究发表于2019年6月10日的《IET Intelligent Transport Systems》期刊,DOI为10.1049/iet-its.2018.5530。
本研究的主要科学领域是城市轨道交通的短期客流预测。随着自动检票系统、列车自动运行控制系统和视频采集系统的智能化推广,城市轨道交通的运行信息被更准确、全面地收集。这些海量出行数据为分析城市轨道交通的运行状态和出行特征提供了重要依据,并为管理部门的决策提供了数据支持。然而,现有的长期客流预测模型因弹性模型的局限性遇到了瓶颈,而短期客流预测模型则广泛采用了基于统计学和计算机智能的方法。本研究旨在提出一种基于核岭回归(Kernel Ridge Regression, KRR)和高斯过程回归(Gaussian Process Regression, GPR)的混合预测模型,以提高城市轨道交通短期客流预测的准确性和时间效率。
本研究主要包括以下几个步骤:
数据预处理与特征选择
研究首先使用稳定性特征选择算法(Stability Feature Selection Algorithm)对原始数据进行降维,以减少有限样本的误差。该算法基于最小绝对收缩和选择算子(Lasso)进行改进,通过多次子采样和特征加权,提取出稳定的特征。
高斯过程回归(GPR)预测
在特征选择后,研究采用GPR算法对客流进行初步预测。GPR是一种基于贝叶斯技术的回归方法,能够定量分析结果的不确定性。研究通过GPR模型生成初步的客流预测结果,并将其作为后续核岭回归模型的输入之一。
站点聚类与特征提取
为了进一步提高预测精度,研究采用堆叠自编码器网络(Stacked Auto-Encoder Network, SAE)构建特征提取模型,并使用K-means算法将站点划分为不同类型,定义为站点特征。这一步骤旨在捕捉站点之间的时空相关性。
核岭回归(KRR)混合预测
研究将GPR的预测结果与节假日信息、站点类别信息结合,采用KRR算法进行最终预测。KRR模型在处理中等规模数据集时表现优异,具有较短的建模时间和较少的参数,适合用于混合预测。
模型验证与对比
研究在自动售检票系统(Automatic Fare Collection System, AFC)数据集上验证了所提出的混合模型,并与现有的小波神经网络(Wavelet Neural Network, WNN)、堆叠自编码器深度神经网络(SAE-DNN)和小波支持向量机(Wavelet-SVM)模型进行了对比。
GPR模型的预测效果
GPR模型在预测精度上显著优于支持向量回归(SVR)和梯度提升回归树(GBRT)模型。其平均绝对误差(MAE)为55.9074,平均绝对百分比误差(MAPE)为10.89%,均方根误差(RMSE)为101.7798。
混合模型的预测效果
GPR-KRR混合模型在节假日和突发事件等外部因素影响下的预测表现显著优于单一GPR模型。其MAE为40.0833,MAPE为14.66%,RMSE为71.3964,均优于对比模型。
站点聚类与特征提取的有效性
通过SAE网络和K-means算法,研究成功将166个站点划分为7种主要客流类型,并提取了有效的站点特征,进一步提高了预测精度。
本研究首次将GPR和KRR混合模型引入城市轨道交通短期客流预测领域,取得了显著的预测效果。该模型不仅提高了预测精度,还能够在节假日和突发事件等复杂情况下提供更准确的预测结果,具有重要的实际应用价值。然而,客流预测还受到天气、季节等多种外部因素的影响,未来研究可以进一步结合更多外部因素,以提升预测模型的全面性和准确性。
混合模型的创新性
本研究首次将GPR和KRR结合,提出了一种混合预测模型,显著提高了预测精度和时间效率。
特征提取与站点聚类的有效性
通过SAE网络和K-means算法,研究成功捕捉了站点之间的时空相关性,为预测模型提供了更丰富的输入特征。
对外部因素的处理能力
该模型在节假日和突发事件等外部因素影响下的预测表现显著优于现有模型,展示了其在实际应用中的潜力。
本研究还详细介绍了GPR和KRR算法的理论基础和实现过程,为相关领域的研究者提供了有价值的参考。此外,研究还公开了所使用的数据集和模型参数,便于其他研究者复现和验证实验结果。
本研究在城市轨道交通短期客流预测领域取得了重要进展,为未来的研究和实际应用提供了新的思路和方法。