基于时间序列模型的短时交通流预测研究论文
2026-01-05 11:09:01 来源: 作者:xuling
摘要:短时交通流预测是智能交通系统的核心功能之一,旨在通过历史与实时数据对未来5分钟至1小时的交通流量、速度等进行动态评估,为交通管理和出行决策提供支持。
摘要:短时交通流预测是智能交通系统的核心功能之一,旨在通过历史与实时数据对未来5分钟至1小时的交通流量、速度等进行动态评估,为交通管理和出行决策提供支持。本文系统地分析了时间序列模型在短时交通流预测中的应用流程,包括数据采集、原始数据预处理、数据离散化等,提出了基于ARIMA模型的预测实现方法,通过差分消除非平稳性,结合自回归与移动平均项构建模型,并采用滚动预测机制动态更新参数,以适应交通流的时变特性。
关键词:时间序列模型;短时交通流预测;离散化
短时交通流预测是指基于历史与实时数据,对未来5分钟至1小时内的流量、速度、密度等交通参数进行动态评估,通过捕捉交通流的时序变化规律,为交通管理者和出行者提供前瞻性决策支持。从技术原理上看,交通流具有显著的时变性、周期性和随机性的特点,其中时变性主要体现为交通状态随早晚高峰、天气事件等因素的动态波动;周期性则表现为每日或每周相似时段的流量重复模式;而随机性主要是各类交通事故、突发拥堵等不可预见因素。预测模型需在复杂噪声干扰下,从海量数据中提取有效特征并建立输入与输出间的映射关系,从而实现对未来状态的可靠推断[1]。
1时间序列模型基本原理与核心结构
自回归(AR)组件主要通过线性组合历史流量数
据预测当前值,例如利用前5分钟的流量加权求和估计当前流量;差分(I)组件通过对原始序列进行阶数可调的差值计算,消除非平稳趋势,比如早晚高峰流量的整体上升或下降,确保数据满足建模所需的平稳性条件;移动平均(MA)组件通过拟合历史预测误差的线性组合,降低随机扰动对模型的影响。ARIMA模型的数学表达式如式(1)所示:

建模时,需通过ADF检验判断序列平稳性,结合自相关图(ACF)和偏自相关图(PACF)确定参数p和q,最终采用AIC准则优选模型[2]。
2基于时间序列模型的短时交通流预测分析
2.1交通流数据采集
交通流数据的质量直接决定预测模型的可靠性,因此数据采集质量十分重要。在短时交通流预测模型中,需要采集的数据包括单位时间内通过的车辆数、车辆的平均行驶速度、单位长度道路上的车辆数等,上述三个参数分别对应流量、速度、密度。实际应用中需要采用多源数据融合策略,将地磁线圈的高频流量数据与浮动车的空间轨迹相结合,通过状态向量含流量—速度二维参数、观测矩阵基于传感器精度矩阵构建的卡尔曼滤波算法实现数据时空对齐。具体做法如下,首先,构建状态方程如式(2)所示:
X(k)=A•X(k-1)+W(k)(2)
式中,A表示路段历史流量—速度关联系数,取值(0.95~0.98);W(k)表示高斯白噪声;观测矩阵根据传感器精度分配权重,地磁线圈流量数据权重设为0.7(误差率≤3%),浮动车速度数据权重设为0.3(误差率≤8%)。其次,通过卡尔曼滤波的预测—更新迭代,每1分钟输出一次融合后的路段流量—速度数据。具体可采用Apache Spark进行分布式计算,其中Spark Streaming模块处理实时地磁数据流,Spark SQL模块完成离线浮动车轨迹数据关联,提升数据融合效率[3]。
2.2交通流数据预处理
原始交通流数据除正常数据外,通常还包含噪声、缺失值与异常值,需通过预处理提升数据质量。首先,噪声处理。噪声主要来源于传感器测量误差或环境干扰。噪声数据可通过滑动平均法进行平滑处理,滑动平均法以固定窗口大小计算流量均值,抑制短期随机波动。该算法构建固定长度的时间窗口,计算窗口内数据的均值作为当前时刻的平滑值,公式如式(3)所示:

式中,xt'表示时刻的平滑值;xt+i表示t+i时刻的原始数据;N表示窗口半宽,窗口总长度为2N+1。取不同的滑动参数会得到不同的滑动平均结果,滑动参数过小,起不到抑制随机波动的作用;反之则可能滤掉高频变化的规律性部分,影响整体的预测精度。因此,需要选择一个合理的滑动参数值做滑动平均,计算不同滑动参数对应的预测序列,并计算各自平均相对误差。
其次,缺失值处理。缺失值处理需区分短时缺失与长时缺失,其中短时缺失主要是指单点缺失,可采用线性插值填充,使用线性插值法将待求解的优化变量由一组预测控制输入序列参数化为由多个状态反馈控制输入的线性组合,待求解的优化变量简化为其对应的权重系数,具体公式如式(4)所示:

式中,t表示缺失时刻;xt-1表示缺失点前有效数据;xt+1表示缺失点后有效数据。长时缺失主要是由于设备故障导致的连续缺失,这种情况需要结合上下游路段数据,基于时空相关性建立回归模型进行估计。
最后,异常值检测。异常值检测通常采用箱线图法,识别并剔除超出合理范围的数据点。箱线图法主要通过统计量确定并剔除数据中的异常点,找出数据中大量出现的正常值,箱体宽度1.5倍须线内的值为湿和异常值,以外为尖锐异常值,需剔除。在短时交通流预测中,箱线图法应用于非正态数据,计算四分位数,即下四分位Q1、上四分位Q3、四分位距IQR=Q3-Q1,异常值范围为[Q1-1.5*IQR,Q3+1.5*IQR],超出该范围数据即为异常。

2.3交通流数据离散化
离散化旨在将连续时间序列转换为有限状态集合,降低建模复杂度并增强模型鲁棒性。常用方法包括等宽分箱、等频分箱与聚类分箱,其中等宽分箱按照固定间隔划分流量等级,该方法操作简单,但可能割裂实际交通状态;等宽分箱是根据数据全量范围与预设区间数计算固定分箱宽度,公式如式(5)所示:

聚类分箱基于K-means或DBSCAN算法自动识别流量密度的自然分布,能够准确划分“畅通”“缓行”“拥堵”等不同状态的边界,利用Seaborn库绘制热力图可视化离散化效果,辅助人工校验状态划分合理性。离散化过程中,利用Seaborn库绘制热力图可视化离散效果,同时通过混淆矩阵计算状态分类准确率辅助人工校验。离散区间数需权衡信息损失与计算效率,即区间数超过8类时模型精度提升趋缓,而少于4类则难以区分关键状态变化。离散化后需验证状态划分的合理性,通过卡方检验确认各状态间统计显著性差异,避免主观划分导致模型偏差。
2.4短时交通流预测实现
基于时间序列模型的预测实现包含模型选择、参数优化与滚动预测三个核心环节。以ARIMA模型为例,首先,需检验序列平稳性,检验过程中通过ADF检验判断原始流量序列是否满足均值与方差恒定,若存在趋势或周期性,比如早高峰流量持续上升,则需进行一阶或季节性差分处理。其次,确定模型阶数(p,d,q),利用自相关图(ACF)识别移动平均阶数q,采用偏自相关图(PACF)确定自回归阶数p,差分阶数d通过多次差分直至序列平稳。参数优化阶段采用网格搜索法遍历候选参数组合,以AIC(赤池信息准则)或BIC(贝叶斯信息准则)评估模型拟合优度,选择最小准则值对应的参数。最后,模型训练完成后,需通过滚动预测机制实现动态更新,以滑动窗口为基础预测未来5~15分钟流量,并将新观测值纳入窗口进行模型重训练,从而适应交通流的时变特性。模型性能评估采用平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)等三项指标,具体公式如式(7)~式(9)所示:

需注意避免过拟合问题,比如训练集误差极低而测试集误差骤升,可通过交叉验证或早停法加以控制[4]。
2.5模型优化与误差分析
时间序列模型的预测误差主要源于三方面:数据质量缺陷、模型假设偏离与外部事件干扰。首先,针对数据质量问题,引入Huber鲁棒损失函数,误差较小时用平方损失,较大时用绝对损失,以降低异常值影响,或采用基于验证集MAPE倒数加权的集成学习框架,比如3个不同参数的ARIMA模型加权融合,权重之和为1,以提升稳定性;集成模型需通过Bagging策略降低方差,样本随机抽样比例70%,避免单一模型偏差。其次,针对模型假设偏离问题,主要指线性假设与真实交通流非线性特性的冲突,Box-Cox变换,参数λ通过极大似然估计确定,将非线性序列转化为近似线性,或构建混合模型,比如ARIMA-LSTM混合模型,其中ARIMA拟合线性趋势,LSTM捕捉非线性波动;混合模型通过注意力机制(Attention)动态分配两部分输出权重,提升非线性拟合能力。。最后,外部事件干扰问题。包括交通事故、恶劣天气等,针对这类因素产生的干扰,需通过外生变量扩展模型,在ARIMAX模型中增加天气等级,采用独热编码转换为3-5维二进制变量,以及事件报警标志等辅助变量;引入前采用方差膨胀因子(VIF)检验(VIF<10)消除多重共线性,再建立多因素耦合的预测方程。此外,需定期进行模型退化检测,通过残差分析判断模型是否失效,并触发参数重校准或结构重构流程。
结语
在交通流预测中,时间序列模型尤其适用于处理以固定时间间隔采集的流量、速度等连续观测数据,能够有效捕捉交通流的短期波动规律,为短时交通流预测提供了高效、可解释的解决方案,但后续需针对其线性假设与外部事件适应性做进一步改进。未来研究中,可融合深度学习捕捉交通流的非线性时空关联,构建动态学习机制应对路网变化与突发事件,并结合车路协同技术实现高精度实时预测。通过模型优化与多技术协同,短时预测将成为智慧交通系统动态管控的核心支撑,促进城市交通管理的智能化升级。
参考文献
[1]邹宗民,郝龙,李全杰,等.基于粒子群优化—支持向量回归的高速公路短时交通流预测[J].科学技术与工程,2021,21(12):5118-5123.
[2]余敬柳,陈鹏,谢静敏.基于状态频率记忆神经网络的短时交通流预测[J].武汉理工大学学报(交通科学与工程版),2020,44(4):733-737.
[3]张阳,杨书敏,辛东嵘.改进小波包与长短时记忆组合模型的短时交通流预测[J].交通运输系统工程与信息,2020,20(2):204-210.
[4]马超群,李培坤,朱才华,等.基于不同时间粒度的城市轨道交通短时客流预测[J].长安大学学报(自然科学版),2020,40(3):75-83.