摘要——自相关性(Autocorrelation)是时间序列数据的本质特征,表现为各观测值对其前序值存在统计依赖性。在深度时间序列预测领域,自相关性广泛存在于输入历史(Input history)与标签序列(Label sequences)中,由此引发了两个核心研究挑战:(1)如何设计高效的神经架构以表征历史序列中的自相关性;(2)如何构建恰当的学习目标以建模标签序列中的自相关性。尽管近期研究在应对上述挑战方面已取得显著进展,但仍缺乏兼顾这两个维度的系统性综述。
为填补这一研究空白,本文从自相关建模的视角出发,对深度时间序列预测的研究现状进行了全面综述。相较于既有综述,本工作的贡献主要体现在两个方面:首先,本文提出了一种全新的分类体系,有机整合了涵盖模型架构与学习目标的近期文献——而此前的综述往往忽略了对后者的深入探讨;其次,本文基于统一的“以自相关为中心”的视角,对相关文献的逻辑动机、核心见解及技术演进进行了深度剖析,从而勾勒出深度时间序列预测发展的全景图。本文涉及的完整论文列表及资源已发布于:https://github.com/Master-PLC/Awesome-TSF-Papers。
时间序列预测旨在基于历史观测值推断未来数值,是各领域数据驱动决策的基石 [1, 2]。在金融领域,它支持资产定价与风险管理 [3];在智慧交通中,它赋能流量优化与路径规划 [4, 5];在能源部门,它提升了负载均衡与电网稳定性 [6];而在制造业中,它实现了过程监控与推理性感知 [7–9]。随着神经网络的飞速发展,利用神经网络进行预测的深度时间序列预测已成为一种主流范式 [2, 10]。深度模型凭借其可扩展性与非线性表征能力,能够捕捉大规模数据集内复杂的时空依赖关系,显著提升了预测精度。目前,深度时间序列预测已成为处理现代应用中日益增长的规模化、非线性且复杂时序数据的核心技术 [11, 12]。 时间序列的一个根本特征是自相关性(Autocorrelation) [13, 14],即每个观测值在统计上均依赖于其前序值。例如,每日气温不仅与近期观测值相关,还与往年同期的观测值相关。这一特性使时间序列区别于表格数据、图像等其他数据模态,并为预测任务带来了独特的挑战 [15, 16]。自统计预测发展初期,自相关性的重要性便已得到广泛认可,并驱动了诸如 ARIMA 和 VAR 等显式整合自相关性方法的诞生 [17–20]。在深度时间序列预测时代,自相关性依然至关重要,因为它固有地存在于训练深度神经网络所需的输入(历史)序列与输出(标签)序列中。从形式上看,这引出了两个研究挑战:❶ 如何设计神经架构以适配历史序列中的自相关性;❷ 如何设计学习目标(Learning objectives)以适配标签序列中的自相关性。 应对这两个挑战是近期深度时间序列预测取得进展的关键驱动力 [15, 21]。为建模历史自相关性(挑战 ❶),研究人员开发了多样化的神经架构,如循环神经网络 (RNN) [22, 23]、卷积神经网络 (CNN) [24–26]、稠密神经网络 (DNN) [27, 28] 以及 Transformer [29, 30]。近年来,各架构体系内均涌现出显著创新:RNN 中的状态空间模型 (SSM) [31, 32]、CNN 中的大卷积核设计 [26, 33]、DNN 中的深度分解技术 [34, 35],以及 Transformer 中的大语言模型 (LLM) 应用 [36]。这些进展弥补了早期设计的局限,大幅增强了模型捕捉复杂历史自相关模式的能力。为建模标签自相关性(挑战 ❷),研究人员基于似然估计 [15, 37]、形状对齐 [38] 及分布均衡 [16, 39] 开发了多种训练目标。近期还涌现出一种新范式,将预测重构为条件生成任务 [40],利用扩散模型 [41, 42] 或自回归目标 [43] 来建模标签的自相关结构。总而言之,这两个研究方向互为补充,分别针对时间序列自相关性带来的两个固有挑战。 尽管解决这些挑战的研究进展迅速,但目前仍明显缺乏从自相关统一视角出发、兼顾神经架构与学习目标的全面综述。首先,现有综述主要侧重于神经架构,或详述单一架构 [44, 45],或对多种架构进行广泛分类 [1, 2, 46]。相比之下,尽管相关工作不断增多 [15, 47, 48],学习目标的发展所受到的关注却相对有限。其次,既往综述往往强调方法的具体实现,而未能显式地将其与底层的根本预测挑战建立联系。特别是自相关性的角色——及其产生的独特建模挑战——尚未得到充分分析。这一空白凸显了建立统一框架的需求,以理解时间序列预测的核心挑战及其解决方案的技术演进。
为填补这一空白,本文从自相关建模的视角对深度时间序列预测进行了全面回顾,主要贡献如下:
首先,提出了一种整合模型架构与学习目标近期文献的新型分类体系。 在模型架构方面,创新性地涵盖了状态空间模型 [31, 32]、专家混合模型 (MoE) [49–51]、大核 CNN [26] 及基于 LLM 的模型 [52] 等新兴方法,助力读者把握快速演变的趋势;在学习目标方面,提供了该领域的首次系统性分析,填补了以往综述中未经探讨的关键空白 [2, 44, 45]。 * 其次,从统一的“以自相关为中心”的视角,对所查阅文献的动机、见解与进展进行了透彻分析。
这些贡献共同构成了一个统一且宏观的框架,用以理解深度时间序列预测领域的最新进展。 本文后续章节安排如下:第 2 节介绍问题定义并强调自相关的核心地位;第 3 节详述所提分类体系并与现有综述进行对比;第 4 节回顾针对历史自相关建模设计的模型架构;第 5 节回顾针对标签自相关建模的学习目标;最后,第 6 节基于对自相关性的进一步发掘讨论未来研究方向。