深度自相关建模在时间序列预测中的应用：研究进展与前景展望

摘要——自相关性（Autocorrelation）是时间序列数据的本质特征，表现为各观测值对其前序值存在统计依赖性。在深度时间序列预测领域，自相关性广泛存在于输入历史（Input history）与标签序列（Label sequences）中，由此引发了两个核心研究挑战：（1）如何设计高效的神经架构以表征历史序列中的自相关性；（2）如何构建恰当的学习目标以建模标签序列中的自相关性。尽管近期研究在应对上述挑战方面已取得显著进展，但仍缺乏兼顾这两个维度的系统性综述。

为填补这一研究空白，本文从自相关建模的视角出发，对深度时间序列预测的研究现状进行了全面综述。相较于既有综述，本工作的贡献主要体现在两个方面：首先，本文提出了一种全新的分类体系，有机整合了涵盖模型架构与学习目标的近期文献——而此前的综述往往忽略了对后者的深入探讨；其次，本文基于统一的“以自相关为中心”的视角，对相关文献的逻辑动机、核心见解及技术演进进行了深度剖析，从而勾勒出深度时间序列预测发展的全景图。本文涉及的完整论文列表及资源已发布于：https://github.com/Master-PLC/Awesome-TSF-Papers。

1 引言

时间序列预测旨在基于历史观测值推断未来数值，是各领域数据驱动决策的基石 [1, 2]。在金融领域，它支持资产定价与风险管理 [3]；在智慧交通中，它赋能流量优化与路径规划 [4, 5]；在能源部门，它提升了负载均衡与电网稳定性 [6]；而在制造业中，它实现了过程监控与推理性感知 [7–9]。随着神经网络的飞速发展，利用神经网络进行预测的深度时间序列预测已成为一种主流范式 [2, 10]。深度模型凭借其可扩展性与非线性表征能力，能够捕捉大规模数据集内复杂的时空依赖关系，显著提升了预测精度。目前，深度时间序列预测已成为处理现代应用中日益增长的规模化、非线性且复杂时序数据的核心技术 [11, 12]。时间序列的一个根本特征是自相关性（Autocorrelation） [13, 14]，即每个观测值在统计上均依赖于其前序值。例如，每日气温不仅与近期观测值相关，还与往年同期的观测值相关。这一特性使时间序列区别于表格数据、图像等其他数据模态，并为预测任务带来了独特的挑战 [15, 16]。自统计预测发展初期，自相关性的重要性便已得到广泛认可，并驱动了诸如 ARIMA 和 VAR 等显式整合自相关性方法的诞生 [17–20]。在深度时间序列预测时代，自相关性依然至关重要，因为它固有地存在于训练深度神经网络所需的输入（历史）序列与输出（标签）序列中。从形式上看，这引出了两个研究挑战：❶ 如何设计神经架构以适配历史序列中的自相关性；❷ 如何设计学习目标（Learning objectives）以适配标签序列中的自相关性。应对这两个挑战是近期深度时间序列预测取得进展的关键驱动力 [15, 21]。为建模历史自相关性（挑战 ❶），研究人员开发了多样化的神经架构，如循环神经网络 (RNN) [22, 23]、卷积神经网络 (CNN) [24–26]、稠密神经网络 (DNN) [27, 28] 以及 Transformer [29, 30]。近年来，各架构体系内均涌现出显著创新：RNN 中的状态空间模型 (SSM) [31, 32]、CNN 中的大卷积核设计 [26, 33]、DNN 中的深度分解技术 [34, 35]，以及 Transformer 中的大语言模型 (LLM) 应用 [36]。这些进展弥补了早期设计的局限，大幅增强了模型捕捉复杂历史自相关模式的能力。为建模标签自相关性（挑战 ❷），研究人员基于似然估计 [15, 37]、形状对齐 [38] 及分布均衡 [16, 39] 开发了多种训练目标。近期还涌现出一种新范式，将预测重构为条件生成任务 [40]，利用扩散模型 [41, 42] 或自回归目标 [43] 来建模标签的自相关结构。总而言之，这两个研究方向互为补充，分别针对时间序列自相关性带来的两个固有挑战。尽管解决这些挑战的研究进展迅速，但目前仍明显缺乏从自相关统一视角出发、兼顾神经架构与学习目标的全面综述。首先，现有综述主要侧重于神经架构，或详述单一架构 [44, 45]，或对多种架构进行广泛分类 [1, 2, 46]。相比之下，尽管相关工作不断增多 [15, 47, 48]，学习目标的发展所受到的关注却相对有限。其次，既往综述往往强调方法的具体实现，而未能显式地将其与底层的根本预测挑战建立联系。特别是自相关性的角色——及其产生的独特建模挑战——尚未得到充分分析。这一空白凸显了建立统一框架的需求，以理解时间序列预测的核心挑战及其解决方案的技术演进。

为填补这一空白，本文从自相关建模的视角对深度时间序列预测进行了全面回顾，主要贡献如下：

首先，提出了一种整合模型架构与学习目标近期文献的新型分类体系。 在模型架构方面，创新性地涵盖了状态空间模型 [31, 32]、专家混合模型 (MoE) [49–51]、大核 CNN [26] 及基于 LLM 的模型 [52] 等新兴方法，助力读者把握快速演变的趋势；在学习目标方面，提供了该领域的首次系统性分析，填补了以往综述中未经探讨的关键空白 [2, 44, 45]。 * 其次，从统一的“以自相关为中心”的视角，对所查阅文献的动机、见解与进展进行了透彻分析。

这些贡献共同构成了一个统一且宏观的框架，用以理解深度时间序列预测领域的最新进展。本文后续章节安排如下：第 2 节介绍问题定义并强调自相关的核心地位；第 3 节详述所提分类体系并与现有综述进行对比；第 4 节回顾针对历史自相关建模设计的模型架构；第 5 节回顾针对标签自相关建模的学习目标；最后，第 6 节基于对自相关性的进一步发掘讨论未来研究方向。