A Policy Gradient-Based Sequence-to-Sequence Method for Time Series Prediction - 专知论文

会员服务 ·

0

序列 · 梯度 · 序列到序列 · 序列预测 · 策略梯度 ·

A Policy Gradient-Based Sequence-to-Sequence Method for Time Series Prediction

翻译：基于策略梯度的序列到序列时间序列预测方法

Qi Sima,Xinze Zhang,Yukun Bao,Siyue Yang,Liang Shen

Sequence-to-sequence architectures built upon recurrent neural networks have become a standard choice for multi-step-ahead time series prediction. In these models, the decoder produces future values conditioned on contextual inputs, typically either actual historical observations (ground truth) or previously generated predictions. During training, feeding ground-truth values helps stabilize learning but creates a mismatch between training and inference conditions, known as exposure bias, since such true values are inaccessible during real-world deployment. On the other hand, using the model's own outputs as inputs at test time often causes errors to compound rapidly across prediction steps. To mitigate these limitations, we introduce a new training paradigm grounded in reinforcement learning: a policy gradient-based method to learn an adaptive input selection strategy for sequence-to-sequence prediction models. Auxiliary models first synthesize plausible input candidates for the decoder, and a trainable policy network optimized via policy gradients dynamically chooses the most beneficial inputs to maximize long-term prediction performance. Empirical evaluations on diverse time series datasets confirm that our approach enhances both accuracy and stability in multi-step forecasting compared to conventional methods.

翻译：基于循环神经网络构建的序列到序列架构已成为多步超前时间序列预测的标准选择。在这些模型中，解码器根据上下文输入生成未来值，这些输入通常为实际历史观测值（真实值）或先前生成的预测值。训练过程中，输入真实值有助于稳定学习过程，但会导致训练条件与推理条件不匹配（称为暴露偏差），因为在真实部署场景中无法获取此类真实值。另一方面，在测试阶段使用模型自身输出作为输入通常会导致误差随预测步长快速累积。为缓解这些局限性，我们提出一种基于强化学习的新训练范式：采用基于策略梯度的方法，为序列到序列预测模型学习自适应输入选择策略。辅助模型首先生成解码器的合理输入候选集，随后通过策略梯度优化的可训练策略网络动态选择最具效益的输入，以最大化长期预测性能。在多样化时间序列数据集上的实证评估表明，与传统方法相比，本方法在多步预测的准确性与稳定性方面均有提升。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

决策智能中的时间序列预测大模型

决策智能中的时间序列预测大模型

专知会员服务

34+阅读 · 2025年5月8日

《深度学习在时间序列预测中的应用：综述》

《深度学习在时间序列预测中的应用：综述》

专知会员服务

30+阅读 · 2025年3月14日

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

专知会员服务

85+阅读 · 2023年5月22日

【干货书】用于数据科学分析和预测的时间序列，529页pdf

【干货书】用于数据科学分析和预测的时间序列，529页pdf

专知会员服务

123+阅读 · 2022年10月10日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

时空序列预测方法综述

时空序列预测方法综述

专知会员服务

171+阅读 · 2020年10月18日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

基于LSTM深层神经网络的时间序列预测

基于LSTM深层神经网络的时间序列预测

论智

22+阅读 · 2018年9月4日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

基于时变回声状态网的光伏发电在线短期预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于Memetic多目标时变优化的全基因代谢网络重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

Deep Learning Network-Temporal Models For Traffic Prediction

Arxiv

0+阅读 · 3月12日

FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting

Arxiv

0+阅读 · 3月10日

Towards Accurate and Interpretable Time-series Forecasting: A Polynomial Learning Approach

Arxiv

0+阅读 · 3月3日

Learning Long-Range Dependencies with Temporal Predictive Coding

Arxiv

0+阅读 · 2月20日

A Decomposable Forward Process in Diffusion Models for Time-Series Forecasting

Arxiv

0+阅读 · 2月16日

Semantic-Enhanced Time-Series Forecasting via Large Language Models

Arxiv

0+阅读 · 2月11日

FreqLens: Interpretable Frequency Attribution for Time Series Forecasting

Arxiv

0+阅读 · 2月9日

Empowering Time Series Analysis with Large-Scale Multimodal Pretraining

Arxiv

0+阅读 · 2月5日

T-LLM: Teaching Large Language Models to Forecast Time Series via Temporal Distillation

Arxiv

0+阅读 · 2月2日

Sequence Diffusion Model for Temporal Link Prediction in Continuous-Time Dynamic Graph

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

序列到序列

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 今天14:49

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

2+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

2+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

决策智能中的时间序列预测大模型

决策智能中的时间序列预测大模型

专知会员服务

34+阅读 · 2025年5月8日

《深度学习在时间序列预测中的应用：综述》

《深度学习在时间序列预测中的应用：综述》

专知会员服务

30+阅读 · 2025年3月14日

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

专知会员服务

85+阅读 · 2023年5月22日

【干货书】用于数据科学分析和预测的时间序列，529页pdf

【干货书】用于数据科学分析和预测的时间序列，529页pdf

专知会员服务

123+阅读 · 2022年10月10日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

时空序列预测方法综述

时空序列预测方法综述

专知会员服务

171+阅读 · 2020年10月18日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

【UCLA论文】利用神经网络进行时间序列预测的综合分析，Comprehensive Analysis of Time Series Forecasting Using Neural Networks

专知会员服务

97+阅读 · 2020年2月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

基于LSTM深层神经网络的时间序列预测

基于LSTM深层神经网络的时间序列预测

论智

22+阅读 · 2018年9月4日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

Deep Learning Network-Temporal Models For Traffic Prediction

Arxiv

0+阅读 · 3月12日

FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting

Arxiv

0+阅读 · 3月10日

Towards Accurate and Interpretable Time-series Forecasting: A Polynomial Learning Approach

Arxiv

0+阅读 · 3月3日

Learning Long-Range Dependencies with Temporal Predictive Coding

Arxiv

0+阅读 · 2月20日

A Decomposable Forward Process in Diffusion Models for Time-Series Forecasting

Arxiv

0+阅读 · 2月16日

Semantic-Enhanced Time-Series Forecasting via Large Language Models

Arxiv

0+阅读 · 2月11日

FreqLens: Interpretable Frequency Attribution for Time Series Forecasting

Arxiv

0+阅读 · 2月9日

Empowering Time Series Analysis with Large-Scale Multimodal Pretraining

Arxiv

0+阅读 · 2月5日

T-LLM: Teaching Large Language Models to Forecast Time Series via Temporal Distillation

Arxiv

0+阅读 · 2月2日

Sequence Diffusion Model for Temporal Link Prediction in Continuous-Time Dynamic Graph

Arxiv

0+阅读 · 1月30日

相关基金

基于时变回声状态网的光伏发电在线短期预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于Memetic多目标时变优化的全基因代谢网络重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员