Byte Pair Encoding for Efficient Time Series Forecasting - 专知论文

会员服务 ·

0

序列 · 时间序列 · 基元 · 序列预测 · 编码方法 ·

Byte Pair Encoding for Efficient Time Series Forecasting

翻译：面向高效时间序列预测的字节对编码方法

Leon Götz,Marcel Kollovieh,Stephan Günnemann,Leo Schwinn

from arxiv, 29 pages in total, 22 figures

Existing time series tokenization methods predominantly encode a constant number of samples into individual tokens. This inflexible approach can generate excessive tokens for even simple patterns like extended constant values, resulting in substantial computational overhead. Inspired by the success of byte pair encoding, we propose the first pattern-centric tokenization scheme for time series analysis. Based on a discrete vocabulary of frequent motifs, our method merges samples with underlying patterns into tokens, compressing time series adaptively. Exploiting our finite set of motifs and the continuous properties of time series, we further introduce conditional decoding as a lightweight yet powerful post-hoc optimization method, which requires no gradient computation and adds no computational overhead. On recent time series foundation models, our motif-based tokenization improves forecasting performance by 36% and boosts efficiency by 1990% on average. Conditional decoding further reduces MSE by up to 44%. In an extensive analysis, we demonstrate the adaptiveness of our tokenization to diverse temporal patterns, its generalization to unseen data, and its meaningful token representations capturing distinct time series properties, including statistical moments and trends.

翻译：现有时间序列标记化方法主要将固定数量的样本编码为单个标记。这种僵化的方法即使对简单模式（如持续恒定值）也会生成过多标记，导致显著的计算开销。受字节对编码成功应用的启发，我们提出了首个面向时间序列分析的以模式为中心的标记化方案。基于频繁基元的离散词汇表，我们的方法将具有底层模式的样本合并为标记，从而自适应地压缩时间序列。利用有限的基元集合和时间序列的连续特性，我们进一步引入了条件解码作为轻量级但强大的事后优化方法，该方法无需梯度计算且不增加计算开销。在近期的时间序列基础模型上，我们基于基元的标记化方法将预测性能平均提升36%，效率平均提升1990%。条件解码进一步将均方误差降低高达44%。通过广泛分析，我们证明了我们的标记化方法对多样化时序模式的自适应性、对未见数据的泛化能力，以及其能够捕获包括统计矩和趋势在内的不同时间序列特性的有意义的标记表示。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【AAAI2025】TimeDP：通过领域提示学习生成多领域时间序列

【AAAI2025】TimeDP：通过领域提示学习生成多领域时间序列

专知会员服务

14+阅读 · 2025年1月10日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

68+阅读 · 2024年5月11日

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

专知会员服务

85+阅读 · 2023年5月22日

12篇顶会论文，深度学习时间序列预测经典方案汇总！

12篇顶会论文，深度学习时间序列预测经典方案汇总！

专知会员服务

55+阅读 · 2022年4月11日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

144+阅读 · 2022年4月8日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

专知会员服务

41+阅读 · 2020年11月18日

时空序列预测方法综述

时空序列预测方法综述

专知会员服务

171+阅读 · 2020年10月18日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

30+阅读 · 2022年5月26日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【Manning新书】 Python中时间序列预测，222页pdf手把手教你实战时序建模

【Manning新书】 Python中时间序列预测，222页pdf手把手教你实战时序建模

专知

28+阅读 · 2022年3月29日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

R语言时间序列分析

R语言时间序列分析

R语言中文社区

12+阅读 · 2018年11月19日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

高准度二代测序比对算法

国家自然科学基金

3+阅读 · 2015年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

A Decomposable Forward Process in Diffusion Models for Time-Series Forecasting

Arxiv

0+阅读 · 2月16日

Kairos: Toward Adaptive and Parameter-Efficient Time Series Foundation Models

Arxiv

0+阅读 · 2月13日

Instruction-based Time Series Editing

Arxiv

0+阅读 · 2月13日

Discrete Chi-Square Method can model and forecast complex time series

Arxiv

0+阅读 · 2月12日

Temporally Unified Adversarial Perturbations for Time Series Forecasting

Arxiv

0+阅读 · 2月12日

Semantic-Enhanced Time-Series Forecasting via Large Language Models

Arxiv

0+阅读 · 2月11日

An Optimization Method for Autoregressive Time Series Forecasting

Arxiv

0+阅读 · 2月2日

Dual-Prototype Disentanglement: A Context-Aware Enhancement Framework for Time Series Forecasting

Arxiv

0+阅读 · 1月27日

Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting

Arxiv

0+阅读 · 1月21日

InstructTime++: Time Series Classification with Multimodal Language Modeling via Implicit Feature Enhancement

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 53分钟前

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 55分钟前

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【AAAI2025】TimeDP：通过领域提示学习生成多领域时间序列

【AAAI2025】TimeDP：通过领域提示学习生成多领域时间序列

专知会员服务

14+阅读 · 2025年1月10日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

68+阅读 · 2024年5月11日

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

时序挖掘如何预训练？华南理工最新《时间序列预训练模型》综述，29页pdf详述时序预训练方法体系

专知会员服务

85+阅读 · 2023年5月22日

12篇顶会论文，深度学习时间序列预测经典方案汇总！

12篇顶会论文，深度学习时间序列预测经典方案汇总！

专知会员服务

55+阅读 · 2022年4月11日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

144+阅读 · 2022年4月8日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

最新《深度学习序列标记》综述论文，16页pdf134篇参考文献

专知会员服务

41+阅读 · 2020年11月18日

时空序列预测方法综述

时空序列预测方法综述

专知会员服务

171+阅读 · 2020年10月18日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

30+阅读 · 2022年5月26日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【Manning新书】 Python中时间序列预测，222页pdf手把手教你实战时序建模

【Manning新书】 Python中时间序列预测，222页pdf手把手教你实战时序建模

专知

28+阅读 · 2022年3月29日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

R语言时间序列分析

R语言时间序列分析

R语言中文社区

12+阅读 · 2018年11月19日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

相关论文

A Decomposable Forward Process in Diffusion Models for Time-Series Forecasting

Arxiv

0+阅读 · 2月16日

Kairos: Toward Adaptive and Parameter-Efficient Time Series Foundation Models

Arxiv

0+阅读 · 2月13日

Instruction-based Time Series Editing

Arxiv

0+阅读 · 2月13日

Discrete Chi-Square Method can model and forecast complex time series

Arxiv

0+阅读 · 2月12日

Temporally Unified Adversarial Perturbations for Time Series Forecasting

Arxiv

0+阅读 · 2月12日

Semantic-Enhanced Time-Series Forecasting via Large Language Models

Arxiv

0+阅读 · 2月11日

An Optimization Method for Autoregressive Time Series Forecasting

Arxiv

0+阅读 · 2月2日

Dual-Prototype Disentanglement: A Context-Aware Enhancement Framework for Time Series Forecasting

Arxiv

0+阅读 · 1月27日

Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting

Arxiv

0+阅读 · 1月21日

InstructTime++: Time Series Classification with Multimodal Language Modeling via Implicit Feature Enhancement

Arxiv

0+阅读 · 1月21日

相关基金

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

高准度二代测序比对算法

国家自然科学基金

3+阅读 · 2015年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员