Learning time series foundation models has been shown to be a promising approach for zero-shot time series forecasting across diverse time series domains. Insofar as scaling has been a critical driver of performance of foundation models in other modalities such as language and vision, much recent work on time series foundation modeling has focused on scaling. This has resulted in time series foundation models with hundreds of millions of parameters that are, while performant, inefficient and expensive to use in practice. This paper describes a simple recipe for learning efficient foundation models for zero-shot time series forecasting that are orders of magnitude smaller. We show that large-scale transformers are not necessary: small hybrid models that interleave long convolution and linear RNN layers (in particular DeltaNet layers) can match the performance of larger transformer-based models while being more than a hundred times smaller. We also describe several data augmentation and inference strategies that further improve performance. This recipe results in Reverso, a family of efficient time series foundation models for zero-shot forecasting that significantly push the performance-efficiency Pareto frontier.


翻译:学习时间序列基础模型已被证明是实现跨领域时间序列零样本预测的一种有前景的方法。鉴于模型规模扩展一直是语言和视觉等其他模态基础模型性能提升的关键驱动力,近期许多时间序列基础模型的研究也聚焦于规模扩展。这导致了参数规模达数亿的时间序列基础模型的出现,这些模型虽然性能优异,但在实际使用中效率低下且成本高昂。本文提出了一种构建高效零样本时间序列预测基础模型的简洁方案,该方案所得模型的规模可缩小数个数量级。我们证明大规模Transformer并非必需:通过交错使用长卷积层与线性RNN层(特别是DeltaNet层)构建的小型混合模型,在性能上可媲美基于Transformer的大型模型,同时参数量减少百倍以上。我们还描述了多种数据增强与推理策略以进一步提升性能。基于此方案,我们提出了Reverso系列模型——一个显著推进性能-效率帕累托前沿的高效零样本时间序列预测基础模型家族。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
决策智能中的时间序列预测大模型
专知会员服务
34+阅读 · 1月7日
用于时间序列预测的扩散模型:综述
专知会员服务
29+阅读 · 2025年7月22日
时间序列大模型综述
专知会员服务
46+阅读 · 2025年4月8日
【NeurIPS2024】用于时间序列预测的检索增强扩散模型
专知会员服务
24+阅读 · 2024年10月25日
「深度时间序列模型」综述
专知会员服务
43+阅读 · 2024年7月19日
时间序列和时空数据扩散模型综述
专知会员服务
64+阅读 · 2024年5月1日
时空序列预测方法综述
专知
22+阅读 · 2020年10月19日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
VIP会员
相关VIP内容
决策智能中的时间序列预测大模型
专知会员服务
34+阅读 · 1月7日
用于时间序列预测的扩散模型:综述
专知会员服务
29+阅读 · 2025年7月22日
时间序列大模型综述
专知会员服务
46+阅读 · 2025年4月8日
【NeurIPS2024】用于时间序列预测的检索增强扩散模型
专知会员服务
24+阅读 · 2024年10月25日
「深度时间序列模型」综述
专知会员服务
43+阅读 · 2024年7月19日
时间序列和时空数据扩散模型综述
专知会员服务
64+阅读 · 2024年5月1日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员