MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts - 专知论文

会员服务 ·

0

序列 · 异构 · 混合 · 片段 · 时间序列 ·

MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts

翻译：MoHETS：基于异构专家混合的长期时间序列预测

Evandro S. Ortigossa,Guy Lutsker,Eran Segal

from arxiv, Under review

Real-world multivariate time series can exhibit intricate multi-scale structures, including global trends, local periodicities, and non-stationary regimes, which makes long-horizon forecasting challenging. Although sparse Mixture-of-Experts (MoE) approaches improve scalability and specialization, they typically rely on homogeneous MLP experts that poorly capture the diverse temporal dynamics of time series data. We address these limitations with MoHETS, an encoder-only Transformer that integrates sparse Mixture-of-Heterogeneous-Experts (MoHE) layers. MoHE routes temporal patches to a small subset of expert networks, combining a shared depthwise-convolution expert for sequence-level continuity with routed Fourier-based experts for patch-level periodic structures. MoHETS further improves robustness to non-stationary dynamics by incorporating exogenous information via cross-attention over covariate patch embeddings. Finally, we replace parameter-heavy linear projection heads with a lightweight convolutional patch decoder, improving parameter efficiency, reducing training instability, and allowing a single model to generalize across arbitrary forecast horizons. We validate across seven multivariate benchmarks and multiple horizons, with MoHETS consistently achieving state-of-the-art performance, reducing the average MSE by $12\%$ compared to strong recent baselines, demonstrating effective heterogeneous specialization for long-term forecasting.

翻译：现实世界的多元时间序列可能呈现出复杂的多尺度结构，包括全局趋势、局部周期性以及非平稳状态，这使得长期预测具有挑战性。尽管稀疏的专家混合方法提升了可扩展性和专业化程度，但它们通常依赖于同质的MLP专家，难以有效捕捉时间序列数据中多样的时序动态。我们通过MoHETS解决了这些局限性，这是一种仅包含编码器的Transformer模型，集成了稀疏的异构专家混合层。MoHE将时序片段路由至一小部分专家网络，其中结合了一个共享的深度卷积专家以保持序列级连续性，以及多个基于傅里叶的专家以处理片段级周期性结构。MoHETS进一步通过对协变量片段嵌入进行交叉注意力机制引入外生信息，增强了对非平稳动态的鲁棒性。最后，我们用轻量级的卷积片段解码器取代了参数密集的线性投影头，从而提高了参数效率，减少了训练不稳定性，并允许单一模型泛化至任意预测长度。我们在七个多元基准数据集和多个预测长度上进行了验证，MoHETS始终取得最先进的性能，相较于近期强基线模型，平均MSE降低了$12\%$，证明了其在长期预测中异构专家专业化的有效性。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

【KDD2025】DUET：双重聚类增强的多变量时间序列预测

【KDD2025】DUET：双重聚类增强的多变量时间序列预测

专知会员服务

17+阅读 · 2024年12月30日

「深度时间序列模型」综述

「深度时间序列模型」综述

专知会员服务

44+阅读 · 2024年7月19日

深度学习和基础模型在时间序列预测中的综述

深度学习和基础模型在时间序列预测中的综述

专知会员服务

50+阅读 · 2024年1月26日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

143+阅读 · 2022年4月8日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

42+阅读 · 2021年11月12日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【经典书】时间序列分析与预测导论，671页pdf

【经典书】时间序列分析与预测导论，671页pdf

专知

15+阅读 · 2022年4月1日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

你真的懂时间序列预测吗？

你真的懂时间序列预测吗？

腾讯大讲堂

104+阅读 · 2019年1月7日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

HPMixer: Hierarchical Patching for Multivariate Time Series Forecasting

Arxiv

0+阅读 · 2月18日

Hybrid Feature Learning with Time Series Embeddings for Equipment Anomaly Prediction

Arxiv

0+阅读 · 2月16日

Enhancing Multivariate Time Series Forecasting with Global Temporal Retrieval

Arxiv

0+阅读 · 2月11日

Let Experts Feel Uncertainty: A Multi-Expert Label Distribution Approach to Probabilistic Time Series Forecasting

Arxiv

0+阅读 · 2月4日

MTS-JEPA: Multi-Resolution Joint-Embedding Predictive Architecture for Time-Series Anomaly Prediction

Arxiv

0+阅读 · 2月4日

MoGU: Mixture-of-Gaussians with Uncertainty-based Gating for Time Series Forecasting

Arxiv

0+阅读 · 2月3日

AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging

Arxiv

0+阅读 · 1月31日

TimeCatcher: A Variational Framework for Volatility-Aware Forecasting of Non-Stationary Time Series

Arxiv

0+阅读 · 1月28日

Super-Linear: A Lightweight Pretrained Mixture of Linear Experts for Time Series Forecasting

Arxiv

0+阅读 · 1月27日

Task-Aware Mixture-of-Experts for Time Series Analysis

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

最新内容

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

1+阅读 · 今天14:48

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

1+阅读 · 今天14:38

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

7+阅读 · 今天8:46

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

5+阅读 · 今天7:41

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

3+阅读 · 今天7:22

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

8+阅读 · 今天6:04

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

9+阅读 · 今天5:37

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

7+阅读 · 今天5:35

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

3+阅读 · 今天5:24

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

3+阅读 · 今天5:18

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

3+阅读 · 今天3:25

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

17+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

4+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

5+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

5+阅读 · 4月23日

相关VIP内容

【KDD2025】DUET：双重聚类增强的多变量时间序列预测

【KDD2025】DUET：双重聚类增强的多变量时间序列预测

专知会员服务

17+阅读 · 2024年12月30日

「深度时间序列模型」综述

「深度时间序列模型」综述

专知会员服务

44+阅读 · 2024年7月19日

深度学习和基础模型在时间序列预测中的综述

深度学习和基础模型在时间序列预测中的综述

专知会员服务

50+阅读 · 2024年1月26日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

103+阅读 · 2022年7月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

143+阅读 · 2022年4月8日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

42+阅读 · 2021年11月12日

时间序列预测方法综述

专知会员服务

237+阅读 · 2020年12月15日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

热门VIP内容

开通专知VIP会员享更多权益服务

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

战场之外的较量：美伊冲突中的认知战与心理博弈

【NTU博士论文】3D人体动作生成

以色列军事技术对美国军力发展的持续性赋能

相关资讯

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【经典书】时间序列分析与预测导论，671页pdf

【经典书】时间序列分析与预测导论，671页pdf

专知

15+阅读 · 2022年4月1日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

你真的懂时间序列预测吗？

你真的懂时间序列预测吗？

腾讯大讲堂

104+阅读 · 2019年1月7日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

HPMixer: Hierarchical Patching for Multivariate Time Series Forecasting

Arxiv

0+阅读 · 2月18日

Hybrid Feature Learning with Time Series Embeddings for Equipment Anomaly Prediction

Arxiv

0+阅读 · 2月16日

Enhancing Multivariate Time Series Forecasting with Global Temporal Retrieval

Arxiv

0+阅读 · 2月11日

Let Experts Feel Uncertainty: A Multi-Expert Label Distribution Approach to Probabilistic Time Series Forecasting

Arxiv

0+阅读 · 2月4日

MTS-JEPA: Multi-Resolution Joint-Embedding Predictive Architecture for Time-Series Anomaly Prediction

Arxiv

0+阅读 · 2月4日

MoGU: Mixture-of-Gaussians with Uncertainty-based Gating for Time Series Forecasting

Arxiv

0+阅读 · 2月3日

AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging

Arxiv

0+阅读 · 1月31日

TimeCatcher: A Variational Framework for Volatility-Aware Forecasting of Non-Stationary Time Series

Arxiv

0+阅读 · 1月28日

Super-Linear: A Lightweight Pretrained Mixture of Linear Experts for Time Series Forecasting

Arxiv

0+阅读 · 1月27日

Task-Aware Mixture-of-Experts for Time Series Analysis

Arxiv

0+阅读 · 1月20日

相关基金

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

近似周期时间序列分析及其在程序化交易中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员