Dataset-Driven Channel Masks in Transformers for Multivariate Time Series - 专知论文

会员服务 ·

0

通道 · 数据集 · 掩码 · 序列 · 时间序列 ·

Dataset-Driven Channel Masks in Transformers for Multivariate Time Series

翻译：基于数据集驱动的Transformer通道掩码在多元时间序列中的应用

Seunghan Lee,Taeyoung Park,Kibok Lee

from arxiv, ICASSP 2026. Preliminary version: NeurIPS Workshop on Time Series in the Age of Large Models 2024 (Oral presentation)

Recent advancements in foundation models have been successfully extended to the time series (TS) domain, facilitated by the emergence of large-scale TS datasets. However, previous efforts have primarily Capturing channel dependency (CD) is essential for modeling multivariate time series (TS), and attention-based methods have been widely employed for this purpose. Nonetheless, these methods primarily focus on modifying the architecture, often neglecting the importance of dataset-specific characteristics. In this work, we introduce the concept of partial channel dependence (PCD) to enhance CD modeling in Transformer-based models by leveraging dataset-specific information to refine the CD captured by the model. To achieve PCD, we propose channel masks (CMs), which are integrated into the attention matrices of Transformers via element-wise multiplication. CMs consist of two components: 1) a similarity matrix that captures relationships between the channels, and 2) dataset-specific and learnable domain parameters that refine the similarity matrix. We validate the effectiveness of PCD across diverse tasks and datasets with various backbones. Code is available at this repository: https://github.com/YonseiML/pcd.

翻译：近年来，基础模型的进展已成功扩展至时间序列领域，这得益于大规模时间序列数据集的涌现。然而，先前的研究主要聚焦于通过调整架构来捕捉通道依赖性，而通道依赖性的建模对于多元时间序列分析至关重要，基于注意力机制的方法已被广泛用于此目的。尽管如此，这些方法往往忽视了数据集特定特征的重要性。在本研究中，我们引入了部分通道依赖性的概念，旨在通过利用数据集特定信息来优化Transformer模型所捕获的通道依赖性，从而增强基于Transformer的模型在通道依赖性建模方面的性能。为实现部分通道依赖性，我们提出了通道掩码，该掩码通过逐元素乘法集成到Transformer的注意力矩阵中。通道掩码由两个部分组成：1) 捕捉通道间关系的相似性矩阵，以及2) 基于数据集特定且可学习的领域参数，用于优化相似性矩阵。我们在多种任务和数据集上，结合不同的骨干网络，验证了部分通道依赖性的有效性。代码可在以下仓库获取：https://github.com/YonseiML/pcd。

0

相关内容

【博士论文】改进时间序列建模：应对真实世界序列数据的挑战与方法

【博士论文】改进时间序列建模：应对真实世界序列数据的挑战与方法

专知会员服务

23+阅读 · 2025年11月12日

图深度学习在时间序列处理中的应用：预测、重构与分析

图深度学习在时间序列处理中的应用：预测、重构与分析

专知会员服务

35+阅读 · 2024年11月30日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

69+阅读 · 2024年5月11日

时间序列和时空数据扩散模型综述

时间序列和时空数据扩散模型综述

专知会员服务

64+阅读 · 2024年5月1日

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型

专知会员服务

20+阅读 · 2024年3月16日

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

专知会员服务

86+阅读 · 2022年5月5日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

【Reza Yazdanfar】基于递归神经网络的多元缺失值时间序列

【Reza Yazdanfar】基于递归神经网络的多元缺失值时间序列

专知会员服务

21+阅读 · 2022年3月16日

阿里巴巴发布最新《时间序列Transformer建模》综述论文

阿里巴巴发布最新《时间序列Transformer建模》综述论文

专知会员服务

137+阅读 · 2022年2月16日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

车-车通信时变信道多径动态簇建模研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

基于时序空间关系的目标跟踪及遮挡识别研究

国家自然科学基金

6+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Deep Learning Network-Temporal Models For Traffic Prediction

Arxiv

0+阅读 · 3月12日

A statistical perspective on transformers for small longitudinal cohort data

Arxiv

0+阅读 · 2月18日

Enhancing Multivariate Time Series Forecasting with Global Temporal Retrieval

Arxiv

0+阅读 · 2月11日

Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting

Arxiv

0+阅读 · 2月10日

Low Rank Transformer for Multivariate Time Series Anomaly Detection and Localization

Arxiv

0+阅读 · 2月9日

Interpretable Dynamic Network Modeling of Tensor Time Series via Kronecker Time-Varying Graphical Lasso

Arxiv

0+阅读 · 2月9日

Revisiting the Generic Transformer: Deconstructing a Strong Baseline for Time Series Foundation Models

Arxiv

0+阅读 · 2月6日

Empowering Time Series Analysis with Large-Scale Multimodal Pretraining

Arxiv

0+阅读 · 2月5日

CATS: Enhancing Multivariate Time Series Forecasting by Constructing Auxiliary Time Series as Exogenous Variables

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 今天14:49

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

2+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

2+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

【博士论文】改进时间序列建模：应对真实世界序列数据的挑战与方法

【博士论文】改进时间序列建模：应对真实世界序列数据的挑战与方法

专知会员服务

23+阅读 · 2025年11月12日

图深度学习在时间序列处理中的应用：预测、重构与分析

图深度学习在时间序列处理中的应用：预测、重构与分析

专知会员服务

35+阅读 · 2024年11月30日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

69+阅读 · 2024年5月11日

时间序列和时空数据扩散模型综述

时间序列和时空数据扩散模型综述

专知会员服务

64+阅读 · 2024年5月1日

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型

【CVPR2024】掩码自解码器是有效的多任务视觉通用模型

专知会员服务

20+阅读 · 2024年3月16日

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

专知会员服务

86+阅读 · 2022年5月5日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

【Reza Yazdanfar】基于递归神经网络的多元缺失值时间序列

【Reza Yazdanfar】基于递归神经网络的多元缺失值时间序列

专知会员服务

21+阅读 · 2022年3月16日

阿里巴巴发布最新《时间序列Transformer建模》综述论文

阿里巴巴发布最新《时间序列Transformer建模》综述论文

专知会员服务

137+阅读 · 2022年2月16日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

相关论文

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Deep Learning Network-Temporal Models For Traffic Prediction

Arxiv

0+阅读 · 3月12日

A statistical perspective on transformers for small longitudinal cohort data

Arxiv

0+阅读 · 2月18日

Enhancing Multivariate Time Series Forecasting with Global Temporal Retrieval

Arxiv

0+阅读 · 2月11日

Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting

Arxiv

0+阅读 · 2月10日

Low Rank Transformer for Multivariate Time Series Anomaly Detection and Localization

Arxiv

0+阅读 · 2月9日

Interpretable Dynamic Network Modeling of Tensor Time Series via Kronecker Time-Varying Graphical Lasso

Arxiv

0+阅读 · 2月9日

Revisiting the Generic Transformer: Deconstructing a Strong Baseline for Time Series Foundation Models

Arxiv

0+阅读 · 2月6日

Empowering Time Series Analysis with Large-Scale Multimodal Pretraining

Arxiv

0+阅读 · 2月5日

CATS: Enhancing Multivariate Time Series Forecasting by Constructing Auxiliary Time Series as Exogenous Variables

Arxiv

0+阅读 · 2月5日

相关基金

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

车-车通信时变信道多径动态簇建模研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

基于时序空间关系的目标跟踪及遮挡识别研究

国家自然科学基金

6+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员