Split-and-Conquer: Distributed Factor Modeling for High-Dimensional Matrix-Variate Time Series - 专知论文

会员服务 ·

0

时序数据 · 因子 · 时序 · 高维 · 分析 ·

Split-and-Conquer: Distributed Factor Modeling for High-Dimensional Matrix-Variate Time Series

翻译：分割与征服：面向高维矩阵时序数据的分布式因子建模

Hangjin Jiang,Yuzhou Li,Zhaoxing Gao

In this paper, we propose a distributed framework for reducing the dimensionality of high-dimensional, large-scale, heterogeneous matrix-variate time series data using a factor model. The data are first partitioned column-wise (or row-wise) and allocated to node servers, where each node estimates the row (or column) loading matrix via two-dimensional tensor PCA. These local estimates are then transmitted to a central server and aggregated, followed by a final PCA step to obtain the global row (or column) loading matrix estimator. Given the estimated loading matrices, the corresponding factor matrices are subsequently computed. Unlike existing distributed approaches, our framework preserves the latent matrix structure, thereby improving computational efficiency and enhancing information utilization. We also discuss row- and column-wise clustering procedures for settings in which the group memberships are unknown. Furthermore, we extend the analysis to unit-root nonstationary matrix-variate time series. Asymptotic properties of the proposed method are derived for the diverging dimension of the data in each computing unit and the sample size $T$. Simulation results assess the computational efficiency and estimation accuracy of the proposed framework, and real data applications further validate its predictive performance.

翻译：本文提出了一种分布式框架，用于通过因子模型对高维、大规模、异构的矩阵时序数据进行降维处理。数据首先按列方向（或行方向）进行划分并分配至节点服务器，各节点通过二维张量主成分分析估计行（或列）载荷矩阵。这些局部估计值随后传输至中央服务器进行聚合，再经过最终的主成分分析步骤得到全局的行（或列）载荷矩阵估计量。在获得估计的载荷矩阵后，可进一步计算相应的因子矩阵。与现有分布式方法不同，本框架保留了潜在的矩阵结构，从而提升了计算效率并增强了信息利用率。我们还讨论了在组别归属未知情况下的行向与列向聚类流程。此外，我们将分析扩展至单位根非平稳矩阵时序数据。针对每个计算单元中数据维度与样本量$T$发散的情形，推导了所提方法的渐近性质。仿真实验评估了该框架的计算效率与估计精度，实际数据应用进一步验证了其预测性能。

0

相关内容

时序数据

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

42+阅读 · 2025年12月16日

时间序列大模型综述

时间序列大模型综述

专知会员服务

46+阅读 · 2025年4月8日

「深度时间序列模型」综述

「深度时间序列模型」综述

专知会员服务

44+阅读 · 2024年7月19日

《大规模分布式图算法》综述

《大规模分布式图算法》综述

专知会员服务

28+阅读 · 2024年4月11日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

GNN如何建模时间序列？莫纳什大学等最新《时间序列图神经网络综述:预测、分类、插补和异常检测》，27页pdf

GNN如何建模时间序列？莫纳什大学等最新《时间序列图神经网络综述:预测、分类、插补和异常检测》，27页pdf

专知会员服务

102+阅读 · 2023年7月11日

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

专知会员服务

86+阅读 · 2023年3月23日

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

专知会员服务

86+阅读 · 2022年5月5日

【ECML-PKDD 2019】多维时间序列和事件日志的模式挖掘和异常检测框架（A framework for pattern mining and anomalydetection in multi-dimensional time series andevent logs）

【ECML-PKDD 2019】多维时间序列和事件日志的模式挖掘和异常检测框架（A framework for pattern mining and anomalydetection in multi-dimensional time series andevent logs）

专知会员服务

38+阅读 · 2019年12月1日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

Spark机器学习：矩阵及推荐算法

Spark机器学习：矩阵及推荐算法

LibRec智能推荐

16+阅读 · 2017年8月3日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

天文大数据中时序图像子集高效检索方法与系统研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维高频数据下金融资产积分波动率矩阵的统计分析

国家自然科学基金

2+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

高维时空场数据的层次张量建模与分析方法

国家自然科学基金

2+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

城市建筑群空间分布模式的识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月18日

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月17日

On the relation between Global VAR Models and Matrix Time Series Models with Multiple Terms

Arxiv

0+阅读 · 2月13日

Modelling multivariate ordinal time series using pairwise likelihood

Arxiv

0+阅读 · 2月13日

Modewise Additive Factor Model for Matrix Time Series

Arxiv

0+阅读 · 2月10日

Interpretable Dynamic Network Modeling of Tensor Time Series via Kronecker Time-Varying Graphical Lasso

Arxiv

0+阅读 · 2月9日

Regularized Estimation of the Loading Matrix in Factor Models for High-Dimensional Time Series

Arxiv

0+阅读 · 1月30日

Bilateral Distribution Compression: Reducing Both Data Size and Dimensionality

Arxiv

0+阅读 · 1月27日

Associating High-Dimensional Longitudinal Datasets through an Efficient Cross-Covariance Decomposition

Arxiv

0+阅读 · 1月19日

Data-Driven Dynamic Factor Modeling via Manifold Learning

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

1+阅读 · 49分钟前

多智能体协作机制

多智能体协作机制

专知会员服务

0+阅读 · 53分钟前

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

14+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

6+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

9+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

7+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

8+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

7+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

10+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

14+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

10+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

5+阅读 · 4月24日

相关VIP内容

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

42+阅读 · 2025年12月16日

时间序列大模型综述

时间序列大模型综述

专知会员服务

46+阅读 · 2025年4月8日

「深度时间序列模型」综述

「深度时间序列模型」综述

专知会员服务

44+阅读 · 2024年7月19日

《大规模分布式图算法》综述

《大规模分布式图算法》综述

专知会员服务

28+阅读 · 2024年4月11日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

GNN如何建模时间序列？莫纳什大学等最新《时间序列图神经网络综述:预测、分类、插补和异常检测》，27页pdf

GNN如何建模时间序列？莫纳什大学等最新《时间序列图神经网络综述:预测、分类、插补和异常检测》，27页pdf

专知会员服务

102+阅读 · 2023年7月11日

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

中科院计算所最新《时态数据因果发现》综述，50页pdf详述多元时间和事件序列因果发现

专知会员服务

86+阅读 · 2023年3月23日

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

Transformers如何进行时序分析？Rowan大学最新《Transformers时序分析》综述

专知会员服务

86+阅读 · 2022年5月5日

【ECML-PKDD 2019】多维时间序列和事件日志的模式挖掘和异常检测框架（A framework for pattern mining and anomalydetection in multi-dimensional time series andevent logs）

【ECML-PKDD 2019】多维时间序列和事件日志的模式挖掘和异常检测框架（A framework for pattern mining and anomalydetection in multi-dimensional time series andevent logs）

专知会员服务

38+阅读 · 2019年12月1日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

91+阅读 · 2019年11月20日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

Spark机器学习：矩阵及推荐算法

Spark机器学习：矩阵及推荐算法

LibRec智能推荐

16+阅读 · 2017年8月3日

相关论文

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月18日

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月17日

On the relation between Global VAR Models and Matrix Time Series Models with Multiple Terms

Arxiv

0+阅读 · 2月13日

Modelling multivariate ordinal time series using pairwise likelihood

Arxiv

0+阅读 · 2月13日

Modewise Additive Factor Model for Matrix Time Series

Arxiv

0+阅读 · 2月10日

Interpretable Dynamic Network Modeling of Tensor Time Series via Kronecker Time-Varying Graphical Lasso

Arxiv

0+阅读 · 2月9日

Regularized Estimation of the Loading Matrix in Factor Models for High-Dimensional Time Series

Arxiv

0+阅读 · 1月30日

Bilateral Distribution Compression: Reducing Both Data Size and Dimensionality

Arxiv

0+阅读 · 1月27日

Associating High-Dimensional Longitudinal Datasets through an Efficient Cross-Covariance Decomposition

Arxiv

0+阅读 · 1月19日

Data-Driven Dynamic Factor Modeling via Manifold Learning

Arxiv

0+阅读 · 1月15日

相关基金

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

天文大数据中时序图像子集高效检索方法与系统研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维高频数据下金融资产积分波动率矩阵的统计分析

国家自然科学基金

2+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

高维时空场数据的层次张量建模与分析方法

国家自然科学基金

2+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

城市建筑群空间分布模式的识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员