Birkhoff Decompositions and Photonic Interconnects Wait! Don't Forget the Compute! - 专知论文

会员服务 ·

0

推断 · Spark · MoDELS · 讲稿 · 优化器 ·

Birkhoff Decompositions and Photonic Interconnects Wait! Don't Forget the Compute!

翻译：伯克霍夫分解与光子互连——别忘了计算！

Eliezer Amponsah,Vamsi Addanki

The growing demand for efficient communication in distributed training and inference has sparked significant interest in reconfigurable photonic interconnects across both academia and industry. Mixture-of-Experts (MoE) models, with their highly skewed communication patterns, present a natural opportunity for such circuit-switched fabrics. However, existing approaches largely optimize communication in isolation, overlooking the interaction between communication and the expert computation that follows. In this paper, we revisit circuit scheduling for all-to-all communication in MoE execution. We show that the dispatch--compute--combine structure fundamentally challenges classical scheduling techniques such as Birkhoff--von Neumann (BvN) decomposition. First, MoE communication matrices are rarely doubly stochastic, introducing significant scheduling bubbles in BvN-based schedules. Second, while decomposition enables communication--compute overlap, the excessive number of matchings produced by BvN fragments execution into small batches, leading to severe compute inefficiencies due to fixed execution overheads. Motivated by these observations, we explore a simple greedy max-weight decomposition strategy that bounds the number of matchings while preserving large batch sizes per matching. Despite its simplicity, the approach significantly improves overlap efficiency, reduces compute overheads, and approaches the performance of an ideal congestion-free all-to-all.

翻译：分布式训练和推理中对高效通信日益增长的需求，促使学术界和工业界对可重构光子互连产生了浓厚兴趣。混合专家（MoE）模型因其高度倾斜的通信模式，天然适用于这种电路交换网络。然而，现有方法主要孤立地优化通信，忽视了通信与后续专家计算之间的交互。本文重新审视了MoE执行中全对全通信的电路调度问题，揭示了“分发-计算-合并”结构从根本上挑战了伯克霍夫-冯·诺依曼（BvN）分解等经典调度技术。首先，MoE通信矩阵极少是双随机的，这会在基于BvN的调度中引入显著的调度气泡。其次，虽然分解能够实现通信与计算的重叠，但BvN产生的过多匹配数会将执行碎片化为小批量，因固定执行开销导致严重的计算效率低下。基于上述观察，我们探索了一种简单的贪心最大权重分解策略，该策略在限制匹配数的同时保持每个匹配的大批量大小。尽管方法简单，但该策略显著提升了重叠效率、降低了计算开销，并接近理想无阻塞全对全通信的性能。

0

相关内容

稀疏混合专家模型 (SMoE) 的崛起：从算法基础、去中心化架构到垂直领域应用的综述

稀疏混合专家模型 (SMoE) 的崛起：从算法基础、去中心化架构到垂直领域应用的综述

专知会员服务

17+阅读 · 2月12日

混合专家模型简述

混合专家模型简述

专知会员服务

18+阅读 · 2025年5月30日

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

46+阅读 · 2024年12月21日

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

算法、系统和应用，三个视角全面读懂《混合专家（MoE）》

算法、系统和应用，三个视角全面读懂《混合专家（MoE）》

专知会员服务

77+阅读 · 2024年7月28日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

27+阅读 · 2022年10月18日

Jeff Dean署名《深度学习稀疏专家模型》综述论文

Jeff Dean署名《深度学习稀疏专家模型》综述论文

专知会员服务

39+阅读 · 2022年10月4日

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

专知会员服务

14+阅读 · 2022年4月10日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

带宽可变的硅基模式-波长选择光开关机理及实现

国家自然科学基金

0+阅读 · 2015年12月31日

基于光学超晶格实现光纤通讯和量子存储波段的多色连续变量纠缠光场

国家自然科学基金

0+阅读 · 2015年12月31日

多原子分子与强激光场相互作用的含时理论

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

量子点中重空穴-轻空穴耦合和发光极化各向异性机制和量子调控

国家自然科学基金

0+阅读 · 2014年12月31日

莫比乌斯不变空间上复合算子若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

基于热原子系统产生连续变量多组分纠缠光源的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

硅基长波长光电集成接收机的关键技术及相关理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

AIMER: Calibration-Free Task-Agnostic MoE Expert Pruning

Arxiv

0+阅读 · 6月16日

Conflict-Aware Federated Fine-Tuning of Large Language Models with Mixture-of-Experts

Arxiv

0+阅读 · 6月14日

A theoretical model for task routing in mixture-of-expert transformers

Arxiv

0+阅读 · 6月12日

CRAFT: Fine-Grained Cost-Aware Expert Replication For Efficient Mixture-of-Experts Serving

Arxiv

0+阅读 · 5月29日

Revisiting Bruck: Phase-Efficient All-to-All Communication in Reconfigurable Networks

Arxiv

0+阅读 · 5月26日

Lynx: Enabling Efficient MoE Inference through Dynamic Batch-Aware Expert Selection

Arxiv

0+阅读 · 5月18日

SpaceMoE: Towards Orbital General Intelligence with Distributed Mixture-of-Experts Inference

Arxiv

0+阅读 · 5月16日

Sieve: Dynamic Expert-Aware PIM Acceleration for Evolving Mixture-of-Experts Models

Arxiv

0+阅读 · 5月11日

MoE-Hub: Taming Software Complexity for Seamless MoE Overlap with Hardware-Accelerated Communication on Multi-GPU Systems

Arxiv

0+阅读 · 5月7日

AxMoE: Characterizing the Impact of Approximate Multipliers on Mixture-of-Experts DNN Architectures

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

1+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

稀疏混合专家模型 (SMoE) 的崛起：从算法基础、去中心化架构到垂直领域应用的综述

稀疏混合专家模型 (SMoE) 的崛起：从算法基础、去中心化架构到垂直领域应用的综述

专知会员服务

17+阅读 · 2月12日

混合专家模型简述

混合专家模型简述

专知会员服务

18+阅读 · 2025年5月30日

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

46+阅读 · 2024年12月21日

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

算法、系统和应用，三个视角全面读懂《混合专家（MoE）》

算法、系统和应用，三个视角全面读懂《混合专家（MoE）》

专知会员服务

77+阅读 · 2024年7月28日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

27+阅读 · 2022年10月18日

Jeff Dean署名《深度学习稀疏专家模型》综述论文

Jeff Dean署名《深度学习稀疏专家模型》综述论文

专知会员服务

39+阅读 · 2022年10月4日

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

专知会员服务

14+阅读 · 2022年4月10日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

相关论文

AIMER: Calibration-Free Task-Agnostic MoE Expert Pruning

Arxiv

0+阅读 · 6月16日

Conflict-Aware Federated Fine-Tuning of Large Language Models with Mixture-of-Experts

Arxiv

0+阅读 · 6月14日

A theoretical model for task routing in mixture-of-expert transformers

Arxiv

0+阅读 · 6月12日

CRAFT: Fine-Grained Cost-Aware Expert Replication For Efficient Mixture-of-Experts Serving

Arxiv

0+阅读 · 5月29日

Revisiting Bruck: Phase-Efficient All-to-All Communication in Reconfigurable Networks

Arxiv

0+阅读 · 5月26日

Lynx: Enabling Efficient MoE Inference through Dynamic Batch-Aware Expert Selection

Arxiv

0+阅读 · 5月18日

SpaceMoE: Towards Orbital General Intelligence with Distributed Mixture-of-Experts Inference

Arxiv

0+阅读 · 5月16日

Sieve: Dynamic Expert-Aware PIM Acceleration for Evolving Mixture-of-Experts Models

Arxiv

0+阅读 · 5月11日

MoE-Hub: Taming Software Complexity for Seamless MoE Overlap with Hardware-Accelerated Communication on Multi-GPU Systems

Arxiv

0+阅读 · 5月7日

AxMoE: Characterizing the Impact of Approximate Multipliers on Mixture-of-Experts DNN Architectures

Arxiv

0+阅读 · 5月6日

相关基金

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

带宽可变的硅基模式-波长选择光开关机理及实现

国家自然科学基金

0+阅读 · 2015年12月31日

基于光学超晶格实现光纤通讯和量子存储波段的多色连续变量纠缠光场

国家自然科学基金

0+阅读 · 2015年12月31日

多原子分子与强激光场相互作用的含时理论

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

量子点中重空穴-轻空穴耦合和发光极化各向异性机制和量子调控

国家自然科学基金

0+阅读 · 2014年12月31日

莫比乌斯不变空间上复合算子若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

基于热原子系统产生连续变量多组分纠缠光源的实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

硅基长波长光电集成接收机的关键技术及相关理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员