Network Design for Wafer-Scale Systems with Wafer-on-Wafer Hybrid Bonding - 专知论文

会员服务 ·

0

混合 · 系统 · 网络设计 · 设计 · 传输 ·

Network Design for Wafer-Scale Systems with Wafer-on-Wafer Hybrid Bonding

翻译：面向晶圆间混合键合晶圆级系统的网络设计

Patrick Iff,Tommaso Bonato,Maciej Besta,Luca Benini,Torsten Hoefler

Transformer-based large language models are increasingly constrained by data movement as communication bandwidth drops sharply beyond the chip boundary. Wafer-scale integration using wafer-on-wafer hybrid bonding alleviates this limitation by providing ultra-high bandwidth between reticles on bonded wafers. In this paper, we investigate how the physical placement of reticles on wafers influences the achievable network topology and the resulting communication performance. Starting from a 2D mesh-like baseline, we propose four reticle placements (Aligned, Interleaved, Rotated, and Contoured) that improve throughput by up to 250%, reduce latency by up to 36%, and decrease energy per transmitted byte by up to 38%.

翻译：基于Transformer的大语言模型日益受到数据传输瓶颈的制约，因为通信带宽在芯片边界外急剧下降。采用晶圆间混合键合的晶圆级集成技术，通过在键合晶圆上的掩模版之间提供超高带宽来缓解这一限制。在本文中，我们研究了掩模版在晶圆上的物理布局如何影响可达网络拓扑结构以及由此产生的通信性能。以2D类网格基线为起点，我们提出了四种掩模版布局方案（对齐式、交错式、旋转式和轮廓式），这些方案可将吞吐量提升高达250%，延迟降低高达36%，并使每传输字节的能耗减少高达38%。

0

相关内容

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

专知会员服务

23+阅读 · 2022年3月28日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

专知会员服务

116+阅读 · 2019年12月30日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【数字孪生】数字孪生是工业互联网关键技术和重要场景

【数字孪生】数字孪生是工业互联网关键技术和重要场景

产业智能官

39+阅读 · 2019年4月9日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

使用tinc构建full mesh结构的VPN

使用tinc构建full mesh结构的VPN

运维帮

68+阅读 · 2018年12月1日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

专知

14+阅读 · 2018年3月30日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向三维集成的基于纳米颗粒修饰的晶圆级互连技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

异构网络中的分层并发传输技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

弹性的光与无线前传融合接入网系统的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

三维片上网络芯片关键设计技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

EnCoR: An end-to-end architecture for simplifying cellular networks

Arxiv

0+阅读 · 5月22日

DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces

Arxiv

0+阅读 · 4月29日

Scaling Multi-Node Mixture-of-Experts Inference Using Expert Activation Patterns

Arxiv

0+阅读 · 4月25日

Verifying In-Network Computing Systems for Design Risks

Arxiv

0+阅读 · 4月21日

ChipLight: Cross-Layer Optimization of Chiplet Design with Optical Interconnects for LLM Training

Arxiv

0+阅读 · 4月20日

TRAPTI: Time-Resolved Analysis for SRAM Banking and Power Gating Optimization in Embedded Transformer Inference

Arxiv

0+阅读 · 4月8日

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Arxiv

0+阅读 · 4月2日

Benchmarking simulation of hybrid decoding scheme for parity-encoded spin systems

Arxiv

0+阅读 · 3月29日

Characterization of Off-wafer Pulse Communication in BrainScaleS Neuromorphic System

Arxiv

0+阅读 · 3月25日

State Space Model for New-Generation Network Alternative to Transformers: A Survey

Arxiv

14+阅读 · 2024年4月15日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

专知会员服务

23+阅读 · 2022年3月28日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

专知会员服务

116+阅读 · 2019年12月30日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【数字孪生】数字孪生是工业互联网关键技术和重要场景

【数字孪生】数字孪生是工业互联网关键技术和重要场景

产业智能官

39+阅读 · 2019年4月9日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

使用tinc构建full mesh结构的VPN

使用tinc构建full mesh结构的VPN

运维帮

68+阅读 · 2018年12月1日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

专知

14+阅读 · 2018年3月30日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

EnCoR: An end-to-end architecture for simplifying cellular networks

Arxiv

0+阅读 · 5月22日

DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces

Arxiv

0+阅读 · 4月29日

Scaling Multi-Node Mixture-of-Experts Inference Using Expert Activation Patterns

Arxiv

0+阅读 · 4月25日

Verifying In-Network Computing Systems for Design Risks

Arxiv

0+阅读 · 4月21日

ChipLight: Cross-Layer Optimization of Chiplet Design with Optical Interconnects for LLM Training

Arxiv

0+阅读 · 4月20日

TRAPTI: Time-Resolved Analysis for SRAM Banking and Power Gating Optimization in Embedded Transformer Inference

Arxiv

0+阅读 · 4月8日

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Arxiv

0+阅读 · 4月2日

Benchmarking simulation of hybrid decoding scheme for parity-encoded spin systems

Arxiv

0+阅读 · 3月29日

Characterization of Off-wafer Pulse Communication in BrainScaleS Neuromorphic System

Arxiv

0+阅读 · 3月25日

State Space Model for New-Generation Network Alternative to Transformers: A Survey

Arxiv

14+阅读 · 2024年4月15日

相关基金

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向三维集成的基于纳米颗粒修饰的晶圆级互连技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

异构网络中的分层并发传输技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

弹性的光与无线前传融合接入网系统的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

三维片上网络芯片关键设计技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员