Network Design for Wafer-Scale Systems with Wafer-on-Wafer Hybrid Bonding - 专知论文

会员服务 ·

0

混合 · 系统 · 网络设计 · 带宽 · 设计 ·

Network Design for Wafer-Scale Systems with Wafer-on-Wafer Hybrid Bonding

翻译：基于晶圆间混合键合的晶圆级系统网络设计

Patrick Iff,Tommaso Bonato,Maciej Besta,Luca Benini,Torsten Hoefler

Transformer-based large language models are increasingly constrained by data movement as communication bandwidth drops sharply beyond the chip boundary. Wafer-scale integration using wafer-on-wafer hybrid bonding alleviates this limitation by providing ultra-high bandwidth between reticles on bonded wafers. In this paper, we investigate how the physical placement of reticles on wafers influences the achievable network topology and the resulting communication performance. Starting from a 2D mesh-like baseline, we propose four reticle placements (Aligned, Interleaved, Rotated, and Contoured) that improve throughput by up to 250%, reduce latency by up to 36%, and decrease energy per transmitted byte by up to 38%.

翻译：基于Transformer的大语言模型日益受到数据移动的限制，因为通信带宽在芯片边界之外急剧下降。采用晶圆间混合键合的晶圆级集成技术通过在键合晶圆上的光罩之间提供超高带宽，缓解了这一限制。本文研究了晶圆上光罩的物理布局如何影响可实现的网络拓扑结构以及由此产生的通信性能。从一个二维网状基线出发，我们提出了四种光罩布局方案（对齐式、交错式、旋转式和轮廓式），这些方案可将吞吐量提升高达250%，将延迟降低高达36%，并将每传输字节的能耗降低高达38%。

0

相关内容

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

专知会员服务

86+阅读 · 2023年2月2日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

专知会员服务

23+阅读 · 2022年3月28日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【数字孪生】工业互联网支持下的数字孪生车间

【数字孪生】工业互联网支持下的数字孪生车间

产业智能官

21+阅读 · 2019年6月3日

【数字孪生】数字孪生是工业互联网关键技术和重要场景

【数字孪生】数字孪生是工业互联网关键技术和重要场景

产业智能官

39+阅读 · 2019年4月9日

【数字孪生】林诗万：数字孪生体在工业互联网的作用与意义（附PPT）

【数字孪生】林诗万：数字孪生体在工业互联网的作用与意义（附PPT）

产业智能官

40+阅读 · 2019年3月27日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

使用tinc构建full mesh结构的VPN

使用tinc构建full mesh结构的VPN

运维帮

68+阅读 · 2018年12月1日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向三维集成的基于纳米颗粒修饰的晶圆级互连技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

弹性的光与无线前传融合接入网系统的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

支持软件定义的可变带宽光网络节点关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于混沌信号的超宽带收发机关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

Resilient Chaotic Cross-Layer Routing for Smart Grid IoT Networks

Arxiv

0+阅读 · 3月15日

Multi-Agent SAC Enabled Beamforming Design for Joint Secret Key Generation and Data Transmission

Arxiv

0+阅读 · 3月14日

System-Technology Co-Optimization of Bitline Routing and Bonding Pathways in Monolithic 3D DRAM Architectures

Arxiv

0+阅读 · 3月12日

SORT: A Systematically Optimized Ranking Transformer for Industrial-scale Recommenders

Arxiv

0+阅读 · 3月4日

Energy Efficient Point-to-Point PON-based Architecture for the Backhaul of a VLC System

Arxiv

0+阅读 · 3月3日

Reconstructing KV Caches with Cross-layer Fusion For Enhanced Transformers

Arxiv

0+阅读 · 2月19日

MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders

Arxiv

0+阅读 · 2月15日

From Buffers to Registers: Unlocking Fine-Grained FlashAttention with Hybrid-Bonded 3D NPU Co-Design

Arxiv

0+阅读 · 2月11日

Scaling Routers with In-Package Optics and High-Bandwidth Memories

Arxiv

0+阅读 · 2月11日

Transformer-based Hybrid Beamforming with Dynamic Subarray for Near-Space Airship-Borne Communications

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

8+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

5+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

20+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

12+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

【NeurIPS2024】LSH-MoE：通过局部敏感哈希实现通信高效的专家混合模型训练

专知会员服务

14+阅读 · 2024年11月14日

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

数字孪生互联网是什么？西安交大等最新《数字孪生技术》综述论文，21页pdf全面阐述数字孪生体系结构、赋能技术、安全与隐私与展望

专知会员服务

86+阅读 · 2023年2月2日

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

【ECCV2022】UniNet:具有卷积、Transformer和MLP的统一架构搜索

专知会员服务

30+阅读 · 2022年7月15日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

最新！《信息技术系统间远程通信和信息交换时间敏感网络与用于过程控制的对象连接与嵌入统一架构融合信息模型映射》国家标准意见稿发布

专知会员服务

23+阅读 · 2022年3月28日

【Google】高效Transformer综述，Efficient Transformers: A Survey

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

66+阅读 · 2022年3月17日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【数字孪生】工业互联网支持下的数字孪生车间

【数字孪生】工业互联网支持下的数字孪生车间

产业智能官

21+阅读 · 2019年6月3日

【数字孪生】数字孪生是工业互联网关键技术和重要场景

【数字孪生】数字孪生是工业互联网关键技术和重要场景

产业智能官

39+阅读 · 2019年4月9日

【数字孪生】林诗万：数字孪生体在工业互联网的作用与意义（附PPT）

【数字孪生】林诗万：数字孪生体在工业互联网的作用与意义（附PPT）

产业智能官

40+阅读 · 2019年3月27日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

使用tinc构建full mesh结构的VPN

使用tinc构建full mesh结构的VPN

运维帮

68+阅读 · 2018年12月1日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Resilient Chaotic Cross-Layer Routing for Smart Grid IoT Networks

Arxiv

0+阅读 · 3月15日

Multi-Agent SAC Enabled Beamforming Design for Joint Secret Key Generation and Data Transmission

Arxiv

0+阅读 · 3月14日

System-Technology Co-Optimization of Bitline Routing and Bonding Pathways in Monolithic 3D DRAM Architectures

Arxiv

0+阅读 · 3月12日

SORT: A Systematically Optimized Ranking Transformer for Industrial-scale Recommenders

Arxiv

0+阅读 · 3月4日

Energy Efficient Point-to-Point PON-based Architecture for the Backhaul of a VLC System

Arxiv

0+阅读 · 3月3日

Reconstructing KV Caches with Cross-layer Fusion For Enhanced Transformers

Arxiv

0+阅读 · 2月19日

MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders

Arxiv

0+阅读 · 2月15日

From Buffers to Registers: Unlocking Fine-Grained FlashAttention with Hybrid-Bonded 3D NPU Co-Design

Arxiv

0+阅读 · 2月11日

Scaling Routers with In-Package Optics and High-Bandwidth Memories

Arxiv

0+阅读 · 2月11日

Transformer-based Hybrid Beamforming with Dynamic Subarray for Near-Space Airship-Borne Communications

Arxiv

0+阅读 · 2月7日

相关基金

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向三维集成的基于纳米颗粒修饰的晶圆级互连技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

弹性的光与无线前传融合接入网系统的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

支持软件定义的可变带宽光网络节点关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于混沌信号的超宽带收发机关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员