The datacenter industry is converging on SmartNIC-based resource management. Wave (Humphries et al., ASPLOS '25) demonstrates the practical feasibility of offloading kernel thread scheduling, memory management, and RPC stacks to the ARM cores of Intel's Mount Evans Infrastructure Processing Unit (IPU). The engineering is careful and the results are honest: without Wave's PCIe latency mitigations, offloaded workloads degrade by 350%. We argue that this 350% degradation is not an engineering problem to be optimized away but a diagnostic symptom of a deeper architectural issue: Wave's communication model is Forward-In-Time-Only (FITO). Every interaction between host and SmartNIC is a unidirectional message -- event forward, decision back -- creating a temporal vulnerability window in which decisions can become stale before they are enforced. Wave's entire optimization stack (write-combining page table entries, prestaging, prefetching, atomic transaction abort) exists to hide or tolerate this window. We apply the FITO diagnostic to Wave's architecture systematically, identify the category mistake it inherits from Lamport's happened-before and Shannon's channel model, and show how Open Atomic Ethernet's bilateral swap primitive -- implemented on the same Intel IPU hardware -- dissolves the latency, atomicity, and timeout problems without engineering around them. The SmartNIC is the right location for resource management; what is missing is the right communication primitive at that location.


翻译:数据中心行业正趋向于采用基于智能网卡的资源管理方案。Wave(Humphries等人,ASPLOS '25)展示了将内核线程调度、内存管理和RPC栈卸载至英特尔Mount Evans基础设施处理单元ARM核心的实际可行性。其工程实现严谨且结果可靠:若无Wave的PCIe延迟缓解机制,卸载工作负载性能将下降350%。我们认为,这350%的性能下降并非可通过工程优化消除的技术问题,而是一个更深层架构缺陷的诊断性症状:Wave的通信模型采用仅前向时间模式。主机与智能网卡间的每次交互均为单向消息——事件前传、决策回传——这造成了决策在生效前即可能过时的时间脆弱窗口。Wave的整套优化机制(写合并页表项、预置处理、预取、原子事务中止)均旨在掩盖或容忍此窗口。我们系统性地将仅前向时间诊断框架应用于Wave架构,指出其承袭自Lamport"事前发生"关系与香农信道模型的范畴错误,并论证基于相同英特尔IPU硬件实现的开放原子以太网双向交换原语如何从根本上消解延迟、原子性与超时问题,而非通过工程手段规避。智能网卡确是资源管理的理想载体,当前缺失的正是该载体所需的正确通信原语。

0
下载
关闭预览

相关内容

算力调度:算力时代的国家电网
专知会员服务
44+阅读 · 2023年11月7日
未来网络白皮书——SmartNIC/DPU技术白皮书
专知会员服务
83+阅读 · 2022年8月31日
专访阿里亚顿:Serverless与BFF与前端
前端之巅
45+阅读 · 2019年5月8日
【大数据】StreamSets:一个大数据采集工具
产业智能官
40+阅读 · 2018年12月5日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
详述DeepMind wavenet原理及其TensorFlow实现
深度学习每日摘要
12+阅读 · 2017年6月26日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
最新内容
《Palantir的科技生态系统》
专知会员服务
4+阅读 · 6月2日
《反无人机系统传感器融合》90页报告
专知会员服务
8+阅读 · 6月2日
运用人工智能与卫星通信驱散“战争迷雾”
专知会员服务
3+阅读 · 6月2日
综述 | OPSD:大语言模型的在线策略自蒸馏
专知会员服务
4+阅读 · 6月1日
帕兰蒂尔Maven:军事人工智能的新纪元
专知会员服务
9+阅读 · 6月1日
相关VIP内容
算力调度:算力时代的国家电网
专知会员服务
44+阅读 · 2023年11月7日
未来网络白皮书——SmartNIC/DPU技术白皮书
专知会员服务
83+阅读 · 2022年8月31日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员