Modern microservices increasingly depend on high-performance remote procedure calls (RPCs) to coordinate fine-grained, distributed computation. As network bandwidths continue to scale, the CPU overhead associated with RPC processing, particularly serialization, deserialization, and protocol handling, has become a critical bottleneck. This challenge is exacerbated by fast user-space networking stacks such as DPDK, which expose RPC processing as the dominant performance limiter. While prior work has explored software optimizations and FPGA-based offload engines, these approaches remain physically distant from the CPU's memory hierarchy, incurring unnecessary data movement and cache pollution. We present Arcalis, a near-cache RPC accelerator that positions a lightweight hardware engine adjacent to the last-level cache (LLC). Arcalis offloads RPC processing to dedicated microengines on receive and transmit paths that operate with cache-line latency while preserving programmability. By decoupling RPC processing logic, enabling microservice-specific execution, and positioning itself near the LLC to immediately consume data injected by network cards, Arcalis achieves 1.79-4.16$\times$ end-to-end speedup compared to the CPU baseline, while significantly reducing microarchitectural overhead by up to 88%, and achieves up to a 1.62$\times$ higher throughput than prior solutions. These results highlight the potential of near-cache RPC acceleration as a practical solution for high-performance microservice deployment.


翻译:现代微服务架构日益依赖高性能远程过程调用(RPC)来协调细粒度的分布式计算。随着网络带宽的持续提升,与RPC处理相关的CPU开销——特别是序列化、反序列化及协议处理——已成为关键性能瓶颈。这一挑战在用户态高速网络栈(如DPDK)中尤为突出,使得RPC处理成为主要性能限制因素。现有研究虽已探索软件优化及基于FPGA的卸载引擎,但这些方案仍位于CPU内存层次结构的物理远端,导致不必要的数据迁移和缓存污染。本文提出Arcalis,一种部署于末级缓存(LLC)旁的近缓存RPC加速器。Arcalis将RPC处理卸载至收发路径上的专用微引擎,这些微引擎在保持可编程性的同时以缓存行延迟运行。通过解耦RPC处理逻辑、支持微服务定制化执行,并借助近LLC部署直接处理网卡注入的数据,Arcalis相比CPU基线实现了1.79-4.16$\times$的端到端加速,同时将微架构开销降低达88%,并较现有方案获得最高1.62$\times$的吞吐量提升。这些结果表明近缓存RPC加速技术为高性能微服务部署提供了切实可行的解决方案。

0
下载
关闭预览

相关内容

RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。
战术边缘计算:实现更快速、更智能军事决策的关键
专知会员服务
20+阅读 · 2025年9月20日
国防领域边缘计算:将智能推向行动前沿
专知会员服务
28+阅读 · 2025年4月6日
国家标准《信息技术云计算参考架构》
专知会员服务
37+阅读 · 2024年5月24日
专知会员服务
48+阅读 · 2021年2月2日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
【APC】先进过程控制系统(APC: Advanced Process Control)
产业智能官
69+阅读 · 2020年7月12日
阿里巴巴全球化架构设计挑战
InfoQ
36+阅读 · 2019年11月25日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
《压缩式分布式交互仿真标准》120页
专知会员服务
0+阅读 · 11分钟前
《电子战数据交换模型研究报告》
专知会员服务
1+阅读 · 19分钟前
《基于Transformer的异常舰船导航识别与跟踪》80页
专知会员服务
1+阅读 · 47分钟前
《低数据领域军事目标检测模型研究》
专知会员服务
1+阅读 · 55分钟前
【CMU博士论文】物理世界的视觉感知与深度理解
伊朗战争停火期间美军关键弹药状况分析
专知会员服务
8+阅读 · 4月22日
电子战革命:塑造战场的十年突破(2015–2025)
人工智能即服务与未来战争(印度视角)
专知会员服务
4+阅读 · 4月22日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员