Modern microservices increasingly depend on high-performance remote procedure calls (RPCs) to coordinate fine-grained, distributed computation. As network bandwidths continue to scale, the CPU overhead associated with RPC processing, particularly serialization, deserialization, and protocol handling, has become a critical bottleneck. This challenge is exacerbated by fast user-space networking stacks such as DPDK, which expose RPC processing as the dominant performance limiter. While prior work has explored software optimizations and FPGA-based offload engines, these approaches remain physically distant from the CPU's memory hierarchy, incurring unnecessary data movement and cache pollution. We present Arcalis, a near-cache RPC accelerator that positions a lightweight hardware engine adjacent to the last-level cache (LLC). Arcalis offloads RPC processing to dedicated microengines on receive and transmit paths that operate with cache-line latency while preserving programmability. By decoupling RPC processing logic, enabling microservice-specific execution, and positioning itself near the LLC to immediately consume data injected by network cards, Arcalis achieves 1.79-4.16$\times$ end-to-end speedup compared to the CPU baseline, while significantly reducing microarchitectural overhead by up to 88%, and achieves up to a 1.62$\times$ higher throughput than prior solutions. These results highlight the potential of near-cache RPC acceleration as a practical solution for high-performance microservice deployment.


翻译:现代微服务架构日益依赖高性能远程过程调用(RPC)来协调细粒度的分布式计算。随着网络带宽的持续提升,与RPC处理相关的CPU开销——特别是序列化、反序列化及协议处理——已成为关键性能瓶颈。这一挑战在用户态高速网络栈(如DPDK)中尤为突出,使得RPC处理成为主要性能限制因素。现有研究虽已探索软件优化及基于FPGA的卸载引擎,但这些方案仍位于CPU内存层次结构的物理远端,导致不必要的数据迁移和缓存污染。本文提出Arcalis,一种部署于末级缓存(LLC)旁的近缓存RPC加速器。Arcalis将RPC处理卸载至收发路径上的专用微引擎,这些微引擎在保持可编程性的同时以缓存行延迟运行。通过解耦RPC处理逻辑、支持微服务定制化执行,并借助近LLC部署直接处理网卡注入的数据,Arcalis相比CPU基线实现了1.79-4.16$\times$的端到端加速,同时将微架构开销降低达88%,并较现有方案获得最高1.62$\times$的吞吐量提升。这些结果表明近缓存RPC加速技术为高性能微服务部署提供了切实可行的解决方案。

0
下载
关闭预览

相关内容

RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。
战术边缘计算:实现更快速、更智能军事决策的关键
专知会员服务
17+阅读 · 2025年9月20日
国防领域边缘计算:将智能推向行动前沿
专知会员服务
27+阅读 · 2025年4月6日
国家标准《信息技术云计算参考架构》
专知会员服务
35+阅读 · 2024年5月24日
专知会员服务
48+阅读 · 2021年2月2日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
【APC】先进过程控制系统(APC: Advanced Process Control)
产业智能官
69+阅读 · 2020年7月12日
阿里巴巴全球化架构设计挑战
InfoQ
36+阅读 · 2019年11月25日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员