OnePiece：面向复杂AI生成内容工作流的大规模分布式推理系统 (OnePiece: A Large-Scale Distributed Inference System with RDMA for Complex AI-Generated Content (AIGC) Workflows) - 专知论文

会员服务 ·

0

系统 · AI · 分布式推理 · RDMA · 推理系统 ·

OnePiece: A Large-Scale Distributed Inference System with RDMA for Complex AI-Generated Content (AIGC) Workflows

翻译：OnePiece：面向复杂AI生成内容工作流的大规模分布式推理系统

June Chen,Neal Xu,Gragas Huang,Bok Zhou,Stephen Liu

from arxiv, 12 pages

The rapid growth of AI-generated content (AIGC) has enabled high-quality creative production across diverse domains, yet existing systems face critical inefficiencies in throughput, resource utilization, and scalability under concurrent workloads. This paper introduces OnePiece, a large-scale distributed inference system with RDMA optimized for multi-stage AIGC workflows. By decomposing pipelines into fine-grained microservices and leveraging one-sided RDMA communication, OnePiece significantly reduces inter-node latency and CPU overhead while improving GPU utilization. The system incorporates a novel double-ring buffer design to resolve deadlocks in RDMA-aware memory access without CPU involvement. Additionally, a dynamic Node Manager allocates resources elastically across workflow stages in response to real-time load. Experimental results demonstrate that OnePiece reduces GPU resource consumption by 16x in Wan2.1 image-to-video generation compared to monolithic inference pipelines, offering a scalable, fault-tolerant, and efficient solution for production AIGC environments.

翻译：AI生成内容（AIGC）的快速发展推动了跨领域高质量创意内容的生成，然而现有系统在并发工作负载下面临吞吐量、资源利用率和可扩展性方面的严重效率瓶颈。本文提出OnePiece，一种针对多阶段AIGC工作流优化的、基于RDMA的大规模分布式推理系统。通过将流水线分解为细粒度微服务并利用单边RDMA通信，OnePiece显著降低了节点间通信延迟与CPU开销，同时提升了GPU利用率。系统采用创新的双环形缓冲区设计，在无需CPU介入的情况下解决了RDMA感知内存访问中的死锁问题。此外，动态节点管理器可根据实时负载弹性分配跨工作流阶段的资源。实验结果表明，在Wan2.1图像到视频生成任务中，相较于单体推理流水线，OnePiece将GPU资源消耗降低了16倍，为生产级AIGC环境提供了可扩展、容错且高效的解决方案。

0

相关内容

AIGC如何助力工作和学习，98页ppt

AIGC如何助力工作和学习，98页ppt

专知会员服务

40+阅读 · 2025年3月14日

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

专知会员服务

24+阅读 · 2024年6月29日

多模态AIGC有什么进展？SUTD等最新《各种数据模态AIGC》综述，全面详述AIGC进展

多模态AIGC有什么进展？SUTD等最新《各种数据模态AIGC》综述，全面详述AIGC进展

专知会员服务

81+阅读 · 2023年8月29日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

西交大最新《ChatGPT:人工智能生成的内容、挑战与解决方案》综述

西交大最新《ChatGPT:人工智能生成的内容、挑战与解决方案》综述

专知会员服务

145+阅读 · 2023年6月3日

【ChatGPT系列报告】AIGC最新应用与场景研究，95页ppt

【ChatGPT系列报告】AIGC最新应用与场景研究，95页ppt

专知会员服务

155+阅读 · 2023年5月29日

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

专知会员服务

138+阅读 · 2023年4月18日

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

专知会员服务

95+阅读 · 2023年3月30日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

150+阅读 · 2023年3月22日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知会员服务

257+阅读 · 2022年9月3日

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月26日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

AI综述专栏 | 跨领域推荐系统文献综述（上）

AI综述专栏 | 跨领域推荐系统文献综述（上）

人工智能前沿讲习班

13+阅读 · 2018年5月16日

SCENE-一个可扩展两层级新闻推荐系统

SCENE-一个可扩展两层级新闻推荐系统

全球人工智能

11+阅读 · 2018年1月7日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

1+阅读 · 2017年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Arxiv

0+阅读 · 2月12日

Multi-Agentic AI for Fairness-Aware and Accelerated Multi-modal Large Model Inference in Real-world Mobile Edge Networks

Arxiv

0+阅读 · 2月6日

OneFlowSBI: One Model, Many Queries for Simulation-Based Inference

Arxiv

0+阅读 · 1月30日

OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender

Arxiv

0+阅读 · 1月30日

Generative AI Agents for Controllable and Protected Content Creation

Arxiv

0+阅读 · 1月18日

TopoDIM: One-shot Topology Generation of Diverse Interaction Modes for Multi-Agent Systems

Arxiv

0+阅读 · 1月15日

Content Accuracy and Quality Aware Resource Allocation Based on LP-Guided DRL for ISAC-Driven AIGC Networks

Arxiv

0+阅读 · 1月14日

A Marketplace for AI-Generated Adult Content and Deepfakes

Arxiv

0+阅读 · 1月14日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

154+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

88+阅读 · 2023年3月21日

VIP会员

文章信息

相关主题

分布式推理

相关VIP内容

AIGC如何助力工作和学习，98页ppt

AIGC如何助力工作和学习，98页ppt

专知会员服务

40+阅读 · 2025年3月14日

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

专知会员服务

24+阅读 · 2024年6月29日

多模态AIGC有什么进展？SUTD等最新《各种数据模态AIGC》综述，全面详述AIGC进展

多模态AIGC有什么进展？SUTD等最新《各种数据模态AIGC》综述，全面详述AIGC进展

专知会员服务

81+阅读 · 2023年8月29日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

西交大最新《ChatGPT:人工智能生成的内容、挑战与解决方案》综述

西交大最新《ChatGPT:人工智能生成的内容、挑战与解决方案》综述

专知会员服务

145+阅读 · 2023年6月3日

【ChatGPT系列报告】AIGC最新应用与场景研究，95页ppt

【ChatGPT系列报告】AIGC最新应用与场景研究，95页ppt

专知会员服务

155+阅读 · 2023年5月29日

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

专知会员服务

138+阅读 · 2023年4月18日

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

专知会员服务

95+阅读 · 2023年3月30日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

150+阅读 · 2023年3月22日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知会员服务

257+阅读 · 2022年9月3日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月26日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

AI综述专栏 | 跨领域推荐系统文献综述（上）

AI综述专栏 | 跨领域推荐系统文献综述（上）

人工智能前沿讲习班

13+阅读 · 2018年5月16日

SCENE-一个可扩展两层级新闻推荐系统

SCENE-一个可扩展两层级新闻推荐系统

全球人工智能

11+阅读 · 2018年1月7日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

相关论文

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

Arxiv

0+阅读 · 2月12日

Multi-Agentic AI for Fairness-Aware and Accelerated Multi-modal Large Model Inference in Real-world Mobile Edge Networks

Arxiv

0+阅读 · 2月6日

OneFlowSBI: One Model, Many Queries for Simulation-Based Inference

Arxiv

0+阅读 · 1月30日

OneTrans: Unified Feature Interaction and Sequence Modeling with One Transformer in Industrial Recommender

Arxiv

0+阅读 · 1月30日

Generative AI Agents for Controllable and Protected Content Creation

Arxiv

0+阅读 · 1月18日

TopoDIM: One-shot Topology Generation of Diverse Interaction Modes for Multi-Agent Systems

Arxiv

0+阅读 · 1月15日

Content Accuracy and Quality Aware Resource Allocation Based on LP-Guided DRL for ISAC-Driven AIGC Networks

Arxiv

0+阅读 · 1月14日

A Marketplace for AI-Generated Adult Content and Deepfakes

Arxiv

0+阅读 · 1月14日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

154+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

88+阅读 · 2023年3月21日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

1+阅读 · 2017年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员