Embodied intelligence is a key step towards Artificial General Intelligence (AGI), yet its development faces multiple challenges including data, frameworks, infrastructure, and evaluation systems. To address these issues, we have, for the first time in the industry, launched a cloud-based, thousand-GPU distributed training platform for embodied intelligence, built upon the widely adopted LeRobot framework, and have systematically overcome bottlenecks across the entire pipeline. At the data layer, we have restructured the data pipeline to optimize the flow of embodied training data. In terms of training, for the GR00T-N1.5 model, utilizing thousand-GPU clusters and data at the scale of hundreds of millions, the single-round training time has been reduced from 15 hours to just 22 minutes, achieving a 40-fold speedup. At the model layer, by combining variable-length FlashAttention and Data Packing, we have moved from sample redundancy to sequence integration, resulting in a 188% speed increase; π-0.5 attention optimization has accelerated training by 165%; and FP8 quantization has delivered a 140% speedup. On the infrastructure side, relying on high-performance storage, a 3.2T RDMA network, and a Ray-driven elastic AI data lake, we have achieved deep synergy among data, storage, communication, and computation. We have also built an end-to-end evaluation system, creating a closed loop from training to simulation to assessment. This framework has already been fully validated on thousand-GPU clusters, laying a crucial technical foundation for the development and application of next-generation autonomous intelligent robots, and is expected to accelerate the arrival of the era of human-machine integration.


翻译:具身智能是实现通用人工智能的关键一步,但其发展面临数据、框架、基础设施及评估体系等多重挑战。针对这些问题,我们基于业界广泛采用的LeRobot框架,首次在行业内构建了面向具身智能的云原生千GPU分布式训练平台,并系统性地突破了全流程瓶颈。在数据层,我们重构了数据流水线以优化具身训练数据流。在训练方面,针对GR00T-N1.5模型,利用千GPU集群和数亿量级数据,单轮训练时间从15小时缩短至22分钟,实现了40倍加速。在模型层,通过结合可变长FlashAttention与数据打包技术,我们从样本冗余转向序列集成,获得188%的速度提升;π-0.5注意力优化将训练速度提升165%;FP8量化则带来140%的加速。在基础设施层面,依托高性能存储、3.2T RDMA网络以及基于Ray的弹性AI数据湖,实现了数据、存储、通信与计算的深度协同。我们还构建了端到端评估体系,形成了从训练到仿真再到评估的完整闭环。该框架已在千GPU集群上得到全面验证,为下一代自主智能机器人的开发与应用奠定了关键技术基础,有望加速人机融合时代的到来。

0
下载
关闭预览

相关内容

大模型赋能的具身智能:决策与具身学习综述
专知会员服务
48+阅读 · 2025年8月16日
基于多模态大模型的具身智能体研究进展与展望
专知会员服务
27+阅读 · 2025年7月2日
具身智能学习综述:基于物理模拟器与世界模型的方法
专知会员服务
35+阅读 · 2025年7月2日
《2024具身智能科技前沿热点》正式发布!32页pdf
专知会员服务
66+阅读 · 2024年12月30日
重磅!《具身智能发展报告(2024年)》发布,54页pdf
专知会员服务
92+阅读 · 2024年8月27日
2024年中国具身智能行业研究:知行合一,拥抱AI新范式
专知会员服务
64+阅读 · 2024年8月13日
多模态大模型时代的全球首篇《具身智能》综述
专知会员服务
77+阅读 · 2024年7月26日
2021年中国云原生AI开发平台白皮书
专知会员服务
59+阅读 · 2021年12月4日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
完备的 AI 学习路线,最详细的资源整理!
新智元
18+阅读 · 2019年5月4日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
VIP会员
相关主题
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
大模型赋能的具身智能:决策与具身学习综述
专知会员服务
48+阅读 · 2025年8月16日
基于多模态大模型的具身智能体研究进展与展望
专知会员服务
27+阅读 · 2025年7月2日
具身智能学习综述:基于物理模拟器与世界模型的方法
专知会员服务
35+阅读 · 2025年7月2日
《2024具身智能科技前沿热点》正式发布!32页pdf
专知会员服务
66+阅读 · 2024年12月30日
重磅!《具身智能发展报告(2024年)》发布,54页pdf
专知会员服务
92+阅读 · 2024年8月27日
2024年中国具身智能行业研究:知行合一,拥抱AI新范式
专知会员服务
64+阅读 · 2024年8月13日
多模态大模型时代的全球首篇《具身智能》综述
专知会员服务
77+阅读 · 2024年7月26日
2021年中国云原生AI开发平台白皮书
专知会员服务
59+阅读 · 2021年12月4日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员