Universal embodied intelligence demands robust generalization across heterogeneous embodiments, such as autonomous driving, robotics, and unmanned aerial vehicles (UAVs). However, existing embodied brain in training a unified model over diverse embodiments frequently triggers long-tail data, gradient interference, and catastrophic forgetting, making it notoriously difficult to balance universal generalization with domain-specific proficiency. In this report, we introduce ACE-Brain-0, a generalist foundation brain that unifies spatial reasoning, autonomous driving, and embodied manipulation within a single multimodal large language model~(MLLM). Our key insight is that spatial intelligence serves as a universal scaffold across diverse physical embodiments: although vehicles, robots, and UAVs differ drastically in morphology, they share a common need for modeling 3D mental space, making spatial cognition a natural, domain-agnostic foundation for cross-embodiment transfer. Building on this insight, we propose the Scaffold-Specialize-Reconcile~(SSR) paradigm, which first establishes a shared spatial foundation, then cultivates domain-specialized experts, and finally harmonizes them through data-free model merging. Furthermore, we adopt Group Relative Policy Optimization~(GRPO) to strengthen the model's comprehensive capability. Extensive experiments demonstrate that ACE-Brain-0 achieves competitive and even state-of-the-art performance across 24 spatial and embodiment-related benchmarks.


翻译:通用具身智能需要在自动驾驶、机器人学和无人机等异构具身体系中实现稳健的泛化。然而,现有方法在多样化具身体系上训练统一模型时,常引发长尾数据、梯度干扰与灾难性遗忘问题,导致在通用泛化与领域专精能力间取得平衡极为困难。本报告介绍了ACE-Brain-0——一个将空间推理、自动驾驶与具身操作统一于单一多模态大语言模型(MLLM)的通用基础大脑。我们的核心洞见在于:空间智能可作为跨异质物理具身的通用支架。尽管车辆、机器人和无人机在形态上差异显著,但它们共同需要建模三维心智空间,这使得空间认知成为跨具身迁移的自然且领域无关的基础。基于此洞见,我们提出“支架-专精-调和”(SSR)范式:首先建立共享空间基础,继而培养领域专精专家,最终通过无数据模型融合实现协同。此外,我们采用分组相对策略优化(GRPO)以增强模型的综合能力。大量实验表明,ACE-Brain-0在24个空间与具身相关基准测试中取得了具有竞争力乃至最先进的性能。

0
下载
关闭预览

相关内容

通用智能体评估的逻辑架构
专知会员服务
21+阅读 · 2月28日
《具身智能发展报告(2025年)》,67页pdf
专知会员服务
22+阅读 · 2月1日
通用型虚拟智能体:关于跨数字平台自主智能体的综述
专知会员服务
35+阅读 · 2024年11月20日
基于大模型的具身智能系统综述
专知会员服务
87+阅读 · 2024年11月1日
多模态大模型时代的全球首篇《具身智能》综述
专知会员服务
76+阅读 · 2024年7月26日
敏捷作战部署(ACE)概念
专知会员服务
85+阅读 · 2024年7月4日
走向通用虚拟智能体
专知会员服务
76+阅读 · 2023年11月26日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
26+阅读 · 2019年9月9日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
最新内容
美国当前高超音速导弹发展概述
专知会员服务
1+阅读 · 今天15:03
《高超音速武器:一项再度兴起的技术》120页slides
无人机蜂群建模与仿真方法
专知会员服务
1+阅读 · 今天14:08
澳大利亚发布《国防战略(2026年)》
专知会员服务
0+阅读 · 今天13:42
【CMU博士论文】迈向基于基础先验的 4D 感知研究
专知会员服务
0+阅读 · 今天13:46
全球高超音速武器最新发展趋势
专知会员服务
1+阅读 · 今天13:17
相关VIP内容
通用智能体评估的逻辑架构
专知会员服务
21+阅读 · 2月28日
《具身智能发展报告(2025年)》,67页pdf
专知会员服务
22+阅读 · 2月1日
通用型虚拟智能体:关于跨数字平台自主智能体的综述
专知会员服务
35+阅读 · 2024年11月20日
基于大模型的具身智能系统综述
专知会员服务
87+阅读 · 2024年11月1日
多模态大模型时代的全球首篇《具身智能》综述
专知会员服务
76+阅读 · 2024年7月26日
敏捷作战部署(ACE)概念
专知会员服务
85+阅读 · 2024年7月4日
走向通用虚拟智能体
专知会员服务
76+阅读 · 2023年11月26日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员