Debate2Create: Robot Co-design via Multi-Agent LLM Debate - 专知论文

会员服务 ·

0

设计 · 语言模型 · 协同 · 结构 · 智能体大语言模型 ·

Debate2Create: Robot Co-design via Multi-Agent LLM Debate

翻译：Debate2Create：基于多智能体大语言模型辩论的机器人协同设计

Kevin Qiu,Marek Cygan

We introduce Debate2Create (D2C), a multi-agent LLM framework that formulates robot co-design as structured, iterative debate grounded in physics-based evaluation. A design agent and control agent engage in a thesis-antithesis-synthesis loop, while pluralistic LLM judges provide multi-objective feedback to steer exploration. Across five MuJoCo locomotion benchmarks, D2C achieves up to $3.2\times$ the default Ant score and $\sim9\times$ on Swimmer, outperforming prior LLM-based methods and black-box optimization. Iterative debate yields 18--35% gains over compute-matched zero-shot generation, and D2C-generated rewards transfer to default morphologies in 4/5 tasks. Our results demonstrate that structured multi-agent debate offers an effective alternative to hand-designed objectives for joint morphology-reward optimization.

翻译：本文提出Debate2Create（D2C），一种将机器人协同设计构建为基于物理评估的结构化迭代辩论的多智能体大语言模型框架。设计智能体与控制智能体通过“正题-反题-合题”循环展开辩论，同时多元化的大语言模型评委提供多目标反馈以引导探索。在五个MuJoCo运动基准测试中，D2C在Ant环境中达到默认性能的$3.2\times$，在Swimmer环境中达到$\sim9\times$，优于现有基于大语言模型的方法与黑盒优化方法。相比计算资源匹配的零样本生成方法，迭代辩论带来18–35%的性能提升，且D2C生成的奖励函数在4/5任务中可迁移至默认形态结构。我们的研究结果表明，结构化多智能体辩论为形态-奖励联合优化提供了一种替代人工设计目标的有效方案。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

专知会员服务

28+阅读 · 5月11日

多智能体协作机制

多智能体协作机制

专知会员服务

23+阅读 · 4月25日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

35+阅读 · 2025年5月16日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

61+阅读 · 2025年4月6日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

专知会员服务

72+阅读 · 2025年2月21日

多循环嵌套的大语言模型多智能体指挥控制过程

多循环嵌套的大语言模型多智能体指挥控制过程

专知会员服务

44+阅读 · 2025年1月19日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图景》

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图景》

专知会员服务

91+阅读 · 2024年12月2日

斯坦福等最新《机器人大模型》综述，详述LLM+Robot进展，33页pdf

斯坦福等最新《机器人大模型》综述，详述LLM+Robot进展，33页pdf

专知会员服务

61+阅读 · 2023年12月27日

【EMNLP 2023】基于大语言模型辩论的多智能体协作推理分析

【EMNLP 2023】基于大语言模型辩论的多智能体协作推理分析

专知会员服务

44+阅读 · 2023年11月27日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

165+阅读 · 2022年9月28日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

59+阅读 · 2022年9月24日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

基于金融-司法领域(兼有闲聊性质)的聊天机器人

基于金融-司法领域(兼有闲聊性质)的聊天机器人

专知

10+阅读 · 2019年7月8日

开始报名！SMP机器人群聊比赛

开始报名！SMP机器人群聊比赛

哈工大SCIR

13+阅读 · 2019年6月28日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Task-Driven Co-Design of Heterogeneous Multi-Robot Systems

Arxiv

0+阅读 · 4月23日

A Replicable Robotics Awareness Method Using LLM-Enabled Robotics Interaction: Evidence from a Corporate Challenge

Arxiv

0+阅读 · 4月23日

Competition and Cooperation of LLM Agents in Games

Arxiv

0+阅读 · 4月11日

CoopGuard: Stateful Cooperative Agents Safeguarding LLMs Against Evolving Multi-Round Attacks

Arxiv

0+阅读 · 4月5日

MARS: toward more efficient multi-agent collaboration for LLM reasoning

Arxiv

0+阅读 · 3月24日

A Multimodal Framework for Human-Multi-Agent Interaction

Arxiv

0+阅读 · 3月24日

Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs

Arxiv

0+阅读 · 3月23日

DEBATE: A Large-Scale Benchmark for Evaluating Opinion Dynamics in Role-Playing LLM Agents

Arxiv

0+阅读 · 3月22日

Efficient LLM Safety Evaluation through Multi-Agent Debate

Efficient LLM Safety Evaluation through Multi-Agent Debate

Arxiv

0+阅读 · 3月18日

COMRES-VLM: Coordinated Multi-Robot Exploration and Search using Vision Language Models

Arxiv

0+阅读 · 3月1日

VIP会员

文章信息

相关主题

智能体大语言模型

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

专知会员服务

28+阅读 · 5月11日

多智能体协作机制

多智能体协作机制

专知会员服务

23+阅读 · 4月25日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

35+阅读 · 2025年5月16日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

61+阅读 · 2025年4月6日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

专知会员服务

72+阅读 · 2025年2月21日

多循环嵌套的大语言模型多智能体指挥控制过程

多循环嵌套的大语言模型多智能体指挥控制过程

专知会员服务

44+阅读 · 2025年1月19日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图景》

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图景》

专知会员服务

91+阅读 · 2024年12月2日

斯坦福等最新《机器人大模型》综述，详述LLM+Robot进展，33页pdf

斯坦福等最新《机器人大模型》综述，详述LLM+Robot进展，33页pdf

专知会员服务

61+阅读 · 2023年12月27日

【EMNLP 2023】基于大语言模型辩论的多智能体协作推理分析

【EMNLP 2023】基于大语言模型辩论的多智能体协作推理分析

专知会员服务

44+阅读 · 2023年11月27日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

165+阅读 · 2022年9月28日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

59+阅读 · 2022年9月24日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

基于金融-司法领域(兼有闲聊性质)的聊天机器人

基于金融-司法领域(兼有闲聊性质)的聊天机器人

专知

10+阅读 · 2019年7月8日

开始报名！SMP机器人群聊比赛

开始报名！SMP机器人群聊比赛

哈工大SCIR

13+阅读 · 2019年6月28日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

相关论文

Task-Driven Co-Design of Heterogeneous Multi-Robot Systems

Arxiv

0+阅读 · 4月23日

A Replicable Robotics Awareness Method Using LLM-Enabled Robotics Interaction: Evidence from a Corporate Challenge

Arxiv

0+阅读 · 4月23日

Competition and Cooperation of LLM Agents in Games

Arxiv

0+阅读 · 4月11日

CoopGuard: Stateful Cooperative Agents Safeguarding LLMs Against Evolving Multi-Round Attacks

Arxiv

0+阅读 · 4月5日

MARS: toward more efficient multi-agent collaboration for LLM reasoning

Arxiv

0+阅读 · 3月24日

A Multimodal Framework for Human-Multi-Agent Interaction

Arxiv

0+阅读 · 3月24日

Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs

Arxiv

0+阅读 · 3月23日

DEBATE: A Large-Scale Benchmark for Evaluating Opinion Dynamics in Role-Playing LLM Agents

Arxiv

0+阅读 · 3月22日

Efficient LLM Safety Evaluation through Multi-Agent Debate

Efficient LLM Safety Evaluation through Multi-Agent Debate

Arxiv

0+阅读 · 3月18日

COMRES-VLM: Coordinated Multi-Robot Exploration and Search using Vision Language Models

Arxiv

0+阅读 · 3月1日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员