Open-ended self-improving agents can autonomously modify their own structural designs to advance their capabilities and overcome the limits of pre-defined architectures, thus reducing reliance on human intervention. We introduce Group-Evolving Agents (GEA), a new paradigm for open-ended self-improvements, which treats a group of agents as the fundamental evolutionary unit, enabling explicit experience sharing and reuse within the group throughout evolution. Unlike existing open-ended self-evolving paradigms that adopt tree-structured evolution, GEA overcomes the limitation of inefficient utilization of exploratory diversity caused by isolated evolutionary branches. We evaluate GEA on challenging coding benchmarks, where it significantly outperforms state-of-the-art self-evolving methods (71.0% vs. 56.7% on SWE-bench Verified, 88.3% vs. 68.3% on Polyglot) and matches or exceeds top human-designed agent frameworks (71.8% and 52.0% on two benchmarks, respectively). Analysis reveals that GEA more effectively converts early-stage exploratory diversity into sustained, long-term progress, achieving stronger performance under the same number of evolved agents. Furthermore, GEA exhibits consistent transferability across different coding models and greater robustness, fixing framework-level bugs in 1.4 iterations on average, versus 5 for self-evolving methods.


翻译:开放式自我改进智能体能够自主修改其自身结构设计以提升能力并突破预定义架构的限制,从而减少对人类干预的依赖。本文提出群体演化智能体这一开放式自我改进新范式,其以智能体群体作为基本演化单元,支持在演化过程中实现群体内显式的经验共享与复用。与现有采用树状结构演化的开放式自演化范式不同,GEA克服了因演化分支孤立导致的探索多样性利用效率低下的局限。我们在具有挑战性的代码生成基准测试中评估GEA,其显著优于当前最先进的自演化方法(在SWE-bench Verified上达到71.0%对比56.7%,在Polyglot上达到88.3%对比68.3%),并与顶尖人工设计的智能体框架性能相当或更优(在两个基准测试中分别达到71.8%和52.0%)。分析表明,GEA能更有效地将早期探索多样性转化为持续的长期进步,在相同演化智能体数量下实现更强性能。此外,GEA在不同编码模型间展现出稳定的可迁移性和更强的鲁棒性,平均仅需1.4次迭代即可修复框架级错误,而自演化方法平均需要5次迭代。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
AI 智能体系统:体系架构、应用场景及评估范式
智能体化多模态大语言模型综述
专知会员服务
38+阅读 · 2025年10月14日
开放环境下的协作多智能体强化学习进展综述
专知会员服务
34+阅读 · 2025年1月19日
智能集群系统的强化学习方法综述
专知会员服务
83+阅读 · 2024年1月1日
梅宏院士:如何构造人工群体智能
专知会员服务
96+阅读 · 2022年5月2日
清华大学:从单体仿生到群体智能
专知会员服务
73+阅读 · 2022年2月9日
清华大学:从单体仿生到群体智能
专知
18+阅读 · 2022年2月9日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
【类脑智能】类脑智能技术初探
产业智能官
15+阅读 · 2020年2月16日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
智能无人机集群技术概述
无人机
44+阅读 · 2018年2月28日
CCCF专栏文章:人机共融智能
中国计算机学会
15+阅读 · 2017年12月21日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关VIP内容
相关资讯
清华大学:从单体仿生到群体智能
专知
18+阅读 · 2022年2月9日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
【类脑智能】类脑智能技术初探
产业智能官
15+阅读 · 2020年2月16日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
智能无人机集群技术概述
无人机
44+阅读 · 2018年2月28日
CCCF专栏文章:人机共融智能
中国计算机学会
15+阅读 · 2017年12月21日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员