群体演化智能体：通过经验共享实现开放式自我改进 (Group-Evolving Agents: Open-Ended Self-Improvement via Experience Sharing) - 专知论文

会员服务 ·

0

智能体 · 结构 · 多样性 · 基准 · 基准测试 ·

Group-Evolving Agents: Open-Ended Self-Improvement via Experience Sharing

翻译：群体演化智能体：通过经验共享实现开放式自我改进

Zhaotian Weng,Antonis Antoniades,Deepak Nathani,Zhen Zhang,Xiao Pu,Xin Eric Wang

from arxiv, 18 pages

Open-ended self-improving agents can autonomously modify their own structural designs to advance their capabilities and overcome the limits of pre-defined architectures, thus reducing reliance on human intervention. We introduce Group-Evolving Agents (GEA), a new paradigm for open-ended self-improvements, which treats a group of agents as the fundamental evolutionary unit, enabling explicit experience sharing and reuse within the group throughout evolution. Unlike existing open-ended self-evolving paradigms that adopt tree-structured evolution, GEA overcomes the limitation of inefficient utilization of exploratory diversity caused by isolated evolutionary branches. We evaluate GEA on challenging coding benchmarks, where it significantly outperforms state-of-the-art self-evolving methods (71.0% vs. 56.7% on SWE-bench Verified, 88.3% vs. 68.3% on Polyglot) and matches or exceeds top human-designed agent frameworks (71.8% and 52.0% on two benchmarks, respectively). Analysis reveals that GEA more effectively converts early-stage exploratory diversity into sustained, long-term progress, achieving stronger performance under the same number of evolved agents. Furthermore, GEA exhibits consistent transferability across different coding models and greater robustness, fixing framework-level bugs in 1.4 iterations on average, versus 5 for self-evolving methods.

翻译：开放式自我改进智能体能够自主修改其自身结构设计以提升能力并突破预定义架构的限制，从而减少对人类干预的依赖。本文提出群体演化智能体这一开放式自我改进新范式，其以智能体群体作为基本演化单元，支持在演化过程中实现群体内显式的经验共享与复用。与现有采用树状结构演化的开放式自演化范式不同，GEA克服了因演化分支孤立导致的探索多样性利用效率低下的局限。我们在具有挑战性的代码生成基准测试中评估GEA，其显著优于当前最先进的自演化方法（在SWE-bench Verified上达到71.0%对比56.7%，在Polyglot上达到88.3%对比68.3%），并与顶尖人工设计的智能体框架性能相当或更优（在两个基准测试中分别达到71.8%和52.0%）。分析表明，GEA能更有效地将早期探索多样性转化为持续的长期进步，在相同演化智能体数量下实现更强性能。此外，GEA在不同编码模型间展现出稳定的可迁移性和更强的鲁棒性，平均仅需1.4次迭代即可修复框架级错误，而自演化方法平均需要5次迭代。

0

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

42+阅读 · 1月8日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

67+阅读 · 1月6日

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

专知会员服务

28+阅读 · 1月2日

智能体化多模态大语言模型综述

智能体化多模态大语言模型综述

专知会员服务

38+阅读 · 2025年10月14日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

开放环境下的协作多智能体强化学习进展综述

开放环境下的协作多智能体强化学习进展综述

专知会员服务

34+阅读 · 2025年1月19日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

84+阅读 · 2024年1月1日

梅宏院士：如何构造人工群体智能

梅宏院士：如何构造人工群体智能

专知会员服务

96+阅读 · 2022年5月2日

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知会员服务

73+阅读 · 2022年2月9日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知

18+阅读 · 2022年2月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【类脑智能】类脑智能技术初探

【类脑智能】类脑智能技术初探

产业智能官

15+阅读 · 2020年2月16日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

群智感知中基于可信交互的细粒度众包机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

合作竞争网络中异质个体的群集行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于众包的群体智慧涌现及创新效应研究

国家自然科学基金

3+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education

Arxiv

0+阅读 · 3月18日

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

Arxiv

0+阅读 · 3月17日

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

OpenSage: Self-programming Agent Generation Engine

Arxiv

0+阅读 · 2月18日

From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture

Arxiv

0+阅读 · 2月11日

CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs

Arxiv

0+阅读 · 2月10日

TodoEvolve: Learning to Architect Agent Planning Systems

Arxiv

0+阅读 · 2月8日

AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration

Arxiv

0+阅读 · 2月7日

Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks

Arxiv

0+阅读 · 2月6日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

（中文）AUKUS第二支柱中的人工智能与自主性方案

（中文）AUKUS第二支柱中的人工智能与自主性方案

专知会员服务

0+阅读 · 19分钟前

（译文）认知战：以士兵为目标，塑造战略

（译文）认知战：以士兵为目标，塑造战略

专知会员服务

0+阅读 · 31分钟前

（中文）认知战的本体论基础（2026报告）

（中文）认知战的本体论基础（2026报告）

专知会员服务

5+阅读 · 今天1:45

美空军条令（2026）：外国对内防御

美空军条令（2026）：外国对内防御

专知会员服务

2+阅读 · 今天1:32

美国与以色列如何在攻击伊朗中使用人工智能

美国与以色列如何在攻击伊朗中使用人工智能

专知会员服务

6+阅读 · 4月16日

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

7+阅读 · 4月16日

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

3+阅读 · 4月16日

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

9+阅读 · 4月16日

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

3+阅读 · 4月16日

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

4+阅读 · 4月16日

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

4+阅读 · 4月16日

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

3+阅读 · 4月16日

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

10+阅读 · 4月16日

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

5+阅读 · 4月16日

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

7+阅读 · 4月16日

相关VIP内容

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

42+阅读 · 1月8日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

67+阅读 · 1月6日

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

智能体 AI (Agentic AI) 的新进展：回归初心，预见未来

专知会员服务

28+阅读 · 1月2日

智能体化多模态大语言模型综述

智能体化多模态大语言模型综述

专知会员服务

38+阅读 · 2025年10月14日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

开放环境下的协作多智能体强化学习进展综述

开放环境下的协作多智能体强化学习进展综述

专知会员服务

34+阅读 · 2025年1月19日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

84+阅读 · 2024年1月1日

梅宏院士：如何构造人工群体智能

梅宏院士：如何构造人工群体智能

专知会员服务

96+阅读 · 2022年5月2日

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知会员服务

73+阅读 · 2022年2月9日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

（译文）认知战：以士兵为目标，塑造战略

美空军条令（2026）：外国对内防御

（中文）AUKUS第二支柱中的人工智能与自主性方案

（中文）认知战的本体论基础（2026报告）

相关资讯

清华大学：从单体仿生到群体智能

清华大学：从单体仿生到群体智能

专知

18+阅读 · 2022年2月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【类脑智能】类脑智能技术初探

【类脑智能】类脑智能技术初探

产业智能官

15+阅读 · 2020年2月16日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education

Arxiv

0+阅读 · 3月18日

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

Arxiv

0+阅读 · 3月17日

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

OpenSage: Self-programming Agent Generation Engine

Arxiv

0+阅读 · 2月18日

From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture

Arxiv

0+阅读 · 2月11日

CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs

Arxiv

0+阅读 · 2月10日

TodoEvolve: Learning to Architect Agent Planning Systems

Arxiv

0+阅读 · 2月8日

AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration

Arxiv

0+阅读 · 2月7日

Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks

Arxiv

0+阅读 · 2月6日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

相关基金

群智感知中基于可信交互的细粒度众包机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

合作竞争网络中异质个体的群集行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于众包的群体智慧涌现及创新效应研究

国家自然科学基金

3+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员