Self-evolving skill libraries face a silent failure mode we term \emph{library drift}: unbounded skill accumulation without outcome-driven lifecycle management causes retrieval degradation, false-positive injections, and performance stagnation. Recent evaluation confirms the symptom--LLM-authored skills deliver +0.0pp gain while human-curated ones deliver +16.2pp (SkillsBench)--yet the underlying mechanism has not been isolated. We provide (1) a reproducible trigger: ablations that isolate drift--one disables skill injection (flat floor, +0.002), one imposes premature retirement (active harm, $-$0.019); (2) trace-level diagnostics: an append-only evidence log with per-skill contribution scores, attribution verdicts, and router engagement metrics that make the failure visible before it reaches end-task scores; and (3) a verified fix: a minimal governance recipe (outcome-driven retirement + bounded active-cap + meta-skill authoring prior) that lifts held-out pass@1 from a 0.258 baseline to a late-window mean of 0.584 (rolling gain $+$0.328) on MBPP+ hard-100 over 100 rounds. Eight ablations decompose which governance mechanisms are load-bearing and which are subsumed, providing a concrete playbook for diagnosing library drift in any self-evolving agent.


翻译:[译摘要] 自演化技能库面临一种我们称之为“库漂移”的静默失效模式:缺乏基于结果的生命周期管理导致的无限技能积累,会造成检索退化、误阳性注入以及性能停滞。近期评估证实了该表象——由大语言模型撰写的技能带来0.0个百分点的性能提升,而人工筛选技能则带来16.2个百分点的提升(SkillsBench)——然而,其潜在机制尚未被分离出来。我们提供了:(1) 一个可复现的触发机制:通过消融实验隔离漂移——一项实验禁用技能注入(平坦下限,+0.002),另一项实验强制过早淘汰(活跃伤害,-0.019);(2) 轨迹级诊断:一个仅可追加的证据日志,包含每个技能的贡献评分、归属判定以及路由参与度指标,以便在问题影响最终任务分数前使其暴露;(3) 一个经验证的修复方案:一套最小化治理方案(基于结果的淘汰机制 + 有界活跃容量 + 元技能创作先验),在MBPP+ hard-100基准上经过100轮迭代,将保留样本的pass@1从0.258的基线提升至后期窗口均值0.584(滚增益+0.328)。八项消融实验分解了哪些治理机制是承载负荷的、哪些是已被包含的,为诊断任何自演化智能体中的库漂移提供了具体指南。

0
下载
关闭预览

相关内容

BES:让语言模型通过双向进化搜索自我改进
专知会员服务
8+阅读 · 5月30日
大语言模型的自改进机制:技术综述与未来展望
专知会员服务
17+阅读 · 4月18日
大语言模型的自提升:技术综述与未来展望
专知会员服务
19+阅读 · 3月29日
大语言模型机器遗忘综述
专知会员服务
18+阅读 · 2025年11月2日
多模态大语言模型的自我改进:综述
专知会员服务
28+阅读 · 2025年10月8日
大型语言模型对齐技术综述:RLHF、RLAIF、PPO、DPO 等
专知会员服务
55+阅读 · 2024年7月24日
大模型如何迭代?北大等《大型语言模型自我进化》综述
八个不容错过的 GitHub Copilot 功能!
CSDN
11+阅读 · 2022年9月22日
一文看懂AutoEncoder模型演进图谱
AINLP
12+阅读 · 2019年6月17日
迁移自适应学习最新综述,附21页论文下载
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员