【ICLR2026】基于小型语言模型的终身智能体 - 专知VIP

会员服务 ·

0

ICLR 2026 · 小型语言模型 · 终身智能体 ·

【ICLR2026】基于小型语言模型的终身智能体

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

终身智能体正日益普及，但依赖云端前沿 API 面临着成本高昂、延迟与隐私限制以及多用户个性化难以实现等根本性问题，使小型语言模型成为唯一现实的部署载体。本报告围绕构建终身智能体的三个核心挑战展开：（1）领域专业化：提出 A3（Agent-as-Annotators）方法，利用前沿模型自动生成并筛选带推理轨迹的交互数据，将 Qwen3.5-9B 在 WebArena 上的成功率从 31.0% 提升至 41.5%，媲美 27B 模型，且在四个分布外环境中展现出强泛化能力。（2）用户个性化：构建 AdaptArena 基准以评估智能体从隐式历史轨迹推断用户偏好的能力。即使最强的前沿模型与 Oracle 之间仍存在超过 15 个百分点的性能差距；交换历史实验证实，性能增益源于正确的用户-上下文对齐，而非通用示例。（3）记忆与通信：提出 LLM2Vec-Gen，在语言模型自身的输出空间中学习生成嵌入，在 MTEB 上以 61.9 分刷新自监督最优结果，并在推理密集型检索任务上显著优于基线，且嵌入可通过 Logit Lens 实现可解释阅读。该嵌入空间还可作为智能体间通信的共享表示，将数百个 token 压缩为少量潜在向量，提升多智能体交互效率。综上，融合专业化、个性化与高效检索的小型语言模型，有望成为终身多智能体系统中缺失的核心基元。

成为VIP会员查看完整内容

0

相关内容

ICLR 2026

VIP会员

相关主题

小型语言模型

终身智能体

最新内容

【ICLR2026】基于小型语言模型的终身智能体

【ICLR2026】基于小型语言模型的终身智能体

专知会员服务

0+阅读 · 今天15:50

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

专知会员服务

0+阅读 · 今天15:46

全面的反无人机系统培训计划

全面的反无人机系统培训计划

专知会员服务

1+阅读 · 今天10:28

数字孪生在军事领域的应用综述：陆地、海上、空中、太空和网络空间多域赋能

数字孪生在军事领域的应用综述：陆地、海上、空中、太空和网络空间多域赋能

专知会员服务

4+阅读 · 今天10:10

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

专知会员服务

5+阅读 · 今天3:36

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

专知会员服务

4+阅读 · 今天3:23

探秘Palantir：驱动美情报的科技巨头

探秘Palantir：驱动美情报的科技巨头

专知会员服务

3+阅读 · 今天3:14

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

专知会员服务

5+阅读 · 今天3:09

《美国海军军事海运司令部 2026年手册》

《美国海军军事海运司令部 2026年手册》

专知会员服务

3+阅读 · 今天3:05

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

专知会员服务

5+阅读 · 今天2:36

《人工智能使能系统可靠性框架》

《人工智能使能系统可靠性框架》

专知会员服务

7+阅读 · 今天2:28

2026“人工智能+”行业发展蓝皮书（附下载）

2026“人工智能+”行业发展蓝皮书（附下载）

专知会员服务

17+阅读 · 4月26日

《强化学习数学基础》

《强化学习数学基础》

专知会员服务

13+阅读 · 4月26日

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

9+阅读 · 4月26日

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

10+阅读 · 4月26日

热门VIP内容

开通专知VIP会员享更多权益服务

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

数字孪生在军事领域的应用综述：陆地、海上、空中、太空和网络空间多域赋能

【ICLR2026】基于小型语言模型的终身智能体

全面的反无人机系统培训计划

微信扫码咨询专知VIP会员