Agentic systems increasingly rely on reusable procedural capabilities, \textit{a.k.a., agentic skills}, to execute long-horizon workflows reliably. These capabilities are callable modules that package procedural knowledge with explicit applicability conditions, execution policies, termination criteria, and reusable interfaces. Unlike one-off plans or atomic tool calls, skills operate (and often do well) across tasks. This paper maps the skill layer across the full lifecycle (discovery, practice, distillation, storage, composition, evaluation, and update) and introduces two complementary taxonomies. The first is a system-level set of \textbf{seven design patterns} capturing how skills are packaged and executed in practice, from metadata-driven progressive disclosure and executable code skills to self-evolving libraries and marketplace distribution. The second is an orthogonal \textbf{representation $\times$ scope} taxonomy describing what skills \emph{are} (natural language, code, policy, hybrid) and what environments they operate over (web, OS, software engineering, robotics). We analyze the security and governance implications of skill-based agents, covering supply-chain risks, prompt injection via skill payloads, and trust-tiered execution, grounded by a case study of the ClawHavoc campaign in which nearly 1{,}200 malicious skills infiltrated a major agent marketplace, exfiltrating API keys, cryptocurrency wallets, and browser credentials at scale. We further survey deterministic evaluation approaches, anchored by recent benchmark evidence that curated skills can substantially improve agent success rates while self-generated skills may degrade them. We conclude with open challenges toward robust, verifiable, and certifiable skills for real-world autonomous agents.


翻译:智能体系统日益依赖可复用的程序化能力,即智能体技能,以可靠地执行长时程工作流。这些能力是可调用模块,将程序性知识与明确的适用条件、执行策略、终止标准及可复用接口封装在一起。与一次性规划或原子工具调用不同,技能可跨任务运行(且通常表现良好)。本文从全生命周期(发现、实践、提炼、存储、组合、评估与更新)维度梳理技能层,并引入两种互补的分类体系。其一是系统级的**七种设计模式**,涵盖实践中技能封装与执行的方式,包括元数据驱动的渐进式披露、可执行代码技能、自进化库及市场分发等。其二是一个正交的**表示形式×作用域**分类法,描述技能的本质(自然语言、代码、策略、混合形式)及其运行环境(网络、操作系统、软件工程、机器人学)。我们分析了基于技能的智能体在安全与治理方面的影响,涵盖供应链风险、通过技能载荷的提示注入及信任分级执行等问题,并以ClawHavoc攻击活动为案例进行论证——该活动中近1,200个恶意技能渗透至主流智能体市场,大规模窃取API密钥、加密货币钱包及浏览器凭证。我们进一步系统梳理了确定性评估方法,结合近期基准测试证据指出:经精心设计的技能可显著提升智能体成功率,而自生成技能可能降低其性能。最后,我们针对现实世界自主智能体所需具备的鲁棒、可验证、可认证技能提出了开放挑战。

0
下载
关闭预览

相关内容

伯克利最新《智能体 AI (Agentic AI)》课程
专知会员服务
36+阅读 · 3月1日
通用智能体评估的逻辑架构
专知会员服务
17+阅读 · 2月28日
智能体工程(Agent Engineering)
专知会员服务
30+阅读 · 2025年12月31日
迈向智能体系统规模化的科学
专知会员服务
20+阅读 · 2025年12月12日
智能体适应
专知会员服务
24+阅读 · 2025年12月11日
AI专题·Agent:智能体基建厚积薄发,商业化应用曙光乍现
大模型智能体:概念、前沿和产业实践
专知会员服务
77+阅读 · 2024年8月20日
【类脑智能】类脑智能技术初探
产业智能官
15+阅读 · 2020年2月16日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
人工智能训练师的再定义
竹间智能Emotibot
10+阅读 · 2019年5月15日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
相关VIP内容
伯克利最新《智能体 AI (Agentic AI)》课程
专知会员服务
36+阅读 · 3月1日
通用智能体评估的逻辑架构
专知会员服务
17+阅读 · 2月28日
智能体工程(Agent Engineering)
专知会员服务
30+阅读 · 2025年12月31日
迈向智能体系统规模化的科学
专知会员服务
20+阅读 · 2025年12月12日
智能体适应
专知会员服务
24+阅读 · 2025年12月11日
AI专题·Agent:智能体基建厚积薄发,商业化应用曙光乍现
大模型智能体:概念、前沿和产业实践
专知会员服务
77+阅读 · 2024年8月20日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员