Agent skills extend local AI agents, such as Claude Code or Open Claw, with additional functionality, and their popularity has led to the emergence of dedicated skill marketplaces, similar to app stores for mobile applications. Simultaneously, automated skill scanners were introduced, analyzing the skill description available in SKILL.md, to verify their benign behavior. The results for individual market places mark up to 46.8% of skills as malicious. In this paper, we present the largest empirical security analysis of the AI agent skill ecosystem, questioning this high classification of malicious skills. Therefore, we collect 238,180 unique skills from three major distribution platforms and GitHub to systematically analyze their type and behavior. This approach substantially reduces the number of skills flagged as non-benign by security scanners to only 0.52% which remain in malicious flagged repositories. Consequently, out methodology substantially reduces false positives and provides a more robust view of the ecosystem's current risk surface. Beyond that, we extend the security analysis from the mere investigation of the skill description to a comparison of its congruence with the GitHub repository the skill is embedded in, providing additional context. Furthermore, our analysis also uncovers several, by now undocumented real-world attack vectors, namely hijacking skills hosted on abandoned GitHub repositories.


翻译:智能体技能为本地AI智能体(如Claude Code或Open Claw)扩展了附加功能,其流行催生了专用技能市场的出现,类似于移动应用程序的应用商店。与此同时,自动化技能扫描器被引入,通过分析SKILL.md中提供的技能描述来验证其良性行为。个别市场的扫描结果显示高达46.8%的技能被标记为恶意。本文提出了对AI智能体技能生态系统的最大规模实证安全分析,对这一高比例的恶意技能分类提出质疑。为此,我们从三大分发平台及GitHub收集了238,180个独立技能,系统性地分析其类型与行为。该方法将安全扫描器标记为非良性的技能数量大幅降低至仅0.52%,这些技能仍存留于被标记为恶意的代码仓库中。因此,我们的方法显著减少了误报,并为生态系统当前的风险态势提供了更稳健的评估视角。此外,我们将安全分析从单纯考察技能描述,扩展到比较技能描述与其所在GitHub仓库内容的一致性,从而提供额外上下文。进一步地,我们的分析还揭示了若干迄今未公开记录的真实世界攻击向量,即劫持托管于废弃GitHub仓库的技能。

0
下载
关闭预览

相关内容

伯克利最新《智能体 AI (Agentic AI)》课程
专知会员服务
43+阅读 · 3月1日
通用智能体评估的逻辑架构
专知会员服务
21+阅读 · 2月28日
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
AI智能体基础设施
专知会员服务
41+阅读 · 2025年7月12日
《负责任的AI智能体》最新50页
专知会员服务
60+阅读 · 2025年3月2日
设计和构建强大的大语言模型智能体
专知会员服务
55+阅读 · 2024年10月6日
人工智能训练师的再定义
竹间智能Emotibot
10+阅读 · 2019年5月15日
深度文本匹配在智能客服中的应用
AI100
18+阅读 · 2018年10月24日
科普 | 动态本体简介
开放知识图谱
14+阅读 · 2017年11月11日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
高效视频扩散模型:进展与挑战
专知会员服务
0+阅读 · 今天13:34
乌克兰前线的五项创新
专知会员服务
4+阅读 · 今天6:14
 军事通信系统与设备的技术演进综述
专知会员服务
3+阅读 · 今天5:59
《北约标准:医疗评估手册》174页
专知会员服务
3+阅读 · 今天5:51
《提升生成模型的安全性与保障》博士论文
专知会员服务
3+阅读 · 今天5:47
美国当前高超音速导弹发展概述
专知会员服务
4+阅读 · 4月19日
无人机蜂群建模与仿真方法
专知会员服务
12+阅读 · 4月19日
澳大利亚发布《国防战略(2026年)》
专知会员服务
6+阅读 · 4月19日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员