The emerging agentic web envisions AI agents that reliably fulfill users' natural-language (NL)-based tasks by interacting with existing web services. However, existing authorization models are misaligned with this vision. In particular, today's operator-scoped authorization, exemplified by OAuth, grants broad permissions tied to operators (e.g., the transfer operator) rather than to the specific operations (e.g., transfer $100 to Bob) implied by a user's task. This will inevitably result in overprivileged agents. We introduce Precise Task-Scoped Implicit Authorization (PAuth), a fundamentally different model in which submitting an NL task implicitly authorizes only the concrete operations required for its faithful execution. To make this enforceable at servers, we propose NL slices: symbolic specifications of the calls each service expects, derived from the task and upstream results. Complementing this, we also propose envelopes: special data structure to bind each operand's concrete value to its symbolic provenance, enabling servers to verify that all operands arise from legitimate computations. PAuth is prototyped in the agent-security evaluation framework AgentDojo. We evaluate it in both benign settings and attack scenarios where a spurious operation is injected into an otherwise normal task. In all benign tests, PAuth executes the tasks successfully without requiring any additional permissions. In all attack tests, PAuth correctly raises warnings about missing permissions. These results demonstrate that PAuth's reasoning about permissions is indeed precise. We further analyze the characteristics of these tasks and measure the associated token costs.


翻译:新兴的智能体网络愿景旨在通过AI智能体与现有网络服务交互,可靠地完成用户基于自然语言的任务。然而,现有授权模型与该愿景存在错位。特别是当前以OAuth为代表的"操作者范围授权"模式,将宽泛权限授予操作者(例如转账操作者),而非用户任务所隐含的具体操作(例如向Bob转账100美元)。这将不可避免地导致智能体权限过度泛化。本文提出精确任务范围隐式授权(PAuth),这是一种根本性不同的授权模型:提交自然语言任务即隐式授权仅执行该任务所需的具体操作。为实现服务端可执行性,我们提出自然语言切片概念——从任务及上游结果推导出的、每个服务预期调用的符号化规范。作为补充,我们还提出信封机制:一种特殊数据结构,将每个操作数的具体值与其符号化来源绑定,使服务端能够验证所有操作数均源自合法计算过程。PAuth已在智能体安全评估框架AgentDojo中实现原型。我们在正常场景和攻击场景(在正常任务中注入虚假操作)中对其进行评估。所有正常测试中,PAuth均成功执行任务且无需额外权限;所有攻击测试中,PAuth均能正确触发权限缺失警告。这些结果表明PAuth的权限推理机制具有精确性。我们进一步分析了任务特征并测量了相关令牌成本。

0
下载
关闭预览

相关内容

通用智能体评估的逻辑架构
专知会员服务
20+阅读 · 2月28日
AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
智能体适应
专知会员服务
25+阅读 · 2025年12月11日
智能体任务执行安全要求
专知会员服务
19+阅读 · 2025年7月12日
《负责任的AI智能体》最新50页
专知会员服务
59+阅读 · 2025年3月2日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
人工智能训练师的再定义
竹间智能Emotibot
10+阅读 · 2019年5月15日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
【智能制造】智能制造的核心——智能决策
产业智能官
12+阅读 · 2018年4月11日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
36+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2月12日
VIP会员
最新内容
美/以-伊战争:停火与后续情景与影响分析
专知会员服务
3+阅读 · 4月11日
美国-以色列-伊朗战争:是否会动用地面部队?
美国协同作战飞机项目新型无人机发动机
专知会员服务
1+阅读 · 4月11日
无人机在美以伊战争中的关键启示(印度视角)
相关VIP内容
通用智能体评估的逻辑架构
专知会员服务
20+阅读 · 2月28日
AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
智能体适应
专知会员服务
25+阅读 · 2025年12月11日
智能体任务执行安全要求
专知会员服务
19+阅读 · 2025年7月12日
《负责任的AI智能体》最新50页
专知会员服务
59+阅读 · 2025年3月2日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
36+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员