Traditional software relies on contracts -- APIs, type systems, assertions -- to specify and enforce correct behavior. AI agents, by contrast, operate on prompts and natural language instructions with no formal behavioral specification. This gap is the root cause of drift, governance failures, and frequent project failures in agentic AI deployments. We introduce Agent Behavioral Contracts (ABC), a formal framework that brings Design-by-Contract principles to autonomous AI agents. An ABC contract C = (P, I, G, R) specifies Preconditions, Invariants, Governance policies, and Recovery mechanisms as first-class, runtime-enforceable components. We define (p, delta, k)-satisfaction -- a probabilistic notion of contract compliance that accounts for LLM non-determinism and recovery -- and prove a Drift Bounds Theorem showing that contracts with recovery rate gamma > alpha (the natural drift rate) bound behavioral drift to D* = alpha/gamma in expectation, with Gaussian concentration in the stochastic setting. We establish sufficient conditions for safe contract composition in multi-agent chains and derive probabilistic degradation bounds. We implement ABC in AgentAssert, a runtime enforcement library, and evaluate on AgentContract-Bench, a benchmark of 200 scenarios across 7 models from 6 vendors. Results across 1,980 sessions show that contracted agents detect 5.2-6.8 soft violations per session that uncontracted baselines miss entirely (p < 0.0001, Cohen's d = 6.7-33.8), achieve 88-100% hard constraint compliance, and bound behavioral drift to D* < 0.27 across extended sessions, with 100% recovery for frontier models and 17-100% across all models, at overhead < 10 ms per action.


翻译:传统软件依赖契约——如API、类型系统、断言——来规约并强制实施正确行为。相比之下,AI智能体基于提示和自然语言指令运行,缺乏形式化的行为规约。这一差距是导致智能体AI部署中漂移、治理失效和项目频繁失败的根本原因。本文提出智能体行为契约(ABC),这是一个将契约式设计原则引入自主AI智能体的形式化框架。ABC契约C = (P, I, G, R)将前置条件、不变量、治理策略和恢复机制作为一等、可运行时强制实施的组件进行规约。我们定义了(p, δ, k)-满足度——一种考虑LLM非确定性和恢复机制的契约依从概率概念——并证明了漂移边界定理:当恢复率γ > α(自然漂移率)时,行为漂移在期望上被约束至D* = α/γ,在随机设定中呈现高斯集中性。我们为多智能体链中的安全契约组合建立了充分条件,并推导出概率性能退化边界。我们在AgentAssert运行时强制实施库中实现了ABC,并在AgentContract-Bench基准上进行了评估,该基准涵盖6家供应商的7个模型共200个场景。1980次会话的结果表明:契约化智能体每会话检测到5.2-6.8个非契约基线完全遗漏的软违规(p < 0.0001,Cohen's d = 6.7-33.8),实现88-100%的硬约束依从率,在扩展会话中将行为漂移约束至D* < 0.27,前沿模型恢复率达100%,所有模型恢复率在17-100%之间,单次动作开销<10毫秒。

0
下载
关闭预览

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
智能体适应
专知会员服务
25+阅读 · 2025年12月11日
智能体任务执行安全要求
专知会员服务
19+阅读 · 2025年7月12日
AI智能体基础设施
专知会员服务
42+阅读 · 2025年7月12日
AI智能体与代理式AI:概念分类、应用与挑战
专知会员服务
28+阅读 · 2025年5月17日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
《结合机器人行为以实现安全、智能的执行》
专知会员服务
16+阅读 · 2023年7月4日
专知会员服务
34+阅读 · 2021年5月8日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【智能制造】新一代智能制造:人工智能与智能制造
产业智能官
17+阅读 · 2018年8月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2月18日
Arxiv
0+阅读 · 2月10日
VIP会员
最新内容
《新兴技术武器化及其对全球风险的影响》
专知会员服务
7+阅读 · 4月29日
《帕兰泰尔平台介绍:信息分析平台》
专知会员服务
18+阅读 · 4月29日
智能体化世界建模:基础、能力、规律及展望
专知会员服务
11+阅读 · 4月28日
相关VIP内容
AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
智能体适应
专知会员服务
25+阅读 · 2025年12月11日
智能体任务执行安全要求
专知会员服务
19+阅读 · 2025年7月12日
AI智能体基础设施
专知会员服务
42+阅读 · 2025年7月12日
AI智能体与代理式AI:概念分类、应用与挑战
专知会员服务
28+阅读 · 2025年5月17日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
《结合机器人行为以实现安全、智能的执行》
专知会员服务
16+阅读 · 2023年7月4日
专知会员服务
34+阅读 · 2021年5月8日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员