As artificial intelligence (AI) systems evolve from stateless chatbots to autonomous multi-step agents, prompt engineering (PE), the discipline of crafting individual queries, proves necessary but insufficient. This paper introduces context engineering (CE) as a standalone discipline concerned with designing, structuring, and managing the entire informational environment in which an AI agent makes decisions. Drawing on vendor architectures (Google ADK, Anthropic, LangChain), current academic work (ACE framework, Google DeepMind's intelligent delegation), enterprise research (Deloitte, 2026; KPMG, 2026), and the author's experience building a multi-agent system, the paper proposes five context quality criteria: relevance, sufficiency, isolation, economy, and provenance, and frames context as the agent's operating system. Two higher-order disciplines follow. Intent engineering (IE) encodes organizational goals, values, and trade-off hierarchies into agent infrastructure. Specification engineering (SE) creates a machine-readable corpus of corporate policies and standards enabling autonomous operation of multi-agent systems at scale. Together these four disciplines form a cumulative pyramid maturity model of agent engineering, in which each level subsumes the previous one as a necessary foundation. Enterprise data reveals a gap: while 75% of enterprises plan agentic AI deployment within two years (Deloitte, 2026), deployment has surged and retreated as organizations confront scaling complexity (KPMG, 2026). The Klarna case illustrates a dual deficit, contextual and intentional. Whoever controls the agent's context controls its behavior; whoever controls its intent controls its strategy; whoever controls its specifications controls its scale.


翻译:随着人工智能系统从无状态的聊天机器人演变为自主的多步骤智能体,提示工程——即精心设计单个查询的学科——被证明是必要但不充分的。本文引入上下文工程作为一个独立的学科,它关注于设计、构建和管理智能体进行决策时所处的整个信息环境。借鉴供应商架构、当前学术工作、企业研究以及作者构建多智能体系统的经验,本文提出了五个上下文质量准则:相关性、充分性、隔离性、经济性和可溯源性,并将上下文框架定义为智能体的操作系统。由此衍生出两个更高阶的学科。意图工程将组织的目标、价值观和权衡层级编码到智能体基础设施中。规范工程则创建一个机器可读的企业政策和标准语料库,使得大规模多智能体系统的自主运行成为可能。这四个学科共同构成了一个累积的金字塔式智能体工程成熟度模型,其中每一层级都包含前一层级作为必要基础。企业数据显示出一个差距:虽然75%的企业计划在两年内部署智能体人工智能,但由于组织面临规模化复杂性,实际部署经历了激增与回落。Klarna案例说明了上下文和意图的双重缺失。谁控制了智能体的上下文,谁就控制了其行为;谁控制了其意图,谁就控制了其战略;谁控制了其规范,谁就控制了其规模。

0
下载
关闭预览

相关内容

智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
上下文工程 2.0:上下文工程的上下文
专知会员服务
24+阅读 · 2025年11月12日
上下文工程到底是什么?一文起底
专知会员服务
23+阅读 · 2025年7月21日
大型语言模型中提示工程的系统综述:技术与应用
专知会员服务
81+阅读 · 2024年2月15日
大型视觉模型和视觉提示工程
专知会员服务
79+阅读 · 2023年7月5日
【知识图谱】从知识工程到知识图谱全面回顾
产业智能官
20+阅读 · 2019年5月31日
全面回顾 | 从知识工程到知识图谱
THU数据派
16+阅读 · 2019年5月11日
【数字工程】美国国防部数字工程战略解读(全文)
产业智能官
36+阅读 · 2019年4月15日
中国工程院:《全球工程前沿2018》(附PDF下载)
走向智能论坛
10+阅读 · 2018年12月5日
一文看懂常用特征工程方法
AI研习社
17+阅读 · 2018年5月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 4月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员