一、 核心定位与目标

本书被定义为“务实的设计指南” 。如果说作者的前作关注“构建什么”,那么本书则专注于“如何构建” 。它通过收集 2025 年智能体爆发年期间,各大模型实验室和初创公司的成功与失败案例,提炼出了一套可落地的架构范式 。 二、 主要内容模块 全书分为五个核心部分,涵盖了智能体生命周期的关键环节: * 第一部分:配置智能体 (Configure Your Agents)

探讨如何从“愿望清单”转向可运行的系统 。 *

关键范式:在白板上规划能力(Whiteboard Capabilities) 、智能体架构的演进 、动态智能体 以及人机回环(Human-in-the-Loop)设计 。 * 第二部分:上下文工程 (Engineer Agent Context)

探讨如何解决上下文溢出(Context Overflow)和模型注意力不集中的问题 。 *

关键范式:谨慎执行并行化 、子智能体间共享上下文 、上下文压缩技术 以及将错误信息反馈至上下文以实现自愈 。 * 第三部分:评估智能体响应 (Evaluate Agent Responses)

针对 AI 输出的非确定性(Nondeterministic),建立生产级评估体系 。 *

关键范式:定义失败模式(Failure Modes) 、建立测试套件 、让领域专家(SMEs)参与数据标注 以及利用“LLM-as-judge”评估生产数据 。 * 第四部分:保障智能体安全 (Secure Your Agents)

应对智能体特有的安全威胁 。 *

关键范式:预防“致命三要素” (The Lethal Trifecta:私有数据访问、不可信内容暴露、外部通信能力) 、沙盒化代码执行 以及实现细粒度的权限控制 。 * 第五部分:智能体的未来 (The Future of Agents)

展望 2025-2035 智能体十年的发展趋势,包括智能体模拟、自主学习和合成评估 。

三、 书中强调的核心观点

反对“单体巨型智能体” (Monolithic Mega-agents):建议通过迭代发现架构,从小规模的专业化专家出发,再通过路由逻辑(Router)进行协作 。 1.

上下文不仅是空间,更是艺术:单纯扩大上下文窗口并不能解决问题,过大的上下文会导致“上下文腐烂” (Context Rot),使模型失去识别重要信息的能力 。 1.

专家标注优于开发者标注:作者认为软件工程师通常不是特定领域的专家,在医疗、法律等垂直领域,必须由领域专家进行标注以建立“黄金答案”数据集 。

成为VIP会员查看完整内容
42

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
【新书】人工智能智能体的应用,527页pdf
专知会员服务
114+阅读 · 2025年2月14日
【新书】生成式人工智能模型,419页pdf
专知会员服务
120+阅读 · 2024年9月3日
【新书】深度学习的数学理论,267页pdf
专知会员服务
60+阅读 · 2024年8月16日
【新书】动态规划卷I:有限状态,446页pdf
专知会员服务
59+阅读 · 2024年1月24日
【2023新书】机器学习集成方法,354页pdf
专知
40+阅读 · 2023年4月11日
【2022新书】深度学习归一化技术,117页pdf
专知
29+阅读 · 2022年11月25日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关主题
相关VIP内容
【新书】人工智能智能体的应用,527页pdf
专知会员服务
114+阅读 · 2025年2月14日
【新书】生成式人工智能模型,419页pdf
专知会员服务
120+阅读 · 2024年9月3日
【新书】深度学习的数学理论,267页pdf
专知会员服务
60+阅读 · 2024年8月16日
【新书】动态规划卷I:有限状态,446页pdf
专知会员服务
59+阅读 · 2024年1月24日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员