Autonomous agents based on Large Language Models (LLMs) have evolved from reactive assistants to systems capable of planning, executing actions via tools, and iterating over environment observations. However, they remain vulnerable to structural limitations: lack of native state, context degradation over long horizons, and the gap between probabilistic generation and deterministic execution requirements. This paper presents the ESAA (Event Sourcing for Autonomous Agents) architecture, which separates the agent's cognitive intention from the project's state mutation, inspired by the Event Sourcing pattern. In ESAA, agents emit only structured intentions in validated JSON (agent.result or issue.report); a deterministic orchestrator validates, persists events in an append-only log (activity.jsonl), applies file-writing effects, and projects a verifiable materialized view (roadmap.json). The proposal incorporates boundary contracts (AGENT_CONTRACT.yaml), metaprompting profiles (PARCER), and replay verification with hashing (esaa verify), ensuring the immutability of completed tasks and forensic traceability. Two case studies validate the architecture: (i) a landing page project (9 tasks, 49 events, single-agent composition) and (ii) a clinical dashboard system (50 tasks, 86 events, 4 concurrent agents across 8 phases), both concluding with run.status=success and verify_status=ok. The multi-agent case study demonstrates real concurrent orchestration with heterogeneous LLMs (Claude Sonnet 4.6, Codex GPT-5, Antigravity/Gemini 3 Pro, and Claude Opus 4.6), providing empirical evidence of the architecture's scalability beyond single-agent scenarios.


翻译:基于大语言模型(LLMs)的自主体已从反应式助手演变为能够进行规划、通过工具执行动作并对环境观察进行迭代的系统。然而,它们仍然面临结构性限制:缺乏原生状态、长周期上下文退化,以及概率性生成与确定性执行要求之间的差距。本文提出ESAA(面向自主体的Event Sourcing)架构,其灵感源自事件溯源模式,将主体的认知意图与项目状态变更分离。在ESAA中,主体仅以经过验证的JSON格式(agent.result或issue.report)发出结构化意图;一个确定性编排器负责验证意图、将事件持久化到仅追加日志(activity.jsonl)中、应用文件写入效果,并生成可验证的物化视图(roadmap.json)。该方案整合了边界契约(AGENT_CONTRACT.yaml)、元提示配置文件(PARCER)以及带哈希的重放验证(esaa verify),确保了已完成任务的不可变性和可追溯性。两个案例研究验证了该架构:(i)一个着陆页项目(9个任务,49个事件,单主体构成)和(ii)一个临床仪表盘系统(50个任务,86个事件,跨越8个阶段的4个并发主体),两者均以run.status=success和verify_status=ok结束。多主体案例研究展示了使用异构LLMs(Claude Sonnet 4.6、Codex GPT-5、Antigravity/Gemini 3 Pro和Claude Opus 4.6)的真实并发编排,为该架构在单主体场景之外的可扩展性提供了实证证据。

0
下载
关闭预览

相关内容

基于大模型的智能体中由自主性引发的安全风险综述
专知会员服务
18+阅读 · 2025年7月1日
基于大型语言模型的人机系统综述
专知会员服务
26+阅读 · 2025年5月12日
基于大型语言模型的软件工程智能体综述
专知会员服务
59+阅读 · 2024年9月6日
大模型如何迭代?北大等《大型语言模型自我进化》综述
基于大语言模型的复杂任务自主规划处理框架
专知会员服务
102+阅读 · 2024年4月12日
【普林斯顿】基于大型语言模型的语言智能体认知架构
专知会员服务
77+阅读 · 2023年9月6日
一文带你读懂自然语言处理 - 事件提取
AI研习社
10+阅读 · 2019年5月10日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
美/以-伊战争:停火与后续情景与影响分析
专知会员服务
3+阅读 · 4月11日
美国-以色列-伊朗战争:是否会动用地面部队?
美国协同作战飞机项目新型无人机发动机
专知会员服务
1+阅读 · 4月11日
无人机在美以伊战争中的关键启示(印度视角)
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员