Long-horizon LLM tasks often fail not because a single answer is unattainable, but because knowledge states drift across rounds, intermediate commitments remain implicit, and interruption fractures the evolving evidence chain. This paper presents ADEMA as a knowledge-state orchestration architecture for long-horizon knowledge synthesis rather than as a generic multi-agent runtime. The architecture combines explicit epistemic bookkeeping, heterogeneous dual-evaluator governance, adaptive task-mode switching, reputation-shaped resource allocation, checkpoint-resumable persistence, segment-level memory condensation, artifact-first assembly, and final-validity checking with safe fallback. Evidence is drawn entirely from existing materials: a four-scenario showcase package, a fixed 60-run mechanism matrix, targeted micro-ablation and artifact-chain supplements, and a repaired protocol-level benchmark in which code-oriented evaluation is the clearest quality-sensitive mechanism block. Across the fixed matrix, removing checkpoint/resume produced the only invalid run, and it did so in the interruption-sensitive resume condition. By contrast, dual evaluation, segment synthesis, and dynamic governance are best interpreted as supporting control mechanisms that shape trajectory discipline, explicit artifact progression, and cost-quality behavior rather than as universal binary prerequisites for completion. The contribution is therefore a knowledge-state orchestration architecture in which explicit epistemic state transition, evidence-bearing artifact progression, and recoverable continuity are the primary design commitments.


翻译:长期大语言模型任务失败的原因往往不在于无法获得单一答案,而在于知识状态在轮次间发生漂移、中间承诺保持隐式状态以及中断导致不断演化的证据链断裂。本文提出ADEMA作为一种面向长时知识合成的知识状态编排架构,而非通用的多智能体运行时环境。该架构融合了显式知识簿记、异构双评估器治理、自适应任务模式切换、声誉驱动的资源分配、可检查点恢复的持久化机制、片段级记忆浓缩、构件优先组装以及带安全回退的最终有效性验证。证据全部来源于现有材料:包含四个场景的演示包、固定60次运行的机制矩阵、定向微型消融实验与构件链补充实验,以及经过修复的协议级基准测试——其中面向代码的评估是最清晰的质量敏感机制模块。在固定矩阵实验中,仅移除检查点/恢复功能即产生无效运行,且该情况恰好发生在对中断敏感的恢复条件下。相比之下,双评估器、片段合成与动态治理更适合解释为塑造轨迹规范性、显式构件演进与成本-质量行为的支撑控制机制,而非实现任务完成的普适性二元前提条件。因此,本文的核心贡献在于提出一种知识状态编排架构,其核心设计原则是显式知识状态转换、承载证据的构件演进与可恢复的连续性。

0
下载
关闭预览

相关内容

MMA:多模态记忆智能体
专知会员服务
10+阅读 · 2月19日
融合知识图谱的大语言模型研究综述
专知会员服务
38+阅读 · 2025年4月18日
基于大模型的态势认知智能体
专知会员服务
197+阅读 · 2024年4月7日
【普林斯顿】基于大型语言模型的语言智能体认知架构
专知会员服务
77+阅读 · 2023年9月6日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
ADL108《知识图谱》开始报名了
中国计算机学会
14+阅读 · 2019年10月8日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
自然语言处理(NLP)知识结构总结
AI100
51+阅读 · 2018年8月17日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
1+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员