Autonomous agents deployed in regulated domains must produce a verification artifact per consequential output: a record an auditor can re-execute offline, capturing what was claimed, against what source, by whom, when, and how. Production verification today splits into two unstandardized halves. Probabilistic verdict patterns (self-consistency voting, reviewer LLM ensembles) produce judgments, not artifacts. Artifact-producing patterns (RAG, tool-augmented traces, generator-verifier loops) produce vendor-specific records no external auditor can reconstruct without bespoke integration. Pramana defines the missing wire format. Every consequential agent output is wrapped in a typed ClaimAttestation with one of four variants (measurement, inference, analogy, citation), each paired with a verify() operation against the recorded source. verify() is deterministic for MeasurementClaim and CitationClaim. For InferenceClaim and AnalogyClaim, determinism is conditional on the oracle (audit-replayable when LLM-backed). The four-way typology derives from classical Indian epistemology (pramana, valid means of knowledge). The lifecycle is specified in TLA+ and exhaustively verified under TLC across three symmetry-reduced models: 38,563 distinct reachable states, zero invariant violations. The Python reference implementation passes 84 tests. An A2A and MCP wire-extension manifest layers three deployment-grade invariants: reachability, SLA bound, and offline re-verifiability. An exploratory pilot (n=100, 2,275 reviewer calls) probes LLM-as-judge in code generation. The strongest observation is a 40-percentage-point raw FPR delta across corpora, consistent with reference-solution quality contributing significantly. The pilot does not validate Pramana on its own; the structural argument and formal verification do that.


翻译:在受监管领域部署的自主智能体,必须为每个关键输出生成可验证的制品:一份可供审计员离线重放的记录,准确捕获所声明的具体内容、信息来源、声明主体、时间戳及验证方式。当前的生产级验证体系分裂为两个未标准化的分支。概率性裁决模式(自一致性投票、评审者大模型集成)产生的是判决结果而非可验证制品;而制品生成模式(检索增强生成、工具增强轨迹、生成器-验证器循环)产出的是厂商特有记录,外部审计员需通过定制化集成才能重构验证过程。Pramana定义了缺失的传输协议格式:每个关键智能体输出被封装为带类型的ClaimAttestation,包含四种变体(测量、推理、类比、引用),每种变体均配有针对记录源执行的verify()操作。对于MeasurementClaim和CitationClaim,verify()具有确定性;而对于InferenceClaim与AnalogyClaim,确定性取决于预言机(当由大模型驱动时可实现审计重放)。四维分类体系源于古印度知识论(pramana,有效认知手段)。其生命周期以TLA+形式化规约,经TLC模型检测器在三个对称约减模型上全面验证:共发现38,563个可达状态,零不变违反。Python参考实现通过84项测试。A2A与MCP协议扩展清单封装了三个部署级不变量:可达性、服务等级协议边界及离线重验证能力。探索性试点实验(n=100,2,275次评审调用)检验了大模型作为裁判在代码生成中的表现,最显著的观测结果为跨语料库原始假阳性率差值达40个百分点,该差异与参考解质量高度相关。需注意,该试点并非对Pramana自身的验证——其结构性论证与形式化验证方构成核心证据。

0
下载
关闭预览

相关内容

通用智能体评估的逻辑架构
专知会员服务
22+阅读 · 2月28日
智能体评判者(Agent-as-a-Judge)研究综述
专知会员服务
37+阅读 · 1月9日
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
工程可信赖的机器学习运维——基于零知识证明
专知会员服务
9+阅读 · 2025年5月27日
《人工智能赋能空战智能体的可解释性》
专知会员服务
70+阅读 · 2024年6月5日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员