As AI agents evolve from text generators into autonomous economic actors that accept jobs, manage budgets, and delegate to sub-agents, the absence of runtime governance becomes a critical gap. Existing frameworks orchestrate agent behavior but impose no fiscal constraints, require no earned permissions, and offer no tamper-evident audit trail. We introduce Sovereign-OS, a governance-first operating system that places every agent action under constitutional control. A declarative Charter (YAML) defines mission scope, fiscal boundaries, and success criteria. A CEO (Strategist) decomposes goals into dependency-aware task DAGs; a CFO (Treasury) gates each expenditure against budget caps, daily burn limits, and profitability floors via an auction-based bidding engine; Workers operate under earned-autonomy permissions governed by a dynamic TrustScore; and an Auditor (ReviewEngine) verifies outputs against Charter KPIs, sealing each report with a SHA-256 proof hash. Across our evaluation suite, Sovereign-OS blocks 100% of fiscal violations (30 scenarios), achieves 94% correct permission gating (200 trust-escalation missions), and maintains zero integrity failure over 1,200+ audit reports. The system further integrates Stripe for real-world payment processing, closing the loop from task planning to revenue collection. Our live demonstration walks through three scenarios: loading distinct Charters to observe divergent agent behavior, triggering CFO fiscal denials under budget and profitability constraints, and escalating a new worker's TrustScore from restricted to fully authorized with on-the-spot cryptographic audit verification.


翻译:随着AI代理从文本生成器演变为能够接受任务、管理预算并委托子代理的自主经济主体,运行时治理的缺失已成为关键短板。现有框架虽能协调代理行为,但既未施加财政约束,亦不要求权限获取,更缺乏防篡改审计追踪机制。本文提出主权操作系统——一种以治理为核心的操作系统,将每个代理行为置于宪章约束之下。声明式宪章(YAML格式)定义了任务范围、财政边界与成功标准。首席执行官(战略规划器)将目标分解为依赖关系感知的任务有向无环图;首席财务官(财政部)通过基于拍卖的竞价引擎,依据预算上限、日消耗限额及盈利底限审核每笔支出;工作者在动态信任积分体系监管下基于已获权限运行;审计官(审查引擎)依据宪章关键绩效指标验证输出,并为每份报告附加SHA-256证明哈希值密封。在完整评估测试中,主权操作系统成功拦截全部财政违规行为(30种场景),实现94%的权限控制准确率(200项信任升级任务),并在1200余份审计报告中保持零完整性失效。该系统进一步集成Stripe实现真实支付处理,形成从任务规划到收益回收的完整闭环。我们的实时演示涵盖三大场景:加载不同宪章观察代理行为分化,在预算与盈利约束下触发首席财务官财政否决,以及将新工作者信任积分从受限级实时提升至完全授权并同步完成密码学审计验证。

0
下载
关闭预览

相关内容

《军用自主人工智能系统的治理与安全》
专知会员服务
17+阅读 · 4月21日
《未来自主协作系统的指挥与控制——2025年度报告》报告
追寻真正的AI自主性:从遗留思维到战场优势
专知会员服务
21+阅读 · 2025年12月17日
一种Agent自主性风险评估框架 | 最新文献
专知会员服务
23+阅读 · 2025年10月24日
《军事领域人工智能网络安全的数字主权控制框架》
专知会员服务
20+阅读 · 2025年9月20日
《面向多计算系统的人工智能自主决策》330页
专知会员服务
64+阅读 · 2024年11月21日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
【无人机】无人机的自主与智能控制
产业智能官
53+阅读 · 2017年11月27日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
Arxiv
0+阅读 · 4月20日
Arxiv
0+阅读 · 4月7日
VIP会员
最新内容
战略前沿人工智能的再思考(中文)
专知会员服务
6+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
5+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
5+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
15+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员