Prior work on trustworthy AI emphasizes model-internal properties such as bias mitigation, adversarial robustness, and interpretability. As AI systems evolve into autonomous agents deployed in open environments and increasingly connected to payments or assets, the operational meaning of trust shifts to end-to-end outcomes: whether an agent completes tasks, follows user intent, and avoids failures that cause material or psychological harm. These risks are fundamentally product-level and cannot be eliminated by technical safeguards alone because agent behavior is inherently stochastic. To address this gap between model-level reliability and user-facing assurance, we propose a complementary framework based on risk management. Drawing inspiration from financial underwriting, we introduce the \textbf{Agentic Risk Standard (ARS)}, a payment settlement standard for AI-mediated transactions. ARS integrates risk assessment, underwriting, and compensation into a single transaction framework that protects users when interacting with agents. Under ARS, users receive predefined and contractually enforceable compensation in cases of execution failure, misalignment, or unintended outcomes. This shifts trust from an implicit expectation about model behavior to an explicit, measurable, and enforceable product guarantee. We also present a simulation study analyzing the social benefits of applying ARS to agentic transactions. ARS's implementation can be found at https://github.com/t54-labs/AgenticRiskStandard.


翻译:先前关于可信AI的研究主要关注模型内部属性,如偏差缓解、对抗鲁棒性和可解释性。随着AI系统演变为部署在开放环境中、并与支付或资产日益相连的自主代理,信任的操作性含义转向端到端结果:代理是否完成任务、遵循用户意图、并避免造成物质或心理伤害的故障。这些风险本质上是产品层面的,无法仅通过技术保障消除,因为代理行为天然具有随机性。为弥合模型级可靠性与面向用户的保障之间的差距,我们提出一种基于风险管理的补充框架。借鉴金融核保的思路,我们引入**代理风险标准(ARS)**,这是一种面向AI中介交易的支付结算标准。ARS将风险评估、核保和补偿整合至单一交易框架中,在用户与代理交互时为其提供保护。在ARS下,若发生执行失败、目标偏离或意外结果,用户可获得预先定义且具有合同约束力的补偿。这将信任从对模型行为的隐含期望,转变为明确、可衡量且可执行的产吕保障。我们还通过仿真研究分析了将ARS应用于代理交易的社会效益。ARS的实现可在https://github.com/t54-labs/AgenticRiskStandard 获取。

0
下载
关闭预览

相关内容

《军事应用中的AI:建立信任》最新报告
专知会员服务
25+阅读 · 2025年12月29日
智能金融稳步前行:构建负责任的可信大模型
专知会员服务
22+阅读 · 2024年10月8日
【资源推荐】AI可解释性资源汇总
专知
47+阅读 · 2019年4月24日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
《军事应用中的AI:建立信任》最新报告
专知会员服务
25+阅读 · 2025年12月29日
智能金融稳步前行:构建负责任的可信大模型
专知会员服务
22+阅读 · 2024年10月8日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员