Towards Auditing AI Systems in the Wild - 专知论文

会员服务 ·

0

系统 · 人工智能系统 · 智能系统 · 约束 · 不确定 ·

Towards Auditing AI Systems in the Wild

翻译：面向真实环境中的人工智能系统审计

Aditya T. Vadlamani,Anutam Srinivasan,Srinivasan Parthasarathy

from arxiv, Accepted to KDD 2026 (Blue Sky Ideas Track)

AI systems are increasingly deployed in real-world settings where their behavior is shaped by dynamic environments, evolving data distributions, and complex interactions with users and infrastructure. Traditional machine learning evaluation focuses on benchmarks and operates within sandboxed environments, providing only a limited view of the true system behavior in the wild. We argue for the development of principled auditing frameworks that monitor deployed AI systems throughout their lifecycle. We further propose framing auditing as a statistical problem of monitoring constraint violations under uncertainty, where desired properties (e.g., fairness and safety) are treated as risk-controlled constraints that must be continuously evaluated as systems evolve through iterative feedback. This perspective highlights the need for uncertainty-aware monitoring methods, socio-technical specifications of audit criteria, and auditing infrastructures that enable ongoing oversight of AI systems in the wild.

翻译：人工智能系统日益部署在行为受动态环境、演化数据分布以及与人及基础设施复杂交互影响的真实环境中。传统机器学习评估侧重于基准测试并在沙箱环境中运行，仅能提供系统在真实场景中行为的有限视角。我们主张开发原则性的审计框架，以全生命周期监测已部署的人工智能系统。进一步提出将审计框架构建为不确定性条件下约束违规监测的统计问题——将公平性、安全性等期望属性视为风险可控约束，当系统通过迭代反馈演化时必须持续评估这些约束。该视角凸显了对不确定性感知的监测方法、社会技术维度的审计标准规范，以及支持对真实环境中人工智能系统进行持续监督的审计基础设施的需求。

0

相关内容

《国防行动中人工智能驱动的情报、监视与侦察（ISR）系统》

《国防行动中人工智能驱动的情报、监视与侦察（ISR）系统》

专知会员服务

31+阅读 · 2025年9月5日

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

专知会员服务

18+阅读 · 2025年7月15日

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

专知会员服务

53+阅读 · 2024年5月25日

《应对人工智能系统测试和评估新挑战的最佳实践》

《应对人工智能系统测试和评估新挑战的最佳实践》

专知会员服务

90+阅读 · 2023年8月7日

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

专知会员服务

92+阅读 · 2023年5月7日

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

专知会员服务

44+阅读 · 2022年4月20日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

专知会员服务

13+阅读 · 2022年3月28日

【AI+会计】2022最新综述26页pdf《人工智能在会计与审计中的应用综述》

【AI+会计】2022最新综述26页pdf《人工智能在会计与审计中的应用综述》

专知会员服务

20+阅读 · 2022年3月28日

人工智能系统可信性度量评估研究综述

人工智能系统可信性度量评估研究综述

专知会员服务

96+阅读 · 2022年1月30日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Human-on-the-Bridge: Scalable Evaluation for AI Agents

Arxiv

0+阅读 · 6月15日

AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges

Arxiv

0+阅读 · 6月12日

Auditing Demographic Bias in Facial Landmark Detection for Fair Human-Robot Interaction

Arxiv

0+阅读 · 6月10日

Towards a Science of AI Agent Reliability

Arxiv

0+阅读 · 6月2日

Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing

Arxiv

0+阅读 · 6月1日

AI Behavioral Science

Arxiv

0+阅读 · 5月29日

AI Cartography: Mapping the Latent Landscape of AI Benchmark Ecosystems

Arxiv

0+阅读 · 5月24日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

Toward Visually Realistic Simulation: A Benchmark for Evaluating Robot Manipulation in Simulation

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

人工智能系统

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

1+阅读 · 今天15:02

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

1+阅读 · 今天15:00

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

2+阅读 · 今天14:30

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

2+阅读 · 今天14:05

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

2+阅读 · 今天13:55

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

2+阅读 · 今天13:51

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

2+阅读 · 今天13:48

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

7+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

《国防行动中人工智能驱动的情报、监视与侦察（ISR）系统》

《国防行动中人工智能驱动的情报、监视与侦察（ISR）系统》

专知会员服务

31+阅读 · 2025年9月5日

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

专知会员服务

18+阅读 · 2025年7月15日

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

专知会员服务

53+阅读 · 2024年5月25日

《应对人工智能系统测试和评估新挑战的最佳实践》

《应对人工智能系统测试和评估新挑战的最佳实践》

专知会员服务

90+阅读 · 2023年8月7日

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

专知会员服务

92+阅读 · 2023年5月7日

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

专知会员服务

44+阅读 · 2022年4月20日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

专知会员服务

13+阅读 · 2022年3月28日

【AI+会计】2022最新综述26页pdf《人工智能在会计与审计中的应用综述》

【AI+会计】2022最新综述26页pdf《人工智能在会计与审计中的应用综述》

专知会员服务

20+阅读 · 2022年3月28日

人工智能系统可信性度量评估研究综述

人工智能系统可信性度量评估研究综述

专知会员服务

96+阅读 · 2022年1月30日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

Human-on-the-Bridge: Scalable Evaluation for AI Agents

Arxiv

0+阅读 · 6月15日

AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges

Arxiv

0+阅读 · 6月12日

Auditing Demographic Bias in Facial Landmark Detection for Fair Human-Robot Interaction

Arxiv

0+阅读 · 6月10日

Towards a Science of AI Agent Reliability

Arxiv

0+阅读 · 6月2日

Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing

Arxiv

0+阅读 · 6月1日

AI Behavioral Science

Arxiv

0+阅读 · 5月29日

AI Cartography: Mapping the Latent Landscape of AI Benchmark Ecosystems

Arxiv

0+阅读 · 5月24日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

Toward Visually Realistic Simulation: A Benchmark for Evaluating Robot Manipulation in Simulation

Arxiv

0+阅读 · 5月7日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员