Compliant But Unsatisfactory: The Gap Between Auditing Standards and Practices for Probabilistic Genotyping Software - 专知论文

会员服务 ·

0

Compliant But Unsatisfactory: The Gap Between Auditing Standards and Practices for Probabilistic Genotyping Software

翻译：合规但不尽人意：概率基因分型软件审计标准与实践之间的鸿沟

Angela Jin,Alexander Asemota,Dan E. Krane,Nathaniel D. Adams,Rediet Abebe

from arxiv, 20 pages, 2 figures, published at ACM CHI, 2026

AI governance efforts increasingly rely on audit standards: agreed-upon practices for conducting audits. However, poorly designed standards can hide and lend credibility to inadequate systems. We explore how an audit standard's design influences its effectiveness through a case study of ASB 018, a standard for auditing probabilistic genotyping software -- software that the U.S. criminal legal system increasingly uses to analyze DNA samples. Through qualitative analysis of ASB 018 and five audit reports, we identify numerous gaps between the standard's desired outcomes and the auditing practices it enables. For instance, ASB 018 envisions that compliant audits establish restrictions on software use based on observed failures. However, audits can comply without establishing such boundaries. We connect these gaps to the design of the standard's requirements such as vague language and undefined terms. We conclude with recommendations for designing audit standards and evaluating their effectiveness.

翻译：人工智能治理工作日益依赖审计标准——即开展审计时商定的实践规范。然而，设计欠妥的标准可能掩盖并赋予不完善系统以可信度。我们以ASB 018标准为案例，探讨审计标准设计如何影响其有效性。ASB 018是用于审计概率基因分型软件的标准，这类软件在美国刑事司法系统中越来越多地被用于DNA样本分析。通过对ASB 018及五份审计报告的定性分析，我们发现了标准预期目标与其所促成的审计实践之间存在诸多差距。例如，ASB 018设想合规审计应根据观测到的故障对软件使用设定限制，但审计可在不设定此类边界的情况下仍满足合规要求。我们将这些差距与标准要求的设计缺陷（如模糊措辞和未定义术语）联系起来。最后，我们提出关于设计审计标准及评估其有效性的建议。

0

相关内容

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

专知会员服务

24+阅读 · 2023年8月20日

重磅！国家标准《人工智能计算平台安全框架》征求意见稿发布，38页pdf详细规定AI计算安全框架

重磅！国家标准《人工智能计算平台安全框架》征求意见稿发布，38页pdf详细规定AI计算安全框架

专知会员服务

75+阅读 · 2023年6月12日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

专知会员服务

44+阅读 · 2022年4月20日

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

专知会员服务

13+阅读 · 2022年3月28日

最新！《智慧城市成熟度评估模型》国家标准征求意见稿发布，45页pdf

最新！《智慧城市成熟度评估模型》国家标准征求意见稿发布，45页pdf

专知会员服务

22+阅读 · 2022年3月22日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

《信息安全技术机器学习算法安全评估规范》国家标准意见稿，33页pdf

《信息安全技术机器学习算法安全评估规范》国家标准意见稿，33页pdf

专知会员服务

74+阅读 · 2022年2月26日

央行发布《人工智能算法金融应用评价规范》，28页pdf

央行发布《人工智能算法金融应用评价规范》，28页pdf

专知会员服务

76+阅读 · 2021年5月2日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

【专题】美国司法部更新《企业合规方案评价指引》解析

【专题】美国司法部更新《企业合规方案评价指引》解析

蚂蚁金服评论

10+阅读 · 2019年5月15日

关于弱监督学习，这可能是目前最详尽的一篇科普文

关于弱监督学习，这可能是目前最详尽的一篇科普文

AI科技评论

29+阅读 · 2019年5月1日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

数据标注术语和规范国家标准出炉,你的写法符合规范么?

数据标注术语和规范国家标准出炉,你的写法符合规范么?

专知

17+阅读 · 2019年3月21日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

ASMR-Bench: Auditing for Sabotage in ML Research

Arxiv

0+阅读 · 4月17日

Reciprocal Trust and Distrust in Artificial Intelligence Systems: The Hard Problem of Regulation

Arxiv

0+阅读 · 4月7日

The Stochastic Gap: A Markovian Framework for Pre-Deployment Reliability and Oversight-Cost Auditing in Agentic Artificial Intelligence

Arxiv

0+阅读 · 3月25日

Multi-Agent Reasoning with Consistency Verification Improves Uncertainty Calibration in Medical MCQA

Arxiv

0+阅读 · 3月25日

Prescriptive Artificial Intelligence: A Formal Paradigm for Auditing Human Decisions Under Uncertainty

Arxiv

0+阅读 · 3月25日

From Accuracy to Readiness: Metrics and Benchmarks for Human-AI Decision-Making

Arxiv

0+阅读 · 3月19日

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Arxiv

0+阅读 · 3月11日

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Arxiv

0+阅读 · 3月9日

The Illusion of Human AI Parity Under Uncertainty: Navigating Elusive Ground Truth via a Probabilistic Paradigm

Arxiv

0+阅读 · 2月23日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 27分钟前

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 29分钟前

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

2+阅读 · 41分钟前

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 52分钟前

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

2+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

专知会员服务

24+阅读 · 2023年8月20日

重磅！国家标准《人工智能计算平台安全框架》征求意见稿发布，38页pdf详细规定AI计算安全框架

重磅！国家标准《人工智能计算平台安全框架》征求意见稿发布，38页pdf详细规定AI计算安全框架

专知会员服务

75+阅读 · 2023年6月12日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

【可审计AI概念】中文版：德国联邦信息安全局等十余个单位联合发布《迈向可审计人工智能系统：现状和未来方向》白皮书

专知会员服务

44+阅读 · 2022年4月20日

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

【AI+会计审计】2022最新paper《内部审计中的人工智能有助于有效治理：深度学习能够检测财务会计数据中的异常现象》

专知会员服务

13+阅读 · 2022年3月28日

最新！《智慧城市成熟度评估模型》国家标准征求意见稿发布，45页pdf

最新！《智慧城市成熟度评估模型》国家标准征求意见稿发布，45页pdf

专知会员服务

22+阅读 · 2022年3月22日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

《信息安全技术机器学习算法安全评估规范》国家标准意见稿，33页pdf

《信息安全技术机器学习算法安全评估规范》国家标准意见稿，33页pdf

专知会员服务

74+阅读 · 2022年2月26日

央行发布《人工智能算法金融应用评价规范》，28页pdf

央行发布《人工智能算法金融应用评价规范》，28页pdf

专知会员服务

76+阅读 · 2021年5月2日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

【专题】美国司法部更新《企业合规方案评价指引》解析

【专题】美国司法部更新《企业合规方案评价指引》解析

蚂蚁金服评论

10+阅读 · 2019年5月15日

关于弱监督学习，这可能是目前最详尽的一篇科普文

关于弱监督学习，这可能是目前最详尽的一篇科普文

AI科技评论

29+阅读 · 2019年5月1日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

数据标注术语和规范国家标准出炉,你的写法符合规范么?

数据标注术语和规范国家标准出炉,你的写法符合规范么?

专知

17+阅读 · 2019年3月21日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

ASMR-Bench: Auditing for Sabotage in ML Research

Arxiv

0+阅读 · 4月17日

Reciprocal Trust and Distrust in Artificial Intelligence Systems: The Hard Problem of Regulation

Arxiv

0+阅读 · 4月7日

The Stochastic Gap: A Markovian Framework for Pre-Deployment Reliability and Oversight-Cost Auditing in Agentic Artificial Intelligence

Arxiv

0+阅读 · 3月25日

Multi-Agent Reasoning with Consistency Verification Improves Uncertainty Calibration in Medical MCQA

Arxiv

0+阅读 · 3月25日

Prescriptive Artificial Intelligence: A Formal Paradigm for Auditing Human Decisions Under Uncertainty

Arxiv

0+阅读 · 3月25日

From Accuracy to Readiness: Metrics and Benchmarks for Human-AI Decision-Making

Arxiv

0+阅读 · 3月19日

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Arxiv

0+阅读 · 3月11日

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Arxiv

0+阅读 · 3月9日

The Illusion of Human AI Parity Under Uncertainty: Navigating Elusive Ground Truth via a Probabilistic Paradigm

Arxiv

0+阅读 · 2月23日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

相关基金

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员