Be Fair! Can Machine Learning Engineering Agents Adhere to Fairness Constraints? - 专知论文

会员服务 ·

0

Facebook AI Research · Agent · 极大似然估计 · Machine Learning · Learning ·

Be Fair! Can Machine Learning Engineering Agents Adhere to Fairness Constraints?

翻译：公平公正！机器学习工程代理能否遵循公平性约束？

Anna Richter,Julia Stoyanovich,Sebastian Schelter

Machine learning engineering (MLE) agents promise to automate end-to-end ML pipeline development from raw data and natural language instructions, potentially making ML accessible to non-technical domain experts. However, in sensitive and regulated domains, this abstraction creates a responsibility gap: end-users may lack visibility into design choices that affect correctness, robustness, fairness, and regulatory compliance. We argue that existing benchmarks are insufficient to assess whether MLE agents can be safely applied in such settings. We propose desiderata for a responsibility-centered evaluation framework and conduct an exploratory study on melanoma classification, focusing on fairness across skin tones as a responsibility constraint. When evaluating two recent MLE agents, we find that agent-generated pipelines show high variance and consistently underperform manually designed baselines in both predictive quality and fairness, despite fairness-oriented prompts. These preliminary results suggest that further research is needed towards redesigning MLE agents to allow humans to guide the search process and reliably assess the compliance and quality of the generated ML pipelines.

翻译：机器学习工程代理承诺从原始数据和自然语言指令中自动化端到端机器学习流水线的开发，这有望使非技术领域专家也能使用机器学习。然而，在敏感且受监管的领域中，这种抽象化造成了责任缺口：最终用户可能无法了解那些影响正确性、鲁棒性、公平性和法规遵从性的设计选择。我们认为现有基准不足以评估机器学习代理能否安全应用于此类场景。我们提出以责任为中心的评估框架的应具备要素，并围绕皮肤肿瘤分类开展探索性研究，将肤色间的公平性作为责任约束进行聚焦。在评估两个近期机器学习代理时，我们发现代理生成的流水线表现出高方差，且即便在面向公平的提示下，其在预测质量和公平性两方面均始终逊于人工设计的基准方法。这些初步结果表明，需要进一步研究以重新设计机器学习代理，使人类能够引导搜索过程，并可靠地评估所生成机器学习流水线的合规性与质量。

0

相关内容

Facebook AI Research

Facebook AI Research

Facebook AI Research

【普林斯顿博士论文】将负责任的机器学习落地：从平等走向公平

【普林斯顿博士论文】将负责任的机器学习落地：从平等走向公平

专知会员服务

21+阅读 · 2024年10月8日

【普林斯顿博士论文】使负责任的机器学习落地：从平等到公平，299页pdf

【普林斯顿博士论文】使负责任的机器学习落地：从平等到公平，299页pdf

专知会员服务

22+阅读 · 2024年8月10日

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

专知会员服务

23+阅读 · 2023年1月28日

不可错过！专门为AI产品经理开设！Delft 大学最新《机器学习设计》课程，9节课带你落地ML到智能产品中

不可错过！专门为AI产品经理开设！Delft 大学最新《机器学习设计》课程，9节课带你落地ML到智能产品中

专知会员服务

27+阅读 · 2022年6月17日

【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models

【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models

专知会员服务

22+阅读 · 2022年3月7日

可信机器学习的公平性综述

可信机器学习的公平性综述

专知会员服务

69+阅读 · 2021年2月23日

【干货书】面向工程师的机器学习简介：理论、算法、概念全覆盖，206页pdf

【干货书】面向工程师的机器学习简介：理论、算法、概念全覆盖，206页pdf

专知会员服务

113+阅读 · 2020年6月13日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

76+阅读 · 2019年12月2日

【电子书推荐】机器学习课程，A Course in Machine Learning，Hal Daumé III

【电子书推荐】机器学习课程，A Course in Machine Learning，Hal Daumé III

专知会员服务

28+阅读 · 2019年11月19日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

专知

46+阅读 · 2019年12月9日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

【机器学习】机器学习工业领域应用

【机器学习】机器学习工业领域应用

产业智能官

11+阅读 · 2018年10月23日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

机器学习笔试题精选

机器学习笔试题精选

人工智能头条

13+阅读 · 2018年7月22日

一文概览能生成代理标签的半监督学习算法

一文概览能生成代理标签的半监督学习算法

论智

12+阅读 · 2018年6月5日

第二章机器学习中的数学基础

第二章机器学习中的数学基础

Datartisan数据工匠

12+阅读 · 2018年4月5日

机器学习必备手册

机器学习必备手册

机器学习研究会

19+阅读 · 2017年10月24日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于代数规约的Web服务在线测试理论和技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

When Agent Automation Becomes Profitable: Quantifying and Insuring Autonomous AI Risk through Trace-Economic Underwriting

Arxiv

0+阅读 · 6月15日

Software Delegation Contracts: Measuring Reviewability in AI Coding-Agent Work

Arxiv

0+阅读 · 6月14日

Will AI Agents Free Us From Meaningless Work? A Human-Centered Analysis

Arxiv

0+阅读 · 6月12日

How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

Arxiv

0+阅读 · 6月11日

Agentomics: Economic Foundations for the Valuation, Attribution, and Pricing of AI Agents in Human-AI Workflows

Arxiv

0+阅读 · 6月9日

How do Agents Refactor: An Empirical Study

Arxiv

0+阅读 · 5月24日

Agentivism: a learning theory for the age of artificial intelligence

Arxiv

0+阅读 · 5月21日

Stochastic Penalty-Barrier Methods for Constrained Machine Learning

Arxiv

0+阅读 · 5月19日

DataMaster: Towards Autonomous Data Engineering for Machine Learning

Arxiv

0+阅读 · 5月11日

Machine Learning Meets Advanced Robotic Manipulation

Arxiv

11+阅读 · 2023年9月22日

VIP会员

文章信息

相关主题

Facebook AI Research

极大似然估计

Machine Learning

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

1+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

1+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

2+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

2+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

3+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

4+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

4+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

5+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

7+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【普林斯顿博士论文】将负责任的机器学习落地：从平等走向公平

【普林斯顿博士论文】将负责任的机器学习落地：从平等走向公平

专知会员服务

21+阅读 · 2024年10月8日

【普林斯顿博士论文】使负责任的机器学习落地：从平等到公平，299页pdf

【普林斯顿博士论文】使负责任的机器学习落地：从平等到公平，299页pdf

专知会员服务

22+阅读 · 2024年8月10日

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

《实施机器伦理：使用机器学习培养有道德的机器》2022年180页博士论文，科克大学

专知会员服务

23+阅读 · 2023年1月28日

不可错过！专门为AI产品经理开设！Delft 大学最新《机器学习设计》课程，9节课带你落地ML到智能产品中

不可错过！专门为AI产品经理开设！Delft 大学最新《机器学习设计》课程，9节课带你落地ML到智能产品中

专知会员服务

27+阅读 · 2022年6月17日

【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models

【MIT-ICLR2022】在机器学习模型中注入公平性, Injecting fairness into machine-learning models

专知会员服务

22+阅读 · 2022年3月7日

可信机器学习的公平性综述

可信机器学习的公平性综述

专知会员服务

69+阅读 · 2021年2月23日

【干货书】面向工程师的机器学习简介：理论、算法、概念全覆盖，206页pdf

【干货书】面向工程师的机器学习简介：理论、算法、概念全覆盖，206页pdf

专知会员服务

113+阅读 · 2020年6月13日

【机器学习课程】机器学习中的常识性问题

【机器学习课程】机器学习中的常识性问题

专知会员服务

76+阅读 · 2019年12月2日

【电子书推荐】机器学习课程，A Course in Machine Learning，Hal Daumé III

【电子书推荐】机器学习课程，A Course in Machine Learning，Hal Daumé III

专知会员服务

28+阅读 · 2019年11月19日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

【UMD开放经典书】机器学习课程简明书，19章227页pdf，带你学习ML

专知

46+阅读 · 2019年12月9日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

【机器学习】机器学习工业领域应用

【机器学习】机器学习工业领域应用

产业智能官

11+阅读 · 2018年10月23日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

机器学习笔试题精选

机器学习笔试题精选

人工智能头条

13+阅读 · 2018年7月22日

一文概览能生成代理标签的半监督学习算法

一文概览能生成代理标签的半监督学习算法

论智

12+阅读 · 2018年6月5日

第二章机器学习中的数学基础

第二章机器学习中的数学基础

Datartisan数据工匠

12+阅读 · 2018年4月5日

机器学习必备手册

机器学习必备手册

机器学习研究会

19+阅读 · 2017年10月24日

相关论文

When Agent Automation Becomes Profitable: Quantifying and Insuring Autonomous AI Risk through Trace-Economic Underwriting

Arxiv

0+阅读 · 6月15日

Software Delegation Contracts: Measuring Reviewability in AI Coding-Agent Work

Arxiv

0+阅读 · 6月14日

Will AI Agents Free Us From Meaningless Work? A Human-Centered Analysis

Arxiv

0+阅读 · 6月12日

How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope

Arxiv

0+阅读 · 6月11日

Agentomics: Economic Foundations for the Valuation, Attribution, and Pricing of AI Agents in Human-AI Workflows

Arxiv

0+阅读 · 6月9日

How do Agents Refactor: An Empirical Study

Arxiv

0+阅读 · 5月24日

Agentivism: a learning theory for the age of artificial intelligence

Arxiv

0+阅读 · 5月21日

Stochastic Penalty-Barrier Methods for Constrained Machine Learning

Arxiv

0+阅读 · 5月19日

DataMaster: Towards Autonomous Data Engineering for Machine Learning

Arxiv

0+阅读 · 5月11日

Machine Learning Meets Advanced Robotic Manipulation

Arxiv

11+阅读 · 2023年9月22日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于代数规约的Web服务在线测试理论和技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员