面向公平的表格基础模型上下文学习 (Towards Fair In-Context Learning with Tabular Foundation Models) - 专知论文

会员服务 ·

0

上下文 · 不确定 · 上下文学习 · 公平性 · 不确定性 ·

Towards Fair In-Context Learning with Tabular Foundation Models

翻译：面向公平的表格基础模型上下文学习

Patrik Kenfack,Samira Ebrahimi Kahou,Ulrich Aïvodji

from arxiv, Published in Transactions on Machine Learning Research (TMLR)

Transformer-based tabular foundation models have recently demonstrated promising in-context learning (ICL) performance on structured data, emerging as competitive alternatives to gradient-boosted trees. However, the fairness implications of this new paradigm remain largely unexplored. We present the first investigation of fairness in tabular ICL, evaluating three recently proposed foundation models--TabPFNv2, TabICL, and TabDPT--on multiple benchmark datasets. To mitigate biases, we explore three pre-processing fairness-enhancing methods: correlation removal (decorrelating input features from the sensitive attribute), group-balanced sample selection (ensuring equal representation of protected groups in context examples), and uncertainty-based sample selection (prioritizing context examples with high sensitive-attribute prediction uncertainty). Our experiments show that the uncertainty-based strategy consistently improves group fairness metrics (e.g., demographic parity, equalized odds, and equal opportunity) with minimal impact on predictive accuracy. We release our code to facilitate reproducibility https://github.com/patrikken/Fair-TabICL.

翻译：基于Transformer的表格基础模型最近在结构化数据上展现出有前景的上下文学习性能，成为梯度提升树的有力竞争替代方案。然而，这一新范式的公平性影响在很大程度上仍未得到探索。我们首次对表格上下文学习的公平性进行了研究，在多个基准数据集上评估了三种近期提出的基础模型——TabPFNv2、TabICL和TabDPT。为了缓解偏差，我们探索了三种用于增强公平性的预处理方法：相关性移除（使输入特征与敏感属性解相关）、组平衡样本选择（确保上下文示例中受保护群体具有同等代表性）以及基于不确定性的样本选择（优先选择敏感属性预测不确定性高的上下文示例）。我们的实验表明，基于不确定性的策略能持续改进群体公平性指标（例如，人口统计均等、机会均等和机会平等），同时对预测准确性的影响最小。我们已公开代码以促进可复现性：https://github.com/patrikken/Fair-TabICL。

0

相关内容

上下文

【博士论文】基于多模态基础模型的上下文学习

【博士论文】基于多模态基础模型的上下文学习

专知会员服务

22+阅读 · 2025年12月17日

《深度表格学习综述》

《深度表格学习综述》

专知会员服务

43+阅读 · 2024年10月18日

表格数据的语言建模：基础、技术与演变综述

表格数据的语言建模：基础、技术与演变综述

专知会员服务

39+阅读 · 2024年8月23日

【CMU博士论文】利用结构和上下文进行语言邻近表示学习

【CMU博士论文】利用结构和上下文进行语言邻近表示学习

专知会员服务

22+阅读 · 2024年5月8日

【阿姆斯特丹博士论文】表格表示学习，179页pdf

【阿姆斯特丹博士论文】表格表示学习，179页pdf

专知会员服务

36+阅读 · 2024年4月6日

谷歌等最新《使用检索示例的大语言模型上下文学习》综述

谷歌等最新《使用检索示例的大语言模型上下文学习》综述

专知会员服务

57+阅读 · 2024年1月24日

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

专知会员服务

38+阅读 · 2024年1月7日

基于表格数据的深度学习方法

基于表格数据的深度学习方法

专知会员服务

40+阅读 · 2021年10月19日

【WWW2020】学习上下文化文档表示用于医疗答案检索，Learning Contextualized Document Representations for Healthcare Answer Retrieval

【WWW2020】学习上下文化文档表示用于医疗答案检索，Learning Contextualized Document Representations for Healthcare Answer Retrieval

专知会员服务

26+阅读 · 2020年2月10日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

300+篇文献！一文详解基于Transformer的多模态学习最新进展

300+篇文献！一文详解基于Transformer的多模态学习最新进展

PaperWeekly

13+阅读 · 2022年7月1日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BERT相关论文、文章和代码资源汇总

BERT相关论文、文章和代码资源汇总

AINLP

19+阅读 · 2018年11月17日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

15+阅读 · 2017年9月24日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

How Data Mixing Shapes In-Context Learning: Asymptotic Equivalence for Transformers with MLPs

Arxiv

0+阅读 · 2月5日

End-to-End Compression for Tabular Foundation Models

Arxiv

0+阅读 · 2月5日

TabPFN-2.5: Advancing the State of the Art in Tabular Foundation Models

Arxiv

0+阅读 · 2月5日

Dissecting Multimodal In-Context Learning: Modality Asymmetries and Circuit Dynamics in modern Transformers

Arxiv

0+阅读 · 1月28日

Causal Pre-training Under the Fairness Lens: An Empirical Study of TabPFN

Arxiv

0+阅读 · 1月27日

Causal Pre-training Under the Fairness Lens: An Empirical Study of TabPFN

Arxiv

0+阅读 · 1月25日

TabDPT: Scaling Tabular Foundation Models on Real Data

Arxiv

0+阅读 · 1月17日

Exploring Fine-Tuning for Tabular Foundation Models

Arxiv

0+阅读 · 1月14日

In-Context Learning Enhanced Credibility Transformer

Arxiv

0+阅读 · 1月14日

End-to-End Test-Time Training for Long Context

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

上下文学习

相关VIP内容

【博士论文】基于多模态基础模型的上下文学习

【博士论文】基于多模态基础模型的上下文学习

专知会员服务

22+阅读 · 2025年12月17日

《深度表格学习综述》

《深度表格学习综述》

专知会员服务

43+阅读 · 2024年10月18日

表格数据的语言建模：基础、技术与演变综述

表格数据的语言建模：基础、技术与演变综述

专知会员服务

39+阅读 · 2024年8月23日

【CMU博士论文】利用结构和上下文进行语言邻近表示学习

【CMU博士论文】利用结构和上下文进行语言邻近表示学习

专知会员服务

22+阅读 · 2024年5月8日

【阿姆斯特丹博士论文】表格表示学习，179页pdf

【阿姆斯特丹博士论文】表格表示学习，179页pdf

专知会员服务

36+阅读 · 2024年4月6日

谷歌等最新《使用检索示例的大语言模型上下文学习》综述

谷歌等最新《使用检索示例的大语言模型上下文学习》综述

专知会员服务

57+阅读 · 2024年1月24日

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

专知会员服务

38+阅读 · 2024年1月7日

基于表格数据的深度学习方法

基于表格数据的深度学习方法

专知会员服务

40+阅读 · 2021年10月19日

【WWW2020】学习上下文化文档表示用于医疗答案检索，Learning Contextualized Document Representations for Healthcare Answer Retrieval

【WWW2020】学习上下文化文档表示用于医疗答案检索，Learning Contextualized Document Representations for Healthcare Answer Retrieval

专知会员服务

26+阅读 · 2020年2月10日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

300+篇文献！一文详解基于Transformer的多模态学习最新进展

300+篇文献！一文详解基于Transformer的多模态学习最新进展

PaperWeekly

13+阅读 · 2022年7月1日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

【华为诺亚新论文】基于图上下文知识融入的预训练语言模型

专知

23+阅读 · 2019年12月8日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BERT相关论文、文章和代码资源汇总

BERT相关论文、文章和代码资源汇总

AINLP

19+阅读 · 2018年11月17日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

15+阅读 · 2017年9月24日

相关论文

How Data Mixing Shapes In-Context Learning: Asymptotic Equivalence for Transformers with MLPs

Arxiv

0+阅读 · 2月5日

End-to-End Compression for Tabular Foundation Models

Arxiv

0+阅读 · 2月5日

TabPFN-2.5: Advancing the State of the Art in Tabular Foundation Models

Arxiv

0+阅读 · 2月5日

Dissecting Multimodal In-Context Learning: Modality Asymmetries and Circuit Dynamics in modern Transformers

Arxiv

0+阅读 · 1月28日

Causal Pre-training Under the Fairness Lens: An Empirical Study of TabPFN

Arxiv

0+阅读 · 1月27日

Causal Pre-training Under the Fairness Lens: An Empirical Study of TabPFN

Arxiv

0+阅读 · 1月25日

TabDPT: Scaling Tabular Foundation Models on Real Data

Arxiv

0+阅读 · 1月17日

Exploring Fine-Tuning for Tabular Foundation Models

Arxiv

0+阅读 · 1月14日

In-Context Learning Enhanced Credibility Transformer

Arxiv

0+阅读 · 1月14日

End-to-End Test-Time Training for Long Context

Arxiv

0+阅读 · 2025年12月31日

相关基金

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员