迈向金融语言模型中更高效的偏见检测 (Towards a more efficient bias detection in financial language models) - 专知论文

会员服务 ·

0

金融 · 属性 · 语言模型 · 识别 · 语料 ·

Towards a more efficient bias detection in financial language models

翻译：迈向金融语言模型中更高效的偏见检测

Firas Hadj Kacem,Ahmed Khanfir,Mike Papadakis

Bias in financial language models constitutes a major obstacle to their adoption in real-world applications. Detecting such bias is challenging, as it requires identifying inputs whose predictions change when varying properties unrelated to the decision, such as demographic attributes. Existing approaches typically rely on exhaustive mutation and pairwise prediction analysis over large corpora, which is effective but computationally expensive-particularly for large language models and can become impractical in continuous retraining and releasing processes. Aiming at reducing this cost, we conduct a large-scale study of bias in five financial language models, examining similarities in their bias tendencies across protected attributes and exploring cross-model-guided bias detection to identify bias-revealing inputs earlier. Our study uses approximately 17k real financial news sentences, mutated to construct over 125k original-mutant pairs. Results show that all models exhibit bias under both atomic (0.58\%-6.05\%) and intersectional (0.75\%-5.97\%) settings. Moreover, we observe consistent patterns in bias-revealing inputs across models, enabling substantial reuse and cost reduction in bias detection. For example, up to 73\% of FinMA's biased behaviours can be uncovered using only 20\% of the input pairs when guided by properties derived from DistilRoBERTa outputs.

翻译：金融语言模型中的偏见构成了其在现实世界应用中的主要障碍。检测此类偏见具有挑战性，因为它需要识别那些当改变与决策无关的属性（如人口统计属性）时预测会发生变化的输入。现有方法通常依赖于对大型语料库进行详尽的变异和成对预测分析，这种方法虽然有效但计算成本高昂——特别是对于大型语言模型而言，并且在持续重训练和发布过程中可能变得不切实际。为了降低这一成本，我们对五种金融语言模型中的偏见进行了大规模研究，考察了它们在受保护属性上偏见倾向的相似性，并探索了跨模型引导的偏见检测方法，以更早地识别揭示偏见的输入。我们的研究使用了约1.7万条真实的金融新闻句子，通过变异构建了超过12.5万条原始-变异对。结果显示，所有模型在原子（0.58\%–6.05\%）和交叉（0.75\%–5.97\%）设置下均表现出偏见。此外，我们观察到不同模型在揭示偏见的输入上存在一致的模式，这使得偏见检测能够实现大量复用并降低成本。例如，当使用从DistilRoBERTa输出中推导的属性进行引导时，仅需20\%的输入对即可揭示FinMA高达73\%的偏见行为。

0

相关内容

在社会经济生活，银行、证券或保险业者从市场主体募集资金，并投资给其它市场主体的经济活动。

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

17+阅读 · 2025年11月25日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

专知会员服务

29+阅读 · 2024年9月22日

人工智能军事决策支持系统中的算法偏见问题

人工智能军事决策支持系统中的算法偏见问题

专知会员服务

33+阅读 · 2024年9月11日

迈向大语言模型偏好学习的统一视角综述

迈向大语言模型偏好学习的统一视角综述

专知会员服务

24+阅读 · 2024年9月7日

大语言模型评估技术研究进展

大语言模型评估技术研究进展

专知会员服务

48+阅读 · 2024年7月9日

【博士论文】语言模型与人类偏好对齐，148页pdf

【博士论文】语言模型与人类偏好对齐，148页pdf

专知会员服务

32+阅读 · 2024年4月21日

大型语言模型在预测和异常检测中的应用综述

大型语言模型在预测和异常检测中的应用综述

专知会员服务

70+阅读 · 2024年2月19日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

【AAAI2021】缓解语言模型政治偏见

专知会员服务

23+阅读 · 2021年2月6日

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

13+阅读 · 2022年11月12日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Biases in the Blind Spot: Detecting What LLMs Fail to Mention

Arxiv

0+阅读 · 2月27日

Intra-Fairness Dynamics: The Bias Spillover Effect in Targeted LLM Alignment

Arxiv

0+阅读 · 2月18日

BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses

Arxiv

0+阅读 · 2月15日

Towards a unified approach to formal risk of bias assessments for causal and descriptive inference

Arxiv

0+阅读 · 2月13日

Biases in the Blind Spot: Detecting What LLMs Fail to Mention

Arxiv

0+阅读 · 2月10日

Context-Aware Counterfactual Data Augmentation for Gender Bias Mitigation in Language Models

Arxiv

0+阅读 · 2月10日

Bi-directional Bias Attribution: Debiasing Large Language Models without Modifying Prompts

Arxiv

0+阅读 · 2月4日

Evaluating the Presence of Sex Bias in Clinical Reasoning by Large Language Models

Arxiv

0+阅读 · 2月4日

DeFrame: Debiasing Large Language Models Against Framing Effects

Arxiv

0+阅读 · 2月4日

BiasGym: Fantastic LLM Biases and How to Find (and Remove) Them

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

0+阅读 · 今天12:07

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

0+阅读 · 今天11:54

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

5+阅读 · 今天4:52

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

9+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

7+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第一部分

以机器速度作战：人工智能与美陆军反火力作战——第一部分

专知会员服务

5+阅读 · 4月11日

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

专知会员服务

6+阅读 · 4月11日

面向空中机器人的视觉语言导航：迈向大语言模型时代

面向空中机器人的视觉语言导航：迈向大语言模型时代

专知会员服务

6+阅读 · 4月11日

美/以-伊战争：停火与后续情景与影响分析

美/以-伊战争：停火与后续情景与影响分析

专知会员服务

3+阅读 · 4月11日

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

专知会员服务

6+阅读 · 4月11日

美国-以色列-伊朗战争：是否会动用地面部队？

美国-以色列-伊朗战争：是否会动用地面部队？

专知会员服务

2+阅读 · 4月11日

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

专知会员服务

7+阅读 · 4月11日

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

专知会员服务

4+阅读 · 4月11日

美国协同作战飞机项目新型无人机发动机

美国协同作战飞机项目新型无人机发动机

专知会员服务

2+阅读 · 4月11日

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

专知会员服务

3+阅读 · 4月11日

相关VIP内容

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

17+阅读 · 2025年11月25日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

专知会员服务

29+阅读 · 2024年9月22日

人工智能军事决策支持系统中的算法偏见问题

人工智能军事决策支持系统中的算法偏见问题

专知会员服务

33+阅读 · 2024年9月11日

迈向大语言模型偏好学习的统一视角综述

迈向大语言模型偏好学习的统一视角综述

专知会员服务

24+阅读 · 2024年9月7日

大语言模型评估技术研究进展

大语言模型评估技术研究进展

专知会员服务

48+阅读 · 2024年7月9日

【博士论文】语言模型与人类偏好对齐，148页pdf

【博士论文】语言模型与人类偏好对齐，148页pdf

专知会员服务

32+阅读 · 2024年4月21日

大型语言模型在预测和异常检测中的应用综述

大型语言模型在预测和异常检测中的应用综述

专知会员服务

70+阅读 · 2024年2月19日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

【AAAI2021】缓解语言模型政治偏见

专知会员服务

23+阅读 · 2021年2月6日

热门VIP内容

开通专知VIP会员享更多权益服务

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

大语言模型溯因推理的统一分类学与综述

大语言模型与国防战略：升级风险与国家安全挑战（综述）

相关资讯

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

13+阅读 · 2022年11月12日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

金融领域自然语言处理研究资源大列表

金融领域自然语言处理研究资源大列表

专知

13+阅读 · 2020年2月27日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

相关论文

Biases in the Blind Spot: Detecting What LLMs Fail to Mention

Arxiv

0+阅读 · 2月27日

Intra-Fairness Dynamics: The Bias Spillover Effect in Targeted LLM Alignment

Arxiv

0+阅读 · 2月18日

BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses

Arxiv

0+阅读 · 2月15日

Towards a unified approach to formal risk of bias assessments for causal and descriptive inference

Arxiv

0+阅读 · 2月13日

Biases in the Blind Spot: Detecting What LLMs Fail to Mention

Arxiv

0+阅读 · 2月10日

Context-Aware Counterfactual Data Augmentation for Gender Bias Mitigation in Language Models

Arxiv

0+阅读 · 2月10日

Bi-directional Bias Attribution: Debiasing Large Language Models without Modifying Prompts

Arxiv

0+阅读 · 2月4日

Evaluating the Presence of Sex Bias in Clinical Reasoning by Large Language Models

Arxiv

0+阅读 · 2月4日

DeFrame: Debiasing Large Language Models Against Framing Effects

Arxiv

0+阅读 · 2月4日

BiasGym: Fantastic LLM Biases and How to Find (and Remove) Them

Arxiv

0+阅读 · 1月30日

相关基金

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

融合多源大数据的互联网金融个性化价值发现与风险评测

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员