评估检索增强对社会偏见的影响 (Evaluating the Effect of Retrieval Augmentation on Social Biases) - 专知论文

会员服务 ·

0

系统 · 检索增强 · 大语言模型 · 呈现 · 问答 ·

Evaluating the Effect of Retrieval Augmentation on Social Biases

翻译：评估检索增强对社会偏见的影响

Tianhui Zhang,Yi Zhou,Danushka Bollegala

from arxiv, EACL26 main

Retrieval Augmented Generation (RAG) has gained popularity as a method for conveniently incorporating novel facts that were not seen during the pre-training stage in Large Language Model (LLM)-based Natural Language Generation (NLG) systems. However, LLMs are known to encode significant levels of unfair social biases. The modulation of these biases by RAG in NLG systems is not well understood. In this paper, we systematically study the relationship between the different components of a RAG system and the social biases presented in the text generated across three languages (i.e. English, Japanese and Chinese) and four social bias types (i.e. gender, race, age and religion). Specifically, using the Bias Question Answering (BBQ) benchmark datasets, we evaluate the social biases in RAG responses from document collections with varying levels of stereotypical biases, employing multiple LLMs used as generators. We find that the biases in document collections are often amplified in the generated responses, even when the generating LLM exhibits a low-level of bias. Our findings raise concerns about the use of RAG as a technique for injecting novel facts into NLG systems and call for careful evaluation of potential social biases in RAG applications before their real-world deployment.

翻译：检索增强生成（RAG）作为一种便捷方法，在基于大语言模型（LLM）的自然语言生成（NLG）系统中整合预训练阶段未见的新事实，已获得广泛关注。然而，已知LLM编码了显著程度的不公平社会偏见。RAG在NLG系统中对这些偏见的调节作用尚未得到充分理解。本文系统研究了RAG系统的不同组件与生成文本中呈现的社会偏见之间的关系，涵盖三种语言（即英语、日语和中文）和四种社会偏见类型（即性别、种族、年龄和宗教）。具体而言，我们使用偏见问答（BBQ）基准数据集，通过具有不同刻板偏见程度的文档集合，评估了由多个作为生成器的LLM产生的RAG响应中的社会偏见。研究发现，即使生成LLM本身表现出较低水平的偏见，文档集合中的偏见也常在生成响应中被放大。我们的研究结果对使用RAG作为向NLG系统注入新事实的技术提出了警示，并呼吁在RAG应用实际部署前，对其潜在社会偏见进行审慎评估。

0

相关内容

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

16+阅读 · 2025年11月25日

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

20+阅读 · 2025年11月15日

【SIGIR2025教程】动态与参数化检索增强生成

【SIGIR2025教程】动态与参数化检索增强生成

专知会员服务

16+阅读 · 2025年7月14日

检索增强生成(RAG)与推理的协同作用：一项系统综述

检索增强生成(RAG)与推理的协同作用：一项系统综述

专知会员服务

33+阅读 · 2025年4月27日

视觉中的检索增强生成与理解：综述与新展望

视觉中的检索增强生成与理解：综述与新展望

专知会员服务

23+阅读 · 2025年4月6日

多模态检索增强生成的综合综述

多模态检索增强生成的综合综述

专知会员服务

43+阅读 · 2025年2月17日

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

37+阅读 · 2025年1月28日

智能体检索增强生成：关于智能体RAG的综述

智能体检索增强生成：关于智能体RAG的综述

专知会员服务

89+阅读 · 2025年1月21日

图检索增强生成研究进展

图检索增强生成研究进展

专知会员服务

36+阅读 · 2024年11月5日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

43+阅读 · 2024年9月18日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

强化学习与文本生成

强化学习与文本生成

微信AI

41+阅读 · 2019年4月4日

NLG ≠ 机器写作 | 专家专栏

NLG ≠ 机器写作 | 专家专栏

量子位

13+阅读 · 2018年9月10日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

RACK7选择性结合活跃增强子的分子机制及生物学意义的研究

国家自然科学基金

0+阅读 · 2016年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动社会网络的动态社区发现及其信任评价机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Benchmarking Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 2月16日

Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

Differentially Private Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

ReFilter: Improving Robustness of Retrieval-Augmented Generation via Gated Filter

Arxiv

0+阅读 · 2月13日

Toward Faithful Retrieval-Augmented Generation with Sparse Autoencoders

Arxiv

0+阅读 · 2月11日

Evaluating Social Bias in RAG Systems: When External Context Helps and Reasoning Hurts

Arxiv

0+阅读 · 2月10日

Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey

Arxiv

0+阅读 · 1月21日

Predicting Retrieval Utility and Answer Quality in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月20日

Unlocking the Potentials of Retrieval-Augmented Generation for Diffusion Language Models

Arxiv

0+阅读 · 1月16日

Classifying and Addressing the Diversity of Errors in Retrieval-Augmented Generation Systems

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

16+阅读 · 2025年11月25日

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

20+阅读 · 2025年11月15日

【SIGIR2025教程】动态与参数化检索增强生成

【SIGIR2025教程】动态与参数化检索增强生成

专知会员服务

16+阅读 · 2025年7月14日

检索增强生成(RAG)与推理的协同作用：一项系统综述

检索增强生成(RAG)与推理的协同作用：一项系统综述

专知会员服务

33+阅读 · 2025年4月27日

视觉中的检索增强生成与理解：综述与新展望

视觉中的检索增强生成与理解：综述与新展望

专知会员服务

23+阅读 · 2025年4月6日

多模态检索增强生成的综合综述

多模态检索增强生成的综合综述

专知会员服务

43+阅读 · 2025年2月17日

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

37+阅读 · 2025年1月28日

智能体检索增强生成：关于智能体RAG的综述

智能体检索增强生成：关于智能体RAG的综述

专知会员服务

89+阅读 · 2025年1月21日

图检索增强生成研究进展

图检索增强生成研究进展

专知会员服务

36+阅读 · 2024年11月5日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

43+阅读 · 2024年9月18日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

强化学习与文本生成

强化学习与文本生成

微信AI

41+阅读 · 2019年4月4日

NLG ≠ 机器写作 | 专家专栏

NLG ≠ 机器写作 | 专家专栏

量子位

13+阅读 · 2018年9月10日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Benchmarking Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 2月16日

Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

Differentially Private Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

ReFilter: Improving Robustness of Retrieval-Augmented Generation via Gated Filter

Arxiv

0+阅读 · 2月13日

Toward Faithful Retrieval-Augmented Generation with Sparse Autoencoders

Arxiv

0+阅读 · 2月11日

Evaluating Social Bias in RAG Systems: When External Context Helps and Reasoning Hurts

Arxiv

0+阅读 · 2月10日

Graph-based Approaches and Functionalities in Retrieval-Augmented Generation: A Comprehensive Survey

Arxiv

0+阅读 · 1月21日

Predicting Retrieval Utility and Answer Quality in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月20日

Unlocking the Potentials of Retrieval-Augmented Generation for Diffusion Language Models

Arxiv

0+阅读 · 1月16日

Classifying and Addressing the Diversity of Errors in Retrieval-Augmented Generation Systems

Arxiv

0+阅读 · 1月15日

相关基金

RACK7选择性结合活跃增强子的分子机制及生物学意义的研究

国家自然科学基金

0+阅读 · 2016年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动社会网络的动态社区发现及其信任评价机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员