Federated Retrieval-Augmented Generation (FedRAG) is attractive for privacy-sensitive applications because raw data remain local. As a result, routing must rely on client-provided semantic profiles, creating a new opportunity for manipulation. We introduce Routing Hijacking, a routing-stage attack in which a malicious client forges its profile to attract target queries despite having irrelevant underlying data. We show that this vulnerability is severe. Across three representative FedRAG routing architectures, Routing Hijacking consistently misroutes target queries and leads to downstream disruptions and failures, including missing evidence, poisoning, incorrect answers, and hallucinations. In a high-stakes MedQA-USMLE case study, we further show that poisoned retrieved evidence can mislead models across scales, leading to incorrect answers, hallucinations, and sycophantic failures. Existing defenses do not close this gap: encrypted routing preserves the exploited ranking, and Byzantine-robust Federated Learning (FL) rules transfer poorly to heterogeneous routing profiles. To address this gap, we propose a trust-aware post-routing framework that reweights clients using returned-evidence feedback, including retrieval relevance, profile consistency, and cross-client agreement; online experiments show that it suppresses persistent hijacking over recurring queries and transfers to a learned neural router. Our findings establish routing integrity as a new security challenge in FedRAG and highlight the need for stronger defenses for secure federated retrieval.


翻译:联邦检索增强生成(FedRAG)因其原始数据保留在本地,对隐私敏感的应用具有吸引力。因此,路由必须依赖于客户端提供的语义配置文件,这为操纵提供了新的机会。我们引入了路由劫持,这是一种路由阶段的攻击,恶意客户端伪造其配置文件以吸引目标查询,尽管其底层数据不相关。我们证明这种漏洞是严重的。在三种具有代表性的FedRAG路由架构中,路由劫持持续地将目标查询错误路由,并导致下游中断和失败,包括证据缺失、投毒、错误答案和幻觉。在高风险的MedQA-USMLE案例研究中,我们进一步证明,投毒的检索证据可以误导不同规模的模型,导致错误答案、幻觉和谄媚式失败。现有的防御措施无法消除这一差距:加密路由保留了被利用的排名,而拜占庭鲁棒联邦学习(FL)规则难以很好地迁移到异构路由配置文件中。为了解决这一差距,我们提出了一种信任感知的路由后框架,该框架利用返回证据反馈(包括检索相关性、配置文件一致性和跨客户端一致性)重新加权客户端;在线实验表明,它抑制了重复查询上的持续劫持,并可迁移到学习的神经路由器。我们的发现将路由完整性确立为FedRAG中的一个新的安全挑战,并强调了加强对安全联邦检索的防御的必要性。

0
下载
关闭预览

相关内容

《利用 LLM 进行高级持续性威胁 (APT) 检测和智能解释》
专知会员服务
24+阅读 · 2025年2月14日
图增强生成(GraphRAG)
专知会员服务
35+阅读 · 2025年1月4日
联邦学习中的成员推断攻击与防御:综述
专知会员服务
17+阅读 · 2024年12月15日
【资源】联邦学习相关文献资源大列表
专知
10+阅读 · 2020年2月25日
FaceNiff工具 - 适用于黑客的Android应用程序
黑白之道
151+阅读 · 2019年4月7日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具
黑白之道
17+阅读 · 2019年2月27日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月9日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
0+阅读 · 13分钟前
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员