Backdoored and privacy-leaking deep neural networks pose a serious threat to the deployment of machine learning systems in security-critical settings. Existing defenses for backdoor detection and membership inference typically require access to clean reference models, extensive retraining, or strong assumptions about the attack mechanism. In this work, we introduce a novel LoRA-based oracle framework that leverages low-rank adaptation modules as a lightweight, model-agnostic probe for both backdoor detection and membership inference. Our approach attaches task-specific LoRA adapters to a frozen backbone and analyzes their optimization dynamics and representation shifts when exposed to suspicious samples. We show that poisoned and member samples induce distinctive low-rank updates that differ significantly from those generated by clean or non-member data. These signals can be measured using simple ranking and energy-based statistics, enabling reliable inference without access to the original training data or modification of the deployed model.


翻译:后门与隐私泄露的深度神经网络对机器学习系统在安全关键场景中的部署构成了严重威胁。现有的后门检测与成员推理防御方法通常需要访问干净的参考模型、进行大量重新训练,或对攻击机制做出强假设。本文提出了一种新颖的基于 LoRA 的预言机框架,该框架利用低秩自适应模块作为一种轻量级、模型无关的探针,用于后门检测和成员推理。我们的方法将特定任务的 LoRA 适配器附加到冻结的主干网络上,并分析其在暴露于可疑样本时的优化动态和表示偏移。我们证明,中毒样本和成员样本会引发独特的低秩更新,这些更新与干净数据或非成员数据产生的更新存在显著差异。这些信号可以通过简单的排序和基于能量的统计量进行测量,从而在无需访问原始训练数据或修改已部署模型的情况下实现可靠的推理。

0
下载
关闭预览

相关内容

Tina:基于 LoRA 的轻量级推理模型
专知会员服务
17+阅读 · 2025年4月24日
TransMLA:多头潜在注意力(MLA)即为所需
专知会员服务
23+阅读 · 2025年2月13日
LoRA进展有哪些?最新《基础模型的低秩适应》综述
专知会员服务
37+阅读 · 2025年1月3日
大语言模型的LoRA研究综述
专知会员服务
54+阅读 · 2024年7月17日
Sora技术详解及影响分析!
专知会员服务
70+阅读 · 2024年2月23日
一大批中文(BERT等)预训练模型等你认领!
PaperWeekly
15+阅读 · 2019年6月25日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
程序员如何借助 AI 开挂股票神预测?| 技术头条
程序人生
13+阅读 · 2019年4月22日
用机器学习来预测股价(代码+文档)——2018年iNTUtion决赛大作!
量化投资与机器学习
25+阅读 · 2018年11月20日
用Rasa NLU构建自己的中文NLU系统
待字闺中
18+阅读 · 2017年9月18日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员