PCDM: A Diffusion-Based Data Poisoning Attack Against Federated Learning Systems - 专知论文

会员服务 ·

0

攻击 · 数据投毒 · 联邦学习 · 系统 · 投毒攻击 ·

PCDM: A Diffusion-Based Data Poisoning Attack Against Federated Learning Systems

翻译：PCDM：一种基于扩散的数据投毒攻击针对联邦学习系统的方法

Wei Sun,Yijun Chen,Bo Gao,Ke Xiong,Yuwei Wang,Pingyi Fan,Khaled Ben Letaief

Federated learning (FL) is vulnerable to data poisoning attacks due to its distributed nature. Although recent GAN-based data poisoning methods have indicated the potential of using generative AI to generate seemingly legitimate poisoned data, the inherent consistency of GAN outputs can still reveal a sign of data poisoning. In this paper, we propose a diffusion-based data poisoning framework against FL systems, which leverages a Poisoning-Oriented Conditional Diffusion Model (PCDM) to enable fine-grained control over the local generation of poisoned data while ensuring both attack effectiveness and stealthiness. Our PCDM incorporates an adjustable poisoning vector within the global context to precisely control the generation of poisoned data, with theoretical guarantees on attack performance. Furthermore, it employs a novel jumping diffusion strategy for lightweight and efficient poisoned data generation. We conduct the most systematic and broad experimental evaluation for FL poisoning attacks against various defenses, including advanced Byzantine robust aggregation mechanisms, on four open datasets: MNIST, Fashion-MNIST, CIFAR-10, CIFAR-100, and a real-world wireless-specific dataset VRAI. Our results demonstrate that PCDM is less likely to exhibit statistical anomalies compared with the state-of-the-art methods while more effectively degrading global FL performance, which poses a significant risk to data security in FL.

翻译：联邦学习因其分布式特性而易受数据投毒攻击。尽管近期基于GAN的数据投毒方法已表明利用生成式AI可生成看似合法的投毒数据，但GAN输出固有的连贯性仍可能暴露投毒迹象。本文提出一种针对联邦学习系统的基于扩散的数据投毒框架，利用面向投毒的条件扩散模型（PCDM）实现对本地投毒数据生成的细粒度控制，同时兼顾攻击有效性与隐蔽性。我们的PCDM在全局上下文中引入可调投毒向量，精准控制投毒数据的生成，并具有攻击性能的理论保障。此外，该模型采用新型跳跃扩散策略，实现轻量高效的投毒数据生成。我们针对多种防御机制（包括先进拜占庭鲁棒聚合机制）进行了联邦学习投毒攻击领域最系统、最广泛的实验评估，覆盖四个公开数据集（MNIST、Fashion-MNIST、CIFAR-10、CIFAR-100）及真实无线专用数据集VRAI。结果表明，与现有最优方法相比，PCDM不仅更不易呈现统计异常，还能更有效地降低全局联邦学习性能，对联邦学习中的数据安全构成重大威胁。

0

相关内容

《用于建模系统攻击路径的强化学习环境》

《用于建模系统攻击路径的强化学习环境》

专知会员服务

22+阅读 · 3月5日

中文版 | 数据投毒：AI驱动战争中优势地位的隐蔽武器

中文版 | 数据投毒：AI驱动战争中优势地位的隐蔽武器

专知会员服务

25+阅读 · 2025年7月6日

深度学习中的数据投毒：综述

深度学习中的数据投毒：综述

专知会员服务

29+阅读 · 2025年4月1日

《联邦学习中的对抗性攻击》48页论文

《联邦学习中的对抗性攻击》48页论文

专知会员服务

41+阅读 · 2023年11月1日

「联邦学习系统攻击与防御技术」最新2023研究综述

「联邦学习系统攻击与防御技术」最新2023研究综述

专知会员服务

41+阅读 · 2023年3月12日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

网络丢包对联邦学习影响很大？中科大数据研究中心团队成果《面向穿戴设备的公平高效联邦学习算法及应用》发表于UbiComp

网络丢包对联邦学习影响很大？中科大数据研究中心团队成果《面向穿戴设备的公平高效联邦学习算法及应用》发表于UbiComp

专知会员服务

16+阅读 · 2022年5月8日

【KDD2021】利用不完整和扰动数据对推荐系统的数据中毒攻击

专知会员服务

18+阅读 · 2021年8月30日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

81+阅读 · 2020年3月4日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

联邦学习最新研究趋势！

联邦学习最新研究趋势！

AI科技评论

52+阅读 · 2020年3月12日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

联邦机器学习-概念与应用，【附19页论文下载】

联邦机器学习-概念与应用，【附19页论文下载】

专知

80+阅读 · 2019年3月9日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

利用禽双链RNA病毒感染瞬间的细胞转录组测序挖掘协助或抵抗病毒进入的基因表达调控网络

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

Cordyceps: Covert Control Attacks on LLMs via Data Poisoning

Arxiv

0+阅读 · 6月15日

When Poison Fails After Retrieval: Revisiting Corpus Poisoning under Chunking and Reranking Pipelines

Arxiv

0+阅读 · 6月9日

Model Poisoning Against Federated Model Adaptation with Chain of Bit-Flips

Arxiv

0+阅读 · 6月8日

Certified Robustness to Data Poisoning in Gradient-Based Training

Arxiv

0+阅读 · 6月5日

FDM: A Framework for Decision-making to build ML-based Malware detection systems

Arxiv

0+阅读 · 6月5日

Phantom Transfer: Data Poisoning can Survive Data-Level Defences

Arxiv

0+阅读 · 6月2日

EnCAgg: Enhanced Clustering Aggregation for Robust Federated Learning against Dynamic Model Poisoning

Arxiv

0+阅读 · 5月21日

Knowledge Poisoning Attacks on Medical Multi-Modal Retrieval-Augmented Generation

Arxiv

0+阅读 · 5月11日

CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly Detection and Attack Classification

Arxiv

0+阅读 · 5月7日

DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

4+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

4+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

4+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

5+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

5+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《用于建模系统攻击路径的强化学习环境》

《用于建模系统攻击路径的强化学习环境》

专知会员服务

22+阅读 · 3月5日

中文版 | 数据投毒：AI驱动战争中优势地位的隐蔽武器

中文版 | 数据投毒：AI驱动战争中优势地位的隐蔽武器

专知会员服务

25+阅读 · 2025年7月6日

深度学习中的数据投毒：综述

深度学习中的数据投毒：综述

专知会员服务

29+阅读 · 2025年4月1日

《联邦学习中的对抗性攻击》48页论文

《联邦学习中的对抗性攻击》48页论文

专知会员服务

41+阅读 · 2023年11月1日

「联邦学习系统攻击与防御技术」最新2023研究综述

「联邦学习系统攻击与防御技术」最新2023研究综述

专知会员服务

41+阅读 · 2023年3月12日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

网络丢包对联邦学习影响很大？中科大数据研究中心团队成果《面向穿戴设备的公平高效联邦学习算法及应用》发表于UbiComp

网络丢包对联邦学习影响很大？中科大数据研究中心团队成果《面向穿戴设备的公平高效联邦学习算法及应用》发表于UbiComp

专知会员服务

16+阅读 · 2022年5月8日

【KDD2021】利用不完整和扰动数据对推荐系统的数据中毒攻击

专知会员服务

18+阅读 · 2021年8月30日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

81+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

联邦学习最新研究趋势！

联邦学习最新研究趋势！

AI科技评论

52+阅读 · 2020年3月12日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

【对抗学习综述论文】-宾西法利亚大学-统计分类中的对抗性学习:对攻击防御的全面回顾

专知

23+阅读 · 2019年4月15日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

联邦机器学习-概念与应用，【附19页论文下载】

联邦机器学习-概念与应用，【附19页论文下载】

专知

80+阅读 · 2019年3月9日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

相关论文

Cordyceps: Covert Control Attacks on LLMs via Data Poisoning

Arxiv

0+阅读 · 6月15日

When Poison Fails After Retrieval: Revisiting Corpus Poisoning under Chunking and Reranking Pipelines

Arxiv

0+阅读 · 6月9日

Model Poisoning Against Federated Model Adaptation with Chain of Bit-Flips

Arxiv

0+阅读 · 6月8日

Certified Robustness to Data Poisoning in Gradient-Based Training

Arxiv

0+阅读 · 6月5日

FDM: A Framework for Decision-making to build ML-based Malware detection systems

Arxiv

0+阅读 · 6月5日

Phantom Transfer: Data Poisoning can Survive Data-Level Defences

Arxiv

0+阅读 · 6月2日

EnCAgg: Enhanced Clustering Aggregation for Robust Federated Learning against Dynamic Model Poisoning

Arxiv

0+阅读 · 5月21日

Knowledge Poisoning Attacks on Medical Multi-Modal Retrieval-Augmented Generation

Arxiv

0+阅读 · 5月11日

CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly Detection and Attack Classification

Arxiv

0+阅读 · 5月7日

DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning

Arxiv

0+阅读 · 5月7日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量模式的DTI数据模式分类及其分布式算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

利用禽双链RNA病毒感染瞬间的细胞转录组测序挖掘协助或抵抗病毒进入的基因表达调控网络

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员