Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations - 专知论文

会员服务 ·

0

变换 · 黑盒 · 图像变换 · 后门防御 · 多阶 ·

Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations

翻译：Lite-BD：一种通过恢复多阶段图像变换实现的轻量级黑盒后门防御

Abdullah Arafat Miah,Yu Bi

Deep Neural Networks (DNNs) are vulnerable to backdoor attacks. Due to the nature of Machine Learning as a Service (MLaaS) applications, black-box defenses are more practical than white-box methods, yet existing purification techniques suffer from key limitations: a lack of justification for specific transformations, dataset dependency, high computational overhead, and a neglect of frequency-domain transformations. This paper conducts a preliminary study on various image transformations, identifying down-upscaling as the most effective backdoor trigger disruption technique. We subsequently propose \texttt{Lite-BD}, a lightweight two-stage blackbox backdoor defense. \texttt{Lite-BD} first employs a super-resolution-based down-upscaling stage to neutralize spatial triggers. A secondary stage utilizes query-based band-by-band frequency filtering to remove triggers hidden in specific bands. Extensive experiments against state-of-the-art attacks demonstrate that \texttt{Lite-BD} provides robust and efficient protection. Codes can be found at https://github.com/SiSL-URI/Lite-BD.

翻译：深度神经网络（DNNs）容易受到后门攻击。由于机器学习即服务（MLaaS）应用的性质，黑盒防御比白盒方法更具实用性，然而现有的净化技术存在关键局限性：缺乏对特定变换的合理性论证、数据集依赖性、高计算开销以及对频域变换的忽视。本文对各种图像变换进行了初步研究，发现下采样-上采样是最有效的后门触发器破坏技术。我们随后提出了 \texttt{Lite-BD}，一种轻量级的两阶段黑盒后门防御方法。\texttt{Lite-BD} 首先采用基于超分辨率的降采样-上采样阶段来中和空间触发器。第二阶段利用基于查询的逐频带滤波来移除隐藏在特定频带中的触发器。针对最先进攻击的大量实验表明，\texttt{Lite-BD} 提供了鲁棒且高效的防护。代码可在 https://github.com/SiSL-URI/Lite-BD 找到。

0

相关内容

计算机视觉领域的后门攻击与防御：综述

计算机视觉领域的后门攻击与防御：综述

专知会员服务

19+阅读 · 2025年9月13日

面向深度学习的后门攻击及防御研究综述

面向深度学习的后门攻击及防御研究综述

专知会员服务

12+阅读 · 2025年7月4日

神经网络后门攻击与防御综述

神经网络后门攻击与防御综述

专知会员服务

19+阅读 · 2024年7月30日

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

专知会员服务

50+阅读 · 2023年4月23日

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

专知会员服务

26+阅读 · 2022年11月16日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

图神经网络黑盒攻击近期进展

图神经网络黑盒攻击近期进展

专知会员服务

19+阅读 · 2022年10月14日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

11+阅读 · 2022年10月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

FaceNiff工具 - 适用于黑客的Android应用程序

FaceNiff工具 - 适用于黑客的Android应用程序

黑白之道

149+阅读 · 2019年4月7日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

【干货】对抗自编码器PyTorch手把手实战系列——PyTorch实现对抗自编码器

【干货】对抗自编码器PyTorch手把手实战系列——PyTorch实现对抗自编码器

专知

51+阅读 · 2018年3月20日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

复杂通信网络传输容量与级联效应安全防护综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相位-幅度转换和数字混沌密钥的光混沌保密通信理论与实现技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

面向10Tb/in2级磁存储系统的二维LDPC码设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

HAMLOCK: HArdware-Model LOgically Combined attacK

HAMLOCK: HArdware-Model LOgically Combined attacK

Arxiv

0+阅读 · 3月16日

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Arxiv

0+阅读 · 3月7日

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Arxiv

0+阅读 · 3月7日

IU: Imperceptible Universal Backdoor Attack

Arxiv

0+阅读 · 2月28日

Soft-CAM: Making black box models self-explainable for medical image analysis

Arxiv

0+阅读 · 2月20日

Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting

Arxiv

0+阅读 · 2月19日

Cert-SSBD: Certified Backdoor Defense with Sample-Specific Smoothing Noises

Arxiv

0+阅读 · 2月19日

A Cognitive Distribution and Behavior-Consistent Framework for Black-Box Attacks on Recommender Systems

Arxiv

0+阅读 · 2月12日

Transferable Backdoor Attacks for Code Models via Sharpness-Aware Adversarial Perturbation

Arxiv

0+阅读 · 2月11日

Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

0+阅读 · 今天13:13

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

0+阅读 · 今天13:08

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

3+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

5+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

17+阅读 · 4月22日

相关VIP内容

计算机视觉领域的后门攻击与防御：综述

计算机视觉领域的后门攻击与防御：综述

专知会员服务

19+阅读 · 2025年9月13日

面向深度学习的后门攻击及防御研究综述

面向深度学习的后门攻击及防御研究综述

专知会员服务

12+阅读 · 2025年7月4日

神经网络后门攻击与防御综述

神经网络后门攻击与防御综述

专知会员服务

19+阅读 · 2024年7月30日

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

专知会员服务

50+阅读 · 2023年4月23日

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

专知会员服务

26+阅读 · 2022年11月16日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

图神经网络黑盒攻击近期进展

图神经网络黑盒攻击近期进展

专知会员服务

19+阅读 · 2022年10月14日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体长期记忆安全性综述：迈向记忆主权

人工智能赋能无人机：俄乌战争（万字长文）

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

相关资讯

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

11+阅读 · 2022年10月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

FaceNiff工具 - 适用于黑客的Android应用程序

FaceNiff工具 - 适用于黑客的Android应用程序

黑白之道

149+阅读 · 2019年4月7日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

【干货】对抗自编码器PyTorch手把手实战系列——PyTorch实现对抗自编码器

【干货】对抗自编码器PyTorch手把手实战系列——PyTorch实现对抗自编码器

专知

51+阅读 · 2018年3月20日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

相关论文

HAMLOCK: HArdware-Model LOgically Combined attacK

HAMLOCK: HArdware-Model LOgically Combined attacK

Arxiv

0+阅读 · 3月16日

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Arxiv

0+阅读 · 3月7日

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Arxiv

0+阅读 · 3月7日

IU: Imperceptible Universal Backdoor Attack

Arxiv

0+阅读 · 2月28日

Soft-CAM: Making black box models self-explainable for medical image analysis

Arxiv

0+阅读 · 2月20日

Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting

Arxiv

0+阅读 · 2月19日

Cert-SSBD: Certified Backdoor Defense with Sample-Specific Smoothing Noises

Arxiv

0+阅读 · 2月19日

A Cognitive Distribution and Behavior-Consistent Framework for Black-Box Attacks on Recommender Systems

Arxiv

0+阅读 · 2月12日

Transferable Backdoor Attacks for Code Models via Sharpness-Aware Adversarial Perturbation

Arxiv

0+阅读 · 2月11日

Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations

Arxiv

0+阅读 · 2月6日

相关基金

复杂通信网络传输容量与级联效应安全防护综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相位-幅度转换和数字混沌密钥的光混沌保密通信理论与实现技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

面向10Tb/in2级磁存储系统的二维LDPC码设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员