硬件触发的后门 (Hardware-Triggered Backdoors) - 专知论文

会员服务 ·

0

学习模型 · 机器学习模型 · 相同 · 决策函数 · 决策边界 ·

Hardware-Triggered Backdoors

翻译：硬件触发的后门

Jonas Möller,Erik Imgrund,Thorsten Eisenhofer,Konrad Rieck

Machine learning models are routinely deployed on a wide range of computing hardware. Although such hardware is typically expected to produce identical results, differences in its design can lead to small numerical variations during inference. In this work, we show that these variations can be exploited to create backdoors in machine learning models. The core idea is to shape the model's decision function such that it yields different predictions for the same input when executed on different hardware. This effect is achieved by locally moving the decision boundary close to a target input and then refining numerical deviations to flip the prediction on selected hardware. We empirically demonstrate that these hardware-triggered backdoors can be created reliably across common GPU accelerators. Our findings reveal a novel attack vector affecting the use of third-party models, and we investigate different defenses to counter this threat.

翻译：机器学习模型被广泛部署于各种计算硬件上。尽管此类硬件通常被预期产生相同的结果，但其设计差异可能导致推理过程中出现微小的数值变化。在本研究中，我们证明这些变化可被利用以在机器学习模型中创建后门。其核心思想是通过调整模型的决策函数，使得同一输入在不同硬件上执行时产生不同的预测结果。这一效果是通过将决策边界局部移动至目标输入附近，并优化数值偏差以在选定硬件上翻转预测来实现的。我们通过实验证明，这些硬件触发的后门可以在常见的GPU加速器上被可靠地创建。我们的研究揭示了一种影响第三方模型使用的新型攻击向量，并探讨了应对此类威胁的不同防御策略。

0

相关内容

学习模型

计算机视觉领域的后门攻击与防御：综述

计算机视觉领域的后门攻击与防御：综述

专知会员服务

19+阅读 · 2025年9月13日

深度学习中的架构后门：漏洞、检测与防御综述

深度学习中的架构后门：漏洞、检测与防御综述

专知会员服务

12+阅读 · 2025年7月19日

面向深度学习的后门攻击及防御研究综述

面向深度学习的后门攻击及防御研究综述

专知会员服务

12+阅读 · 2025年7月4日

【NTU博士论文】深度学习中的后门：新的威胁与机会

【NTU博士论文】深度学习中的后门：新的威胁与机会

专知会员服务

26+阅读 · 2025年1月31日

通信网络中大型语言模型的后门攻击的综述

通信网络中大型语言模型的后门攻击的综述

专知会员服务

30+阅读 · 2023年9月5日

【斯坦福博士论文】硬件感知的高效机器学习算法，215页pdf

【斯坦福博士论文】硬件感知的高效机器学习算法，215页pdf

专知会员服务

41+阅读 · 2023年8月16日

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

专知会员服务

26+阅读 · 2022年11月16日

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

专知会员服务

15+阅读 · 2021年1月31日

首篇《后门学习综述》论文发布，阐述AI系统训练过程的安全性问题

专知会员服务

31+阅读 · 2020年11月21日

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

专知会员服务

52+阅读 · 2020年9月29日

TheFatRat 一款简易后门工具

TheFatRat 一款简易后门工具

黑白之道

36+阅读 · 2019年10月23日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

8月最新-《可解释机器学习-Christoph Molnar》-新书分享

8月最新-《可解释机器学习-Christoph Molnar》-新书分享

深度学习与NLP

10+阅读 · 2019年8月12日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

数据驱动关键性能指标相关的故障诊断方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

传感器故障下的数据驱动容错控制技术及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

Backdoor Directions in Vision Transformers

Arxiv

0+阅读 · 3月11日

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Arxiv

0+阅读 · 3月11日

Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors

Arxiv

0+阅读 · 3月10日

Tuning Just Enough: Lightweight Backdoor Attacks on Multi-Encoder Diffusion Models

Arxiv

0+阅读 · 3月4日

Revisiting Backdoor Threat in Federated Instruction Tuning from a Signal Aggregation Perspective

Arxiv

0+阅读 · 2月17日

Weight space Detection of Backdoors in LoRA Adapters

Arxiv

0+阅读 · 2月16日

PBP: Post-training Backdoor Purification for Malware Classifiers

Arxiv

0+阅读 · 2月12日

Kill it with FIRE: On Leveraging Latent Space Directions for Runtime Backdoor Mitigation in Deep Neural Networks

Arxiv

0+阅读 · 2月11日

Transferable Backdoor Attacks for Code Models via Sharpness-Aware Adversarial Perturbation

Arxiv

0+阅读 · 2月11日

Beware Untrusted Simulators -- Reward-Free Backdoor Attacks in Reinforcement Learning

Arxiv

0+阅读 · 2月9日

VIP会员

文章信息

相关主题

机器学习模型

最新内容

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

专知会员服务

2+阅读 · 4月14日

内省扩散语言模型

内省扩散语言模型

专知会员服务

1+阅读 · 4月14日

美伊停火协议：评估、各方反应及美国会面临的问题

美伊停火协议：评估、各方反应及美国会面临的问题

专知会员服务

3+阅读 · 4月14日

国外反无人机系统与技术动态

国外反无人机系统与技术动态

专知会员服务

2+阅读 · 4月14日

世界无人无线电情报系统经验分析与实验实现（研究论文）

世界无人无线电情报系统经验分析与实验实现（研究论文）

专知会员服务

3+阅读 · 4月14日

大规模作战行动中的战术作战评估（研究论文）

大规模作战行动中的战术作战评估（研究论文）

专知会员服务

4+阅读 · 4月14日

（中文长文）城市战与小部队城市战术：来自俄乌战争的观察

（中文长文）城市战与小部队城市战术：来自俄乌战争的观察

专知会员服务

3+阅读 · 4月14日

未来的海战无人自主系统

未来的海战无人自主系统

专知会员服务

2+阅读 · 4月14日

美军多域作战现状分析：战略、概念还是幻想？

美军多域作战现状分析：战略、概念还是幻想？

专知会员服务

4+阅读 · 4月14日

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

专知会员服务

18+阅读 · 4月14日

无人机与反无人机系统（书籍）

无人机与反无人机系统（书籍）

专知会员服务

16+阅读 · 4月14日

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

专知会员服务

6+阅读 · 4月14日

美陆军2026条令：安全与机动支援

美陆军2026条令：安全与机动支援

专知会员服务

6+阅读 · 4月14日

【牛津博士论文】以语言为接口的医学影像表示学习

【牛津博士论文】以语言为接口的医学影像表示学习

专知会员服务

12+阅读 · 4月13日

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

专知会员服务

10+阅读 · 4月13日

相关VIP内容

计算机视觉领域的后门攻击与防御：综述

计算机视觉领域的后门攻击与防御：综述

专知会员服务

19+阅读 · 2025年9月13日

深度学习中的架构后门：漏洞、检测与防御综述

深度学习中的架构后门：漏洞、检测与防御综述

专知会员服务

12+阅读 · 2025年7月19日

面向深度学习的后门攻击及防御研究综述

面向深度学习的后门攻击及防御研究综述

专知会员服务

12+阅读 · 2025年7月4日

【NTU博士论文】深度学习中的后门：新的威胁与机会

【NTU博士论文】深度学习中的后门：新的威胁与机会

专知会员服务

26+阅读 · 2025年1月31日

通信网络中大型语言模型的后门攻击的综述

通信网络中大型语言模型的后门攻击的综述

专知会员服务

30+阅读 · 2023年9月5日

【斯坦福博士论文】硬件感知的高效机器学习算法，215页pdf

【斯坦福博士论文】硬件感知的高效机器学习算法，215页pdf

专知会员服务

41+阅读 · 2023年8月16日

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

《不同触发位置的多模型选择性后门攻击》韩国陆军士官学校2022最新论文

专知会员服务

26+阅读 · 2022年11月16日

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器

专知会员服务

15+阅读 · 2021年1月31日

首篇《后门学习综述》论文发布，阐述AI系统训练过程的安全性问题

专知会员服务

31+阅读 · 2020年11月21日

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

【干货书-IBM推荐】机器学习傻瓜式入门，75页pdf

专知会员服务

52+阅读 · 2020年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

内省扩散语言模型

国外反无人机系统与技术动态

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

美伊停火协议：评估、各方反应及美国会面临的问题

相关资讯

TheFatRat 一款简易后门工具

TheFatRat 一款简易后门工具

黑白之道

36+阅读 · 2019年10月23日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

8月最新-《可解释机器学习-Christoph Molnar》-新书分享

8月最新-《可解释机器学习-Christoph Molnar》-新书分享

深度学习与NLP

10+阅读 · 2019年8月12日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

相关论文

Backdoor Directions in Vision Transformers

Arxiv

0+阅读 · 3月11日

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Arxiv

0+阅读 · 3月11日

Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors

Arxiv

0+阅读 · 3月10日

Tuning Just Enough: Lightweight Backdoor Attacks on Multi-Encoder Diffusion Models

Arxiv

0+阅读 · 3月4日

Revisiting Backdoor Threat in Federated Instruction Tuning from a Signal Aggregation Perspective

Arxiv

0+阅读 · 2月17日

Weight space Detection of Backdoors in LoRA Adapters

Arxiv

0+阅读 · 2月16日

PBP: Post-training Backdoor Purification for Malware Classifiers

Arxiv

0+阅读 · 2月12日

Kill it with FIRE: On Leveraging Latent Space Directions for Runtime Backdoor Mitigation in Deep Neural Networks

Arxiv

0+阅读 · 2月11日

Transferable Backdoor Attacks for Code Models via Sharpness-Aware Adversarial Perturbation

Arxiv

0+阅读 · 2月11日

Beware Untrusted Simulators -- Reward-Free Backdoor Attacks in Reinforcement Learning

Arxiv

0+阅读 · 2月9日

相关基金

数据驱动关键性能指标相关的故障诊断方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

传感器故障下的数据驱动容错控制技术及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员