NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness - 专知论文

会员服务 ·

0

对抗 · 鲁棒 · 对抗训练 · 对抗鲁棒性 · 神经符号 ·

NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness

翻译：NeuroShield：一种用于对抗鲁棒性的神经符号框架

Ali Shafiee Sarvestani,Jason Schmidt,Arman Roohi

Adversarial vulnerability and lack of interpretability are critical limitations of deep neural networks, especially in safety-sensitive settings such as autonomous driving. We introduce \DesignII, a neuro-symbolic framework that integrates symbolic rule supervision into neural networks to enhance both adversarial robustness and explainability. Domain knowledge is encoded as logical constraints over appearance attributes such as shape and color, and enforced through semantic and symbolic logic losses applied during training. Using the GTSRB dataset, we evaluate robustness against FGSM and PGD attacks at a standard $\ell_\infty$ perturbation budget of $\varepsilon = 8/255$. Relative to clean training, standard adversarial training provides modest improvements in robustness ($\sim$10 percentage points). Conversely, our FGSM-Neuro-Symbolic and PGD-Neuro-Symbolic models achieve substantially larger gains, improving adversarial accuracy by 18.1\% and 17.35\% over their corresponding adversarial-training baselines, representing roughly a three-fold larger robustness gain than standard adversarial training provides when both are measured relative to the same clean-training baseline, without reducing clean-sample accuracy. Compared to transformer-based defenses such as LNL-MoEx, which require heavy architectures and extensive data augmentation, our PGD-Neuro-Symbolic variant attains comparable or superior robustness using a ResNet18 backbone trained for 10 epochs. These results show that symbolic reasoning offers an effective path to robust and interpretable AI.

翻译：对抗性脆弱性和缺乏可解释性是深度神经网络的关键局限，尤其在自动驾驶等安全敏感场景中。我们提出NeuroShield，一种将符号规则监督集成到神经网络中以增强对抗鲁棒性和可解释性的神经符号框架。领域知识被编码为关于形状、颜色等外观属性的逻辑约束，并通过训练过程中应用的语义与符号逻辑损失进行强制约束。基于GTSRB数据集，我们在标准$\ell_\infty$扰动预算$\varepsilon = 8/255$下评估针对FGSM和PGD攻击的鲁棒性。相较于干净训练，标准对抗训练仅带来有限的鲁棒性提升（约10个百分点）。相比之下，我们的FGSM-Neuro-Symbolic与PGD-Neuro-Symbolic模型取得了显著更大的增益，对抗精度分别比对应对抗训练基线提升18.1%和17.35%，相当于以相同干净训练基线衡量时，其鲁棒性增益约为标准对抗训练的三倍，且未降低干净样本精度。与LNL-MoEx等需要复杂架构和大量数据增强的基于Transformer的防御方法相比，我们的PGD-Neuro-Symbolic变体仅使用训练10个周期的ResNet18骨干网络即可达到相当或更优的鲁棒性。这些结果表明符号推理为构建鲁棒且可解释的AI提供了有效路径。

0

相关内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

专知会员服务

28+阅读 · 2024年5月15日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

NeurIPS 2022最新「神经符号编程」教程报告，120+页PPT阐述神经符号编程最新进展

NeurIPS 2022最新「神经符号编程」教程报告，120+页PPT阐述神经符号编程最新进展

专知会员服务

40+阅读 · 2022年12月6日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

【NeurIPS2020】可靠图神经网络鲁棒聚合

【NeurIPS2020】可靠图神经网络鲁棒聚合

专知会员服务

20+阅读 · 2020年11月6日

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

专知会员服务

44+阅读 · 2020年5月21日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

26+阅读 · 2020年4月7日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

AI100

33+阅读 · 2019年3月16日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

24+阅读 · 2018年10月23日

神经网络结构在命名实体识别（NER）中的应用

神经网络结构在命名实体识别（NER）中的应用

全球人工智能

11+阅读 · 2018年4月5日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

经鼻给予神经生长因子通过NF-κB/BACE1信号通路治疗脑外伤相关的认知功能障碍

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

神经干细胞复合功能化注射型胶原支架用于脊髓损伤的修复及实时监测

国家自然科学基金

0+阅读 · 2015年12月31日

缝隙连接蛋白36在脑缺血诱导的纹状体神经元损伤中的作用及其活化的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

neuritin抑制神经炎症改善糖尿病中枢神经病变的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Neural-POD: A Plug-and-Play Neural Operator Framework for Infinite-Dimensional Functional Nonlinear Proper Orthogonal Decomposition

Arxiv

0+阅读 · 2月17日

NeuroSymActive: Differentiable Neural-Symbolic Reasoning with Active Exploration for Knowledge Graph Question Answering

Arxiv

0+阅读 · 2月17日

Neurosim: A Fast Simulator for Neuromorphic Robot Perception

Arxiv

0+阅读 · 2月16日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

Neuro-Symbolic Synergy for Interactive World Modeling

Arxiv

0+阅读 · 2月12日

Tracking Finite-Time Lyapunov Exponents to Robustify Neural ODEs

Arxiv

0+阅读 · 2月10日

SnareNet: Flexible Repair Layers for Neural Networks with Hard Constraints

Arxiv

0+阅读 · 2月10日

NeuralFLoC: Neural Flow-Based Joint Registration and Clustering of Functional Data

Arxiv

0+阅读 · 2月3日

NeuroAI Temporal Neural Networks (NeuTNNs): Microarchitecture and Design Framework for Specialized Neuromorphic Processing Units

Arxiv

0+阅读 · 2月2日

A universal linearized subspace refinement framework for neural networks

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

对抗鲁棒性

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

0+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

0+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

3+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

3+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

7+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

4+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

5+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

5+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

10+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

5+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

7+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

8+阅读 · 5月29日

相关VIP内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

专知会员服务

28+阅读 · 2024年5月15日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

NeurIPS 2022最新「神经符号编程」教程报告，120+页PPT阐述神经符号编程最新进展

NeurIPS 2022最新「神经符号编程」教程报告，120+页PPT阐述神经符号编程最新进展

专知会员服务

40+阅读 · 2022年12月6日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

【NeurIPS2020】可靠图神经网络鲁棒聚合

【NeurIPS2020】可靠图神经网络鲁棒聚合

专知会员服务

20+阅读 · 2020年11月6日

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

【KDD2020-MSU】图结构学习的鲁棒图神经网络，克服对抗攻击提升GNN防御能力

专知会员服务

44+阅读 · 2020年5月21日

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

[CVPR 2020-港中文-MIT] 神经架构搜索鲁棒性

专知会员服务

26+阅读 · 2020年4月7日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

百度提出ERNIE，多项中文NLP任务表现出色（已开源）

AI100

33+阅读 · 2019年3月16日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

24+阅读 · 2018年10月23日

神经网络结构在命名实体识别（NER）中的应用

神经网络结构在命名实体识别（NER）中的应用

全球人工智能

11+阅读 · 2018年4月5日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Neural-POD: A Plug-and-Play Neural Operator Framework for Infinite-Dimensional Functional Nonlinear Proper Orthogonal Decomposition

Arxiv

0+阅读 · 2月17日

NeuroSymActive: Differentiable Neural-Symbolic Reasoning with Active Exploration for Knowledge Graph Question Answering

Arxiv

0+阅读 · 2月17日

Neurosim: A Fast Simulator for Neuromorphic Robot Perception

Arxiv

0+阅读 · 2月16日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

Neuro-Symbolic Synergy for Interactive World Modeling

Arxiv

0+阅读 · 2月12日

Tracking Finite-Time Lyapunov Exponents to Robustify Neural ODEs

Arxiv

0+阅读 · 2月10日

SnareNet: Flexible Repair Layers for Neural Networks with Hard Constraints

Arxiv

0+阅读 · 2月10日

NeuralFLoC: Neural Flow-Based Joint Registration and Clustering of Functional Data

Arxiv

0+阅读 · 2月3日

NeuroAI Temporal Neural Networks (NeuTNNs): Microarchitecture and Design Framework for Specialized Neuromorphic Processing Units

Arxiv

0+阅读 · 2月2日

A universal linearized subspace refinement framework for neural networks

Arxiv

0+阅读 · 1月20日

相关基金

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

经鼻给予神经生长因子通过NF-κB/BACE1信号通路治疗脑外伤相关的认知功能障碍

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

神经干细胞复合功能化注射型胶原支架用于脊髓损伤的修复及实时监测

国家自然科学基金

0+阅读 · 2015年12月31日

缝隙连接蛋白36在脑缺血诱导的纹状体神经元损伤中的作用及其活化的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

neuritin抑制神经炎症改善糖尿病中枢神经病变的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员