APEX: Probing Neural Networks via Activation Perturbation - 专知论文

会员服务 ·

0

扰动 · 结构 · 神经网络 · 输入空间 · 表示 ·

APEX: Probing Neural Networks via Activation Perturbation

翻译：APEX：通过激活扰动探测神经网络

Tao Ren,Xiaoyu Luo,Qiongxiu Li

Prior work on probing neural networks primarily relies on input-space analysis or parameter perturbation, both of which face fundamental limitations in accessing structural information encoded in intermediate representations. We introduce Activation Perturbation for EXploration (APEX), an inference-time probing paradigm that perturbs hidden activations while keeping both inputs and model parameters fixed. We theoretically show that activation perturbation induces a principled transition from sample-dependent to model-dependent behavior by suppressing input-specific signals and amplifying representation-level structure, and further establish that input perturbation corresponds to a constrained special case of this framework. Through representative case studies, we demonstrate the practical advantages of APEX. In the small-noise regime, APEX provides a lightweight and efficient measure of sample regularity that aligns with established metrics, while also distinguishing structured from randomly labeled models and revealing semantically coherent prediction transitions. In the large-noise regime, APEX exposes training-induced model-level biases, including a pronounced concentration of predictions on the target class in backdoored models. Overall, our results show that APEX offers an effective perspective for exploring, and understanding neural networks beyond what is accessible from input space alone.

翻译：先前关于神经网络探测的研究主要依赖于输入空间分析或参数扰动，这两种方法在获取中间表示所编码的结构信息方面均面临根本性局限。我们提出用于探索的激活扰动（APEX），这是一种推理时探测范式，它在保持输入和模型参数不变的情况下扰动隐藏激活。我们从理论上证明，激活扰动通过抑制输入特定信号并放大表示层面的结构，能够引导模型行为从样本依赖性向模型依赖性发生原则性转变，并进一步论证输入扰动对应于该框架的一个受限特例。通过代表性案例研究，我们展示了APEX的实际优势。在小噪声机制下，APEX提供了一种轻量高效的样本规律性度量，该度量与既有指标一致，同时能区分结构化模型与随机标注模型，并揭示语义一致的预测转变。在大噪声机制下，APEX暴露了训练诱导的模型层面偏差，包括后门模型中预测结果向目标类别的显著集中现象。总体而言，我们的研究结果表明，APEX为探索和理解神经网络提供了超越输入空间局限的有效视角。

0

相关内容

激活的三十年:神经网络400个激活函数的全面综述

激活的三十年:神经网络400个激活函数的全面综述

专知会员服务

71+阅读 · 2024年2月18日

神经网络架构搜索研究进展与展望

神经网络架构搜索研究进展与展望

专知会员服务

50+阅读 · 2023年12月21日

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

专知会员服务

53+阅读 · 2023年11月19日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

【DeepMind-ICLR2020】MEMO-情景记忆的灵活组合的深层网络，A DEEP NETWORK FOR FLEXIBLE COMBINATION OF EPISODIC MEMORIES

【DeepMind-ICLR2020】MEMO-情景记忆的灵活组合的深层网络，A DEEP NETWORK FOR FLEXIBLE COMBINATION OF EPISODIC MEMORIES

专知会员服务

18+阅读 · 2020年2月2日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

神经网络中的「注意力」是什么？怎么用？

神经网络中的「注意力」是什么？怎么用？

北京思腾合力科技有限公司

17+阅读 · 2017年10月28日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

警觉信息素唤醒作用及其神经环路

国家自然科学基金

1+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于事件驱动的不完整信息耦合复杂网络群集动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

介观兴奋/抑制神经元网络的放电动力学行为特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

Incremental Neural Network Verification via Learned Conflicts

Incremental Neural Network Verification via Learned Conflicts

Arxiv

0+阅读 · 3月12日

Spark: Modular Spiking Neural Networks

Arxiv

0+阅读 · 2月25日

Pinet: Optimizing hard-constrained neural networks with orthogonal projection layers

Arxiv

0+阅读 · 2月18日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

Evolving Multi-Channel Confidence-Aware Activation Functions for Missing Data with Channel Propagation

Arxiv

0+阅读 · 2月14日

Can Neural Networks Provide Latent Embeddings for Telemetry-Aware Greedy Routing?

Arxiv

0+阅读 · 2月13日

Modal Logical Neural Networks

Arxiv

0+阅读 · 2月12日

APEX-SQL: Talking to the data via Agentic Exploration for Text-to-SQL

Arxiv

0+阅读 · 2月11日

Spiking Neural Network Architecture Search: A Survey

Arxiv

0+阅读 · 2月3日

PENEX: AdaBoost-Inspired Neural Network Regularization

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

0+阅读 · 26分钟前

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

1+阅读 · 28分钟前

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

0+阅读 · 39分钟前

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

0+阅读 · 35分钟前

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

0+阅读 · 38分钟前

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

0+阅读 · 今天13:17

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

人工智能在战场行动中的演进及伊朗案例

人工智能在战场行动中的演进及伊朗案例

专知会员服务

7+阅读 · 4月18日

美AI公司Anthropic推出网络安全模型“Mythos”

美AI公司Anthropic推出网络安全模型“Mythos”

专知会员服务

4+阅读 · 4月18日

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

5+阅读 · 4月18日

相关VIP内容

激活的三十年:神经网络400个激活函数的全面综述

激活的三十年:神经网络400个激活函数的全面综述

专知会员服务

71+阅读 · 2024年2月18日

神经网络架构搜索研究进展与展望

神经网络架构搜索研究进展与展望

专知会员服务

50+阅读 · 2023年12月21日

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

专知会员服务

53+阅读 · 2023年11月19日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

【DeepMind-ICLR2020】MEMO-情景记忆的灵活组合的深层网络，A DEEP NETWORK FOR FLEXIBLE COMBINATION OF EPISODIC MEMORIES

【DeepMind-ICLR2020】MEMO-情景记忆的灵活组合的深层网络，A DEEP NETWORK FOR FLEXIBLE COMBINATION OF EPISODIC MEMORIES

专知会员服务

18+阅读 · 2020年2月2日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《量化反无人机系统对抗无人机蜂群效能的创新方法》

【CMU博士论文】迈向基于基础先验的 4D 感知研究

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

澳大利亚发布《国防战略（2026年）》

相关资讯

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

神经网络中的「注意力」是什么？怎么用？

神经网络中的「注意力」是什么？怎么用？

北京思腾合力科技有限公司

17+阅读 · 2017年10月28日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Incremental Neural Network Verification via Learned Conflicts

Incremental Neural Network Verification via Learned Conflicts

Arxiv

0+阅读 · 3月12日

Spark: Modular Spiking Neural Networks

Arxiv

0+阅读 · 2月25日

Pinet: Optimizing hard-constrained neural networks with orthogonal projection layers

Arxiv

0+阅读 · 2月18日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

Evolving Multi-Channel Confidence-Aware Activation Functions for Missing Data with Channel Propagation

Arxiv

0+阅读 · 2月14日

Can Neural Networks Provide Latent Embeddings for Telemetry-Aware Greedy Routing?

Arxiv

0+阅读 · 2月13日

Modal Logical Neural Networks

Arxiv

0+阅读 · 2月12日

APEX-SQL: Talking to the data via Agentic Exploration for Text-to-SQL

Arxiv

0+阅读 · 2月11日

Spiking Neural Network Architecture Search: A Survey

Arxiv

0+阅读 · 2月3日

PENEX: AdaBoost-Inspired Neural Network Regularization

Arxiv

0+阅读 · 1月30日

相关基金

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

警觉信息素唤醒作用及其神经环路

国家自然科学基金

1+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于事件驱动的不完整信息耦合复杂网络群集动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

介观兴奋/抑制神经元网络的放电动力学行为特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员