Shortcuts and Identifiability in Concept-based Models from a Neuro-Symbolic Lens - 专知论文

会员服务 ·

0

识别 · 神经符号 · 提取 · 映射 · 准确率 ·

Shortcuts and Identifiability in Concept-based Models from a Neuro-Symbolic Lens

翻译：基于神经符号视角的概念模型中的捷径与可识别性

Samuele Bortolotti,Emanuele Marconato,Paolo Morettin,Andrea Passerini,Stefano Teso

from arxiv, Accepted at NeurIPS25

Concept-based Models are neural networks that learn a concept extractor to map inputs to high-level concepts and an inference layer to translate these into predictions. Ensuring these modules produce interpretable concepts and behave reliably in out-of-distribution is crucial, yet the conditions for achieving this remain unclear. We study this problem by establishing a novel connection between Concept-based Models and reasoning shortcuts (RSs), a common issue where models achieve high accuracy by learning low-quality concepts, even when the inference layer is fixed and provided upfront. Specifically, we extend RSs to the more complex setting of Concept-based Models and derive theoretical conditions for identifying both the concepts and the inference layer. Our empirical results highlight the impact of RSs and show that existing methods, even combined with multiple natural mitigation strategies, often fail to meet these conditions in practice.

翻译：概念模型是一种神经网络，它通过学习概念提取器将输入映射到高层概念，并通过推理层将这些概念转化为预测。确保这些模块产生可解释的概念并在分布外场景中可靠运行至关重要，然而实现这一目标的条件尚不明确。我们通过建立概念模型与推理捷径之间的新联系来研究此问题。推理捷径是一种常见问题，即模型通过学习低质量概念获得高准确率，即使推理层已预先固定并提供。具体而言，我们将推理捷径扩展到概念模型这一更复杂的场景中，并推导出识别概念与推理层的理论条件。我们的实证结果突显了推理捷径的影响，并表明现有方法即使结合多种自然缓解策略，在实践中也常常无法满足这些条件。

0

相关内容

【CMU博士论文】功能组件作为神经模型可解释性的范式

【CMU博士论文】功能组件作为神经模型可解释性的范式

专知会员服务

20+阅读 · 2025年2月3日

【博士论文】机器学习中新型神经元模型的研究

【博士论文】机器学习中新型神经元模型的研究

专知会员服务

25+阅读 · 2024年11月20日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

专知会员服务

33+阅读 · 2023年12月26日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

《深度学习中神经注意力模型》综述论文

《深度学习中神经注意力模型》综述论文

专知会员服务

114+阅读 · 2021年12月15日

【纽约大学】产生新的概念与混合神经符号模型，Generating new concepts with hybrid neuro-symbolic models

【纽约大学】产生新的概念与混合神经符号模型，Generating new concepts with hybrid neuro-symbolic models

专知会员服务

17+阅读 · 2020年3月23日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

专知会员服务

41+阅读 · 2019年12月30日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

机器之心

19+阅读 · 2019年4月10日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

GAN生成式对抗网络

10+阅读 · 2018年3月4日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

NeuroSymActive: Differentiable Neural-Symbolic Reasoning with Active Exploration for Knowledge Graph Question Answering

Arxiv

0+阅读 · 2月17日

Modal Logical Neural Networks

Arxiv

0+阅读 · 2月12日

Concepts in Motion: Temporal Bottlenecks for Interpretable Video Classification

Arxiv

0+阅读 · 2月6日

Right for the Right Reasons: Avoiding Reasoning Shortcuts via Prototypical Neurosymbolic AI

Arxiv

0+阅读 · 1月30日

Clarity: The Flexibility-Interpretability Trade-Off in Sparsity-aware Concept Bottleneck Models

Arxiv

0+阅读 · 1月29日

REASON: Accelerating Probabilistic Logical Reasoning for Scalable Neuro-Symbolic Intelligence

Arxiv

0+阅读 · 1月28日

Neural Logic Networks for Interpretable Classification

Arxiv

0+阅读 · 1月22日

Vision-Language Models Align with Human Neural Representations in Concept Processing

Arxiv

0+阅读 · 1月22日

To Neuro-Symbolic Classification and Beyond by Compiling Description Logic Ontologies to Probabilistic Circuits

Arxiv

0+阅读 · 1月21日

On the Theoretical Foundation of Sparse Dictionary Learning in Mechanistic Interpretability

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

1+阅读 · 今天15:00

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

1+阅读 · 今天14:54

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

0+阅读 · 今天14:49

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

0+阅读 · 今天14:44

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

1+阅读 · 今天14:03

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

0+阅读 · 今天13:36

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

0+阅读 · 今天13:34

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

5+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

3+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

5+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

3+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

3+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

12+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

13+阅读 · 4月19日

相关VIP内容

【CMU博士论文】功能组件作为神经模型可解释性的范式

【CMU博士论文】功能组件作为神经模型可解释性的范式

专知会员服务

20+阅读 · 2025年2月3日

【博士论文】机器学习中新型神经元模型的研究

【博士论文】机器学习中新型神经元模型的研究

专知会员服务

25+阅读 · 2024年11月20日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

专知会员服务

33+阅读 · 2023年12月26日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

《深度学习中神经注意力模型》综述论文

《深度学习中神经注意力模型》综述论文

专知会员服务

114+阅读 · 2021年12月15日

【纽约大学】产生新的概念与混合神经符号模型，Generating new concepts with hybrid neuro-symbolic models

【纽约大学】产生新的概念与混合神经符号模型，Generating new concepts with hybrid neuro-symbolic models

专知会员服务

17+阅读 · 2020年3月23日

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

【论文】用于推理的概率逻辑神经网络（Probabilistic Logic Neural Networks for Reasoning）

专知会员服务

104+阅读 · 2019年12月30日

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

专知会员服务

41+阅读 · 2019年12月30日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《系统簇式多域作战规划范畴论框架》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

相关资讯

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

机器之心

19+阅读 · 2019年4月10日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

GAN生成式对抗网络

10+阅读 · 2018年3月4日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

相关论文

NeuroSymActive: Differentiable Neural-Symbolic Reasoning with Active Exploration for Knowledge Graph Question Answering

Arxiv

0+阅读 · 2月17日

Modal Logical Neural Networks

Arxiv

0+阅读 · 2月12日

Concepts in Motion: Temporal Bottlenecks for Interpretable Video Classification

Arxiv

0+阅读 · 2月6日

Right for the Right Reasons: Avoiding Reasoning Shortcuts via Prototypical Neurosymbolic AI

Arxiv

0+阅读 · 1月30日

Clarity: The Flexibility-Interpretability Trade-Off in Sparsity-aware Concept Bottleneck Models

Arxiv

0+阅读 · 1月29日

REASON: Accelerating Probabilistic Logical Reasoning for Scalable Neuro-Symbolic Intelligence

Arxiv

0+阅读 · 1月28日

Neural Logic Networks for Interpretable Classification

Arxiv

0+阅读 · 1月22日

Vision-Language Models Align with Human Neural Representations in Concept Processing

Arxiv

0+阅读 · 1月22日

To Neuro-Symbolic Classification and Beyond by Compiling Description Logic Ontologies to Probabilistic Circuits

Arxiv

0+阅读 · 1月21日

On the Theoretical Foundation of Sparse Dictionary Learning in Mechanistic Interpretability

Arxiv

0+阅读 · 1月13日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员