Spectral Superposition: A Theory of Feature Geometry - 专知论文

会员服务 ·

0

几何结构 · 结构 · 特征空间 · 几何理论 · 表示 ·

Spectral Superposition: A Theory of Feature Geometry

翻译：谱叠加：特征几何理论

Georgi Ivanov,Narmeen Oozeer,Shivam Raval,Tasana Pejovic,Shriyash Upadhyay,Amir Abdullah

Neural networks represent more features than they have dimensions via superposition, forcing features to share representational space. Current methods decompose activations into sparse linear features but discard geometric structure. We develop a theory for studying the geometric structre of features by analyzing the spectra (eigenvalues, eigenspaces, etc.) of weight derived matrices. In particular, we introduce the frame operator $F = WW^\top$, which gives us a spectral measure that describes how each feature allocates norm across eigenspaces. While previous tools could describe the pairwise interactions between features, spectral methods capture the global geometry (``how do all features interact?''). In toy models of superposition, we use this theory to prove that capacity saturation forces spectral localization: features collapse onto single eigenspaces, organize into tight frames, and admit discrete classification via association schemes, classifying all geometries from prior work (simplices, polygons, antiprisms). The spectral measure formalism applies to arbitrary weight matrices, enabling diagnosis of feature localization beyond toy settings. These results point toward a broader program: applying operator theory to interpretability.

翻译：神经网络通过叠加表示比其维度更多的特征，迫使特征共享表示空间。现有方法将激活分解为稀疏线性特征，但丢弃了几何结构。我们通过分析权重导出矩阵的谱（特征值、特征空间等），发展了一种研究特征几何结构的理论。具体而言，我们引入框架算子$F = WW^\top$，它提供了一个谱测度，用于描述每个特征如何在特征空间之间分配范数。以往的工具仅能描述特征间的成对相互作用，而谱方法能够捕捉全局几何结构（"所有特征如何相互作用？"）。在叠加的玩具模型中，我们利用该理论证明容量饱和会迫使谱局部化：特征坍缩到单个特征空间，组织成紧框架，并通过关联方案允许离散分类，从而对先前工作中的所有几何结构（单纯形、多边形、反棱柱）进行分类。谱测度形式体系适用于任意权重矩阵，使得在玩具模型之外诊断特征局部化成为可能。这些结果指向一个更广泛的研究方向：应用算子理论于可解释性研究。

0

相关内容

几何结构

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

专知会员服务

48+阅读 · 2022年11月8日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知会员服务

71+阅读 · 2022年9月4日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知会员服务

34+阅读 · 2022年8月10日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知会员服务

76+阅读 · 2022年4月15日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【LITIS Lab】衔接图卷积神经网络谱域和空间域，Spectral and Spatial Domains in GNN

【LITIS Lab】衔接图卷积神经网络谱域和空间域，Spectral and Spatial Domains in GNN

专知会员服务

25+阅读 · 2020年3月30日

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

专知会员服务

51+阅读 · 2020年2月22日

【课程推荐】深度学习中的几何（Geometry of Deep Learning）

【课程推荐】深度学习中的几何（Geometry of Deep Learning）

专知会员服务

59+阅读 · 2019年11月10日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏性与分片常数空间的网格简化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

模拟人眼视觉特性的高性能矢量多边形叠加分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有限正交几何的图的自同构群研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于量子力学的算子谱理论问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

超图的张量表示及其谱理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

Theoretical Foundations of Superhypergraph and Plithogenic Graph Neural Networks

Arxiv

0+阅读 · 3月2日

A Gauge Theory of Superposition: Toward a Sheaf-Theoretic Atlas of Neural Representations

Arxiv

0+阅读 · 2月28日

On the Complexity of Neural Computation in Superposition

Arxiv

0+阅读 · 2月26日

On the Mechanism and Dynamics of Modular Addition: Fourier Features, Lottery Ticket, and Grokking

Arxiv

0+阅读 · 2月18日

Relative Geometry of Neural Forecasters: Linking Accuracy and Alignment in Learned Latent Geometry

Arxiv

0+阅读 · 2月17日

VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow

Arxiv

0+阅读 · 2月17日

Superposed parameterised quantum circuits

Arxiv

0+阅读 · 2月16日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 2月9日

Implicit Unitarity Bias in Tensor Factorization: A Theoretical Framework for Symmetry Group Discovery

Arxiv

0+阅读 · 2月6日

The Representational Geometry of Number

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

0+阅读 · 14分钟前

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

1+阅读 · 16分钟前

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

0+阅读 · 27分钟前

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

0+阅读 · 23分钟前

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

0+阅读 · 26分钟前

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

0+阅读 · 52分钟前

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

人工智能在战场行动中的演进及伊朗案例

人工智能在战场行动中的演进及伊朗案例

专知会员服务

7+阅读 · 4月18日

美AI公司Anthropic推出网络安全模型“Mythos”

美AI公司Anthropic推出网络安全模型“Mythos”

专知会员服务

4+阅读 · 4月18日

【博士论文】面向城市环境的可解释计算机视觉

【博士论文】面向城市环境的可解释计算机视觉

专知会员服务

5+阅读 · 4月18日

相关VIP内容

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

专知会员服务

48+阅读 · 2022年11月8日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知会员服务

71+阅读 · 2022年9月4日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知会员服务

34+阅读 · 2022年8月10日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知会员服务

76+阅读 · 2022年4月15日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【LITIS Lab】衔接图卷积神经网络谱域和空间域，Spectral and Spatial Domains in GNN

【LITIS Lab】衔接图卷积神经网络谱域和空间域，Spectral and Spatial Domains in GNN

专知会员服务

25+阅读 · 2020年3月30日

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

专知会员服务

51+阅读 · 2020年2月22日

【课程推荐】深度学习中的几何（Geometry of Deep Learning）

【课程推荐】深度学习中的几何（Geometry of Deep Learning）

专知会员服务

59+阅读 · 2019年11月10日

热门VIP内容

开通专知VIP会员享更多权益服务

澳大利亚发布《国防战略（2026年）》

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

《量化反无人机系统对抗无人机蜂群效能的创新方法》

【CMU博士论文】迈向基于基础先验的 4D 感知研究

相关资讯

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

【深度学习】深度学习的几何观点：流形分布定律、学习能力的上限、概率变换的几何观点

产业智能官

10+阅读 · 2018年6月23日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

相关论文

Theoretical Foundations of Superhypergraph and Plithogenic Graph Neural Networks

Arxiv

0+阅读 · 3月2日

A Gauge Theory of Superposition: Toward a Sheaf-Theoretic Atlas of Neural Representations

Arxiv

0+阅读 · 2月28日

On the Complexity of Neural Computation in Superposition

Arxiv

0+阅读 · 2月26日

On the Mechanism and Dynamics of Modular Addition: Fourier Features, Lottery Ticket, and Grokking

Arxiv

0+阅读 · 2月18日

Relative Geometry of Neural Forecasters: Linking Accuracy and Alignment in Learned Latent Geometry

Arxiv

0+阅读 · 2月17日

VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow

Arxiv

0+阅读 · 2月17日

Superposed parameterised quantum circuits

Arxiv

0+阅读 · 2月16日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 2月9日

Implicit Unitarity Bias in Tensor Factorization: A Theoretical Framework for Symmetry Group Discovery

Arxiv

0+阅读 · 2月6日

The Representational Geometry of Number

Arxiv

0+阅读 · 2月6日

相关基金

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏性与分片常数空间的网格简化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

模拟人眼视觉特性的高性能矢量多边形叠加分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有限正交几何的图的自同构群研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于量子力学的算子谱理论问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

超图的张量表示及其谱理论研究

国家自然科学基金

2+阅读 · 2014年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员