Global Geometry Is Not Enough for Vision Representations - 专知论文

会员服务 ·

0

表示 · 嵌入 · 度量 · 输出 · 敏感性 ·

Global Geometry Is Not Enough for Vision Representations

翻译：全局几何不足以表征视觉表示

Jiwan Chung,Seon Joo Kim

A common assumption in representation learning is that globally well-distributed embeddings support robust and generalizable representations. This focus has shaped both training objectives and evaluation protocols, implicitly treating global geometry as a proxy for representational competence. While global geometry effectively encodes which elements are present, it is often insensitive to how they are composed. We investigate this limitation by testing the ability of geometric metrics to predict compositional binding across 21 vision encoders. We find that standard geometry-based statistics exhibit near-zero correlation with compositional binding. In contrast, functional sensitivity, as measured by the input-output Jacobian, reliably tracks this capability. We further provide an analytic account showing that this disparity arises from objective design, as existing losses explicitly constrain embedding geometry but leave the local input-output mapping unconstrained. These results suggest that global embedding geometry captures only a partial view of representational competence and establish functional sensitivity as a critical complementary axis for modeling composite structure.

翻译：表征学习中的一个常见假设是，全局分布均匀的嵌入能够支撑鲁棒且可泛化的表示。这一关注点同时影响了训练目标和评估方案，隐含地将全局几何视为表征能力的代理。虽然全局几何能有效编码存在哪些元素，但它通常对元素的组合方式不敏感。我们通过测试几何度量在21个视觉编码器中预测组合绑定能力，来探究这一局限性。研究发现，基于标准几何的统计量与组合绑定能力呈现近乎零的相关性。相比之下，通过输入-输出雅可比矩阵度量的功能敏感性则能可靠地追踪该能力。我们进一步通过理论分析表明，这种差异源于目标函数的设计：现有损失函数明确约束了嵌入几何，却未对局部输入-输出映射施加约束。这些结果表明，全局嵌入几何仅能捕捉表征能力的局部特征，从而确立了功能敏感性作为建模组合结构的关键补充维度。

0

相关内容

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

专知会员服务

22+阅读 · 2024年8月28日

【NeurIPS2023】用几何协调对抗表示学习视差

【NeurIPS2023】用几何协调对抗表示学习视差

专知会员服务

27+阅读 · 2023年10月28日

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

60+阅读 · 2023年4月14日

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知会员服务

71+阅读 · 2022年9月4日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

15+阅读 · 2021年9月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

专知会员服务

18+阅读 · 2019年11月1日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

最新《几何深度学习》教程，100页ppt，Geometric Deep Learning

最新《几何深度学习》教程，100页ppt，Geometric Deep Learning

专知

13+阅读 · 2020年7月16日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CMU-Spring2020课程】离散微分几何15讲，Discrete Differential Geometry

【CMU-Spring2020课程】离散微分几何15讲，Discrete Differential Geometry

专知

12+阅读 · 2020年3月26日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

GAN生成式对抗网络

10+阅读 · 2018年3月4日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

算子空间上与谱，局部谱以及零斜Lie积相关的完全保持问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类含∞-Laplace算子的特征值问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

物体形状部分视觉显著性度量及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

有限局部交换环与零化理想图

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

若干组合几何全局优化问题的机械化算法

国家自然科学基金

0+阅读 · 2014年12月31日

Any Resolution Any Geometry: From Multi-View To Multi-Patch

Arxiv

0+阅读 · 3月3日

Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models

Arxiv

0+阅读 · 2月27日

GeoWorld: Geometric World Models

Arxiv

0+阅读 · 2月26日

Stagewise Reinforcement Learning and the Geometry of the Regret Landscape

Arxiv

0+阅读 · 2月25日

Information-Theoretic Causal Bounds under Unmeasured Confounding

Arxiv

0+阅读 · 2月20日

Advances in Global Solvers for 3D Vision

Arxiv

0+阅读 · 2月16日

Geometric Stability: The Missing Axis of Representations

Arxiv

0+阅读 · 2月12日

GeoFocus: Blending Efficient Global-to-Local Perception for Multimodal Geometry Problem-Solving

Arxiv

0+阅读 · 2月9日

The Representational Geometry of Number

Arxiv

0+阅读 · 2月6日

Same Answer, Different Representations: Hidden instability in VLMs

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

1+阅读 · 今天15:03

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

2+阅读 · 今天14:33

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

1+阅读 · 今天14:08

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

1+阅读 · 今天13:55

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

2+阅读 · 今天13:53

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

0+阅读 · 今天13:42

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

0+阅读 · 今天13:46

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

0+阅读 · 今天13:43

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

1+阅读 · 今天13:17

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

相关VIP内容

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

专知会员服务

22+阅读 · 2024年8月28日

【NeurIPS2023】用几何协调对抗表示学习视差

【NeurIPS2023】用几何协调对抗表示学习视差

专知会员服务

27+阅读 · 2023年10月28日

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

60+阅读 · 2023年4月14日

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知会员服务

71+阅读 · 2022年9月4日

【ICML2021】GeomCA: 数据表示几何评估

专知会员服务

15+阅读 · 2021年9月11日

【ICML2021】数据表示的几何评估

专知会员服务

38+阅读 · 2021年6月3日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

【NeurlPS2019论文总结】一致收敛可能无法解释深度学习中的泛化现象，Uniform convergence may be unable to explain generalization in deep learning

专知会员服务

15+阅读 · 2019年12月17日

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

专知会员服务

18+阅读 · 2019年11月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

最新《几何深度学习》教程，100页ppt，Geometric Deep Learning

最新《几何深度学习》教程，100页ppt，Geometric Deep Learning

专知

13+阅读 · 2020年7月16日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CMU-Spring2020课程】离散微分几何15讲，Discrete Differential Geometry

【CMU-Spring2020课程】离散微分几何15讲，Discrete Differential Geometry

专知

12+阅读 · 2020年3月26日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

【学界】从可视化到新模型：纵览深度学习的视觉可解释性

GAN生成式对抗网络

10+阅读 · 2018年3月4日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

Any Resolution Any Geometry: From Multi-View To Multi-Patch

Arxiv

0+阅读 · 3月3日

Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models

Arxiv

0+阅读 · 2月27日

GeoWorld: Geometric World Models

Arxiv

0+阅读 · 2月26日

Stagewise Reinforcement Learning and the Geometry of the Regret Landscape

Arxiv

0+阅读 · 2月25日

Information-Theoretic Causal Bounds under Unmeasured Confounding

Arxiv

0+阅读 · 2月20日

Advances in Global Solvers for 3D Vision

Arxiv

0+阅读 · 2月16日

Geometric Stability: The Missing Axis of Representations

Arxiv

0+阅读 · 2月12日

GeoFocus: Blending Efficient Global-to-Local Perception for Multimodal Geometry Problem-Solving

Arxiv

0+阅读 · 2月9日

The Representational Geometry of Number

Arxiv

0+阅读 · 2月6日

Same Answer, Different Representations: Hidden instability in VLMs

Arxiv

0+阅读 · 2月6日

相关基金

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

算子空间上与谱，局部谱以及零斜Lie积相关的完全保持问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类含∞-Laplace算子的特征值问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

物体形状部分视觉显著性度量及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

有限局部交换环与零化理想图

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

若干组合几何全局优化问题的机械化算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员