基于双曲空间视觉层次学习的图像检索方法 (Learning Visual Hierarchies in Hyperbolic Space for Image Retrieval) - 专知论文

会员服务 ·

0

结构 · 层次结构 · 图像检索 · 双曲空间 · 层次学习 ·

Learning Visual Hierarchies in Hyperbolic Space for Image Retrieval

翻译：基于双曲空间视觉层次学习的图像检索方法

Ziwei Wang,Sameera Ramasinghe,Chenchen Xu,Julien Monteil,Loris Bazzani,Thalaiyasingam Ajanthan

Structuring latent representations in a hierarchical manner enables models to learn patterns at multiple levels of abstraction. However, most prevalent image understanding models focus on visual similarity, and learning visual hierarchies is relatively unexplored. In this work, for the first time, we introduce a learning paradigm that can encode user-defined multi-level complex visual hierarchies in hyperbolic space without requiring explicit hierarchical labels. As a concrete example, first, we define a part-based image hierarchy using object-level annotations within and across images. Then, we introduce an approach to enforce the hierarchy using contrastive loss with pairwise entailment metrics. Finally, we discuss new evaluation metrics to effectively measure hierarchical image retrieval. Encoding these complex relationships ensures that the learned representations capture semantic and structural information that transcends mere visual similarity. Experiments in part-based image retrieval show significant improvements in hierarchical retrieval tasks, demonstrating the capability of our model in capturing visual hierarchies.

翻译：以层次化方式构建潜在表示，能够使模型学习多层次的抽象模式。然而，当前主流的图像理解模型大多侧重于视觉相似性，对视觉层次结构的学习仍相对欠缺。本研究首次提出一种学习范式，能够在无需显式层次标签的情况下，将用户定义的多层次复杂视觉层次结构编码至双曲空间中。作为具体示例，我们首先利用图像内部及跨图像的物体级标注，定义了一种基于部件的图像层次结构。随后，我们提出一种通过结合对比损失与成对蕴含度量的方法来实现层次约束。最后，我们探讨了用于有效评估层次化图像检索性能的新评价指标。编码此类复杂关系确保了学习到的表征能够捕捉超越单纯视觉相似性的语义与结构信息。在基于部件的图像检索实验中，我们的模型在层次化检索任务上取得了显著提升，验证了其捕捉视觉层次结构的能力。

0

相关内容

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

60+阅读 · 2023年4月14日

【AAAI2023】用单塔Transformer统一视觉语言表示空间

【AAAI2023】用单塔Transformer统一视觉语言表示空间

专知会员服务

16+阅读 · 2022年11月27日

【CVPR2022】海德堡大学《深度视觉相似性与度量学习》教程，200+页ppt

【CVPR2022】海德堡大学《深度视觉相似性与度量学习》教程，200+页ppt

专知会员服务

44+阅读 · 2022年6月22日

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

专知会员服务

21+阅读 · 2022年3月2日

复杂网络的双曲空间表征学习方法

专知会员服务

47+阅读 · 2020年11月13日

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

专知会员服务

38+阅读 · 2020年4月6日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

【NeurlPS2019论文总结】它是这样的:用于可解释图像识别的深度学习，This Looks Like That: Deep Learning for Interpretable Image Recognition

【NeurlPS2019论文总结】它是这样的:用于可解释图像识别的深度学习，This Looks Like That: Deep Learning for Interpretable Image Recognition

专知会员服务

22+阅读 · 2019年12月17日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知

12+阅读 · 2021年11月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知

12+阅读 · 2020年10月9日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

图像和文本的融合表示学习——Text2Image和Image2Text

图像和文本的融合表示学习——Text2Image和Image2Text

专知

125+阅读 · 2018年6月11日

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

专知

14+阅读 · 2018年6月11日

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

专知

12+阅读 · 2018年6月9日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

极市平台

12+阅读 · 2018年5月17日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

Multiview Self-Representation Learning across Heterogeneous Views

Arxiv

0+阅读 · 2月4日

SciTextures: Collecting and Connecting Visual Patterns, Models, and Code Across Science and Art

Arxiv

0+阅读 · 2月2日

bi-modal textual prompt learning for vision-language models in remote sensing

Arxiv

0+阅读 · 1月28日

Minimax Rates for Hyperbolic Hierarchical Learning

Arxiv

0+阅读 · 1月27日

HexFormer: Hyperbolic Vision Transformer with Exponential Map Aggregation

Arxiv

0+阅读 · 1月27日

Revisiting Multi-Task Visual Representation Learning

Arxiv

0+阅读 · 1月20日

Visual Attention Reasoning via Hierarchical Search and Self-Verification

Arxiv

0+阅读 · 1月9日

VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding

Arxiv

0+阅读 · 1月8日

VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation

Arxiv

0+阅读 · 1月5日

Learning Hierarchical Features for Visual Object Tracking with Recursive Neural Networks

Arxiv

13+阅读 · 2018年1月6日

VIP会员

文章信息

相关主题

相关VIP内容

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

图表示学习还有什么研究点？北大等最新最全《深度图表示学习》综述论文，85页pdf全面详述图监督图结构等图学习技术进展

专知会员服务

60+阅读 · 2023年4月14日

【AAAI2023】用单塔Transformer统一视觉语言表示空间

【AAAI2023】用单塔Transformer统一视觉语言表示空间

专知会员服务

16+阅读 · 2022年11月27日

【CVPR2022】海德堡大学《深度视觉相似性与度量学习》教程，200+页ppt

【CVPR2022】海德堡大学《深度视觉相似性与度量学习》教程，200+页ppt

专知会员服务

44+阅读 · 2022年6月22日

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

专知会员服务

21+阅读 · 2022年3月2日

复杂网络的双曲空间表征学习方法

专知会员服务

47+阅读 · 2020年11月13日

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

专知会员服务

38+阅读 · 2020年4月6日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

【NeurlPS2019论文总结】它是这样的:用于可解释图像识别的深度学习，This Looks Like That: Deep Learning for Interpretable Image Recognition

【NeurlPS2019论文总结】它是这样的:用于可解释图像识别的深度学习，This Looks Like That: Deep Learning for Interpretable Image Recognition

专知会员服务

22+阅读 · 2019年12月17日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知

12+阅读 · 2021年11月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知

12+阅读 · 2020年10月9日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

图像和文本的融合表示学习——Text2Image和Image2Text

图像和文本的融合表示学习——Text2Image和Image2Text

专知

125+阅读 · 2018年6月11日

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

专知

14+阅读 · 2018年6月11日

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

专知

12+阅读 · 2018年6月9日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

极市平台

12+阅读 · 2018年5月17日

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

【论文推荐】最新七篇图像检索相关论文—草图、Tie-Aware、场景图解析、叠加跨注意力机制、深度哈希、人群估计

专知

10+阅读 · 2018年4月22日

相关论文

Multiview Self-Representation Learning across Heterogeneous Views

Arxiv

0+阅读 · 2月4日

SciTextures: Collecting and Connecting Visual Patterns, Models, and Code Across Science and Art

Arxiv

0+阅读 · 2月2日

bi-modal textual prompt learning for vision-language models in remote sensing

Arxiv

0+阅读 · 1月28日

Minimax Rates for Hyperbolic Hierarchical Learning

Arxiv

0+阅读 · 1月27日

HexFormer: Hyperbolic Vision Transformer with Exponential Map Aggregation

Arxiv

0+阅读 · 1月27日

Revisiting Multi-Task Visual Representation Learning

Arxiv

0+阅读 · 1月20日

Visual Attention Reasoning via Hierarchical Search and Self-Verification

Arxiv

0+阅读 · 1月9日

VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding

Arxiv

0+阅读 · 1月8日

VisionReward: Fine-Grained Multi-Dimensional Human Preference Learning for Image and Video Generation

Arxiv

0+阅读 · 1月5日

Learning Hierarchical Features for Visual Object Tracking with Recursive Neural Networks

Arxiv

13+阅读 · 2018年1月6日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员