The dictionary learning problem can be viewed as a data-driven process to learn a suitable transformation so that data is sparsely represented directly from example data. In this paper, we examine the problem of learning a dictionary that is invariant under a pre-specified group of transformations. Natural settings include Cryo-EM, multi-object tracking, synchronization, pose estimation, etc. We specifically study this problem under the lens of mathematical representation theory. Leveraging the power of non-abelian Fourier analysis for functions over compact groups, we prescribe an algorithmic recipe for learning dictionaries that obey such invariances. We relate the dictionary learning problem in the physical domain, which is naturally modelled as being infinite dimensional, with the associated computational problem, which is necessarily finite dimensional. We establish that the dictionary learning problem can be effectively understood as an optimization instance over certain matrix orbitopes having a particular block-diagonal structure governed by the irreducible representations of the group of symmetries. This perspective enables us to introduce a band-limiting procedure which obtains dimensionality reduction in applications. We provide guarantees for our computational ansatz to provide a desirable dictionary learning outcome. We apply our paradigm to investigate the dictionary learning problem for the groups SO(2) and SO(3). While the SO(2)-orbitope admits an exact spectrahedral description, substantially less is understood about the SO(3)-orbitope. We describe a tractable spectrahedral outer approximation of the SO(3)-orbitope, and contribute an alternating minimization paradigm to perform optimization in this setting. We provide numerical experiments to highlight the efficacy of our approach in learning SO(3)-invariant dictionaries, both on synthetic and on real world data.


翻译:字典学习问题可视为一种数据驱动过程,旨在从示例数据中直接学习能够使数据获得稀疏表示的合适变换。本文研究在预定义变换群作用下保持不变的字典学习问题,其自然应用场景包括冷冻电镜、多目标跟踪、同步问题、姿态估计等。我们特别从数学表示理论的视角探讨该问题。通过利用紧群上函数的非阿贝尔傅里叶分析工具,我们提出了一种学习具有此类不变性字典的算法框架。我们将物理域中自然建模为无限维的字典学习问题,与必然有限维的相关计算问题建立联系。我们证明字典学习问题可被有效理解为在特定矩阵轨道体上的优化实例,这些轨道体具有由对称群的不可约表示决定的块对角结构。该视角使我们能够引入带限处理程序,在应用中实现降维。我们为计算方案提供了保证字典学习获得理想结果的理论依据。应用该范式,我们研究了SO(2)群和SO(3)群的字典学习问题。虽然SO(2)轨道体存在精确的谱面体描述,但对SO(3)轨道体的理解仍存在显著不足。我们提出了SO(3)轨道体的可处理谱面体外逼近方法,并构建了在此设定下执行优化的交替最小化范式。通过合成数据与真实数据的数值实验,我们验证了所提方法在学习SO(3)不变字典方面的有效性。

0
下载
关闭预览

相关内容

稀疏表达的效果好坏和用的字典有着密切的关系。字典分两类,一种是预先给定的分析字典,比如小波基、DCT等,另一种则是针对特定数据集学习出特定的字典。这种学出来的字典能大大提升在特定数据集的效果。
【剑桥大学博士论文】基于注意力的图表示学习
专知会员服务
25+阅读 · 2025年11月3日
【阿姆斯特丹博士论文】表格表示学习,179页pdf
专知会员服务
36+阅读 · 2024年4月6日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
174+阅读 · 2020年7月11日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
长文本表示学习概述
云栖社区
15+阅读 · 2019年5月9日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
网络表示学习介绍
人工智能前沿讲习班
18+阅读 · 2018年11月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关资讯
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
长文本表示学习概述
云栖社区
15+阅读 · 2019年5月9日
学会原创 | 自然语言的语义表示学习方法与应用
中国人工智能学会
11+阅读 · 2019年3月7日
网络表示学习介绍
人工智能前沿讲习班
18+阅读 · 2018年11月26日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员