This paper introduces the Intrinsic Dimension Estimating Autoencoder (IDEA), which identifies the underlying intrinsic dimension of a wide range of datasets whose samples lie on either linear or nonlinear manifolds. Beyond estimating the intrinsic dimension, IDEA is also able to reconstruct the original dataset after projecting it onto the corresponding latent space, which is structured using re-weighted double CancelOut layers. Our key contribution is the introduction of the projected reconstruction loss term, guiding the training of the model by continuously assessing the reconstruction quality under the removal of an additional latent dimension. We first assess the performance of IDEA on a series of theoretical benchmarks to validate its robustness. These experiments allow us to test its reconstruction ability and compare its performance with state-of-the-art intrinsic dimension estimators. The benchmarks show good accuracy and high versatility of our approach. Subsequently, we apply our model to data generated from the numerical solution of a vertically resolved one-dimensional free-surface flow, following a pointwise discretization of the vertical velocity profile in the horizontal direction, vertical direction, and time. IDEA succeeds in estimating the dataset's intrinsic dimension and then reconstructs the original solution by working directly within the projection space identified by the network.


翻译:本文提出本征维数估计自编码器(IDEA),该方法能够识别广泛数据集的内在维数,这些数据集的样本分布于线性或非线性流形上。除估计本征维数外,IDEA还能在将数据集投影至相应潜在空间后重建原始数据,该潜在空间通过重新加权的双重CancelOut层构建。我们的核心贡献在于引入投影重建损失项,该损失项通过持续评估在移除一个额外潜在维度下的重建质量来指导模型训练。我们首先在一系列理论基准测试中评估IDEA的性能以验证其鲁棒性。这些实验使我们能够测试其重建能力,并将其性能与最先进的本征维数估计方法进行比较。基准测试表明我们的方法具有良好的准确性和高度的普适性。随后,我们将模型应用于由垂向解析一维自由表面流数值解生成的数据,该数据遵循垂直速度剖面在水平方向、垂直方向及时间上的逐点离散化。IDEA成功估计了数据集的本征维数,并直接在网络识别的投影空间内重建了原始解。

0
下载
关闭预览

相关内容

专知会员服务
37+阅读 · 2021年10月16日
【2020新书】软件和人工智能项目中的设计思维,157页pdf
专知会员服务
123+阅读 · 2020年8月30日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
再谈变分自编码器VAE:从贝叶斯观点出发
PaperWeekly
13+阅读 · 2018年4月2日
【干货】深入理解自编码器(附代码实现)
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
专知会员服务
37+阅读 · 2021年10月16日
【2020新书】软件和人工智能项目中的设计思维,157页pdf
专知会员服务
123+阅读 · 2020年8月30日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员