Scale-adaptive and robust intrinsic dimension estimation via optimal neighbourhood identification - 专知论文

会员服务 ·

0

本征 · 稳健 · 尺度自适应 · 自适应 · 本征维数估计 ·

Scale-adaptive and robust intrinsic dimension estimation via optimal neighbourhood identification

翻译：尺度自适应的稳健本征维数估计：基于最优邻域识别

Antonio Di Noia,Iuri Macocco,Aldo Glielmo,Alessandro Laio,Antonietta Mira

The Intrinsic Dimension (ID) is a key concept in unsupervised learning and feature selection, as it is a lower bound to the number of variables which are necessary to describe a system. However, in almost any real-world dataset the ID depends on the scale at which the data are analysed. Quite typically at a small scale, the ID is very large, as the data are affected by measurement errors. At large scale, the ID can also appear erroneously large, due to the curvature and the topology of the manifold containing the data. In this work, we introduce an automatic protocol to select the sweet spot, namely the correct range of scales in which the ID is meaningful and useful. This protocol is based on imposing that for distances smaller than the correct scale the density of the data is constant. In the presented framework, to estimate the density it is necessary to know the ID, therefore, this condition is imposed self-consistently. We illustrate the usefulness and robustness of this procedure to noise by benchmarks on artificial and real-world datasets.

翻译：本征维数是无监督学习和特征选择中的关键概念，它是描述一个系统所需变量的下界。然而，在几乎所有的真实数据集中，本征维数都依赖于数据分析的尺度。通常在小尺度下，本征维数非常大，因为数据受到测量误差的影响；在大尺度下，由于包含数据的流形的曲率和拓扑结构，本征维数也可能看似偏大。本文提出了一种自动选择"最佳尺度"——即本征维数具有意义和效用的正确尺度范围——的协议。该协议基于以下假设：在小于正确尺度的距离内，数据密度为常数。在所提出的框架中，估计密度需要先知道本征维数，因此该条件以自洽方式施加。通过人工和真实数据集的基准测试，我们证明了该过程对噪声的实用性和稳健性。

0

相关内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

无人自主系统能力边界参数自适应判别方法

无人自主系统能力边界参数自适应判别方法

专知会员服务

20+阅读 · 2024年10月26日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知会员服务

47+阅读 · 2022年1月25日

[ICCV 2021] 用于任意形状文本检测的自适应边界推荐网络

专知会员服务

11+阅读 · 2021年10月3日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

159+阅读 · 2019年11月26日

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

面向机器学习和数据分析的特征工程，附新书419页pdf

面向机器学习和数据分析的特征工程，附新书419页pdf

专知

93+阅读 · 2019年10月5日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

专知

20+阅读 · 2018年4月5日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

部分特征值统计量的中心极限定理及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

观测反馈能稳的控制系统的最佳结构参数

国家自然科学基金

0+阅读 · 2014年12月31日

Adaptive Node Feature Selection For Graph Neural Networks

Arxiv

0+阅读 · 5月1日

Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

Arxiv

0+阅读 · 4月26日

Missingness-Adaptive Factor Identification in High-Dimensional Data

Arxiv

0+阅读 · 4月20日

Discrepancies are Virtue: Weak-to-Strong Generalization through Lens of Intrinsic Dimension

Arxiv

0+阅读 · 4月19日

Propensity Score Methods for Local Test Score Equating: Stratification and Inverse Probability Weighting

Arxiv

0+阅读 · 4月9日

Covariance Matrix Estimation for High-Dimensional Interval-Valued Data with Positive Definiteness

Arxiv

0+阅读 · 4月1日

Robust domain selection for functional data via interval-wise testing and effect size mapping

Arxiv

0+阅读 · 3月25日

Estimate of the Neural Network Dimension using Algebraic Topology and Lie Theory

Arxiv

0+阅读 · 3月23日

Size-adaptive Hypothesis Testing for Fairness

Arxiv

0+阅读 · 3月19日

Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

Arxiv

0+阅读 · 3月12日

VIP会员

文章信息

相关主题

尺度自适应

本征维数估计

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

无人自主系统能力边界参数自适应判别方法

无人自主系统能力边界参数自适应判别方法

专知会员服务

20+阅读 · 2024年10月26日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知会员服务

47+阅读 · 2022年1月25日

[ICCV 2021] 用于任意形状文本检测的自适应边界推荐网络

专知会员服务

11+阅读 · 2021年10月3日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

【干货】面向机器学习和数据分析的特征工程，附新书419页pdf

专知会员服务

159+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

面向机器学习和数据分析的特征工程，附新书419页pdf

面向机器学习和数据分析的特征工程，附新书419页pdf

专知

93+阅读 · 2019年10月5日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

专知

20+阅读 · 2018年4月5日

相关论文

Adaptive Node Feature Selection For Graph Neural Networks

Arxiv

0+阅读 · 5月1日

Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

Arxiv

0+阅读 · 4月26日

Missingness-Adaptive Factor Identification in High-Dimensional Data

Arxiv

0+阅读 · 4月20日

Discrepancies are Virtue: Weak-to-Strong Generalization through Lens of Intrinsic Dimension

Arxiv

0+阅读 · 4月19日

Propensity Score Methods for Local Test Score Equating: Stratification and Inverse Probability Weighting

Arxiv

0+阅读 · 4月9日

Covariance Matrix Estimation for High-Dimensional Interval-Valued Data with Positive Definiteness

Arxiv

0+阅读 · 4月1日

Robust domain selection for functional data via interval-wise testing and effect size mapping

Arxiv

0+阅读 · 3月25日

Estimate of the Neural Network Dimension using Algebraic Topology and Lie Theory

Arxiv

0+阅读 · 3月23日

Size-adaptive Hypothesis Testing for Fairness

Arxiv

0+阅读 · 3月19日

Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

Arxiv

0+阅读 · 3月12日

相关基金

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

部分特征值统计量的中心极限定理及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

观测反馈能稳的控制系统的最佳结构参数

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员