Fast Nearest Neighbor Search for $\ell_p$ Metrics - 专知论文

会员服务 ·

0

结构 · 数据结构 · 度量 · 最近邻 · 最近邻搜索 ·

Fast Nearest Neighbor Search for $\ell_p$ Metrics

翻译：$\ell_p$ 度量的快速最近邻搜索

Robert Krauthgamer,Nir Petruschka

from arxiv, 9 pages

The Nearest Neighbor Search (NNS) problem asks to design a data structure that preprocesses an $n$-point dataset $X$ lying in a metric space $\mathcal{M}$, so that given a query point $q \in \mathcal{M}$, one can quickly return a point of $X$ minimizing the distance to $q$. The efficiency of such a data structure is evaluated primarily by the amount of space it uses and the time required to answer a query. We focus on the fast query-time regime, which is crucial for modern large-scale applications, where datasets are massive and queries must be processed online, and is often modeled by query time $\text{poly}(d \log n)$. Our main result is such a randomized data structure for NNS in $\ell_p$ spaces, $p>2$, that achieves $p^{O(1) + \log\log p}$ approximation with fast query time and $\text{poly}(dn)$ space. Our data structure improves, or is incomparable to, the state-of-the-art for the fast query-time regime from [Bartal and Gottlieb, TCS 2019] and [Krauthgamer, Petruschka and Sapir, FOCS 2025].

翻译：最近邻搜索（NNS）问题要求设计一种数据结构，它能预处理位于度量空间 $\mathcal{M}$ 中的 $n$ 点数据集 $X$，使得给定查询点 $q \in \mathcal{M}$ 时，能快速返回 $X$ 中距离 $q$ 最近的点。此类数据结构的效率主要取决于其空间开销和查询响应时间。我们聚焦于快速查询时间场景——这是现代大规模应用（数据集庞大且需在线处理查询）的关键需求，通常建模为查询时间 $\text{poly}(d \log n)$。我们的主要成果是针对 $\ell_p$ 空间（$p>2$）中 NNS 问题的一种随机化数据结构，该结构在快速查询时间和 $\text{poly}(dn)$ 空间条件下实现了 $p^{O(1) + \log\log p}$ 近似比。我们的数据结构相较于 [Bartal and Gottlieb, TCS 2019] 和 [Krauthgamer, Petruschka and Sapir, FOCS 2025] 在快速查询时间场景下的最佳现有结果，或有所改进，或具有不可比性。

0

相关内容

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

专知会员服务

19+阅读 · 2024年6月25日

【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN

【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN

专知会员服务

11+阅读 · 2021年11月17日

【NeurIPS2021】SOLQ：基于学习查询的物体分割

【NeurIPS2021】SOLQ：基于学习查询的物体分割

专知会员服务

10+阅读 · 2021年11月9日

在线哈希算法研究综述

专知会员服务

19+阅读 · 2021年5月16日

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

专知会员服务

17+阅读 · 2020年6月4日

【剑桥大学】图网络的主邻域聚合，Principal Neighbourhood Aggregation for Graph Nets

【剑桥大学】图网络的主邻域聚合，Principal Neighbourhood Aggregation for Graph Nets

专知会员服务

42+阅读 · 2020年4月22日

【北大-阿里巴巴】深度哈希方法综述，23页pdf，A Survey on Deep Hashing Methods

【北大-阿里巴巴】深度哈希方法综述，23页pdf，A Survey on Deep Hashing Methods

专知会员服务

27+阅读 · 2020年3月9日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

【WSDM2020】微软上海交大，基于双侧邻域协作关系建模的顺序推荐，Sequential Recommendation with Dual Side Neighbor-based Collaborative Relation Modeling（附pdf）

专知会员服务

23+阅读 · 2019年11月23日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

博客 | 度量学习总结(三) | Deep Metric Learning for Sequential Data

博客 | 度量学习总结(三) | Deep Metric Learning for Sequential Data

AI研习社

27+阅读 · 2019年4月13日

博客 | 度量学习笔记(一) | Metric Learning for text categorization

博客 | 度量学习笔记(一) | Metric Learning for text categorization

AI研习社

21+阅读 · 2019年3月15日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

极市平台

12+阅读 · 2018年5月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

M-矩阵（张量）最小特征值估计及其相关问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于秩一张量近似的多目标跟踪

国家自然科学基金

0+阅读 · 2015年12月31日

积分型样条函数逼近新理论、新方法及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

Adaptive $k$NN graph model

Arxiv

0+阅读 · 6月13日

Parallel Metric Skip Lists and Nearest Neighbor Search

Arxiv

0+阅读 · 6月12日

TSseek: Regular Expression-Based Similarity Search for Distributed Time Series Datasets

Arxiv

0+阅读 · 6月10日

LAANN: I/O-Aware Look-Ahead Search for Disk-Based Approximate Nearest Neighbor Search

Arxiv

0+阅读 · 6月1日

Generalized Range Filtering Approximate Nearest Neighbor Search: Containment and Overlap [Technical Report]

Arxiv

0+阅读 · 5月26日

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Arxiv

0+阅读 · 5月19日

Incremental Strongly Connected Components with Predictions

Arxiv

0+阅读 · 4月28日

Onyx: Cost-Efficient Disk-Oblivious ANN Search

Arxiv

0+阅读 · 4月22日

Geodesic Semantic Search: Cartographic Navigation of Citation Graphs with Learned Local Riemannian Maps

Arxiv

0+阅读 · 4月17日

A Polynomial Coreset for Furthest Neighbor in Planar Metrics

Arxiv

0+阅读 · 3月30日

VIP会员

文章信息

相关主题

最近邻搜索

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

3+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

专知会员服务

19+阅读 · 2024年6月25日

【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN

【NeurIPS2021】上亿量级规模高效向量近似最近邻搜索系统 SPANN

专知会员服务

11+阅读 · 2021年11月17日

【NeurIPS2021】SOLQ：基于学习查询的物体分割

【NeurIPS2021】SOLQ：基于学习查询的物体分割

专知会员服务

10+阅读 · 2021年11月9日

在线哈希算法研究综述

专知会员服务

19+阅读 · 2021年5月16日

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

专知会员服务

17+阅读 · 2020年6月4日

【剑桥大学】图网络的主邻域聚合，Principal Neighbourhood Aggregation for Graph Nets

【剑桥大学】图网络的主邻域聚合，Principal Neighbourhood Aggregation for Graph Nets

专知会员服务

42+阅读 · 2020年4月22日

【北大-阿里巴巴】深度哈希方法综述，23页pdf，A Survey on Deep Hashing Methods

【北大-阿里巴巴】深度哈希方法综述，23页pdf，A Survey on Deep Hashing Methods

专知会员服务

27+阅读 · 2020年3月9日

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

【康奈尔大学】度量数据粒度，Measuring Dataset Granularity

专知会员服务

13+阅读 · 2019年12月27日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

【WSDM2020】微软上海交大，基于双侧邻域协作关系建模的顺序推荐，Sequential Recommendation with Dual Side Neighbor-based Collaborative Relation Modeling（附pdf）

专知会员服务

23+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

博客 | 度量学习总结(三) | Deep Metric Learning for Sequential Data

博客 | 度量学习总结(三) | Deep Metric Learning for Sequential Data

AI研习社

27+阅读 · 2019年4月13日

博客 | 度量学习笔记(一) | Metric Learning for text categorization

博客 | 度量学习笔记(一) | Metric Learning for text categorization

AI研习社

21+阅读 · 2019年3月15日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

基于二进制哈希编码快速学习的快速图像检索

基于二进制哈希编码快速学习的快速图像检索

极市平台

12+阅读 · 2018年5月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

相关论文

Adaptive $k$NN graph model

Arxiv

0+阅读 · 6月13日

Parallel Metric Skip Lists and Nearest Neighbor Search

Arxiv

0+阅读 · 6月12日

TSseek: Regular Expression-Based Similarity Search for Distributed Time Series Datasets

Arxiv

0+阅读 · 6月10日

LAANN: I/O-Aware Look-Ahead Search for Disk-Based Approximate Nearest Neighbor Search

Arxiv

0+阅读 · 6月1日

Generalized Range Filtering Approximate Nearest Neighbor Search: Containment and Overlap [Technical Report]

Arxiv

0+阅读 · 5月26日

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Arxiv

0+阅读 · 5月19日

Incremental Strongly Connected Components with Predictions

Arxiv

0+阅读 · 4月28日

Onyx: Cost-Efficient Disk-Oblivious ANN Search

Arxiv

0+阅读 · 4月22日

Geodesic Semantic Search: Cartographic Navigation of Citation Graphs with Learned Local Riemannian Maps

Arxiv

0+阅读 · 4月17日

A Polynomial Coreset for Furthest Neighbor in Planar Metrics

Arxiv

0+阅读 · 3月30日

相关基金

M-矩阵（张量）最小特征值估计及其相关问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于秩一张量近似的多目标跟踪

国家自然科学基金

0+阅读 · 2015年12月31日

积分型样条函数逼近新理论、新方法及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

随机排队网络的强逼近及其相关渐近分析

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员