面向未来的向量检索：从内存驻留、静态异构存储到云原生架构 (Vector Search for the Future: From Memory-Resident, Static Heterogeneous Storage, to Cloud-Native Architectures) - 专知论文

会员服务 ·

0

向量检索 · 存储 · 内存 · 异构 · 云原生 ·

Vector Search for the Future: From Memory-Resident, Static Heterogeneous Storage, to Cloud-Native Architectures

翻译：面向未来的向量检索：从内存驻留、静态异构存储到云原生架构

Yitong Song,Xuanhe Zhou,Christian S. Jensen,Jianliang Xu

from arxiv, Accepted as a tutorial at SIGMOD 2026

Vector search (VS) has become a fundamental component in multimodal data management, enabling core functionalities such as image, video, and code retrieval. As vector data scales rapidly, VS faces growing challenges in balancing search, latency, scalability, and cost. The evolution of VS has been closely driven by changes in storage architecture. Early VS methods rely on all-in-memory designs for low latency, but scalability is constrained by memory capacity and cost. To address this, recent research has adopted heterogeneous architectures that offload space-intensive vectors and index structures to SSDs, while exploiting block locality and I/O-efficient strategies to maintain high search performance at billion scale. Looking ahead, the increasing demand for trillion-scale vector retrieval and cloud-native elasticity is driving a further shift toward memory-SSD-object storage architectures, which enable cost-efficient data tiering and seamless scalability. In this tutorial, we review the evolution of VS techniques from a storage-architecture perspective. We first review memory-resident methods, covering classical IVF, hash, quantization, and graph-based designs. We then present a systematic overview of heterogeneous storage VS techniques, including their index designs, block-level layouts, query strategies, and update mechanisms. Finally, we examine emerging cloud-native systems and highlight open research opportunities for future large-scale vector retrieval systems.

翻译：向量检索已成为多模态数据管理的基础组件，支撑着图像、视频和代码检索等核心功能。随着向量数据规模的快速增长，向量检索在平衡搜索精度、延迟、可扩展性和成本方面面临日益严峻的挑战。向量检索技术的发展始终与存储架构的演进紧密相连。早期的向量检索方法依赖全内存设计以实现低延迟，但其可扩展性受限于内存容量与成本。为解决此问题，近期研究转向采用异构存储架构，将空间密集的向量与索引结构卸载至SSD，同时利用数据块局部性和I/O高效策略，在十亿级规模下维持高性能检索。展望未来，对万亿级向量检索和云原生弹性的需求正推动架构进一步向内存-SSD-对象存储层级演进，以实现成本优化的数据分层与无缝扩展。本教程从存储架构视角系统回顾向量检索技术的演进历程。我们首先梳理内存驻留方法，涵盖经典的倒排索引、哈希、量化和基于图的设计；随后系统综述异构存储向量检索技术，包括其索引设计、块级布局、查询策略与更新机制；最后探讨新兴的云原生系统，并指出未来大规模向量检索系统的开放研究方向。

0

相关内容

向量检索

面向具身智能的多模态数据存储与检索：综述

面向具身智能的多模态数据存储与检索：综述

专知会员服务

29+阅读 · 2025年8月20日

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

人工智能专题研究：向量数据库——AI时代的技术基座，36页pdf

人工智能专题研究：向量数据库——AI时代的技术基座，36页pdf

专知会员服务

118+阅读 · 2023年6月22日

「多模态信息处理」前沿综述:应用、融合和预训练，京东人工智能研究院

「多模态信息处理」前沿综述:应用、融合和预训练，京东人工智能研究院

专知会员服务

148+阅读 · 2022年6月25日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

跨模态检索研究进展综述

专知会员服务

53+阅读 · 2021年8月13日

基于深度学习的跨模态检索综述

专知会员服务

62+阅读 · 2021年3月25日

大数据存储技术综述

专知会员服务

18+阅读 · 2020年11月8日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

【Google】多模态Transformer视频检索，Multi-modal Transformer

【Google】多模态Transformer视频检索，Multi-modal Transformer

专知会员服务

103+阅读 · 2020年7月22日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

关于数据挖掘，有几本书推荐给你......

关于数据挖掘，有几本书推荐给你......

图灵教育

16+阅读 · 2017年10月11日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

下一代异构移动网络中分布式云存储的设计与研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于草图语义部件的三维模型检索技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

二维和三维量子图像的存储、压缩与分割技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

QVCache: A Query-Aware Vector Cache

Arxiv

0+阅读 · 2月2日

Updatable Balanced Index for Stable Streaming Similarity Search over Large-Scale Fresh Vectors

Arxiv

0+阅读 · 1月31日

LEMUR: Learned Multi-Vector Retrieval

Arxiv

0+阅读 · 1月29日

Overcoming In-Memory Bottlenecks in Graph Foundation Models via Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月21日

GPU-Resident Inverted File Index for Streaming Vector Databases

Arxiv

0+阅读 · 1月16日

SpatCode: Rotary-based Unified Encoding Framework for Efficient Spatiotemporal Vector Retrieval

Arxiv

0+阅读 · 1月14日

See More, Store Less: Memory-Efficient Resolution for Video Moment Retrieval

Arxiv

0+阅读 · 1月14日

Vextra: A Unified Middleware Abstraction for Heterogeneous Vector Database Systems

Arxiv

0+阅读 · 1月11日

Reveal Hidden Pitfalls and Navigate Next Generation of Vector Similarity Search from Task-Centric Views

Arxiv

0+阅读 · 2025年12月31日

From HNSW to Information-Theoretic Binarization: Rethinking the Architecture of Scalable Vector Search

Arxiv

0+阅读 · 2025年12月16日

VIP会员

文章信息

相关主题

相关VIP内容

面向具身智能的多模态数据存储与检索：综述

面向具身智能的多模态数据存储与检索：综述

专知会员服务

29+阅读 · 2025年8月20日

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

人工智能专题研究：向量数据库——AI时代的技术基座，36页pdf

人工智能专题研究：向量数据库——AI时代的技术基座，36页pdf

专知会员服务

118+阅读 · 2023年6月22日

「多模态信息处理」前沿综述:应用、融合和预训练，京东人工智能研究院

「多模态信息处理」前沿综述:应用、融合和预训练，京东人工智能研究院

专知会员服务

148+阅读 · 2022年6月25日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

跨模态检索研究进展综述

专知会员服务

53+阅读 · 2021年8月13日

基于深度学习的跨模态检索综述

专知会员服务

62+阅读 · 2021年3月25日

大数据存储技术综述

专知会员服务

18+阅读 · 2020年11月8日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

【Google】多模态Transformer视频检索，Multi-modal Transformer

【Google】多模态Transformer视频检索，Multi-modal Transformer

专知会员服务

103+阅读 · 2020年7月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

关于数据挖掘，有几本书推荐给你......

关于数据挖掘，有几本书推荐给你......

图灵教育

16+阅读 · 2017年10月11日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

相关论文

QVCache: A Query-Aware Vector Cache

Arxiv

0+阅读 · 2月2日

Updatable Balanced Index for Stable Streaming Similarity Search over Large-Scale Fresh Vectors

Arxiv

0+阅读 · 1月31日

LEMUR: Learned Multi-Vector Retrieval

Arxiv

0+阅读 · 1月29日

Overcoming In-Memory Bottlenecks in Graph Foundation Models via Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月21日

GPU-Resident Inverted File Index for Streaming Vector Databases

Arxiv

0+阅读 · 1月16日

SpatCode: Rotary-based Unified Encoding Framework for Efficient Spatiotemporal Vector Retrieval

Arxiv

0+阅读 · 1月14日

See More, Store Less: Memory-Efficient Resolution for Video Moment Retrieval

Arxiv

0+阅读 · 1月14日

Vextra: A Unified Middleware Abstraction for Heterogeneous Vector Database Systems

Arxiv

0+阅读 · 1月11日

Reveal Hidden Pitfalls and Navigate Next Generation of Vector Similarity Search from Task-Centric Views

Arxiv

0+阅读 · 2025年12月31日

From HNSW to Information-Theoretic Binarization: Rethinking the Architecture of Scalable Vector Search

Arxiv

0+阅读 · 2025年12月16日

相关基金

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

下一代异构移动网络中分布式云存储的设计与研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于草图语义部件的三维模型检索技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

二维和三维量子图像的存储、压缩与分割技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员