Data critical to real-world decision-making is increasingly found within organizations. Such data is heterogeneous, constantly evolving, and only imperfectly captured. However, current data management systems remain largely passive, retrieving what is explicitly stored while offering limited support for uncovering implicit structure or reasoning under noise, incompleteness, and continuous updates. We argue that next-generation data management requires neural capabilities, which can uncover complex latent relationships, distinguish reliable signals from noise, and remain consistent as the underlying data state evolves. To support this direction, we introduce NGDBench, a benchmark across five domains that unifies structured and unstructured sources. NGDBench adopts a graph view because graphs provide a flexible abstraction for modeling complex systems, capturing latent relationships, and subsuming structured formats such as relational tables. Each instance pairs a clean latent graph with a realistically perturbed observed graph. NGDBench supports full Cypher queries and dynamic data management operations. Evaluations of state-of-the-art Text-to-Cypher by LLMs and GraphRAG pipelines reveal that current neural query methods remain sensitive to noise and struggle with dynamic state tracking, highlighting the need for resilient, inference-capable data management. Our code is available at https://github.com/HKUST-KnowComp/NGDBench.


翻译:摘要:对现实世界决策至关重要的数据正日益出现在组织内部。这类数据具有异构性、持续演化性,且仅能实现不完全捕获。然而,当前的数据管理系统仍大多处于被动状态——仅能检索显式存储的数据,在揭示隐式结构或应对噪声、不完备性及持续更新下的推理方面支持有限。我们认为,下一代数据管理需要具备神经能力:这种能力能够挖掘复杂潜在关系,从噪声中区分可靠信号,并在底层数据状态演化过程中保持一致性。为支撑这一方向,我们提出NGDBench——一个跨五个领域、统一结构化与非结构化数据源的基准测试集。NGDBench采用图视图,因为图能为复杂系统建模提供灵活抽象,捕获潜在关系,并统摄关系表等结构化格式。每个实例配对了一个纯净的潜在图与一个经过现实扰动的观测图。NGDBench支持完整的Cypher查询与动态数据管理操作。对基于大语言模型的最先进文本到Cypher方法与图RAG管线的评估揭示:当前神经查询方法仍对噪声敏感,且在动态状态追踪上表现不佳,这凸显了对具备弹性与推理能力的数据管理的需求。我们的代码可在https://github.com/HKUST-KnowComp/NGDBench获取。

0
下载
关闭预览

相关内容

图数据管理与图机器学习:协同效应与机会
专知会员服务
16+阅读 · 2025年2月5日
图数据库的发展脉络与技术演进
专知会员服务
25+阅读 · 2023年1月17日
重磅!《数据要素白皮书(2022年)》发布,52页pdf
专知会员服务
86+阅读 · 2023年1月7日
重磅!《2035数字议程重大议题:数据治理》发布,34页pdf
专知会员服务
65+阅读 · 2022年10月21日
专知会员服务
66+阅读 · 2021年7月18日
图神经网络(Graph Neural Networks,GNN)综述
极市平台
104+阅读 · 2019年11月27日
【GNN】深度学习之上,图神经网络(GNN )崛起
产业智能官
16+阅读 · 2019年8月15日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月12日
Arxiv
17+阅读 · 2023年12月4日
Arxiv
15+阅读 · 2023年10月21日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员