NGDBench: Towards Neural Graph Data Management - 专知论文

会员服务 ·

0

图 · 噪声 · 潜在 · 评论员 · Continuity ·

NGDBench: Towards Neural Graph Data Management

翻译：标题：NGDBench：迈向神经图数据管理

Yufei Li,Yisen Gao,Jiaxuan Xiong,Jiaxin Bai,Shijie Zhong,Haoyu Huang,Zhongwei Xie,Hong Ting Tsang,Yangqiu Song

from arxiv, https://github.com/HKUST-KnowComp/NGDBench

Data critical to real-world decision-making is increasingly found within organizations. Such data is heterogeneous, constantly evolving, and only imperfectly captured. However, current data management systems remain largely passive, retrieving what is explicitly stored while offering limited support for uncovering implicit structure or reasoning under noise, incompleteness, and continuous updates. We argue that next-generation data management requires neural capabilities, which can uncover complex latent relationships, distinguish reliable signals from noise, and remain consistent as the underlying data state evolves. To support this direction, we introduce NGDBench, a benchmark across five domains that unifies structured and unstructured sources. NGDBench adopts a graph view because graphs provide a flexible abstraction for modeling complex systems, capturing latent relationships, and subsuming structured formats such as relational tables. Each instance pairs a clean latent graph with a realistically perturbed observed graph. NGDBench supports full Cypher queries and dynamic data management operations. Evaluations of state-of-the-art Text-to-Cypher by LLMs and GraphRAG pipelines reveal that current neural query methods remain sensitive to noise and struggle with dynamic state tracking, highlighting the need for resilient, inference-capable data management. Our code is available at https://github.com/HKUST-KnowComp/NGDBench.

翻译：摘要：对现实世界决策至关重要的数据正日益出现在组织内部。这类数据具有异构性、持续演化性，且仅能实现不完全捕获。然而，当前的数据管理系统仍大多处于被动状态——仅能检索显式存储的数据，在揭示隐式结构或应对噪声、不完备性及持续更新下的推理方面支持有限。我们认为，下一代数据管理需要具备神经能力：这种能力能够挖掘复杂潜在关系，从噪声中区分可靠信号，并在底层数据状态演化过程中保持一致性。为支撑这一方向，我们提出NGDBench——一个跨五个领域、统一结构化与非结构化数据源的基准测试集。NGDBench采用图视图，因为图能为复杂系统建模提供灵活抽象，捕获潜在关系，并统摄关系表等结构化格式。每个实例配对了一个纯净的潜在图与一个经过现实扰动的观测图。NGDBench支持完整的Cypher查询与动态数据管理操作。对基于大语言模型的最先进文本到Cypher方法与图RAG管线的评估揭示：当前神经查询方法仍对噪声敏感，且在动态状态追踪上表现不佳，这凸显了对具备弹性与推理能力的数据管理的需求。我们的代码可在https://github.com/HKUST-KnowComp/NGDBench获取。

0

相关内容

图数据管理与图机器学习：协同效应与机会

图数据管理与图机器学习：协同效应与机会

专知会员服务

16+阅读 · 2025年2月5日

图数据库的发展脉络与技术演进

图数据库的发展脉络与技术演进

专知会员服务

25+阅读 · 2023年1月17日

重磅！《数据要素白皮书（2022年）》发布，52页pdf

重磅！《数据要素白皮书（2022年）》发布，52页pdf

专知会员服务

86+阅读 · 2023年1月7日

重磅！《2035数字议程重大议题：数据治理》发布，34页pdf

重磅！《2035数字议程重大议题：数据治理》发布，34页pdf

专知会员服务

65+阅读 · 2022年10月21日

数据治理研究报告——数据要素权益配置路径（2022年），50页pdf

数据治理研究报告——数据要素权益配置路径（2022年），50页pdf

专知会员服务

43+阅读 · 2022年7月19日

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

专知会员服务

18+阅读 · 2022年4月8日

面向预测数据分析的机器学习，72页pdf

专知会员服务

66+阅读 · 2021年7月18日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

【南洋理工大学Xavier Bresson】图深度学习最近进展，35页ppt，Deep Learning on Graphs

【南洋理工大学Xavier Bresson】图深度学习最近进展，35页ppt，Deep Learning on Graphs

专知会员服务

113+阅读 · 2019年11月27日

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络（Graph Neural Networks，GNN）综述

图神经网络（Graph Neural Networks，GNN）综述

极市平台

104+阅读 · 2019年11月27日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

领域应用 | 到底什么时候使用图数据库？

领域应用 | 到底什么时候使用图数据库？

开放知识图谱

16+阅读 · 2019年4月19日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

VeriGraph: Towards Verifiable Data-Analytic Agents

Arxiv

0+阅读 · 6月15日

LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

Arxiv

0+阅读 · 6月10日

Self-Ensembling Vision-Language Models for Chart Data Extraction

Arxiv

0+阅读 · 5月26日

TorchLean: Formalizing Neural Networks in Lean

Arxiv

0+阅读 · 5月24日

A Reference Model and Patterns for Production Event Data Enrichment

Arxiv

0+阅读 · 5月18日

Towards Foundation Models for Relational Databases with Language Models and Graph Neural Networks

Arxiv

0+阅读 · 5月15日

Random-Set Graph Neural Networks

Arxiv

0+阅读 · 5月12日

A Survey of Graph Neural Networks in Real world: Imbalance, Noise, Privacy and OOD Challenges

Arxiv

11+阅读 · 2024年3月7日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

Survey of Vector Database Management Systems

Arxiv

15+阅读 · 2023年10月21日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

图数据管理与图机器学习：协同效应与机会

图数据管理与图机器学习：协同效应与机会

专知会员服务

16+阅读 · 2025年2月5日

图数据库的发展脉络与技术演进

图数据库的发展脉络与技术演进

专知会员服务

25+阅读 · 2023年1月17日

重磅！《数据要素白皮书（2022年）》发布，52页pdf

重磅！《数据要素白皮书（2022年）》发布，52页pdf

专知会员服务

86+阅读 · 2023年1月7日

重磅！《2035数字议程重大议题：数据治理》发布，34页pdf

重磅！《2035数字议程重大议题：数据治理》发布，34页pdf

专知会员服务

65+阅读 · 2022年10月21日

数据治理研究报告——数据要素权益配置路径（2022年），50页pdf

数据治理研究报告——数据要素权益配置路径（2022年），50页pdf

专知会员服务

43+阅读 · 2022年7月19日

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

专知会员服务

18+阅读 · 2022年4月8日

面向预测数据分析的机器学习，72页pdf

专知会员服务

66+阅读 · 2021年7月18日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

【南洋理工大学Xavier Bresson】图深度学习最近进展，35页ppt，Deep Learning on Graphs

【南洋理工大学Xavier Bresson】图深度学习最近进展，35页ppt，Deep Learning on Graphs

专知会员服务

113+阅读 · 2019年11月27日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络（Graph Neural Networks，GNN）综述

图神经网络（Graph Neural Networks，GNN）综述

极市平台

104+阅读 · 2019年11月27日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

领域应用 | 到底什么时候使用图数据库？

领域应用 | 到底什么时候使用图数据库？

开放知识图谱

16+阅读 · 2019年4月19日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

相关论文

VeriGraph: Towards Verifiable Data-Analytic Agents

Arxiv

0+阅读 · 6月15日

LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

Arxiv

0+阅读 · 6月10日

Self-Ensembling Vision-Language Models for Chart Data Extraction

Arxiv

0+阅读 · 5月26日

TorchLean: Formalizing Neural Networks in Lean

Arxiv

0+阅读 · 5月24日

A Reference Model and Patterns for Production Event Data Enrichment

Arxiv

0+阅读 · 5月18日

Towards Foundation Models for Relational Databases with Language Models and Graph Neural Networks

Arxiv

0+阅读 · 5月15日

Random-Set Graph Neural Networks

Arxiv

0+阅读 · 5月12日

A Survey of Graph Neural Networks in Real world: Imbalance, Noise, Privacy and OOD Challenges

Arxiv

11+阅读 · 2024年3月7日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

Survey of Vector Database Management Systems

Arxiv

15+阅读 · 2023年10月21日

相关基金

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

支持可扩展事务处理的数据库日志机制及其实现

国家自然科学基金

0+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员