EMERGE: A Benchmark for Updating Knowledge Graphs with Emerging Textual Knowledge - 专知论文

会员服务 ·

0

EMERGE: A Benchmark for Updating Knowledge Graphs with Emerging Textual Knowledge

翻译：EMERGE：基于新兴文本知识更新知识图谱的基准数据集

Klim Zaporojets,Daniel Daza,Edoardo Barba,Ira Assent,Roberto Navigli,Paul Groth

Knowledge Graphs (KGs) are structured knowledge repositories containing entities and relations between them. In this paper, we study the problem of automatically updating KGs over time in response to evolving knowledge in unstructured textual sources. Addressing this problem requires identifying a wide range of update operations based on the state of an existing KG at a given time and the information extracted from text. This contrasts with traditional information extraction pipelines, which extract knowledge from text independently of the current state of a KG. To address this challenge, we propose a method for construction of a dataset consisting of Wikidata KG snapshots over time and Wikipedia passages paired with the corresponding edit operations that they induce in a particular KG snapshot. The resulting dataset comprises 233K Wikipedia passages aligned with a total of 1.45 million KG edits over 7 different yearly snapshots of Wikidata from 2019 to 2025. Our experimental results highlight key challenges in updating KG snapshots based on emerging textual knowledge, particularly in integrating knowledge expressed in text with the existing KG structure. These findings position the dataset as a valuable benchmark for future research. Our dataset and model implementations are publicly available.

翻译：知识图谱（KG）是包含实体及其关系的结构化知识库。本文研究如何根据非结构化文本源中不断演变的知识，自动随时间更新知识图谱。解决该问题需要基于现有知识图谱在特定时刻的状态与文本中提取的信息，识别多种更新操作。这与传统信息抽取流程不同——后者独立于知识图谱当前状态从文本中提取知识。为应对这一挑战，我们提出了一种数据集构建方法，该方法包含维基数据（Wikidata）知识图谱随时间变化的快照，以及维基百科篇章与相应编辑操作的配对（这些操作由特定知识图谱快照中的篇章引发）。最终数据集包含23.3万段维基百科文章，对应2019年至2025年7个不同年份的维基数据快照中共计145万条知识图谱编辑记录。实验结果表明，基于新兴文本知识更新知识图谱快照面临关键挑战，尤其体现在如何将文本表达的知识与现有知识图谱结构进行整合。这些发现使该数据集成为未来研究的宝贵基准。我们的数据集与模型实现均已公开。

0

相关内容

【CMU博士论文】利用文本语义学为知识图谱的获取和应用，105页pdf

【CMU博士论文】利用文本语义学为知识图谱的获取和应用，105页pdf

专知会员服务

36+阅读 · 2023年10月12日

【AAAI2023】终身嵌入学习和迁移的知识图谱增长

【AAAI2023】终身嵌入学习和迁移的知识图谱增长

专知会员服务

20+阅读 · 2022年12月1日

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

专知会员服务

153+阅读 · 2020年11月1日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

【ACL2020-斯坦福大学】低维双曲线知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings (ACL 2020)

【ACL2020-斯坦福大学】低维双曲线知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings (ACL 2020)

专知会员服务

55+阅读 · 2020年7月3日

【ACL 2020】低维双曲知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings

【ACL 2020】低维双曲知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings

专知会员服务

77+阅读 · 2020年6月14日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

基于知识图谱的深度学习推荐系统研究，21页pdf，Deep Learning on Knowledge Graph for Recommender System: A Survey

基于知识图谱的深度学习推荐系统研究，21页pdf，Deep Learning on Knowledge Graph for Recommender System: A Survey

专知会员服务

159+阅读 · 2020年4月2日

【WWW2020】什么是正常的，什么是奇怪的，知识图谱中缺少什么：通过归纳总结的统一表征

【WWW2020】什么是正常的，什么是奇怪的，知识图谱中缺少什么：通过归纳总结的统一表征

专知会员服务

25+阅读 · 2020年3月24日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

专知

28+阅读 · 2022年2月18日

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

AI科技评论

19+阅读 · 2020年6月29日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

82+阅读 · 2019年6月9日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

【知识图谱发展报告2018】中文信息学会发布163页报告

【知识图谱发展报告2018】中文信息学会发布163页报告

专知

20+阅读 · 2018年10月1日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

GraphTide: Augmenting Knowledge-Intensive Text with Progressive Nested Graph

Arxiv

0+阅读 · 4月14日

Schema-Aware Planning and Hybrid Knowledge Toolset for Reliable Knowledge Graph Triple Verification

Arxiv

0+阅读 · 4月5日

Ontology-Compliant Knowledge Graphs

Arxiv

0+阅读 · 3月29日

HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature

Arxiv

0+阅读 · 3月24日

OMNIA: Closing the Loop by Leveraging LLMs for Knowledge Graph Completion

Arxiv

0+阅读 · 3月12日

The Initial Exploration Problem in Knowledge Graph Exploration

Arxiv

0+阅读 · 2月24日

Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey

Arxiv

10+阅读 · 2024年2月8日

A Survey on Temporal Knowledge Graph Completion: Taxonomy, Progress, and Prospects

Arxiv

11+阅读 · 2023年8月4日

Continual Multimodal Knowledge Graph Construction

Arxiv

11+阅读 · 2023年5月15日

Knowledge Graph Embedding: A Survey from the Perspective of Representation Spaces

Arxiv

18+阅读 · 2022年11月7日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【CMU博士论文】利用文本语义学为知识图谱的获取和应用，105页pdf

【CMU博士论文】利用文本语义学为知识图谱的获取和应用，105页pdf

专知会员服务

36+阅读 · 2023年10月12日

【AAAI2023】终身嵌入学习和迁移的知识图谱增长

【AAAI2023】终身嵌入学习和迁移的知识图谱增长

专知会员服务

20+阅读 · 2022年12月1日

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

彭博新书《知识图谱: 一种信息检索视角》，159页pdf

专知会员服务

153+阅读 · 2020年11月1日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

【ACL2020-斯坦福大学】低维双曲线知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings (ACL 2020)

【ACL2020-斯坦福大学】低维双曲线知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings (ACL 2020)

专知会员服务

55+阅读 · 2020年7月3日

【ACL 2020】低维双曲知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings

【ACL 2020】低维双曲知识图谱嵌入，Low-Dimensional Hyperbolic Knowledge Graph Embeddings

专知会员服务

77+阅读 · 2020年6月14日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

基于知识图谱的深度学习推荐系统研究，21页pdf，Deep Learning on Knowledge Graph for Recommender System: A Survey

基于知识图谱的深度学习推荐系统研究，21页pdf，Deep Learning on Knowledge Graph for Recommender System: A Survey

专知会员服务

159+阅读 · 2020年4月2日

【WWW2020】什么是正常的，什么是奇怪的，知识图谱中缺少什么：通过归纳总结的统一表征

【WWW2020】什么是正常的，什么是奇怪的，知识图谱中缺少什么：通过归纳总结的统一表征

专知会员服务

25+阅读 · 2020年3月24日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

专知

28+阅读 · 2022年2月18日

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

AI科技评论

19+阅读 · 2020年6月29日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

82+阅读 · 2019年6月9日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

【知识图谱发展报告2018】中文信息学会发布163页报告

【知识图谱发展报告2018】中文信息学会发布163页报告

专知

20+阅读 · 2018年10月1日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

相关论文

GraphTide: Augmenting Knowledge-Intensive Text with Progressive Nested Graph

Arxiv

0+阅读 · 4月14日

Schema-Aware Planning and Hybrid Knowledge Toolset for Reliable Knowledge Graph Triple Verification

Arxiv

0+阅读 · 4月5日

Ontology-Compliant Knowledge Graphs

Arxiv

0+阅读 · 3月29日

HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature

Arxiv

0+阅读 · 3月24日

OMNIA: Closing the Loop by Leveraging LLMs for Knowledge Graph Completion

Arxiv

0+阅读 · 3月12日

The Initial Exploration Problem in Knowledge Graph Exploration

Arxiv

0+阅读 · 2月24日

Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey

Arxiv

10+阅读 · 2024年2月8日

A Survey on Temporal Knowledge Graph Completion: Taxonomy, Progress, and Prospects

Arxiv

11+阅读 · 2023年8月4日

Continual Multimodal Knowledge Graph Construction

Arxiv

11+阅读 · 2023年5月15日

Knowledge Graph Embedding: A Survey from the Perspective of Representation Spaces

Arxiv

18+阅读 · 2022年11月7日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员