As social media and the World Wide Web become hubs for information dissemination, effectively organizing and understanding the vast amounts of dynamically evolving Web content is crucial. Knowledge graphs (KGs) provide a powerful framework for structuring this information. However, the rapid emergence of new hot topics, user relationships, and events in social media renders traditional static knowledge graph embedding (KGE) models rapidly outdated. Continual Knowledge Graph Embedding (CKGE) aims to address this issue, but existing methods commonly suffer from catastrophic forgetting, whereby older, but still valuable, information is lost when learning new knowledge (such as new memes or trending events). This means the model cannot effectively learn the evolution of the data. We propose a novel CKGE framework, BAKE. Unlike existing methods, BAKE formulates CKGE as a sequential Bayesian inference problem and utilizes the Bayesian posterior update principle as a natural continual learning strategy. This principle is insensitive to data order and provides theoretical guarantees to preserve prior knowledge as much as possible. Specifically, we treat each batch of new data as a Bayesian update to the model's prior. By maintaining the posterior distribution, the model effectively preserves earlier knowledge even as it evolves over multiple snapshots. Furthermore, to constrain the evolution of knowledge across snapshots, we introduce a continual clustering method that maintains the compact cluster structure of entity embeddings through a regularization term, ensuring semantic consistency while allowing controlled adaptation to new knowledge. We conduct extensive experiments on multiple CKGE benchmarks, which demonstrate that BAKE achieves the top performance in the vast majority of cases compared to existing approaches.


翻译:随着社交媒体和万维网成为信息传播的中心,有效组织并理解海量动态演变的网络内容至关重要。知识图谱为结构化此类信息提供了强大框架。然而,社交媒体中新兴热点话题、用户关系和事件的快速涌现,使得传统的静态知识图谱嵌入模型迅速过时。持续知识图谱嵌入旨在解决这一问题,但现有方法普遍存在灾难性遗忘问题——在学习新知识(如新出现的网络迷因或热点事件)时,旧有但仍有价值的信息会丢失。这意味着模型无法有效学习数据的演化规律。我们提出了一种新颖的持续知识图谱嵌入框架BAKE。与现有方法不同,BAKE将持续知识图谱嵌入建模为序列贝叶斯推断问题,并利用贝叶斯后验更新原理作为自然的持续学习策略。该原理对数据顺序不敏感,并为尽可能保留先验知识提供了理论保证。具体而言,我们将每批新数据视为对模型先验的贝叶斯更新。通过维护后验分布,模型在经历多个快照演化的过程中仍能有效保留早期知识。此外,为约束知识在快照间的演化,我们引入了一种持续聚类方法,通过正则化项保持实体嵌入的紧凑聚类结构,在确保语义一致性的同时,允许对新知识进行受控适应。我们在多个持续知识图谱嵌入基准上进行了广泛实验,结果表明与现有方法相比,BAKE在绝大多数情况下均取得了最优性能。

0
下载
关闭预览

相关内容

【CVPR2024】MoReVQA:探索视频问答的模块化推理模型
专知会员服务
18+阅读 · 2024年4月10日
专知会员服务
25+阅读 · 2021年9月25日
专知会员服务
22+阅读 · 2021年8月20日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
40+阅读 · 2020年6月22日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关VIP内容
【CVPR2024】MoReVQA:探索视频问答的模块化推理模型
专知会员服务
18+阅读 · 2024年4月10日
专知会员服务
25+阅读 · 2021年9月25日
专知会员服务
22+阅读 · 2021年8月20日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
40+阅读 · 2020年6月22日
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员