Reconnecting Fragmented Citation Networks with Semantic Augmentation - 专知论文

会员服务 ·

0

结构 · 工具 · 关联 · 呈现 · 混合 ·

Reconnecting Fragmented Citation Networks with Semantic Augmentation

翻译：语义增强与断裂引文网络的再连接

Vu Thi Huong,Annika Buchholz,Imene Khebouri,Thorsten Koch,Tim Kunt,Wolfgang Peters-Kottig,Tomasz Stompor,Janina Zittel

from arxiv, 11 pages, 4 figures, 3 tables

Citation graphs are fundamental tools for modeling scientific structure, but are often fragmented due to missing citations of scientifically connected articles. To address this issue, we propose a computationally efficient hybrid framework integrating citation topology with large language model (LLM)-based text similarity. Using 662,369 Web of Science publications in Mathematics and Operations Research & Management Science, we augment the original graph by adding semantic edges from small, disconnected components and weighting existing citations according to textual similarity. Semantic augmentation substantially reduces fragmentation while preserving disciplinary homogeneity. Compared to embedding-only clustering, cluster detection on augmented graphs using the Leiden algorithm retains structural interpretability while offering multi-scale organization. The method scales efficiently to large datasets and offers a practical strategy for strengthening citation-based indicators without collapsing disciplinary boundaries.

翻译：引文图是建模科学结构的基础工具，但由于科学关联文献间存在引用缺失，其常呈现碎片化特征。针对该问题，我们提出一种计算高效的混合框架，融合了引文拓扑结构与基于大语言模型（LLM）的文本相似性。通过使用Web of Science数据库中数学、运筹学与管理科学领域的662,369篇论文，我们从小型孤立组件中引入语义边对原始图进行增强，并根据文本相似度对现有引用进行加权。语义增强在保持学科同质性的同时显著降低了碎片化程度。相较于仅依赖嵌入表示的聚类方法，采用Leiden算法对增强图进行聚类检测，既能保留结构可解释性，又能实现多尺度组织划分。该方法可高效扩展至大规模数据集，为强化引文指标提供实用策略，且不会模糊学科边界。

0

相关内容

大型语言模型遇上文本属性图：一种融合框架与应用的综述

大型语言模型遇上文本属性图：一种融合框架与应用的综述

专知会员服务

10+阅读 · 2025年10月27日

《知识增强型大语言模型及面向创造力支持的人机协作框架》233页

《知识增强型大语言模型及面向创造力支持的人机协作框架》233页

专知会员服务

34+阅读 · 2025年9月29日

大语言模型中的检索与结构化增强生成综述

大语言模型中的检索与结构化增强生成综述

专知会员服务

34+阅读 · 2025年9月17日

《大语言模型的数据合成与增强综述》

《大语言模型的数据合成与增强综述》

专知会员服务

44+阅读 · 2024年10月19日

RAG与RAU：自然语言处理中的检索增强语言模型综述

RAG与RAU：自然语言处理中的检索增强语言模型综述

专知会员服务

89+阅读 · 2024年5月3日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

81+阅读 · 2023年11月25日

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

专知会员服务

98+阅读 · 2023年11月13日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

138+阅读 · 2020年7月29日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

CVPR2020 | 即插即用！语义分割网络用上双边超分辨率，效果喜人！

CVPR2020 | 即插即用！语义分割网络用上双边超分辨率，效果喜人！

AI科技评论

11+阅读 · 2020年6月16日

【新书】图神经网络导论，清华大学刘知远老师著作

【新书】图神经网络导论，清华大学刘知远老师著作

专知

141+阅读 · 2020年6月12日

“推荐系统”加上“图神经网络”

“推荐系统”加上“图神经网络”

机器学习与推荐算法

12+阅读 · 2020年3月23日

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

专知

50+阅读 · 2019年6月7日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

专知

19+阅读 · 2018年6月14日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

专知

10+阅读 · 2018年1月24日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

2+阅读 · 2016年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

层次粒化的不确定多态网络重叠社区发现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

时空混杂社团网络的同步研究

国家自然科学基金

0+阅读 · 2015年12月31日

故障互连网络中含经过指定边的无错误哈密顿圈问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

A Unified Framework for Context-Aware and Relation-Aware Graph Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月16日

Beyond Chunks and Graphs: Retrieval-Augmented Generation through Triplet-Driven Thinking

Arxiv

0+阅读 · 6月15日

Formalizing and Mitigating Structural Distortion in LLM Attention for Zero-Shot Graph Reasoning

Arxiv

0+阅读 · 6月14日

Mapping Scientific Literature with Large Language Models and Topic Modeling

Arxiv

0+阅读 · 6月9日

Reading Between the Citations: A Typed Claim Network for Scientific Literature

Arxiv

0+阅读 · 5月29日

LLMSurgeon: Diagnosing Data Mixture of Large Language Models

Arxiv

0+阅读 · 5月28日

GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation

Arxiv

0+阅读 · 5月19日

An LLM-Based System for Argument Reconstruction

Arxiv

0+阅读 · 5月13日

Extending Confidence-Based Text2Cypher with Grammar and Schema Aware Filtering

Arxiv

0+阅读 · 5月11日

CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-Augmented Validation

Arxiv

0+阅读 · 4月13日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

大型语言模型遇上文本属性图：一种融合框架与应用的综述

大型语言模型遇上文本属性图：一种融合框架与应用的综述

专知会员服务

10+阅读 · 2025年10月27日

《知识增强型大语言模型及面向创造力支持的人机协作框架》233页

《知识增强型大语言模型及面向创造力支持的人机协作框架》233页

专知会员服务

34+阅读 · 2025年9月29日

大语言模型中的检索与结构化增强生成综述

大语言模型中的检索与结构化增强生成综述

专知会员服务

34+阅读 · 2025年9月17日

《大语言模型的数据合成与增强综述》

《大语言模型的数据合成与增强综述》

专知会员服务

44+阅读 · 2024年10月19日

RAG与RAU：自然语言处理中的检索增强语言模型综述

RAG与RAU：自然语言处理中的检索增强语言模型综述

专知会员服务

89+阅读 · 2024年5月3日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

81+阅读 · 2023年11月25日

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

专知会员服务

98+阅读 · 2023年11月13日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

138+阅读 · 2020年7月29日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

CVPR2020 | 即插即用！语义分割网络用上双边超分辨率，效果喜人！

CVPR2020 | 即插即用！语义分割网络用上双边超分辨率，效果喜人！

AI科技评论

11+阅读 · 2020年6月16日

【新书】图神经网络导论，清华大学刘知远老师著作

【新书】图神经网络导论，清华大学刘知远老师著作

专知

141+阅读 · 2020年6月12日

“推荐系统”加上“图神经网络”

“推荐系统”加上“图神经网络”

机器学习与推荐算法

12+阅读 · 2020年3月23日

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

专知

50+阅读 · 2019年6月7日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

专知

19+阅读 · 2018年6月14日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

专知

10+阅读 · 2018年1月24日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

相关论文

A Unified Framework for Context-Aware and Relation-Aware Graph Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月16日

Beyond Chunks and Graphs: Retrieval-Augmented Generation through Triplet-Driven Thinking

Arxiv

0+阅读 · 6月15日

Formalizing and Mitigating Structural Distortion in LLM Attention for Zero-Shot Graph Reasoning

Arxiv

0+阅读 · 6月14日

Mapping Scientific Literature with Large Language Models and Topic Modeling

Arxiv

0+阅读 · 6月9日

Reading Between the Citations: A Typed Claim Network for Scientific Literature

Arxiv

0+阅读 · 5月29日

LLMSurgeon: Diagnosing Data Mixture of Large Language Models

Arxiv

0+阅读 · 5月28日

GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation

Arxiv

0+阅读 · 5月19日

An LLM-Based System for Argument Reconstruction

Arxiv

0+阅读 · 5月13日

Extending Confidence-Based Text2Cypher with Grammar and Schema Aware Filtering

Arxiv

0+阅读 · 5月11日

CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-Augmented Validation

Arxiv

0+阅读 · 4月13日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

2+阅读 · 2016年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

层次粒化的不确定多态网络重叠社区发现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

时空混杂社团网络的同步研究

国家自然科学基金

0+阅读 · 2015年12月31日

故障互连网络中含经过指定边的无错误哈密顿圈问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员