Large-Scale Multidimensional Knowledge Profiling of Scientific Literature - 专知论文

会员服务 ·

0

构建 · 知识 · 图谱 · 图谱构建 · 分析 ·

Large-Scale Multidimensional Knowledge Profiling of Scientific Literature

翻译：大规模科学文献多维知识图谱构建

Zhucun Xue,Jiangning Zhang,Juntao Jiang,Jinzhuo Liu,Haoyang He,Teng Hu,Xiaobin Hu,Guangming Yao,Yi Yuan,Yong Liu

from arxiv, Code and dataset: https://github.com/xzc-zju/Profiling_Scientific_Literature

The rapid expansion of research across machine learning, vision, and language has produced a volume of publications that is increasingly difficult to synthesize. Traditional bibliometric tools rely mainly on metadata and offer limited visibility into the semantic content of papers, making it hard to track how research themes evolve over time or how different areas influence one another. To obtain a clearer picture of recent developments, we compile a unified corpus of more than 100,000 papers from 22 major conferences between 2020 and 2025 and construct a multidimensional profiling pipeline to organize and analyze their textual content. By combining topic clustering, LLM-assisted parsing, and structured retrieval, we derive a comprehensive representation of research activity that supports the study of topic lifecycles, methodological transitions, dataset and model usage patterns, and institutional research directions. Our analysis highlights several notable shifts, including the growth of safety, multimodal reasoning, and agent-oriented studies, as well as the gradual stabilization of areas such as neural machine translation and graph-based methods. These findings provide an evidence-based view of how AI research is evolving and offer a resource for understanding broader trends and identifying emerging directions. Code and dataset: https://github.com/xzc-zju/Profiling_Scientific_Literature

翻译：机器学习、视觉与语言研究领域的快速扩张产生了海量出版物，使得研究成果的整合日益困难。传统的文献计量工具主要依赖元数据，对论文语义内容的可见性有限，难以追踪研究主题随时间的演变规律或不同领域间的相互影响。为更清晰地把握近期发展动态，我们构建了一个包含2020年至2025年间22个重要会议的10万余篇论文的统一语料库，并设计了一套多维知识图谱构建流程来组织分析其文本内容。通过结合主题聚类、大语言模型辅助解析与结构化检索技术，我们建立了支持研究主题生命周期分析、方法论变迁研究、数据集与模型使用模式挖掘以及机构研究方向探索的综合表征体系。分析结果揭示了若干显著趋势转变，包括安全性研究、多模态推理与智能体导向研究的快速增长，以及神经机器翻译和图学习方法等领域的逐步成熟。这些发现为理解人工智能研究的演进路径提供了实证依据，并为把握宏观趋势、识别新兴方向提供了资源支持。代码与数据集：https://github.com/xzc-zju/Profiling_Scientific_Literature

0

相关内容

「大模型」之所短，「知识图谱」之所长

「大模型」之所短，「知识图谱」之所长

专知会员服务

60+阅读 · 2024年5月8日

重磅！《知识图谱与大模型融合实践研究报告》发布，72页ppt

重磅！《知识图谱与大模型融合实践研究报告》发布，72页ppt

专知会员服务

235+阅读 · 2023年8月7日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

专知会员服务

158+阅读 · 2023年3月28日

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

百度基于异构互联知识图谱的多模内容创作技术

百度基于异构互联知识图谱的多模内容创作技术

专知会员服务

52+阅读 · 2022年6月7日

最新《知识图谱:构建到应用》2020大综述论文，261页pdf

最新《知识图谱:构建到应用》2020大综述论文，261页pdf

专知会员服务

292+阅读 · 2020年10月6日

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

62+阅读 · 2019年10月25日

【VLDB2019 tutorial】TextCube：自动构建和多维探索，TextCube: Automated Construction and Multidimensional Exploration，韩家炜，Jingbo Shang

【VLDB2019 tutorial】TextCube：自动构建和多维探索，TextCube: Automated Construction and Multidimensional Exploration，韩家炜，Jingbo Shang

专知会员服务

27+阅读 · 2019年8月29日

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf

新智元

119+阅读 · 2020年3月11日

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

专知

26+阅读 · 2020年3月7日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

近期值得读的知识图谱论文，这里帮你总结好了

近期值得读的知识图谱论文，这里帮你总结好了

PaperWeekly

33+阅读 · 2019年9月3日

【知识图谱】从知识工程到知识图谱全面回顾

【知识图谱】从知识工程到知识图谱全面回顾

产业智能官

20+阅读 · 2019年5月31日

5篇顶会论文带你了解知识图谱最新研究进展

5篇顶会论文带你了解知识图谱最新研究进展

PaperWeekly

15+阅读 · 2019年2月21日

收藏 | 最新知识图谱论文清单（附解读、下载）

收藏 | 最新知识图谱论文清单（附解读、下载）

THU数据派

10+阅读 · 2018年11月19日

【知识图谱】大规模知识图谱的构建、推理及应用

【知识图谱】大规模知识图谱的构建、推理及应用

产业智能官

38+阅读 · 2017年9月12日

大规模知识图谱的构建、推理及应用

大规模知识图谱的构建、推理及应用

人工智能头条

15+阅读 · 2017年8月29日

大规模多视角高维图像特征提取

国家自然科学基金

5+阅读 · 2017年12月31日

天文多节点海量数据归档的关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量的高维多通道图像压缩感知重建理论与算法及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

中美科学基金资助与知识生产比较研究

国家自然科学基金

1+阅读 · 2014年12月31日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月12日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

Modelling and Classifying the Components of a Literature Review

Arxiv

0+阅读 · 2月9日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月4日

FactNet: A Billion-Scale Knowledge Graph for Multilingual Factual Grounding

Arxiv

0+阅读 · 2月3日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月2日

Wikontic: Constructing Wikidata-Aligned, Ontology-Aware Knowledge Graphs with Large Language Models

Arxiv

0+阅读 · 1月29日

Enhancing Academic Paper Recommendations Using Fine-Grained Knowledge Entities and Multifaceted Document Embeddings

Arxiv

0+阅读 · 1月27日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 1月20日

SurGE: A Benchmark and Evaluation Framework for Scientific Survey Generation

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

「大模型」之所短，「知识图谱」之所长

「大模型」之所短，「知识图谱」之所长

专知会员服务

60+阅读 · 2024年5月8日

重磅！《知识图谱与大模型融合实践研究报告》发布，72页ppt

重磅！《知识图谱与大模型融合实践研究报告》发布，72页ppt

专知会员服务

235+阅读 · 2023年8月7日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

大模型时代知识图谱如何搞？澳联大等最新《知识图谱:机遇与挑战》全面综述，详述知识图谱最新进展

专知会员服务

158+阅读 · 2023年3月28日

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

百度基于异构互联知识图谱的多模内容创作技术

百度基于异构互联知识图谱的多模内容创作技术

专知会员服务

52+阅读 · 2022年6月7日

最新《知识图谱:构建到应用》2020大综述论文，261页pdf

最新《知识图谱:构建到应用》2020大综述论文，261页pdf

专知会员服务

292+阅读 · 2020年10月6日

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

62+阅读 · 2019年10月25日

【VLDB2019 tutorial】TextCube：自动构建和多维探索，TextCube: Automated Construction and Multidimensional Exploration，韩家炜，Jingbo Shang

【VLDB2019 tutorial】TextCube：自动构建和多维探索，TextCube: Automated Construction and Multidimensional Exploration，韩家炜，Jingbo Shang

专知会员服务

27+阅读 · 2019年8月29日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf

新智元

119+阅读 · 2020年3月11日

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

专知

26+阅读 · 2020年3月7日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

近期值得读的知识图谱论文，这里帮你总结好了

近期值得读的知识图谱论文，这里帮你总结好了

PaperWeekly

33+阅读 · 2019年9月3日

【知识图谱】从知识工程到知识图谱全面回顾

【知识图谱】从知识工程到知识图谱全面回顾

产业智能官

20+阅读 · 2019年5月31日

5篇顶会论文带你了解知识图谱最新研究进展

5篇顶会论文带你了解知识图谱最新研究进展

PaperWeekly

15+阅读 · 2019年2月21日

收藏 | 最新知识图谱论文清单（附解读、下载）

收藏 | 最新知识图谱论文清单（附解读、下载）

THU数据派

10+阅读 · 2018年11月19日

【知识图谱】大规模知识图谱的构建、推理及应用

【知识图谱】大规模知识图谱的构建、推理及应用

产业智能官

38+阅读 · 2017年9月12日

大规模知识图谱的构建、推理及应用

大规模知识图谱的构建、推理及应用

人工智能头条

15+阅读 · 2017年8月29日

相关论文

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月12日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

Modelling and Classifying the Components of a Literature Review

Arxiv

0+阅读 · 2月9日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月4日

FactNet: A Billion-Scale Knowledge Graph for Multilingual Factual Grounding

Arxiv

0+阅读 · 2月3日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月2日

Wikontic: Constructing Wikidata-Aligned, Ontology-Aware Knowledge Graphs with Large Language Models

Arxiv

0+阅读 · 1月29日

Enhancing Academic Paper Recommendations Using Fine-Grained Knowledge Entities and Multifaceted Document Embeddings

Arxiv

0+阅读 · 1月27日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 1月20日

SurGE: A Benchmark and Evaluation Framework for Scientific Survey Generation

Arxiv

0+阅读 · 1月18日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

5+阅读 · 2017年12月31日

天文多节点海量数据归档的关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量的高维多通道图像压缩感知重建理论与算法及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

中美科学基金资助与知识生产比较研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员