We present SemRepo, an RDF knowledge graph comprising over 81 million triples describing nearly 200,000 GitHub repositories associated with scientific research. SemRepo captures repository-level metadata, such as contributors, issues, and programming languages, and interlinks this information with external scholarly knowledge graphs. In particular, repository authors are linked to their profiles in SemOpenAlex, repositories are connected to scholarly publications in LPWC, and research artifacts, such as datasets and experiments, are linked via MLSea-KG. This integration enables queries that span publications and their scholarly artifacts, which are typically fragmented across separate platforms. SemRepo supports analyses that are difficult to perform with existing resources in isolation, including provenance reconstruction across repositories and publications, as well as the systematic identification of risks to research reproducibility and software sustainability. By unifying research software with its scholarly context in a single graph, SemRepo provides an important infrastructure for large-scale analysis of software within the broader scientific research ecosystem.


翻译:摘要:我们提出SemRepo,一个包含超过8100万个三元组的RDF知识图谱,描述了近20万个与科学研究相关的GitHub仓库。SemRepo捕获了仓库级元数据(如贡献者、问题和编程语言),并将这些信息与外部学术知识图谱进行互连。具体而言,仓库作者关联至SemOpenAlex中的个人资料,仓库连接至LPWC中的学术出版物,而研究制品(如数据集和实验)则通过MLSea-KG进行链接。这种集成使得跨出版物流及其学术制品的查询成为可能,而此类信息通常分散在不同的平台上。SemRepo支持现有孤立资源难以实现的分析,包括跨仓库与出版物的溯源重建,以及系统识别研究可复现性与软件可持续性的风险。通过将研究软件及其学术上下文统一至单一图谱中,SemRepo为更广泛的科学研究生态系统中软件的大规模分析提供了重要基础设施。

0
下载
关闭预览

相关内容

通过学习、实践或探索所获得的认识、判断或技能。
北大关于知识图谱与图数据库的研究工作
专知会员服务
40+阅读 · 2022年8月13日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
87+阅读 · 2020年5月2日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
Github项目推荐 | 知识图谱文献集合
AI研习社
26+阅读 · 2019年4月12日
【荟萃】知识图谱论文与笔记
专知
71+阅读 · 2019年3月25日
技术动态 | TechKG:一个面向中文学术领域的大型知识图谱
开放知识图谱
25+阅读 · 2018年12月20日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
科普 | 典型的知识库/链接数据/知识图谱项目
开放知识图谱
15+阅读 · 2017年10月13日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Arxiv
182+阅读 · 2023年3月24日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
2+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
2+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
3+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
3+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
北大关于知识图谱与图数据库的研究工作
专知会员服务
40+阅读 · 2022年8月13日
【人大】大规模知识图谱补全技术的研究进展
专知会员服务
87+阅读 · 2020年5月2日
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员