HERITRACE is an open-source web application that enables users without Semantic Web expertise to curate RDF data through form-based interfaces with automatic provenance documentation and change tracking in RDF. It uses SHACL for data model definition and form generation, connects to existing SPARQL-accessible stores without data migration, and records every modification as a provenance snapshot that can be browsed and restored. HERITRACE is domain-agnostic: adapting it to a new collection requires only SHACL shapes and YAML display rules, without code changes. This paper describes the software architecture and provides the first empirical evaluation. HERITRACE is deployed in production for the ParaText project, where classical philologists curate bibliographic data about ancient Greek exegetical traditions, and is planned as the editing interface for OpenCitations and as the curation layer for the Social Sciences and Humanities Citation Index within the GRAPHIA Horizon Europe project. Since it operates on any SPARQL-accessible store without data migration, its adoption potential extends to any domain maintaining RDF data. HERITRACE is publicly available on GitHub under the ISC license, archived on Zenodo and Software Heritage Archive, and documented for deployment with a pre-built Docker image.


翻译:HERITRACE是一款开源Web应用程序,使不具备语义网专业知识的用户能够通过基于表单的界面策展RDF数据,并在RDF中自动记录溯源文档及变更追踪。该工具利用SHACL进行数据模型定义与表单生成,可连接现有支持SPARQL查询的数据存储(无需数据迁移),并将每次修改记录为可浏览与恢复的溯源快照。HERITRACE具有领域无关性:适配新数据集仅需提供SHACL形状和YAML显示规则,无需修改代码。本文描述了其软件架构,并首次进行了实证评估。该工具已在ParaText项目中投入生产使用——古典语言文学家在此项目中策展关于古希腊注疏传统的文献数据;它还被计划作为OpenCitations的编辑界面,以及GRAPHIA Horizon Europe项目中社会科学与人文学科引文索引的策展层。由于该工具无需数据迁移即可操作任何支持SPARQL的数据存储,其应用潜力可扩展至任何维护RDF数据的领域。HERITRACE已在GitHub上以ISC许可证公开,存档于Zenodo和Software Heritage Archive,并提供预构建Docker镜像用于部署。

0
下载
关闭预览

相关内容

资源描述框架(英语:Resource Description Framework,缩写为RDF),是万维网联盟(W3C)提出的一组标记语言的技术规范,以便更为丰富地描述和表达网络资源的内容与结构。
《MERLIN:面向推广资源与研究的国家数据管理平台》报告
专知会员服务
18+阅读 · 2025年12月27日
基于MySQL Binlog的Elasticsearch数据同步实践
DBAplus社群
15+阅读 · 2019年9月3日
【大数据】StreamSets:一个大数据采集工具
产业智能官
40+阅读 · 2018年12月5日
NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿
中国人工智能学会
12+阅读 · 2018年11月15日
一种轻量级在线多目标车辆跟踪方法
极市平台
15+阅读 · 2018年8月18日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
5+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
《MERLIN:面向推广资源与研究的国家数据管理平台》报告
专知会员服务
18+阅读 · 2025年12月27日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员