Scientific research relies on well-structured, standardized data; however, much of it is stored in formats such as free-text lab notebooks, non-standardized spreadsheets, or data repositories. This lack of structure challenges interoperability, making data integration, validation, and reuse difficult. LinkML (Linked Data Modeling Language) is an open framework that simplifies the process of authoring, validating, and sharing data. LinkML can describe a range of data structures, from flat, list-based models to complex, interrelated, and normalized models that utilize polymorphism and compound inheritance. It offers an approachable syntax that is not tied to any one technical architecture and can be integrated seamlessly with many existing frameworks. The LinkML syntax provides a standard way to describe schemas, classes, and relationships, allowing modelers to build well-defined, stable, and optionally ontology-aligned data structures. Once defined, LinkML schemas may be imported into other LinkML schemas. These key features make LinkML an accessible platform for interdisciplinary collaboration and a reliable way to define and share data semantics. LinkML helps reduce heterogeneity, complexity, and the proliferation of single-use data models while simultaneously enabling compliance with FAIR data standards. LinkML has seen increasing adoption in various fields, including biology, chemistry, biomedicine, microbiome research, finance, electrical engineering, transportation, and commercial software development. In short, LinkML makes implicit models explicitly computable and allows data to be standardized at its origin. LinkML documentation and code are available at linkml.io.


翻译:科学研究依赖于结构良好、标准化的数据;然而,大量数据存储在自由文本实验记录、非标准化电子表格或数据存储库等格式中。这种结构性的缺失对互操作性提出了挑战,使得数据集成、验证和重用变得困难。LinkML(关联数据建模语言)是一个开放框架,它简化了数据创作、验证和共享的过程。LinkML 能够描述从扁平、基于列表的模型到利用多态性和复合继承的复杂、相互关联且规范化的模型等一系列数据结构。它提供了一种易于使用的语法,不依赖于任何单一技术架构,并且可以与许多现有框架无缝集成。LinkML 语法提供了一种描述模式、类别和关系的标准方式,使建模者能够构建定义明确、稳定且可选择与本体对齐的数据结构。一旦定义,LinkML 模式可以被导入到其他 LinkML 模式中。这些关键特性使 LinkML 成为一个易于使用的跨学科协作平台,以及一种定义和共享数据语义的可靠方式。LinkML 有助于减少异构性、复杂性以及一次性数据模型的激增,同时支持符合 FAIR 数据标准。LinkML 在多个领域中的应用日益广泛,包括生物学、化学、生物医学、微生物组研究、金融、电气工程、交通运输以及商业软件开发。简而言之,LinkML 使隐式模型变得显式可计算,并允许数据在其源头实现标准化。LinkML 的文档和代码可在 linkml.io 获取。

0
下载
关闭预览

相关内容

使用 OpenLLM 构建和部署大模型应用
专知会员服务
55+阅读 · 2024年1月4日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
【干货书】开放数据结构,Open Data Structures,337页pdf
专知会员服务
19+阅读 · 2021年9月17日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
【综述】自动机器学习AutoML最新65页综述,带你了解最新进展
中国人工智能学会
48+阅读 · 2019年5月3日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
使用 OpenLLM 构建和部署大模型应用
专知会员服务
55+阅读 · 2024年1月4日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
【干货书】开放数据结构,Open Data Structures,337页pdf
专知会员服务
19+阅读 · 2021年9月17日
相关基金
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员