The Cell Ontology in the age of single-cell omics - 专知论文

会员服务 ·

0

组学 · 单细胞 · 本体 · 本体论 · 图谱 ·

The Cell Ontology in the age of single-cell omics

翻译：单细胞组学时代的细胞本体论

Shawn Zheng Kai Tan,Aleix Puig-Barbe,Damien Goutte-Gattat,Caroline Eastwood,Brian Aevermann,Alida Avola,James P Balhoff,Ismail Ugur Bayindir,Jasmine Belfiore,Anita Reane Caron,David S Fischer,Nancy George,Benjamin M Gyori,Melissa A Haendel,Charles Tapley Hoyt,Huseyin Kir,Tiago Lubiana,Nicolas Matentzoglu,James A Overton,Beverly Peng,Bjoern Peters,Ellen M Quardokus,Patrick L Ray,Paola Roncaglia,Andrea D Rivera,Ray Stefancsik,Wei Kheng Teh,Sabrina Toro,Nicole Vasilevsky,Chuan Xu,Yun Zhang,Richard H Scheuermann,Christopher J Mungall,Alexander D Diehl,David Osumi-Sutherland

from arxiv, 48 pages, 8 Figures

Single-cell omics technologies have transformed our understanding of cellular diversity by enabling high-resolution profiling of individual cells. However, the unprecedented scale and heterogeneity of these datasets demand robust frameworks for data integration and annotation. The Cell Ontology (CL) has emerged as a pivotal resource for achieving FAIR (Findable, Accessible, Interoperable, and Reusable) data principles by providing standardized, species-agnostic terms for canonical cell types - forming a core component of a wide range of platforms and tools. In this paper, we describe the wide variety of uses of CL in these platforms and tools and detail ongoing work to improve and extend CL content including the addition of transcriptomic types, working closely with major atlasing efforts including the Human Cell Atlas and the Brain Initiative Cell Atlas Network to support their needs. We cover the challenges and future plans for harmonising classical and transcriptomic cell type definitions, integrating markers and using Large Language Models (LLMs) to improve content and efficiency of CL workflows.

翻译：单细胞组学技术通过实现对单个细胞的高分辨率分析，彻底改变了我们对细胞多样性的理解。然而，这些数据集前所未有的规模和异质性要求建立强大的数据整合与注释框架。细胞本体论已成为实现FAIR（可发现、可访问、可互操作、可重用）数据原则的关键资源，它为标准化的、物种无关的经典细胞类型提供术语，构成了众多平台和工具的核心组成部分。本文描述了CL在这些平台和工具中的广泛应用，并详细介绍了为改进和扩展CL内容（包括添加转录组学类型）而正在开展的工作。我们与包括人类细胞图谱和脑计划细胞图谱网络在内的主要图谱计划密切合作，以支持其需求。我们讨论了协调经典细胞类型定义与转录组学细胞类型定义、整合标记物以及利用大型语言模型提升CL工作流程内容与效率所面临的挑战及未来规划。

0

相关内容

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

专知会员服务

9+阅读 · 2025年8月1日

【牛津大学博士论文】用于本体工程的语言模型

【牛津大学博士论文】用于本体工程的语言模型

专知会员服务

37+阅读 · 2024年10月24日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

【博士论文】《生物医学发现信息学的历程：从本体学习到知识图谱嵌入》马萨里克大学189页PDF

【博士论文】《生物医学发现信息学的历程：从本体学习到知识图谱嵌入》马萨里克大学189页PDF

专知会员服务

21+阅读 · 2022年8月22日

【AI+医疗】图表示学习的结构蛋白质组学综述，休斯顿Rice大学

【AI+医疗】图表示学习的结构蛋白质组学综述，休斯顿Rice大学

专知会员服务

24+阅读 · 2022年6月20日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

专知会员服务

14+阅读 · 2022年3月10日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【资源】知识图谱本体构建论文合集

【资源】知识图谱本体构建论文合集

专知

62+阅读 · 2019年10月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

本体：一文读懂领域本体构建

本体：一文读懂领域本体构建

AINLP

40+阅读 · 2019年2月27日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

科普 | 动态本体简介

科普 | 动态本体简介

开放知识图谱

14+阅读 · 2017年11月11日

基于临床代谢组学推断代谢功能异常的生物信息学方法

国家自然科学基金

1+阅读 · 2016年12月31日

微进化机制中群体基因组数据分析的新方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

微流控阵列单细胞电化学分析新方法及其在癌症干细胞识别中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

Arxiv

0+阅读 · 3月8日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Arxiv

0+阅读 · 2月21日

A measurement noise scaling law for cellular representation learning

Arxiv

0+阅读 · 2月20日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 2月16日

Agent-OM: Leveraging LLM Agents for Ontology Matching

Arxiv

0+阅读 · 2月14日

An Ecosystem for Ontology Interoperability

Arxiv

0+阅读 · 2月13日

MOTGNN: Interpretable Graph Neural Networks for Multi-Omics Disease Classification

Arxiv

0+阅读 · 2月11日

STProtein: predicting spatial protein expression from multi-omics data

Arxiv

0+阅读 · 2月5日

Generative Ontology: When Structured Knowledge Learns to Create

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

10+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

9+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

3+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

5+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

7+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

7+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

9+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

9+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

8+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

专知会员服务

9+阅读 · 2025年8月1日

【牛津大学博士论文】用于本体工程的语言模型

【牛津大学博士论文】用于本体工程的语言模型

专知会员服务

37+阅读 · 2024年10月24日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

【博士论文】《生物医学发现信息学的历程：从本体学习到知识图谱嵌入》马萨里克大学189页PDF

【博士论文】《生物医学发现信息学的历程：从本体学习到知识图谱嵌入》马萨里克大学189页PDF

专知会员服务

21+阅读 · 2022年8月22日

【AI+医疗】图表示学习的结构蛋白质组学综述，休斯顿Rice大学

【AI+医疗】图表示学习的结构蛋白质组学综述，休斯顿Rice大学

专知会员服务

24+阅读 · 2022年6月20日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

专知会员服务

14+阅读 · 2022年3月10日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【资源】知识图谱本体构建论文合集

【资源】知识图谱本体构建论文合集

专知

62+阅读 · 2019年10月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

本体：一文读懂领域本体构建

本体：一文读懂领域本体构建

AINLP

40+阅读 · 2019年2月27日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

科普 | 动态本体简介

科普 | 动态本体简介

开放知识图谱

14+阅读 · 2017年11月11日

相关论文

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

Arxiv

0+阅读 · 3月8日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Arxiv

0+阅读 · 2月21日

A measurement noise scaling law for cellular representation learning

Arxiv

0+阅读 · 2月20日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 2月16日

Agent-OM: Leveraging LLM Agents for Ontology Matching

Arxiv

0+阅读 · 2月14日

An Ecosystem for Ontology Interoperability

Arxiv

0+阅读 · 2月13日

MOTGNN: Interpretable Graph Neural Networks for Multi-Omics Disease Classification

Arxiv

0+阅读 · 2月11日

STProtein: predicting spatial protein expression from multi-omics data

Arxiv

0+阅读 · 2月5日

Generative Ontology: When Structured Knowledge Learns to Create

Arxiv

0+阅读 · 2月5日

相关基金

基于临床代谢组学推断代谢功能异常的生物信息学方法

国家自然科学基金

1+阅读 · 2016年12月31日

微进化机制中群体基因组数据分析的新方法研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

微流控阵列单细胞电化学分析新方法及其在癌症干细胞识别中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员