Respiratory viral infections pose a global health burden, yet the cellular immune mechanisms underlying protection and pathology remain unclear. Natural infection cohorts often lack pre-exposure baselines and time-controlled sampling, whereas inoculation and vaccination trials generate well-structured longitudinal transcriptomic data. However, these datasets are scattered across repositories and processed inconsistently, hindering integrative and AI-driven analyses. To address these challenges, we developed the Human Respiratory Viral Immunization LongitudinAl Gene Expression (HR-VILAGE-3K3M) repository: an AI-ready resource integrating bulk and single-cell transcriptomic profiles from 3,178 subjects across 66 studies. The dataset spans vaccination, inoculation, and mixed exposures, with samples from blood and nasal swabs collected from public repositories including GEO, ImmPort, and ArrayExpress. We curated and harmonized subject-level metadata, standardized outcome measures, and applied unified preprocessing with rigorous quality control. We further provide benchmark analyses illustrating its utility. This resource supports discovery of biomarkers, immune mechanisms, and methodological development. As one of the largest longitudinal transcriptomic resources for human respiratory viral immunization, HR-VILAGE-3K3M enables reproducible and scalable analyses to accelerate vaccine and antiviral research.


翻译:呼吸道病毒感染构成全球健康负担,但其保护机制与病理机制所依赖的细胞免疫机制尚不明确。自然感染队列常缺乏暴露前基线数据和时序可控采样,而接种与免疫攻毒试验则可生成结构良好的纵向转录组数据。然而,这些数据集分散存储于不同数据库且处理流程不统一,阻碍了整合分析与基于人工智能的深入研究。为应对上述挑战,我们构建了人类呼吸道病毒免疫纵向基因表达(HR-VILAGE-3K3M)数据库:该人工智能就绪资源整合了来自66项研究的3178名受试者的批量及单细胞转录组图谱。数据集涵盖疫苗接种、免疫攻毒及混合暴露类型,样本采集自血液和鼻拭子,来源于GEO、ImmPort和ArrayExpress等公共数据库。我们通过人工筛选与规范化处理受试者层级元数据、标准化结局指标,并应用统一预处理流程伴随严格质量控制。此外,我们提供了基准分析以阐明其应用价值。该资源可支持生物标志物发现、免疫机制解析及方法学开发。作为针对人类呼吸道病毒免疫的最大规模纵向转录组资源之一,HR-VILAGE-3K3M将推动可重复、可扩展的分析研究,从而加速疫苗及抗病毒药物研发。

0
下载
关闭预览

相关内容

Science|深度学习对抗原序列的通用编码指导免疫治疗
专知会员服务
16+阅读 · 2022年5月22日
专知会员服务
20+阅读 · 2021年6月15日
专知会员服务
52+阅读 · 2021年3月28日
专知会员服务
28+阅读 · 2021年1月29日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
43+阅读 · 2020年7月2日
肿瘤微环境评分: 预测肿瘤免疫治疗疗效的新方法
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员