mmid (Multi-Modal Integration and Downstream analyses for healthcare analytics) is a Python package that offers multi-modal fusion and imputation, classification, time-to-event prediction and clustering functionalities under a single interface, filling the gap of sequential data integration and downstream analyses for healthcare applications in a structured and flexible environment. mmid wraps in a unique package several algorithms for multi-modal decomposition, prediction and clustering, which can be combined smoothly with a single command and proper configuration files, thus facilitating reproducibility and transferability of studies involving heterogeneous health data sources. A showcase on personalised cardiovascular risk prediction is used to highlight the relevance of a composite pipeline enabling proper treatment and analysis of complex multi-modal data. We thus employed mmid in an example real application scenario involving cardiac magnetic resonance imaging, electrocardiogram, and polygenic risk scores data from the UK Biobank. We proved that the three modalities captured joint and individual information that was used to (1) early identify cardiovascular disease before clinical manifestations with cardiological relevance, and (2) do it better than single data sources alone. Moreover, mmid allowed to impute partially observable data modalities without considerable performance losses in downstream disease prediction, thus proving its relevance for real-world health analytics applications (which are often characterised by the presence of missing data).


翻译:mmid(Multi-Modal Integration and Downstream analyses for healthcare analytics)是一个Python软件包,在统一接口下提供多模态融合与插补、分类、事件时间预测及聚类功能,弥补了结构化且灵活环境下医疗应用场景中序列数据集成与下游分析的空白。该软件包将多种多模态分解、预测与聚类算法整合至单一框架中,通过单一指令及配套配置文件即可实现算法间的无缝组合,从而促进涉及异构健康数据源研究的可复现性与可迁移性。以个性化心血管风险预测为展示案例,凸显了组合式流水线在复杂多模态数据合理处理与分析方法中的重要性。我们基于英国生物样本库的心脏磁共振成像、心电图及多基因风险评分数据,在实际应用场景中部署了mmid。实验证明,这三种模态捕获了联合信息与个体信息,可用于:(1)在具有心脏病学意义的临床症状出现前,早期识别心血管疾病;(2)其预测性能优于单一数据源。此外,mmid能够对部分可观测数据模态进行插补,且在下游疾病预测中不会导致显著性能损失,从而印证了其在实际健康分析应用(通常存在数据缺失特征)中的适用性。

0
下载
关闭预览

相关内容

⚡ MMClaw: 超轻量级、纯 Python 开发的 AI Agent 内核
专知会员服务
20+阅读 · 2月10日
多模态知识图谱构建技术及其在军事领域的应用综述
专知会员服务
45+阅读 · 2024年12月6日
MME-Survey:多模态大型语言模型评估的综合性调查
专知会员服务
43+阅读 · 2024年12月1日
MM-REACT:提示ChatGPT进行多模态推理和行动
专知会员服务
35+阅读 · 2023年3月26日
多模态深度学习在生物医学数据融合中的应用研究进展
专知会员服务
62+阅读 · 2022年5月31日
视觉底层任务优秀开源工作:MMEditing 库使用方法
DeepReg:开源深度学习医学图像配准工具包
专知
35+阅读 · 2020年8月29日
MMDetection v2.0 训练自己的数据集
CVer
30+阅读 · 2020年8月9日
专家报告|深度学习+图像多模态融合
中国图象图形学报
12+阅读 · 2019年10月23日
荐书丨Python数据分析从入门到精通
程序人生
19+阅读 · 2018年3月31日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
10+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
7+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关资讯
视觉底层任务优秀开源工作:MMEditing 库使用方法
DeepReg:开源深度学习医学图像配准工具包
专知
35+阅读 · 2020年8月29日
MMDetection v2.0 训练自己的数据集
CVer
30+阅读 · 2020年8月9日
专家报告|深度学习+图像多模态融合
中国图象图形学报
12+阅读 · 2019年10月23日
荐书丨Python数据分析从入门到精通
程序人生
19+阅读 · 2018年3月31日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员