Module-Structured Mixture Factor Models to Identify Outcome-Specific Signatures in Gene Expression Data - 专知论文

会员服务 ·

0

特异 · 混合 · 因子 · 识别 · 基因表达 ·

Module-Structured Mixture Factor Models to Identify Outcome-Specific Signatures in Gene Expression Data

翻译：模块化混合因子模型：识别基因表达数据中结果特异性特征

Jinran Wu,Geoffrey J. McLachlan,Saumyadipta Pyne

from arxiv, 24 pages, 2 figures

High-throughput gene expression data exhibit high dimensionality, complex intergene dependence, and pronounced biological heterogeneity across samples, presenting major challenges for unsupervised clustering and disease subtype discovery. We introduce a module-structured mixture factor model that combines finite mixture modelling with low-rank latent factor representations defined at the gene-module level. By explicitly modelling gene modules in both the mean and covariance structure, the proposed framework decomposes expression variability into global gene-specific effects, cluster-specific module-level shifts, latent dependence within modules, and gene-specific residual noise. An Expectation--Conditional Maximisation algorithm is developed for parameter estimation, allowing stable and scalable inference in high-dimensional transcriptomic settings. This framework enables interpretable unsupervised identification of disease-associated molecular subtypes and phenotypic heterogeneity across two autoimmune diseases using a large clinical transcriptomic dataset.

翻译：高通量基因表达数据呈现高维度、复杂的基因间依赖性以及显著的样本间生物异质性，给无监督聚类和疾病亚型发现带来了重大挑战。我们提出了一种模块化混合因子模型，该模型将有限混合建模与基因模块层面定义的低秩潜在因子表示相结合。通过同时在均值结构和协方差结构中显式建模基因模块，所提出的框架将表达变异分解为全局基因特异性效应、簇特异性模块级偏移、模块内潜在依赖性以及基因特异性残差噪声。我们开发了一种期望-条件最大化算法用于参数估计，从而在高维转录组学环境中实现稳定且可扩展的推断。该框架利用大规模临床转录组学数据集，能够对被识别的疾病相关分子亚型和两种自身免疫疾病的表型异质性进行可解释的无监督分析。

0

相关内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

混合专家模型简述

混合专家模型简述

专知会员服务

18+阅读 · 2025年5月30日

西安交大最新《深度学习因果模型》综述论文，35页pdf涵盖292篇文献阐述三种数据范式因果模型

西安交大最新《深度学习因果模型》综述论文，35页pdf涵盖292篇文献阐述三种数据范式因果模型

专知会员服务

63+阅读 · 2023年11月5日

《深度模型融合》综述

《深度模型融合》综述

专知会员服务

75+阅读 · 2023年9月28日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

专知会员服务

31+阅读 · 2022年12月29日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

专知会员服务

52+阅读 · 2021年3月14日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

专知

10+阅读 · 2018年3月10日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

“模块化自组装”DNA计算模型的研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

多源基因表达数据横向整合的统计方法比较

国家自然科学基金

0+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向进化基因组学的高通量测序数据流形建模

国家自然科学基金

1+阅读 · 2014年12月31日

Entropy, Disagreement, and the Limits of Foundation Models in Genomics

Arxiv

0+阅读 · 6月9日

Inferring cellular heterogeneity with mixture models for DNA methylation rates

Arxiv

0+阅读 · 6月2日

Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models

Arxiv

0+阅读 · 6月1日

Exact conditional goodness-of-fit tests for the mixed membership stochastic block model

Arxiv

0+阅读 · 6月1日

Genotype-Conditioned Molecular Generation via Evidence-Grounded Multi-Objective Latent Perturbation in Diffusion Models

Arxiv

0+阅读 · 5月31日

Dynamic Co-Expression Network Estimation via Multivariate Mixed-Effects Models

Arxiv

0+阅读 · 5月28日

Mixture-of-Finite-Mixtures Wishart Model for Clustering Covariance Matrices with an Application to Brain Functional Connectivity

Arxiv

0+阅读 · 5月22日

Synergistic Benefits of Joint Molecule Generation and Property Prediction

Arxiv

0+阅读 · 5月8日

Spatially continuous modelling of aggregated outcome data

Arxiv

0+阅读 · 4月16日

A Review and Roadmap of Deep Causal Model from Different Causal Structures and Representations

Arxiv

13+阅读 · 2023年11月2日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

9+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

4+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

7+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

9+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

4+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

8+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

6+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

6+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

6+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

4+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

7+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

10+阅读 · 7月31日

相关VIP内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

混合专家模型简述

混合专家模型简述

专知会员服务

18+阅读 · 2025年5月30日

西安交大最新《深度学习因果模型》综述论文，35页pdf涵盖292篇文献阐述三种数据范式因果模型

西安交大最新《深度学习因果模型》综述论文，35页pdf涵盖292篇文献阐述三种数据范式因果模型

专知会员服务

63+阅读 · 2023年11月5日

《深度模型融合》综述

《深度模型融合》综述

专知会员服务

75+阅读 · 2023年9月28日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

专知会员服务

31+阅读 · 2022年12月29日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

专知会员服务

52+阅读 · 2021年3月14日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

专知

10+阅读 · 2018年3月10日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Entropy, Disagreement, and the Limits of Foundation Models in Genomics

Arxiv

0+阅读 · 6月9日

Inferring cellular heterogeneity with mixture models for DNA methylation rates

Arxiv

0+阅读 · 6月2日

Scalable Single-Cell Gene Expression Generation with Latent Diffusion Models

Arxiv

0+阅读 · 6月1日

Exact conditional goodness-of-fit tests for the mixed membership stochastic block model

Arxiv

0+阅读 · 6月1日

Genotype-Conditioned Molecular Generation via Evidence-Grounded Multi-Objective Latent Perturbation in Diffusion Models

Arxiv

0+阅读 · 5月31日

Dynamic Co-Expression Network Estimation via Multivariate Mixed-Effects Models

Arxiv

0+阅读 · 5月28日

Mixture-of-Finite-Mixtures Wishart Model for Clustering Covariance Matrices with an Application to Brain Functional Connectivity

Arxiv

0+阅读 · 5月22日

Synergistic Benefits of Joint Molecule Generation and Property Prediction

Arxiv

0+阅读 · 5月8日

Spatially continuous modelling of aggregated outcome data

Arxiv

0+阅读 · 4月16日

A Review and Roadmap of Deep Causal Model from Different Causal Structures and Representations

Arxiv

13+阅读 · 2023年11月2日

相关基金

“模块化自组装”DNA计算模型的研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

多源基因表达数据横向整合的统计方法比较

国家自然科学基金

0+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

代谢组学数据的多层次融合和模型评价方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向进化基因组学的高通量测序数据流形建模

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员