Multi-context principal component analysis - 专知论文

会员服务 ·

0

情境 · 主成分分析 · 分析 · PCA · 工具 ·

Multi-context principal component analysis

翻译：多情境主成分分析

Kexin Wang,Salil Bhate,João M. Pereira,Joe Kileel,Matylda Figlerowicz,Anna Seigal

from arxiv, 47 pages, 8 figures. Supplementary tables are provided as downloadable file

Principal component analysis (PCA) is a tool to capture factors that explain variation in data. Across domains, data are now collected across multiple contexts (for example, individuals with different diseases, cells of different types, or words across texts). While the factors explaining variation in data are undoubtedly shared across subsets of contexts, no tools currently exist to systematically recover such factors. We develop multi-context principal component analysis (MCPCA), a theoretical and algorithmic framework that decomposes data into factors shared across subsets of contexts. Applied to gene expression, MCPCA reveals axes of variation shared across subsets of cancer types and an axis whose variability in tumor cells, but not mean, is associated with lung cancer progression. Applied to contextualized word embeddings from language models, MCPCA maps stages of a debate on human nature, revealing a discussion between science and fiction over decades. These axes are not found by combining data across contexts or by restricting to individual contexts. MCPCA is a principled generalization of PCA to address the challenge of understanding factors underlying data across contexts.

翻译：主成分分析（PCA）是一种用于捕捉解释数据变异因素的工具。在各领域中，数据现已在多种情境下收集（例如，患有不同疾病的个体、不同类型的细胞或跨文本的词汇）。尽管解释数据变异的因素无疑在不同情境子集间共享，但目前尚无系统性地恢复此类因素的工具。我们开发了多情境主成分分析（MCPCA），这是一个理论与算法框架，可将数据分解为跨情境子集共享的因素。应用于基因表达数据时，MCPCA揭示了跨癌症类型子集共享的变异轴，以及一个在肿瘤细胞中变异程度（而非均值）与肺癌进展相关的轴。应用于语言模型的情境化词嵌入时，MCPCA映射出关于人性辩论的各个阶段，揭示了数十年间科学与虚构之间的讨论。这些轴无法通过跨情境合并数据或局限于单一情境而发现。MCPCA是PCA的一种原则性推广，旨在应对理解跨情境数据背后因素的挑战。

0

相关内容

【NeurIPS2023】因果成分分析

【NeurIPS2023】因果成分分析

专知会员服务

41+阅读 · 2023年11月13日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

47+阅读 · 2023年8月27日

《多目标跟踪中的硬组合问题和使用分析组合方法降低计算复杂性》2022最新教程，68页slides，北约科学与技术组织

《多目标跟踪中的硬组合问题和使用分析组合方法降低计算复杂性》2022最新教程，68页slides，北约科学与技术组织

专知会员服务

34+阅读 · 2022年10月18日

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

专知会员服务

76+阅读 · 2022年8月25日

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

专知会员服务

12+阅读 · 2022年3月24日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

专知会员服务

20+阅读 · 2022年3月3日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【变分推断课件】Lectures on Variational Inference：Statistical Analysis of Variational Approximations（附带pdf）

【变分推断课件】Lectures on Variational Inference：Statistical Analysis of Variational Approximations（附带pdf）

专知会员服务

16+阅读 · 2019年11月30日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

一文了解成分句法分析

一文了解成分句法分析

人工智能头条

15+阅读 · 2019年4月24日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

【专知荟萃17】情感分析Sentiment Analysis 知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃17】情感分析Sentiment Analysis 知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

43+阅读 · 2017年11月16日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

核酸提取和多重PCR集成微流控芯片系统的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Multivariate Partial Information Decomposition: Constructions, Inconsistencies, and Alternative Measures

Arxiv

0+阅读 · 2月11日

MML Probabilistic Principal Component Analysis

Arxiv

0+阅读 · 2月9日

Statistical description and dimension reduction of continuous time categorical trajectories with multivariate functional principal components

Arxiv

0+阅读 · 2月5日

Sparse group principal component analysis via double thresholding with application to multi-cellular programs

Arxiv

0+阅读 · 2月4日

Non-linear PCA via Evolution Strategies: a Novel Objective Function

Arxiv

0+阅读 · 2月3日

Factorial Difference-in-Differences

Arxiv

0+阅读 · 2月3日

Robust functional PCA for relative data

Arxiv

0+阅读 · 1月28日

Contrastive independent component analysis

Arxiv

0+阅读 · 1月26日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月21日

ALPCAHUS: Subspace Clustering for Heteroscedastic Data

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

主成分分析

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

10+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【NeurIPS2023】因果成分分析

【NeurIPS2023】因果成分分析

专知会员服务

41+阅读 · 2023年11月13日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

47+阅读 · 2023年8月27日

《多目标跟踪中的硬组合问题和使用分析组合方法降低计算复杂性》2022最新教程，68页slides，北约科学与技术组织

《多目标跟踪中的硬组合问题和使用分析组合方法降低计算复杂性》2022最新教程，68页slides，北约科学与技术组织

专知会员服务

34+阅读 · 2022年10月18日

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

专知会员服务

76+阅读 · 2022年8月25日

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

专知会员服务

12+阅读 · 2022年3月24日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

专知会员服务

20+阅读 · 2022年3月3日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【变分推断课件】Lectures on Variational Inference：Statistical Analysis of Variational Approximations（附带pdf）

【变分推断课件】Lectures on Variational Inference：Statistical Analysis of Variational Approximations（附带pdf）

专知会员服务

16+阅读 · 2019年11月30日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

一文了解成分句法分析

一文了解成分句法分析

人工智能头条

15+阅读 · 2019年4月24日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

【论文推荐】最新十二篇情感分析相关论文—自然语言推理框架、网络事件、多任务学习、实时情感变化检测、多因素分析、深度语境词表示

专知

22+阅读 · 2018年5月7日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

【专知荟萃17】情感分析Sentiment Analysis 知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃17】情感分析Sentiment Analysis 知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

43+阅读 · 2017年11月16日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

相关论文

Multivariate Partial Information Decomposition: Constructions, Inconsistencies, and Alternative Measures

Arxiv

0+阅读 · 2月11日

MML Probabilistic Principal Component Analysis

Arxiv

0+阅读 · 2月9日

Statistical description and dimension reduction of continuous time categorical trajectories with multivariate functional principal components

Arxiv

0+阅读 · 2月5日

Sparse group principal component analysis via double thresholding with application to multi-cellular programs

Arxiv

0+阅读 · 2月4日

Non-linear PCA via Evolution Strategies: a Novel Objective Function

Arxiv

0+阅读 · 2月3日

Factorial Difference-in-Differences

Arxiv

0+阅读 · 2月3日

Robust functional PCA for relative data

Arxiv

0+阅读 · 1月28日

Contrastive independent component analysis

Arxiv

0+阅读 · 1月26日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月21日

ALPCAHUS: Subspace Clustering for Heteroscedastic Data

Arxiv

0+阅读 · 1月19日

相关基金

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

核酸提取和多重PCR集成微流控芯片系统的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员