Kernel Embeddings and the Separation of Measure Phenomenon - 专知论文

会员服务 ·

0

嵌入 · 概率 · 方差 · 希尔伯特空间 · 概率分布 ·

Kernel Embeddings and the Separation of Measure Phenomenon

翻译：核嵌入与测度分离现象

Leonardo V. Santoro,Kartik G. Waghmare,Victor M. Panaretos

We prove that kernel covariance embeddings lead to information-theoretically perfect separation of distinct continuous probability distributions. In statistical terms, we establish that testing for the \emph{equality} of two non-atomic (Borel) probability measures on a locally compact Polish space is \emph{equivalent} to testing for the \emph{singularity} between two centered Gaussian measures on a reproducing kernel Hilbert space. The corresponding Gaussians are defined via the notion of kernel covariance embedding of a probability measure, and the Hilbert space is that generated by the embedding kernel. Distinguishing singular Gaussians is structurally simpler from an information-theoretic perspective than non-parametric two-sample testing, particularly in complex or high-dimensional domains. This is because singular Gaussians are supported on essentially separate and affine subspaces. Our proof leverages the classical Feldman-Hájek dichotomy, and shows that even a small perturbation of a continuous distribution will be maximally magnified through its Gaussian embedding. This ``separation of measure phenomenon'' appears to be a blessing of infinite dimensionality, by means of embedding, with the potential to inform the design of efficient inference tools in considerable generality. The elicitation of this phenomenon also appears to crystallize, in a precise and simple mathematical statement, a core mechanism underpinning the empirical effectiveness of kernel methods.

翻译：我们证明了核协方差嵌入能够实现不同连续概率分布在信息论意义上的完美分离。从统计学角度而言，我们证明了在局部紧波兰空间上检验两个非原子（Borel）概率测度的相等性，等价于在再生核希尔伯特空间中检验两个中心化高斯测度之间的奇异性。对应的高斯测度通过概率测度的核协方差嵌入概念定义，而希尔伯特空间则由嵌入核生成。从信息论视角来看，区分奇异高斯测度在结构上比非参数双样本检验更为简单，尤其在复杂或高维领域中。这是因为奇异高斯测度本质上支撑在分离的仿射子空间上。我们的证明利用了经典的Feldman-Hájek二分定理，并表明即使对连续分布进行微小扰动，也会通过其高斯嵌入被极大程度地放大。这种“测度分离现象”似乎是通过嵌入实现的无限维优势，有望为广泛领域内高效推断工具的设计提供理论依据。该现象的揭示也以精确而简洁的数学表述，凝练了支撑核方法实证有效性的核心机制。

0

相关内容

【牛津大学博士论文】因果推理和元学习: 核均值嵌入,160页pdf

【牛津大学博士论文】因果推理和元学习: 核均值嵌入,160页pdf

专知会员服务

55+阅读 · 2023年6月14日

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

专知会员服务

48+阅读 · 2022年11月8日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

【ICML2021】深度核过程

专知会员服务

26+阅读 · 2021年8月11日

[NeurIPS 2020] 球形嵌入的深度度量学习

[NeurIPS 2020] 球形嵌入的深度度量学习

专知会员服务

17+阅读 · 2020年11月8日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【图机器学习论文】网络嵌入研究综述（A Survey on Network Embedding）

【图机器学习论文】网络嵌入研究综述（A Survey on Network Embedding）

专知会员服务

82+阅读 · 2019年12月16日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

专知

18+阅读 · 2019年2月5日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

量子相干性的度量及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

基于电子自旋-核自旋耦合的高精度核磁共振磁强计极化与检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

Banach空间的嵌入理论及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构图论的一般图嵌入分布的研究

国家自然科学基金

4+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

迭代函数系的分离条件及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

Simultaneous analysis of approximate leave-one-out cross-validation and mean-field inference

Arxiv

0+阅读 · 2月12日

Universal Approximation of Continuous Functionals on Compact Subsets via Linear Measurements and Scalar Nonlinearities

Arxiv

0+阅读 · 2月3日

PCA of probability measures: Sparse and Dense sampling regimes

Arxiv

0+阅读 · 2月2日

Nested and outlier embeddings into trees

Arxiv

0+阅读 · 1月31日

Optimal differentially private kernel learning with random projection

Arxiv

0+阅读 · 1月29日

Calibrated Similarity for Reliable Geometric Analysis of Embedding Spaces

Arxiv

0+阅读 · 1月23日

Nested and outlier embeddings into trees

Arxiv

0+阅读 · 1月21日

A Kernel Approach for Semi-implicit Variational Inference

Arxiv

0+阅读 · 1月17日

Conditional Distribution Compression via the Kernel Conditional Mean Embedding

Arxiv

0+阅读 · 1月16日

The Kernel Manifold: A Geometric Approach to Gaussian Process Model Selection

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

希尔伯特空间

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

1+阅读 · 今天16:12

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

1+阅读 · 今天16:08

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

2+阅读 · 今天14:39

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

2+阅读 · 今天14:00

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

4+阅读 · 今天13:20

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

4+阅读 · 今天13:16

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

11+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

相关VIP内容

【牛津大学博士论文】因果推理和元学习: 核均值嵌入,160页pdf

【牛津大学博士论文】因果推理和元学习: 核均值嵌入,160页pdf

专知会员服务

55+阅读 · 2023年6月14日

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

如何从数学角度理解知识图谱嵌入？中山大学等最新《知识图谱嵌入:表征空间视角》研究综述，32页pdf阐述代数、几何、分析下的KGE

专知会员服务

48+阅读 · 2022年11月8日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

【ICML2021】深度核过程

专知会员服务

26+阅读 · 2021年8月11日

[NeurIPS 2020] 球形嵌入的深度度量学习

[NeurIPS 2020] 球形嵌入的深度度量学习

专知会员服务

17+阅读 · 2020年11月8日

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

随机特征核近似综述: 算法与理论，Random Features for Kernel Approximation: A Survey in Algorithms, Theory, and Beyond

专知会员服务

33+阅读 · 2020年4月26日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【图机器学习论文】网络嵌入研究综述（A Survey on Network Embedding）

【图机器学习论文】网络嵌入研究综述（A Survey on Network Embedding）

专知会员服务

82+阅读 · 2019年12月16日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

情感分析词嵌入预处理细粒度实验综述（附20页全文下载）

专知

18+阅读 · 2019年2月5日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

相关论文

Simultaneous analysis of approximate leave-one-out cross-validation and mean-field inference

Arxiv

0+阅读 · 2月12日

Universal Approximation of Continuous Functionals on Compact Subsets via Linear Measurements and Scalar Nonlinearities

Arxiv

0+阅读 · 2月3日

PCA of probability measures: Sparse and Dense sampling regimes

Arxiv

0+阅读 · 2月2日

Nested and outlier embeddings into trees

Arxiv

0+阅读 · 1月31日

Optimal differentially private kernel learning with random projection

Arxiv

0+阅读 · 1月29日

Calibrated Similarity for Reliable Geometric Analysis of Embedding Spaces

Arxiv

0+阅读 · 1月23日

Nested and outlier embeddings into trees

Arxiv

0+阅读 · 1月21日

A Kernel Approach for Semi-implicit Variational Inference

Arxiv

0+阅读 · 1月17日

Conditional Distribution Compression via the Kernel Conditional Mean Embedding

Arxiv

0+阅读 · 1月16日

The Kernel Manifold: A Geometric Approach to Gaussian Process Model Selection

Arxiv

0+阅读 · 1月13日

相关基金

量子相干性的度量及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子齐次空间上同调的非交换Hodge分解及形变意义

国家自然科学基金

0+阅读 · 2015年12月31日

基于电子自旋-核自旋耦合的高精度核磁共振磁强计极化与检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

Banach空间的嵌入理论及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构图论的一般图嵌入分布的研究

国家自然科学基金

4+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

迭代函数系的分离条件及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员