On the Entropy of General Mixture Distributions - 专知论文

会员服务 ·

0

混合 · 混合分布 · 闭式 · 多模 · 模态 ·

On the Entropy of General Mixture Distributions

翻译：论一般混合分布的熵

from arxiv, 20 pages, 5 figures

Mixture distributions are a workhorse model for multimodal data in information theory, signal processing, and machine learning. Yet even when each component density is simple, the differential entropy of the mixture is notoriously hard to compute because the mixture couples a logarithm with a sum. This paper develops a deterministic, closed-form toolkit for bounding and accurately approximating mixture entropy directly from component parameters. Our starting point is an information-theoretic channel viewpoint: the latent mixture label plays the role of an input, and the observation is the output. This viewpoint separates mixture entropy into an average within-component uncertainty plus an overlap term that quantifies how much the observation reveals about the hidden label. We then bound and approximate this overlap term using pairwise overlap integrals between component densities, yielding explicit expressions whenever these overlaps admit a closed form. A simple, family-dependent offset corrects the systematic bias of the Jensen overlap bound and is calibrated to be exact in the two limiting regimes of complete overlap and near-perfect separation. A final clipping step guarantees that the estimate always respects universal information-theoretic bounds. Closed-form specializations are provided for Gaussian, factorized Laplacian, uniform, and hybrid mixtures, and numerical experiments validate the resulting bounds and approximations across separation, dimension, number of components, and correlated covariances.

翻译：混合分布是信息论、信号处理与机器学习中处理多模态数据的核心模型。然而，即使每个分量密度函数形式简单，混合分布的微分熵因其对数项与求和项耦合而难以精确计算。本文发展了一套确定性的闭式工具集，用于直接从分量参数出发对混合熵进行定界与精确逼近。我们的出发点是一个信息论的信道视角：隐式的混合标签扮演输入的角色，观测值则为输出。这一视角将混合熵分解为分量内不确定性的平均值，加上一个量化观测值对隐藏标签揭示程度的“重叠项”。随后，我们利用分量密度函数之间的两两重叠积分对该重叠项进行定界与逼近，从而在这些重叠积分存在闭式表达时得到显式结果。一个简单、依赖于分布族的偏移项修正了詹森重叠界的系统性偏差，并通过校准使其在完全重叠与近乎完全分离两种极限情形下达到精确。最终，通过一个截断步骤确保估计值始终满足普适的信息论界限。本文针对高斯混合、因子化拉普拉斯混合、均匀混合及混合类型分布给出了闭式特化结果，并通过数值实验验证了所得界限与逼近方法在分离程度、维度、分量数量及相关协方差等多种场景下的有效性。

0

相关内容

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

专知会员服务

16+阅读 · 2025年7月3日

【ETHZ博士论文】分布不确定性下的决策，234页pdf

【ETHZ博士论文】分布不确定性下的决策，234页pdf

专知会员服务

49+阅读 · 2024年4月5日

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

专知会员服务

18+阅读 · 2023年1月13日

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

专知会员服务

37+阅读 · 2022年5月23日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

专知会员服务

54+阅读 · 2020年3月16日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知会员服务

54+阅读 · 2020年3月9日

【干货】面向深度学习研究者的概率分布基础教程（附代码），庆熙大学| Tae Hwan Jung

【干货】面向深度学习研究者的概率分布基础教程（附代码），庆熙大学| Tae Hwan Jung

专知会员服务

36+阅读 · 2019年9月9日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

机器学习各种熵：从入门到全面掌握

机器学习各种熵：从入门到全面掌握

AI研习社

10+阅读 · 2018年3月22日

从香农熵到手推KL散度：一文带你纵览机器学习中的信息论

从香农熵到手推KL散度：一文带你纵览机器学习中的信息论

算法与数学之美

10+阅读 · 2018年1月14日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

最大熵原理（一）

最大熵原理（一）

深度学习探索

12+阅读 · 2017年8月3日

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复多项式的核拓扑熵

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

一类Caputo型分数阶混沌系统及其同步研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机动力系统中熵结构与热力学形式的研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物膜间的熵力及其性质研究

国家自然科学基金

0+阅读 · 2014年12月31日

Formal Entropy-Regularized Control of Stochastic Systems

Arxiv

0+阅读 · 3月5日

Complete Diagrammatic Axiomatisations of Relative Entropy

Arxiv

0+阅读 · 3月4日

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Arxiv

0+阅读 · 3月4日

Functional Properties of the Focal-Entropy

Arxiv

0+阅读 · 3月3日

Generalized entropy calibration for inference with partially observed data: A unified framework

Arxiv

0+阅读 · 2月22日

Convergence of Differential Entropies -- II

Arxiv

0+阅读 · 2月18日

Nonparametric Identification and Inference for Counterfactual Distributions with Confounding

Arxiv

0+阅读 · 2月17日

A Constructive Method to Maximize Entropy under Marginal Constraints

Arxiv

0+阅读 · 2月6日

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Arxiv

0+阅读 · 2月3日

A complete characterisation of conditional entropies

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

1+阅读 · 30分钟前

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

1+阅读 · 34分钟前

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

1+阅读 · 40分钟前

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

1+阅读 · 58分钟前

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

1+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

0+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

1+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

1+阅读 · 今天6:09

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

13+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

12+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

9+阅读 · 4月25日

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

19+阅读 · 4月25日

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

8+阅读 · 4月25日

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

12+阅读 · 4月25日

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

9+阅读 · 4月24日

相关VIP内容

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

专知会员服务

16+阅读 · 2025年7月3日

【ETHZ博士论文】分布不确定性下的决策，234页pdf

【ETHZ博士论文】分布不确定性下的决策，234页pdf

专知会员服务

49+阅读 · 2024年4月5日

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

【牛津大学博士论文】控制微分方程在流数据中的机器学习应用，166页pdf

专知会员服务

18+阅读 · 2023年1月13日

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

【博士论文】机器学习中的熵最优传输:在分布回归、重心估计和概率匹配中的应用，209页pdf

专知会员服务

37+阅读 · 2022年5月23日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【斯坦福经典书】熵与信息论，311页pdf

专知会员服务

119+阅读 · 2021年3月23日

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

二值分类熵界分析—国科大UCAS胡包钢教授《信息论与机器学习》课程第五讲

专知会员服务

54+阅读 · 2020年3月16日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知会员服务

54+阅读 · 2020年3月9日

【干货】面向深度学习研究者的概率分布基础教程（附代码），庆熙大学| Tae Hwan Jung

【干货】面向深度学习研究者的概率分布基础教程（附代码），庆熙大学| Tae Hwan Jung

专知会员服务

36+阅读 · 2019年9月9日

热门VIP内容

开通专知VIP会员享更多权益服务

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

《实现联合作战能力所需的技术》58页报告

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《无人机革命：来自俄乌战场的启示》（报告）

相关资讯

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

机器学习各种熵：从入门到全面掌握

机器学习各种熵：从入门到全面掌握

AI研习社

10+阅读 · 2018年3月22日

从香农熵到手推KL散度：一文带你纵览机器学习中的信息论

从香农熵到手推KL散度：一文带你纵览机器学习中的信息论

算法与数学之美

10+阅读 · 2018年1月14日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

最大熵原理（一）

最大熵原理（一）

深度学习探索

12+阅读 · 2017年8月3日

相关论文

Formal Entropy-Regularized Control of Stochastic Systems

Arxiv

0+阅读 · 3月5日

Complete Diagrammatic Axiomatisations of Relative Entropy

Arxiv

0+阅读 · 3月4日

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Arxiv

0+阅读 · 3月4日

Functional Properties of the Focal-Entropy

Arxiv

0+阅读 · 3月3日

Generalized entropy calibration for inference with partially observed data: A unified framework

Arxiv

0+阅读 · 2月22日

Convergence of Differential Entropies -- II

Arxiv

0+阅读 · 2月18日

Nonparametric Identification and Inference for Counterfactual Distributions with Confounding

Arxiv

0+阅读 · 2月17日

A Constructive Method to Maximize Entropy under Marginal Constraints

Arxiv

0+阅读 · 2月6日

On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Arxiv

0+阅读 · 2月3日

A complete characterisation of conditional entropies

Arxiv

0+阅读 · 1月30日

相关基金

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复多项式的核拓扑熵

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

一类Caputo型分数阶混沌系统及其同步研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机动力系统中熵结构与热力学形式的研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物膜间的熵力及其性质研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员