Optimal Demixing of Nonparametric Densities - 专知论文

会员服务 ·

0

非参数 · 最优 · 混合 · 样本 · 主题建模 ·

Optimal Demixing of Nonparametric Densities

翻译：最优混合解混非参数密度

Jianqing Fan,Zheng Tracy Ke,Zhaoyang Shi

Motivated by applications in statistics and machine learning, we consider a problem of unmixing convex combinations of nonparametric densities. Suppose we observe $n$ groups of samples, where the $i$th group consists of $N_i$ independent samples from a $d$-variate density $f_i(x)=\sum_{k=1}^K π_i(k)g_k(x)$. Here, each $g_k(x)$ is a nonparametric density, and each $π_i$ is a $K$-dimensional mixed membership vector. We aim to estimate $g_1(x), \ldots,g_K(x)$. This problem generalizes topic modeling from discrete to continuous variables and finds its applications in LLMs with word embeddings. In this paper, we propose an estimator for the above problem, which modifies the classical kernel density estimator by assigning group-specific weights that are computed by topic modeling on histogram vectors and de-biased by U-statistics. For any $β>0$, assuming that each $g_k(x)$ is in the Nikol'ski class with a smooth parameter $β$, we show that the sum of integrated squared errors of the constructed estimators has a convergence rate that depends on $n$, $K$, $d$, and the per-group sample size $N$. We also provide a matching lower bound, which suggests that our estimator is rate-optimal.

翻译：受统计学和机器学习应用的启发，我们考虑一个从非参数密度的凸组合中解混的问题。假设我们观察到n组样本，其中第i组包含来自d维密度f_i(x)=∑_{k=1}^K π_i(k)g_k(x)的N_i个独立样本。这里，每个g_k(x)是一个非参数密度，每个π_i是一个K维的混合隶属度向量。我们的目标是估计g_1(x),...,g_K(x)。该问题将主题建模从离散变量推广到连续变量，并在基于词嵌入的LLMs中找到其应用。本文针对上述问题提出一种估计器，它通过基于直方图向量的主题建模计算各组特异性权重，并用U统计量进行去偏，从而改进了经典的核密度估计器。对于任意β>0，假设每个g_k(x)属于光滑参数为β的Nikol'skii类，我们证明所构造估计量的积分平方误差之和的收敛速度取决于n、K、d以及每组样本量N。我们还提供了匹配的下界，表明我们的估计量达到了率最优性。

0

相关内容

非参数

【MIT博士论文】非参数高维模型：稀疏性、效率、可解释性，296页pdf

【MIT博士论文】非参数高维模型：稀疏性、效率、可解释性，296页pdf

专知会员服务

31+阅读 · 2024年8月24日

【2023新书】机器和深度学习的超参数调优实用指南，327页pdf

【2023新书】机器和深度学习的超参数调优实用指南，327页pdf

专知会员服务

53+阅读 · 2023年3月12日

人工智能指导的现实问题非线性优化，Meta AI Yuandong Tian

人工智能指导的现实问题非线性优化，Meta AI Yuandong Tian

专知会员服务

32+阅读 · 2023年3月3日

非凸优化问题综述“从对称性到几何性”，罗切斯特大学等

非凸优化问题综述“从对称性到几何性”，罗切斯特大学等

专知会员服务

29+阅读 · 2022年7月17日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【罗切斯特Yuqian Zhang等书】从对称到几何:可处理的非凸问题，34页pdf，From Symmetry to Geometry: Tractable Nonconvex Problems

【罗切斯特Yuqian Zhang等书】从对称到几何:可处理的非凸问题，34页pdf，From Symmetry to Geometry: Tractable Nonconvex Problems

专知会员服务

20+阅读 · 2022年3月4日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

112+阅读 · 2020年12月18日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

非凸优化与统计学，89页ppt，普林斯顿Yuxin Chen博士

非凸优化与统计学，89页ppt，普林斯顿Yuxin Chen博士

专知会员服务

104+阅读 · 2020年6月28日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

AI科技评论

10+阅读 · 2019年5月13日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

基于混合蛙跳算法的三维重力密度异常快速反演

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

非凸稀疏正则化模型与算法的研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

带加法噪声高维密度的最优小波点态估计

国家自然科学基金

0+阅读 · 2015年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

非Lipschitz优化问题的理论算法研究及其在稀疏解还原问题中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Efficient Parameter Estimation of Truncated Boolean Product Distributions

Arxiv

0+阅读 · 5月2日

Minimax Optimal Procedures for Joint Detection and Estimation

Arxiv

0+阅读 · 4月24日

The Exact Replica Threshold for Nonlinear Moments of Quantum States

Arxiv

0+阅读 · 4月24日

Data-Efficient Non-Gaussian Semi-Nonparametric Density Estimation for Nonlinear Dynamical Systems

Arxiv

0+阅读 · 4月10日

Optimal Contest Beyond Convexity

Arxiv

0+阅读 · 4月6日

Ratio Covers of Convex Sets and Optimal Mixture Density Estimation

Arxiv

0+阅读 · 4月2日

Unbounded Density Ratio Estimation and Its Application to Covariate Shift Adaptation

Arxiv

0+阅读 · 3月31日

Online monotone density estimation and log-optimal calibration

Arxiv

0+阅读 · 3月30日

Nonparametric Variational Differential Privacy via Embedding Parameter Clipping

Arxiv

0+阅读 · 3月19日

Some structural properties of mixed orthogonal arrays and their irredundancy

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【MIT博士论文】非参数高维模型：稀疏性、效率、可解释性，296页pdf

【MIT博士论文】非参数高维模型：稀疏性、效率、可解释性，296页pdf

专知会员服务

31+阅读 · 2024年8月24日

【2023新书】机器和深度学习的超参数调优实用指南，327页pdf

【2023新书】机器和深度学习的超参数调优实用指南，327页pdf

专知会员服务

53+阅读 · 2023年3月12日

人工智能指导的现实问题非线性优化，Meta AI Yuandong Tian

人工智能指导的现实问题非线性优化，Meta AI Yuandong Tian

专知会员服务

32+阅读 · 2023年3月3日

非凸优化问题综述“从对称性到几何性”，罗切斯特大学等

非凸优化问题综述“从对称性到几何性”，罗切斯特大学等

专知会员服务

29+阅读 · 2022年7月17日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【罗切斯特Yuqian Zhang等书】从对称到几何:可处理的非凸问题，34页pdf，From Symmetry to Geometry: Tractable Nonconvex Problems

【罗切斯特Yuqian Zhang等书】从对称到几何:可处理的非凸问题，34页pdf，From Symmetry to Geometry: Tractable Nonconvex Problems

专知会员服务

20+阅读 · 2022年3月4日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

最新《非凸优化理论》进展书册，79页pdf

最新《非凸优化理论》进展书册，79页pdf

专知会员服务

112+阅读 · 2020年12月18日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

非凸优化与统计学，89页ppt，普林斯顿Yuxin Chen博士

非凸优化与统计学，89页ppt，普林斯顿Yuxin Chen博士

专知会员服务

104+阅读 · 2020年6月28日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

AI科技评论

10+阅读 · 2019年5月13日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

相关论文

Efficient Parameter Estimation of Truncated Boolean Product Distributions

Arxiv

0+阅读 · 5月2日

Minimax Optimal Procedures for Joint Detection and Estimation

Arxiv

0+阅读 · 4月24日

The Exact Replica Threshold for Nonlinear Moments of Quantum States

Arxiv

0+阅读 · 4月24日

Data-Efficient Non-Gaussian Semi-Nonparametric Density Estimation for Nonlinear Dynamical Systems

Arxiv

0+阅读 · 4月10日

Optimal Contest Beyond Convexity

Arxiv

0+阅读 · 4月6日

Ratio Covers of Convex Sets and Optimal Mixture Density Estimation

Arxiv

0+阅读 · 4月2日

Unbounded Density Ratio Estimation and Its Application to Covariate Shift Adaptation

Arxiv

0+阅读 · 3月31日

Online monotone density estimation and log-optimal calibration

Arxiv

0+阅读 · 3月30日

Nonparametric Variational Differential Privacy via Embedding Parameter Clipping

Arxiv

0+阅读 · 3月19日

Some structural properties of mixed orthogonal arrays and their irredundancy

Arxiv

0+阅读 · 3月19日

相关基金

基于混合蛙跳算法的三维重力密度异常快速反演

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

非凸稀疏正则化模型与算法的研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

带加法噪声高维密度的最优小波点态估计

国家自然科学基金

0+阅读 · 2015年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

非Lipschitz优化问题的理论算法研究及其在稀疏解还原问题中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员