Design-Conditional Prior Elicitation for Dirichlet Process Mixtures: A Unified Framework for Cluster Counts and Weight Control - 专知论文

会员服务 ·

0

混合 · 结构 · 设计 · 狄利克雷过程 · 报告 ·

Design-Conditional Prior Elicitation for Dirichlet Process Mixtures: A Unified Framework for Cluster Counts and Weight Control

翻译：基于设计条件的狄利克雷过程混合先验设定：面向聚类数量与权重控制的统一框架

Dirichlet process mixture (DPM) models are widely used for semiparametric Bayesian analysis in educational and behavioral research, yet specifying the concentration parameter remains a critical barrier. Default hyperpriors often impose strong, unintended assumptions about clustering, while existing calibration methods based on cluster counts suffer from computational inefficiency and fail to control the distribution of mixture weights. This article introduces Design-Conditional Elicitation (DCE), a unified framework that translates practitioner beliefs about cluster structure into coherent Gamma hyperpriors for a fixed design size J. DCE makes three contributions. First, it solves the computational bottleneck using Two-Stage Moment Matching (TSMM), which couples a closed-form approximation with an exact Newton refinement to calibrate hyperparameters without grid search. Second, addressing the "unintended prior" phenomenon, DCE incorporates a Dual-Anchor protocol to diagnose and optionally constrain the risk of weight dominance while transparently reporting the resulting trade-off against cluster-count fidelity. Third, the complete workflow is implemented in the open-source DPprior R package with reproducible diagnostics and a reporting checklist. Simulation studies demonstrate that common defaults such as Gamma(1, 1) induce posterior collapse rates exceeding 60% regardless of the true cluster structure, while DCE-calibrated priors substantially reduce bias and improve recovery across varying levels of data informativeness.

翻译：狄利克雷过程混合模型在教育与行为研究的半参数贝叶斯分析中应用广泛，但其浓度参数的设定仍是关键障碍。默认超先验常对聚类结构施加强烈且非预期的假设，而现有基于聚类数量的校准方法存在计算效率低下且无法控制混合权重分布的问题。本文提出设计条件先验设定框架，该统一框架可将研究者对聚类结构的先验信念转化为针对固定设计规模J的一致Gamma超先验。本框架作出三方面贡献：首先，通过两阶段矩匹配方法解决计算瓶颈，该方法将闭式近似与精确牛顿修正相结合，无需网格搜索即可校准超参数；其次，针对“非预期先验”现象，框架引入双锚定协议以诊断并可选地约束权重主导风险，同时透明报告由此产生的与聚类数量保真度的权衡关系；第三，完整工作流程已在开源DPprior R包中实现，包含可复现的诊断工具与报告清单。模拟研究表明，常见默认设置（如Gamma(1,1)）会导致超过60%的后验坍缩率（与真实聚类结构无关），而经DCE校准的先验能显著减少偏差，并在不同数据信息量水平下提升结构恢复能力。

0

相关内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

专知会员服务

27+阅读 · 2025年8月24日

混合战背景下抵抗强度评估模型研究

混合战背景下抵抗强度评估模型研究

专知会员服务

22+阅读 · 2024年10月23日

美国工程院院士MIT教授Dimitri《AlphaZero最优模型预测与自适应控制》2022新书，(附书稿PDF&讲义)

美国工程院院士MIT教授Dimitri《AlphaZero最优模型预测与自适应控制》2022新书，(附书稿PDF&讲义)

专知会员服务

152+阅读 · 2022年1月3日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

43+阅读 · 2021年11月12日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知会员服务

78+阅读 · 2021年1月30日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

专知会员服务

21+阅读 · 2020年3月19日

【UAI 2019 Tutorials】可处理概率模型：表示、算法、学习和应用（Tractable Probabilistic Models: Representations, Algorithms, Learning, and Applications）

【UAI 2019 Tutorials】可处理概率模型：表示、算法、学习和应用（Tractable Probabilistic Models: Representations, Algorithms, Learning, and Applications）

专知会员服务

18+阅读 · 2019年11月16日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

【APC】先进过程控制系统（APC: Advanced Process Control）

【APC】先进过程控制系统（APC: Advanced Process Control）

产业智能官

69+阅读 · 2020年7月12日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

机器学习之确定最佳聚类数目的10种方法

机器学习之确定最佳聚类数目的10种方法

炼数成金订阅号

13+阅读 · 2017年10月12日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向真实细观界面力学行为仿真的沥青混合料多精度三维重构及数值建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于路径全局结构可用性特征的混序制造服务组合建模理论与优选方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

滑模控制方法处理带有干扰的一维具有范德波尔型边界条件的波动方程的稳定性

国家自然科学基金

0+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

多介质流体界面失稳和混合的跨尺度实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

On the interplay between prior weight and variance of the robustification component in Robust Mixture Prior Bayesian Dynamic Borrowing approach

Arxiv

0+阅读 · 3月17日

Prior- and likelihood-free probabilistic inference with finite-sample calibration guarantees

Arxiv

0+阅读 · 3月16日

Mixture priors for replication studies

Arxiv

0+阅读 · 3月13日

Variational Bayes and Truncation approximations for Enriched Dirichlet process mixtures

Arxiv

0+阅读 · 3月12日

Dependent Dirichlet processes via thinning

Arxiv

0+阅读 · 2月27日

Bayesian Repulsive Mixture Modeling with Matérn Point Processes

Arxiv

0+阅读 · 2月21日

Scalable Dirichlet Process Mixture Models with Unknown Concentration and Adaptive Covariance for High-Dimensional Clustering Applied to Leukemia Transcriptomics

Arxiv

0+阅读 · 2月18日

DirMoE: Dirichlet-routed Mixture of Experts

Arxiv

0+阅读 · 2月9日

Clustering under Constraints: Efficient Parameterized Approximation Schemes

Arxiv

0+阅读 · 2月7日

Complexity bounds for Dirichlet process slice samplers

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

狄利克雷过程

最新内容

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

4+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

3+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

10+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

15+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

专知会员服务

27+阅读 · 2025年8月24日

混合战背景下抵抗强度评估模型研究

混合战背景下抵抗强度评估模型研究

专知会员服务

22+阅读 · 2024年10月23日

美国工程院院士MIT教授Dimitri《AlphaZero最优模型预测与自适应控制》2022新书，(附书稿PDF&讲义)

美国工程院院士MIT教授Dimitri《AlphaZero最优模型预测与自适应控制》2022新书，(附书稿PDF&讲义)

专知会员服务

152+阅读 · 2022年1月3日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

43+阅读 · 2021年11月12日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知会员服务

78+阅读 · 2021年1月30日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

专知会员服务

21+阅读 · 2020年3月19日

【UAI 2019 Tutorials】可处理概率模型：表示、算法、学习和应用（Tractable Probabilistic Models: Representations, Algorithms, Learning, and Applications）

【UAI 2019 Tutorials】可处理概率模型：表示、算法、学习和应用（Tractable Probabilistic Models: Representations, Algorithms, Learning, and Applications）

专知会员服务

18+阅读 · 2019年11月16日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于强化学习的自动化红队测试》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

相关资讯

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

【APC】先进过程控制系统（APC: Advanced Process Control）

【APC】先进过程控制系统（APC: Advanced Process Control）

产业智能官

69+阅读 · 2020年7月12日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

机器学习之确定最佳聚类数目的10种方法

机器学习之确定最佳聚类数目的10种方法

炼数成金订阅号

13+阅读 · 2017年10月12日

相关论文

On the interplay between prior weight and variance of the robustification component in Robust Mixture Prior Bayesian Dynamic Borrowing approach

Arxiv

0+阅读 · 3月17日

Prior- and likelihood-free probabilistic inference with finite-sample calibration guarantees

Arxiv

0+阅读 · 3月16日

Mixture priors for replication studies

Arxiv

0+阅读 · 3月13日

Variational Bayes and Truncation approximations for Enriched Dirichlet process mixtures

Arxiv

0+阅读 · 3月12日

Dependent Dirichlet processes via thinning

Arxiv

0+阅读 · 2月27日

Bayesian Repulsive Mixture Modeling with Matérn Point Processes

Arxiv

0+阅读 · 2月21日

Scalable Dirichlet Process Mixture Models with Unknown Concentration and Adaptive Covariance for High-Dimensional Clustering Applied to Leukemia Transcriptomics

Arxiv

0+阅读 · 2月18日

DirMoE: Dirichlet-routed Mixture of Experts

Arxiv

0+阅读 · 2月9日

Clustering under Constraints: Efficient Parameterized Approximation Schemes

Arxiv

0+阅读 · 2月7日

Complexity bounds for Dirichlet process slice samplers

Arxiv

0+阅读 · 1月31日

相关基金

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂工程产品基于多可信度近似的设计优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向真实细观界面力学行为仿真的沥青混合料多精度三维重构及数值建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于路径全局结构可用性特征的混序制造服务组合建模理论与优选方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

滑模控制方法处理带有干扰的一维具有范德波尔型边界条件的波动方程的稳定性

国家自然科学基金

0+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

多介质流体界面失稳和混合的跨尺度实验研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员