Score-based diffusion models have emerged as prominent deep generative models; however, their application to tabular data remains challenging because their backbones assume fully specified inputs, whereas real-world tabular data often contain missing values. We propose AugMask, a plug-and-play training framework that adapts missing-unaware backbones to incomplete data by separating conditioning from supervision. AugMask 1) constructs numeric inputs via conditional stochastic augmentation using lightweight auxiliary models, and 2) applies denoising supervision only to observed coordinates. In effect, augmented missing entries serve as uncertain conditioning context rather than training targets. We connect this training rule to a Rao--Blackwellized objective and show that marginalizing missing entries yields a variance-weighted sensitivity penalty, discouraging over-reliance on uncertain completions. Across diverse datasets and missingness regimes, AugMask enables standard diffusion-based tabular generators to outperform specialized missing-aware baselines.


翻译:基于分数的扩散模型已成为重要的深度生成模型,但其在表格数据上的应用仍具挑战性——模型主干假设输入完全指定,而现实表格数据常含缺失值。我们提出AugMask,一种即插即用的训练框架,通过分离条件化与监督信号,使对缺失不敏感的主干适应不完整数据。AugMask通过以下两点实现:1)利用轻量级辅助模型进行条件随机增强以构建数值型输入;2)仅对观测坐标施加去噪监督。实际上,增强后缺失条目充当不确定的条件化背景而非训练目标。我们将此训练规则关联至Rao-Blackwell化目标,并证明边缘化缺失条目会产生方差加权灵敏度惩罚项,从而抑制对不确定补全结果的过度依赖。跨多种数据集与缺失机制,AugMask使基于标准扩散的表格生成器优于特制的缺失感知基线模型。

0
下载
关闭预览

相关内容

扩散模型与表示学习:综述
专知会员服务
49+阅读 · 2024年7月2日
【CVPR2024】扩散模型的结构指导对抗训练
专知会员服务
27+阅读 · 2024年2月28日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
AmpliGraph:知识图谱表示学习工具包
专知
40+阅读 · 2019年4月6日
深度学习中Attention Mechanism详细介绍:原理、分类及应用
深度学习与NLP
10+阅读 · 2019年2月18日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
扩散模型与表示学习:综述
专知会员服务
49+阅读 · 2024年7月2日
【CVPR2024】扩散模型的结构指导对抗训练
专知会员服务
27+阅读 · 2024年2月28日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员