Missing value imputation is a fundamental challenge in machine intelligence, heavily dependent on data completeness. Current imputation methods often handle numerical and categorical attributes independently, overlooking critical interdependencies among heterogeneous features. To address these limitations, we propose a novel imputation approach that explicitly models cross-type feature dependencies within a unified framework. Our method leverages both complete and incomplete instances to ensure accurate and consistent imputation in tabular data. Extensive experimental results demonstrate that the proposed approach achieves superior performance over existing techniques and significantly enhances downstream machine learning tasks, providing a robust solution for real-world systems with missing data.


翻译:缺失值填补是机器智能领域的一项基础性挑战,其效果高度依赖于数据的完整性。现有的填补方法通常独立处理数值型与分类型属性,忽略了异构特征间关键的内在关联。为克服这些局限,我们提出了一种新颖的填补方法,该方法在统一框架内显式建模跨类型特征依赖关系。我们的方法同时利用完整与不完整样本,以确保表格数据中填补结果的准确性与一致性。大量实验结果表明,所提方法相较现有技术取得了更优的性能,并显著提升了下游机器学习任务的效果,为现实世界中存在缺失数据的系统提供了鲁棒的解决方案。

0
下载
关闭预览

相关内容

【NeurIPS2024】用于缺失值数据集的可解释广义加性模型
专知会员服务
18+阅读 · 2024年12月7日
专知会员服务
57+阅读 · 2021年8月12日
专知会员服务
38+阅读 · 2021年5月10日
专知会员服务
10+阅读 · 2021年1月31日
【国防科大】复杂异构数据的表征学习综述
专知会员服务
85+阅读 · 2020年4月23日
缺失数据统计分析,第三版,462页pdf
专知会员服务
110+阅读 · 2020年2月28日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
缺失数据统计分析,第三版,462页pdf
专知
48+阅读 · 2020年2月28日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
从信息论的角度来理解损失函数
深度学习每日摘要
17+阅读 · 2019年4月7日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
FCS 论坛 | 孟德宇:误差建模原理
FCS
15+阅读 · 2017年8月17日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关资讯
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
缺失数据统计分析,第三版,462页pdf
专知
48+阅读 · 2020年2月28日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
从信息论的角度来理解损失函数
深度学习每日摘要
17+阅读 · 2019年4月7日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
FCS 论坛 | 孟德宇:误差建模原理
FCS
15+阅读 · 2017年8月17日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员