Association Rule Mining (ARM) is a fundamental task for knowledge discovery in tabular data and is widely used in high-stakes decision-making. Classical ARM methods rely on frequent itemset mining, leading to rule explosion and poor scalability, while recent neural approaches mitigate these issues but suffer from degraded performance in low-data regimes. Tabular foundation models (TFMs), pretrained on diverse tabular data with strong in-context generalization, provide a basis for addressing these limitations. We introduce a model-agnostic association rule learning framework that extracts association rules from any conditional probabilistic model over tabular data, enabling us to leverage TFMs. We then introduce TabProbe, an instantiation of our framework that utilizes TFMs as conditional probability estimators to learn association rules out-of-the-box without frequent itemset mining. We evaluate our approach on tabular datasets of varying sizes based on standard ARM rule quality metrics and downstream classification performance. The results show that TFMs consistently produce concise, high-quality association rules with strong predictive performance and remain robust in low-data settings without task-specific training. Source code is available at https://github.com/DiTEC-project/tabprobe.


翻译:关联规则挖掘(ARM)是表格数据知识发现的一项基本任务,广泛应用于高风险决策中。经典的ARM方法依赖于频繁项集挖掘,导致规则爆炸和可扩展性差,而近期的神经方法虽缓解了这些问题,但在低数据量场景下性能显著下降。表格基础模型(TFMs)通过在多样化表格数据上进行预训练,具备强大的上下文泛化能力,为解决这些局限性提供了基础。我们提出了一种模型无关的关联规则学习框架,该框架能够从任何表格数据的条件概率模型中提取关联规则,从而使得我们能够利用TFMs。随后,我们介绍了TabProbe,这是我们框架的一个具体实现,它利用TFMs作为条件概率估计器,无需频繁项集挖掘即可开箱即用地学习关联规则。我们在不同规模的表格数据集上,基于标准ARM规则质量指标和下游分类性能评估了我们的方法。结果表明,TFMs能够持续生成简洁、高质量的关联规则,具备强大的预测性能,并且在低数据量场景下无需任务特定训练仍保持稳健。源代码可在 https://github.com/DiTEC-project/tabprobe 获取。

0
下载
关闭预览

相关内容

基于大语言模型的知识图谱逻辑规则挖掘框架及应用
专知会员服务
27+阅读 · 2025年5月22日
联邦学习中基础模型参数高效微调综述
专知会员服务
16+阅读 · 2025年5月5日
表格数据表示学习综述
专知会员服务
18+阅读 · 2025年4月27日
知识图谱基础模型的数学基础
专知会员服务
41+阅读 · 2025年1月12日
《深度表格学习综述》
专知会员服务
43+阅读 · 2024年10月18日
一种用于军事目标发现的舰船知识图谱表示学习框架
专知会员服务
37+阅读 · 2024年10月15日
【NeurIPS2024】TableRAG:基于语言模型的百万标记表格理解
专知会员服务
37+阅读 · 2024年10月8日
【阿姆斯特丹博士论文】表格表示学习,179页pdf
专知会员服务
36+阅读 · 2024年4月6日
【NUS博士论文】深度表示学习的视频基础模型,236页pdf
专知会员服务
33+阅读 · 2023年12月26日
【斯坦福课程】基础模型进展
专知会员服务
52+阅读 · 2023年1月15日
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
27+阅读 · 2020年3月1日
AmpliGraph:知识图谱表示学习工具包
专知
40+阅读 · 2019年4月6日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
国家自然科学基金
332+阅读 · 2017年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于大语言模型的知识图谱逻辑规则挖掘框架及应用
专知会员服务
27+阅读 · 2025年5月22日
联邦学习中基础模型参数高效微调综述
专知会员服务
16+阅读 · 2025年5月5日
表格数据表示学习综述
专知会员服务
18+阅读 · 2025年4月27日
知识图谱基础模型的数学基础
专知会员服务
41+阅读 · 2025年1月12日
《深度表格学习综述》
专知会员服务
43+阅读 · 2024年10月18日
一种用于军事目标发现的舰船知识图谱表示学习框架
专知会员服务
37+阅读 · 2024年10月15日
【NeurIPS2024】TableRAG:基于语言模型的百万标记表格理解
专知会员服务
37+阅读 · 2024年10月8日
【阿姆斯特丹博士论文】表格表示学习,179页pdf
专知会员服务
36+阅读 · 2024年4月6日
【NUS博士论文】深度表示学习的视频基础模型,236页pdf
专知会员服务
33+阅读 · 2023年12月26日
【斯坦福课程】基础模型进展
专知会员服务
52+阅读 · 2023年1月15日
相关资讯
知识图谱构建-关系抽取和属性抽取
深度学习自然语言处理
27+阅读 · 2020年3月1日
AmpliGraph:知识图谱表示学习工具包
专知
40+阅读 · 2019年4月6日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
相关基金
国家自然科学基金
332+阅读 · 2017年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员