Within the domain of data mining, one critical objective is the discovery of sequential rules with high utility. The goal is to discover sequential rules that exhibit both high utility and strong confidence, which are valuable in real-world applications. However, existing high-utility sequential rule mining algorithms suffer from redundant utility computations, as different rules may consist of the same sequence of items. When these items can form multiple distinct rules, additional utility calculations are required. To address this issue, this study proposes a sequential rule mining algorithm that utilizes segmentation guided by confidence (RSC), which employs confidence-guided segmentation to reduce redundant utility computation. It adopts a method that precomputes the confidence of segmented rules by leveraging the support of candidate subsequences in advance. Once the segmentation point is determined, all rules with different antecedents and consequents are generated simultaneously. RSC uses a utility-linked table to accelerate candidate sequence generation and introduces a stricter utility upper bound, called the reduced remaining utility of a sequence, to address sequences with duplicate items. Finally, the proposed RSC method was evaluated on multiple datasets, and the results demonstrate improvements over state-of-the-art approaches.


翻译:在数据挖掘领域中,一个关键目标是发现具有高效用性的序列规则。该目标旨在挖掘既展现高效用性又具备强置信度的序列规则,这类规则在实际应用中具有重要价值。然而,现有高效用序列规则挖掘算法存在效用计算冗余的问题,因为不同的规则可能由相同的项目序列构成。当这些项目能够形成多个不同规则时,就需要进行额外的效用计算。为解决这一问题,本研究提出一种利用置信度引导分割的序列规则挖掘算法(RSC),该算法通过置信度引导的分割来减少冗余的效用计算。它采用一种方法,通过预先利用候选子序列的支持度来预计算分割规则的置信度。一旦分割点确定,所有具有不同前件和后件的规则将同时生成。RSC使用效用链表来加速候选序列的生成,并引入一种更严格的效用上界,称为序列的缩减剩余效用,以处理包含重复项目的序列。最后,所提出的RSC方法在多个数据集上进行了评估,结果表明其性能优于现有先进方法。

0
下载
关闭预览

相关内容

基于大语言模型的知识图谱逻辑规则挖掘框架及应用
专知会员服务
27+阅读 · 2025年5月22日
【经典书】图数据挖掘算法,安全性及应用,256页pdf
专知会员服务
91+阅读 · 2022年8月22日
时空数据挖掘:综述
专知会员服务
103+阅读 · 2022年6月30日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
时空数据挖掘:综述
专知
36+阅读 · 2022年6月30日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
40+阅读 · 2019年8月18日
清华178页深度报告:一文看懂AI数据挖掘
人工智能学家
10+阅读 · 2019年2月18日
如何系统地学习数据挖掘?
数据库开发
11+阅读 · 2017年10月22日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
13+阅读 · 2017年9月22日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2月6日
VIP会员
相关资讯
时空数据挖掘:综述
专知
36+阅读 · 2022年6月30日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
40+阅读 · 2019年8月18日
清华178页深度报告:一文看懂AI数据挖掘
人工智能学家
10+阅读 · 2019年2月18日
如何系统地学习数据挖掘?
数据库开发
11+阅读 · 2017年10月22日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
13+阅读 · 2017年9月22日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员