-
题名动态数据库中增量Top-k高效用模式挖掘算法
被引量:6
- 1
-
-
作者
吴倩
王林平
罗相洲
崔建群
-
机构
华中师范大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第5期1401-1405,共5页
-
基金
国家自然科学基金资助项目(61370108)
-
文摘
高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅针对静态数据库,但在实际应用中常常会遇到新事务的加入的情况。针对以上问题,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通过四个有效的策略,在增量数据的情况下,有效地挖掘用户所需数量的高效用模式。通过在不同数据集上的对比实验表明TOPK-HUP-INS算法在时空性能上表现优异。
-
关键词
增量挖掘
效用挖掘
top-k模式挖掘
动态数据库
-
Keywords
incremental mining
utility mining
top-k pattern mining
dynamic database
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种快速挖掘top-k高效用模式的算法
被引量:5
- 2
-
-
作者
吴倩
王林平
罗相洲
崔建群
王海
-
机构
华中师范大学计算机学院
华中师范大学科技处
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第11期3303-3307,共5页
-
基金
国家自然科学基金资助项目(61370108)
-
文摘
高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中会产生大量的候选模式,这是影响算法性能的主要因素;后者在挖掘的过程中不产生候选模式。为了更加高效地挖掘效用值最高的k个模式,一阶段算法TKHUP被提出,该算法在进行数据挖掘的过程中主要是通过四个有效策略来减少时间和空间的消耗。通过大量的实验数据表明,TKHUP在时间性能上优于其他top-k高效用模式挖掘算法。
-
关键词
高效用模式
top-k模式挖掘
效用挖掘
数据挖掘
-
Keywords
high utility pattern
top-k pattern mining
utility mining
data mining
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-