-
题名多最小效用阈值的频繁高效用项集快速挖掘算法
被引量:1
- 1
-
-
作者
王斌
吕瑞瑞
房新秀
马俊杰
-
机构
青岛理工大学信息与控制工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第12期3623-3627,共5页
-
基金
国家自然科学基金资助项目(61502262)
-
文摘
针对多最小效用阈值高效用项集挖掘算法(MHUI)中出现的重复计算、挖掘的结果项集不是频繁的问题,提出两个新的快速挖掘算法FMHUI和SFMHUI。FMHUI算法在计算项集的最小效用阈值时利用前一次计算结果,避免了项之间的重复比较;另外定义了项的扩展项的最小效用阈值表EMMU-table快速计算出扩展项的最小效用阈值,提高了运行效率。SFMHUI算法在FMHUI的基础上增加了支持度约束,使挖掘的项集既是高效用的也是频繁的。通过仿真实验验证了所提出算法的高效性和可行性。
-
关键词
频繁项集
高效用项集
支持度
多最小效用阈值
-
Keywords
frequent itemsets
high utility itemsets
support
multiple minimum utility thresholds
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名同类项的频繁高效用项集挖掘算法
被引量:2
- 2
-
-
作者
王斌
吕瑞瑞
周炜
-
机构
青岛理工大学信息与控制工程学院
-
出处
《计算机工程与设计》
北大核心
2019年第11期3142-3150,共9页
-
基金
国家自然科学基金项目(61502262)
-
文摘
现有高效用项集挖掘算法没有考虑分类挖掘的情况,针对这一不足,提出基于同类项的频繁高效用项集挖掘算法CMFHUI。把数据库中的所有项进行分类,给每一类赋予一个最小效用阈值,在这个基础上加上支持度约束,使得最终挖掘的项集既是频繁项集又是高效用项集。为进一步提高算法的挖掘效率,提出改进算法CMFHUI+。利用Mushroom和T10I4D100K数据集,结合4种不同的剪枝性质进行仿真实验,验证了这两种算法的有效性和可行性。
-
关键词
高效用项集
同类项
多最小效用阈值
支持度约束
频繁高效用项集挖掘
-
Keywords
high utility itemsets
similar items
multi-minimum utility thresholds
support constraint
frequent and high utility itemsets mining
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-