-
题名基于加权构造链表的频繁加权项集挖掘算法
被引量:1
- 1
-
-
作者
文凯
许萌萌
耿小海
-
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《计算机工程与设计》
北大核心
2020年第7期1920-1925,共6页
-
文摘
针对当前加权频繁项集挖掘算法建树复杂、挖掘效率较低的问题,提出基于加权构造链表(WB-list)的加权频繁项集挖掘BFWI算法。构造高度压缩信息的加权构造树(WB-tree),由B-list扩展结构WB-list得到节点信息,以集合枚举树作为搜索空间,结合包含索引减少项集连接次数并利用超集等价性质加快加权频繁项集的产生,提高算法的效率。实验结果表明,BFWI算法在时间和空间效率性能上优于IWS和WIT-FWIs-Diff算法,无论是处理稀疏数据还是稠密数据均得到良好效果。
-
关键词
加权构造链表
频繁加权项集挖掘
超集等价
包含索引
数据挖掘
-
Keywords
WB-list
frequent weighted itemsets mining
superset equivalence
subsume index
data mining
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于B-list的快速频繁模式挖掘算法
被引量:6
- 2
-
-
作者
李校林
杜托
刘彪
-
机构
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《计算机应用》
CSCD
北大核心
2017年第8期2357-2361,2367,共6页
-
基金
重庆市研究生科研创新基金资助项目(CYS15166)~~
-
文摘
针对现有的频繁模式挖掘算法存在建树复杂、挖掘效率低等问题,提出一种基于构造链表(B-list)的频繁模式挖掘(BLFPM)算法。BLFPM使用一种新的数据结构B-list表示频繁项集,通过连接两个k-1-频繁项集的B-list可以快速得到k-项集的支持度,避免了多次扫描数据库;针对连接两个B-list时间复杂度高的问题,给出了一种线性时间复杂度的连接方法,提高了BLFPM的时间效率;同时,BLFPM采用集合枚举树代表搜索空间,并使用子集非频繁剪枝策略,减小了频繁模式挖掘的搜索空间,提高了算法的执行速度。实验结果表明,与NSFI算法和prepost算法相比,BLFPM的时间效率提高约12%到29%,空间效率提高约10%到24%,对稀疏数据库或稠密数据库进行频繁模式挖掘均可以得到良好的效果。
-
关键词
数据挖掘
模式挖掘
频繁项集
遍历构造树
构造链表
-
Keywords
data mining
pattern mining
frequent itemset
Traversal when Building tree(TB-tree)
Building list(B-list)
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-