-
题名基于邻接比特压缩表的频繁闭项集挖掘算法
- 1
-
-
作者
杨博超
吴美璇
胡浩
朱敏
-
机构
四川大学计算机学院
-
出处
《计算机仿真》
2024年第1期415-424,共10页
-
文摘
频繁闭项集(Frequent Closed Items,FCI)是一种表示事物之间关联关系的有效方式,它能克服频繁项集(Frequent Items,FI)信息冗余的缺点。FCI挖掘算法研究旨在以更优的时空效率,在原始数据集中找到所有的FCI。相关研究成果重在关注时间效率的提升,但空间效率欠佳。提出一种高空间压缩率数据结构——邻接比特压缩表(Compressed Adjacency Byte table,Cab-table),将项集与交易集压缩到剔除全部0之后的比特表中,使空间高度压缩。基于此数据结构的频繁闭项集挖掘算法(Cab-Miner),采用运算栈与检索栈来实现非递归方式的频繁闭项集挖掘,相较于之前普遍采用递归方式的算法,在理论上可使空间占用率由O(L*N+M)降为O(3N)。基于公开数据集与真实数据集的实验表明,上述算法在原始数据集压缩,以及运算内存消耗上,都有较优的表现,尤其在处理真实数据集时,空间表现极佳。另外在某些属性的数据集上也表现出优越的时间效率。
-
关键词
频繁闭项集
邻接比特压缩表
非递归算法
高空间效率
-
Keywords
Frequent closed items
Compressed adjacency byte table
Non-recursive algorithm
High spatial efficiency
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于外存计算几何原理的空间数据结构及算法研究
- 2
-
-
作者
谈晓军
-
出处
《测绘信息与工程》
2003年第5期42-43,共2页
-
-
关键词
空间数据结构
外存计算几何原理
高效率空间存取
I/O模型
海量空间数据
算法
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
P2
[天文地球—测绘科学与技术]
-