期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于FP-tree的最大频繁项集挖掘算法 被引量:4
1
作者 蒋翠清 胡俊妍 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第9期1387-1391,共5页
现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree... 现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree各分枝作为初始候选项集,并按维数和支持度递减排序,结合子集剪枝策略,自顶向下搜索挖掘最大频繁项集。实验结果表明,该算法在低支持度阈值下稠密数据集中挖掘长模式具有较好性能。 展开更多
关键词 数据挖掘 知识发现 最大频繁项集挖掘算法 模式发现
下载PDF
基于最大频繁项集挖掘的入侵检测研究 被引量:1
2
作者 黄松英 《绍兴文理学院学报》 2007年第10期32-36,共5页
通过建立基于最大频繁项集系统的正常行为模型与攻击模型;采用滑动窗口是否有不被正常行为模型覆盖的频繁模式产生来检测入侵,提高在短时间内对频繁发生的攻击类型的检测精度和响应速度.
关键词 最大频繁项集挖掘 滑动窗口 入侵检测
下载PDF
基于DiffNodeset结构的最大频繁项集挖掘算法 被引量:5
3
作者 尹远 张昌 +1 位作者 文凯 郑云俊 《计算机应用》 CSCD 北大核心 2018年第12期3438-3443,共6页
在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种... 在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果。 展开更多
关键词 最大频繁项集挖掘 关联规则 集合枚举树 优化剪枝 超集检测
下载PDF
基于B-list的最大频繁项集挖掘算法 被引量:4
4
作者 张昌 文凯 郑云俊 《计算机应用研究》 CSCD 北大核心 2019年第2期351-354,共4页
针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁项集,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小... 针对现有的最大频繁项集挖掘算法挖掘时间过长、内存消耗较大的问题,提出了一种基于构造链表B-list的最大频繁项集挖掘算法BMFI。该算法利用B-list数据结构来挖掘频繁项集,并采用全序搜索树作为搜索空间,然后采用父等价剪枝技术来缩小搜索空间;最后再结合基于MFI-tree的投影策略实现超集检测来提高算法的效率。实验结果表明,BMFI算法在时间效率与空间效率方面均优于FPMAX与MFIN算法。该算法在稠密数据集与稀疏数据集中进行最大频繁项集挖掘时均有良好的效果。 展开更多
关键词 最大频繁项集挖掘 深度优先搜索 剪枝技术 超集检测
下载PDF
基于基站数据挖掘个人驻留规律 被引量:3
5
作者 齐帅 单桂华 +1 位作者 田东 刘俊 《计算机系统应用》 2017年第9期176-180,共5页
个人移动通讯设备和位置感知设备的广泛应用,使得运营商积累了大量的用户位置数据.目前对位置数据的研究大都关注于活动轨迹的挖掘,而少量对于个人驻留规律的研究也只停留在识别出驻留点,却缺乏进一步的挖掘.本文基于基站采集的位置数... 个人移动通讯设备和位置感知设备的广泛应用,使得运营商积累了大量的用户位置数据.目前对位置数据的研究大都关注于活动轨迹的挖掘,而少量对于个人驻留规律的研究也只停留在识别出驻留点,却缺乏进一步的挖掘.本文基于基站采集的位置数据进行研究,依据基站数据的特点,提出了一种简单的识别驻留点的方法.继而提出了两种挖掘驻留规律的方法.最后使用真实数据对算法效果进行了验证. 展开更多
关键词 基站数据 活动停留 密度聚类 最大频繁项集挖掘算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部