期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于CFP-Tree的关联分类算法的改进
1
作者 杜永生 《电脑编程技巧与维护》 2011年第20期114-115,共2页
通过在FP-Tree中加入分类信息,并将特征结点与分类结点转换成按字典排序的项-序表,生成被约束子树,实现了对基于分类频繁模式树的关联分类数据挖掘算法的改进。
关键词 cfp-tree 关联规则分类 项-序表 被约束子树
下载PDF
客户导向目录分割问题的改进算法
2
作者 杜萍萍 陆可 吴金南 《计算机系统应用》 2017年第4期155-161,共7页
客户导向目录分割问题假设顾客至少对目录中一定数量的商品感兴趣,计算目录覆盖的顾客数量,据此评估目录分割结果.现有的分割算法为了保证目录尽可能多的覆盖顾客,而忽略了目录分割结果的效用.针对该问题,本文构建一种新的数据存储结构C... 客户导向目录分割问题假设顾客至少对目录中一定数量的商品感兴趣,计算目录覆盖的顾客数量,据此评估目录分割结果.现有的分割算法为了保证目录尽可能多的覆盖顾客,而忽略了目录分割结果的效用.针对该问题,本文构建一种新的数据存储结构CFP-Tree用于存储顾客交易数据,并提出一种新的算法Effective-Cover解决目录分割问题.该算法使用树深度遍历法选择目录产品.实验结果表明,该算法能够获得更好的目录分割结果. 展开更多
关键词 目录分割 cfp-tree Effective-Cover算法 客户 商业智能
下载PDF
一种高效的闭频繁模式挖掘算法 被引量:4
3
作者 谭军 卜英勇 杨勃 《计算机工程与应用》 CSCD 北大核心 2010年第6期130-132,共3页
为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,... 为了构造条件FP树,必须两次遍历FP树。提出一种FP阵列技术,直接从FP阵列得到频繁项的计数,从而省略了第一次遍历。为了检查闭频繁项集,采用FP树的一种变形结构,并将它与FP阵列结合起来,提出了一种高效的闭频繁模式挖掘算法。实验表明,该算法具有很好的性能。 展开更多
关键词 闭频繁模式增长算法 闭频繁模式树 FP阵列
下载PDF
一种挖掘频繁闭项集的深度优先算法 被引量:2
4
作者 张炘 廖频 郭波 《计算机应用》 CSCD 北大核心 2010年第3期806-809,共4页
频繁闭项集挖掘是许多数据挖掘应用中的重要问题。为减少候选项集数量和降低支持度计算的开销,提出一种新的深度优先搜索频繁闭项集(DFFCI)的算法。将改进的压缩频繁模式树(CFP-Tree)表示的数据集信息投影到划分矩阵,使用二进制向量逻... 频繁闭项集挖掘是许多数据挖掘应用中的重要问题。为减少候选项集数量和降低支持度计算的开销,提出一种新的深度优先搜索频繁闭项集(DFFCI)的算法。将改进的压缩频繁模式树(CFP-Tree)表示的数据集信息投影到划分矩阵,使用二进制向量逻辑运算计算支持度,简化了计算过程,减少了时间开销;采用基于支持度预计算技术的全局2-项剪枝和局部扩展剪枝,有效削减了搜索空间。实验结果表明该算法的性能优于其他主流深度优先算法。 展开更多
关键词 数据挖掘 频繁闭项集 压缩频繁模式树 划分矩阵
下载PDF
MapReduce编程模型下的约束频繁模式挖掘算法 被引量:2
5
作者 闫晓妩 张继福 +1 位作者 荀亚玲 赵旭俊 《小型微型计算机系统》 CSCD 北大核心 2015年第10期2257-2261,共5页
约束频繁模式是利用用户给定的约束条件,生成的一种频繁模式,具有针对性强、挖掘效率高等特点.随着数据量的增大,约束频繁模式生成过程存在着占用内存大和I/O代价高等问题,难以适用于海量高维数据集.采用MapReduce编程模型,给出一种约... 约束频繁模式是利用用户给定的约束条件,生成的一种频繁模式,具有针对性强、挖掘效率高等特点.随着数据量的增大,约束频繁模式生成过程存在着占用内存大和I/O代价高等问题,难以适用于海量高维数据集.采用MapReduce编程模型,给出一种约束频繁模式并行挖掘MCFP算法.该算法首先,采用三对Map和Reduce函数实现了将数据中事务映射为频繁项计数、构建约束频繁模式树和生成约束频繁模式,以及频繁模式聚合等主要步骤;其次,根据频繁项支持度,迁移数据记录,有效地实现了频繁模式生成过程中的负载均衡;最后,采用天体光谱数据,实验验证了该算法的有效性、可伸缩性和可扩展性. 展开更多
关键词 约束频繁模式 MapReduce编程模型 CFP—Tree 支持度 负载均衡
下载PDF
基于时序向量聚类的周期关联规则发现算法 被引量:2
6
作者 罗兰 曾斌 《计算机工程》 CAS CSCD 北大核心 2010年第19期110-112,共3页
针对目前周期关联规则难以划分时间区域和基础算法效率低等问题,提出一种基于周期关联规则的发现算法(CARDSATSV)。采用由项目支持度组成的时序向量作为时域数据特征点进行聚类,用DB Index准则控制聚类个数以达到最佳的聚类效果。给出CF... 针对目前周期关联规则难以划分时间区域和基础算法效率低等问题,提出一种基于周期关联规则的发现算法(CARDSATSV)。采用由项目支持度组成的时序向量作为时域数据特征点进行聚类,用DB Index准则控制聚类个数以达到最佳的聚类效果。给出CFP-tree算法来发现周期关联规则,利用基于条件FP-tree的周期性剪裁技术提高算法效率。实验表明,和目前周期关联规则发现算法相比,CARDSATSV可以发现更多有用的周期关联规则,时空效率有一定的提高。 展开更多
关键词 时序向量 强周期关联规则 差异序列法 周期FP—tree算法 差异序列聚类算法
下载PDF
一种约束最大频繁模式快速挖掘算法
7
作者 王闻 谢伙生 《微计算机信息》 2009年第15期143-145,共3页
为了避免用户通过"二次挖掘"才能得到有用的结果集,本文提出了一种新的约束最大频繁模式挖掘算法CSMFP-Max。CSMFP-Max算法基于CFP树和对称矩阵,在挖掘过程中采用了多种剪枝策略并结合了自顶向下和自底向上的双向搜索策略,大... 为了避免用户通过"二次挖掘"才能得到有用的结果集,本文提出了一种新的约束最大频繁模式挖掘算法CSMFP-Max。CSMFP-Max算法基于CFP树和对称矩阵,在挖掘过程中采用了多种剪枝策略并结合了自顶向下和自底向上的双向搜索策略,大大缩小了候选集规模,避免了不必要的条件CFP树的产生。理论分析和实验结果表明CSMFP-Max算法是一种高效的约束最大频繁模式挖掘算法,具有良好的时空效率。 展开更多
关键词 约束最大频繁模式 对称矩阵 CFP树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部