期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于MapReduce的DHP算法并行化研究 被引量:1
1
作者 周国军 吴庆军 《计算机应用与软件》 CSCD 2016年第6期47-50,91,共5页
针对DHP(direct hashing and pruning)算法对大数据挖掘关联规则存在执行时间过长、效率不高的问题,对DHP算法的并行化策略进行了研究。根据云计算平台Hadoop的MapReduce并行编程模型,设计了一种并行DHP算法,给出了算法的总体流程和Map... 针对DHP(direct hashing and pruning)算法对大数据挖掘关联规则存在执行时间过长、效率不高的问题,对DHP算法的并行化策略进行了研究。根据云计算平台Hadoop的MapReduce并行编程模型,设计了一种并行DHP算法,给出了算法的总体流程和Map函数、Reduce函数的算法描述。与DHP算法相比,并行算法利用了Hadoop集群强大的计算能力,提高了从大数据集中挖掘关联规则的效率。通过实例分析了并行DHP算法的执行过程,在多个数据集上进行了实验。实验结果表明:并行DHP算法对大数据具有较好的加速比和可扩展性。 展开更多
关键词 MAPREDUCE HADOOP dhp算法 关联规则
下载PDF
一种基于DHP的动态链地址关联规则挖掘算法 被引量:3
2
作者 吴恒 吴根秀 +1 位作者 毛临川 黄梅 《江西师范大学学报(自然科学版)》 CAS 北大核心 2015年第5期463-468,共6页
采用动态链地址法建立Hk表,提出DLDHP算法,克服DHP算法不能给Ck中的每个项集单独计数的缺点,在增加Hk表的空间时也会删除链表中的结点空间,从而Hk表不会占用较大的内存,最终直接由Hk表得到频繁k-项集的集合Lk,不用再次扫描数据库.实验... 采用动态链地址法建立Hk表,提出DLDHP算法,克服DHP算法不能给Ck中的每个项集单独计数的缺点,在增加Hk表的空间时也会删除链表中的结点空间,从而Hk表不会占用较大的内存,最终直接由Hk表得到频繁k-项集的集合Lk,不用再次扫描数据库.实验结果表明:DLDHP算法是有效可行的. 展开更多
关键词 关联规则 dhp算法 DLdhp算法 HASH表 动态链地址
下载PDF
基于Hash表的关联规则挖掘算法的改进 被引量:10
3
作者 卢云彬 曹汉强 《计算机技术与发展》 2007年第6期12-14,共3页
经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过... 经典的Apriori算法在大项目集的挖掘过程中因为重复搜索导致效率低下。提出一种改进的Hash表结构应用于DHP算法中的项目集存放,定义新的Hash函数确定项目集的存放地址,并基于新的Hash表结构,以并行挖掘的方式优化关联规则算法的剪枝过程。实验结果表明,与Apriori算法相比,文中的方法可以更好地节省存储空间,提高挖掘效率。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 dhp算法 HASH表
下载PDF
动车组运维效率关联规则挖掘优化算法 被引量:3
4
作者 张春 周静 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1958-1965,共8页
随着动车组运营时间和运营里程的增长,动车组运维系统积累了大量的数据.利用高效的关联规则挖掘算法从动车组运维数据中快速发现有用的信息,对于提高动车组关键部件运维效率具有重要意义.针对动车组运维数据的数据量巨大、价值密度低的... 随着动车组运营时间和运营里程的增长,动车组运维系统积累了大量的数据.利用高效的关联规则挖掘算法从动车组运维数据中快速发现有用的信息,对于提高动车组关键部件运维效率具有重要意义.针对动车组运维数据的数据量巨大、价值密度低的特点,设计一种基于近似最小完美Hash函数的AMPHP(approximate minimum perfect hashing and pruning)算法,相较于传统的直接Hash和修剪(direct hashing and pruning,DHP)算法,它可以过滤掉所有的非频繁项集,无需额外的数据库扫描.为了突破单机算法的性能限制,借鉴SON算法思想对AMPHP算法进行并行化改进,提出AMPHPSON算法,进一步提高算法性能.使用实际的动车组牵引电机运维数据进行测试分析,实验结果表明,AMPHP-SON算法具有很好的时间性能,且挖掘出的规则可以有效地指导动车组修程修制优化,从而达到提高动车组运维效率的目的. 展开更多
关键词 关联规则挖掘 dhp算法 近似最小完美Hash函数 SON算法 动车组
下载PDF
一种基于散列技术和事务压缩的关联规则挖掘算法 被引量:11
5
作者 黄传明 《计算机工程》 CAS CSCD 北大核心 2003年第22期117-118,共2页
文章以DHP算法为基础,在产生频繁项集时考虑了一种可以直接删除非频繁项集的散列函数,并压缩了文中提出的几种冗余事务,提出了FDHP算法,其性能优于传统的Apriori算法和DHP算法。
关键词 关联规则 数据挖掘 频繁项集 dhp算法
下载PDF
一种新的关联规则发现算法及应用研究 被引量:3
6
作者 毛秉毅 《计算机工程与应用》 CSCD 北大核心 2002年第22期201-202,共2页
文章对关联规则发现中应用较多的Apriori算法和DHP算法进行了分析,提出了一种新的关联规则发现算法。为了计算项目集的支持度,提出了数据库特征矩阵和特征矢量的概念。该算法通过对特征矢量求内积得出项目集(item-set)的支持度,只需遍... 文章对关联规则发现中应用较多的Apriori算法和DHP算法进行了分析,提出了一种新的关联规则发现算法。为了计算项目集的支持度,提出了数据库特征矩阵和特征矢量的概念。该算法通过对特征矢量求内积得出项目集(item-set)的支持度,只需遍历数据库一次,大大减少了对数据库的操作,提高了算法的效率。算法分析和实例证明验证了算法的快速性和高效性。 展开更多
关键词 数据采掘 知识发现 机器学习 关联规则 APRIORI算法 dhp算法 数据库
下载PDF
动车组故障关联规则挖掘优化算法研究与应用 被引量:4
7
作者 张春 周静 《计算机与现代化》 2017年第9期74-78,共5页
动车组作为一种高速、安全的铁路客运设备,在运营过程中难免发生故障。针对动车组故障数据量巨大、价值密度低的特点,设计一种基于DHP算法的关联规则挖掘优化算法。采用再哈希技术解决DHP算法中的哈希冲突,提出RDHP算法。本算法可以百... 动车组作为一种高速、安全的铁路客运设备,在运营过程中难免发生故障。针对动车组故障数据量巨大、价值密度低的特点,设计一种基于DHP算法的关联规则挖掘优化算法。采用再哈希技术解决DHP算法中的哈希冲突,提出RDHP算法。本算法可以百分百地过滤非频繁项集,无需额外的数据库扫描。为了进一步提高算法的效率,基于MapReduce编程思想,提出MR-RDHP算法,把海量动车组故障数据关联规则挖掘任务分解到集群中的多台计算机上并行处理。实验表明,MR-RDHP算法具有很好的时间性能,且挖掘出的规则可以有效指导动车组运行维修。 展开更多
关键词 动车组 关联规则挖掘 dhp算法 再哈希 MAPREDUCE
下载PDF
基于数据挖掘的IDS日志算法的改进 被引量:1
8
作者 张砚雪 邓文新 《齐齐哈尔大学学报(自然科学版)》 2008年第6期33-36,共4页
提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法。基于Apriori的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整。该算法提高... 提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法。基于Apriori的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整。该算法提高了挖掘效率,通过抑制哈希地址冲突提高了算法的稳定性和可用性。 展开更多
关键词 数据挖掘 入侵检测 关联规则 最小完美哈希函数 dhp算法
下载PDF
相关规则的并行算法
9
作者 臧国心 王莲芳 张兆功 《哈尔滨理工大学学报》 CAS 2003年第1期114-117,119,共5页
给出了一个相关规则新的并行算法,利用DHP算法中的HASH技术削减候选集,同时对DHP算法进行优化改进以利于并行算法的实现.在并行化设计中充分利用DMA及OA算法的鹊巢原理及分割思想,针对DMA及OA算法的优越性依赖于数据的特性,提出了动态... 给出了一个相关规则新的并行算法,利用DHP算法中的HASH技术削减候选集,同时对DHP算法进行优化改进以利于并行算法的实现.在并行化设计中充分利用DMA及OA算法的鹊巢原理及分割思想,针对DMA及OA算法的优越性依赖于数据的特性,提出了动态调整策略,根据数据偏斜情况决定是否采用削剪策略,从而解决数据偏斜问题. 展开更多
关键词 并行算法 相关规则 大项集 候选集 数据分割 数据偏斜 HASH树 dhp算法 数据挖掘 数据库
下载PDF
Apriori算法的改进算法设计与分析
10
作者 陈自力 《闽江学院学报》 2011年第2期38-40,共3页
提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明... 提出采用事务压缩和哈希技术相结合方式的改进算法.该算法通过备份数据库Dk生成候选项目集Ck,在生成Ck的同时计算支持度.针对生成频繁2-项目集L2的瓶颈,在生成L2的时候使用DHP算法.从时间复杂度上对Apriori算法和改进算法进行比较,说明改进算法在效率上优于Apriori算法. 展开更多
关键词 关联规则 APRIORI dhp算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部