期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
一种基于前缀树的频繁模式挖掘算法 被引量:4
1
作者 朱光喜 吴伟民 +1 位作者 阮幼林 刘干 《计算机科学》 CSCD 北大核心 2005年第4期34-36,共3页
挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出... 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于FP-Tree的挖掘算法由于无须生成候进项集效率明显高于Apriori类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高。因此,本文提出一种基于前缀树的新算法。该算法通过引入一种新结构—前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点键直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。 展开更多
关键词 频繁模式 挖掘算法 前缀 关键步骤 数据挖掘 候选项集 动态维护 挖掘过程 时空效率 相关信息 深度优先 数据结构 新算法 中节点 递归
下载PDF
基于FP-Tree快速挖掘频繁项集 被引量:2
2
作者 姜晗 范建淑 贾泂 《计算机应用与软件》 CSCD 2010年第10期36-37,130,共3页
发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前... 发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前缀,组合生成频繁项集,无需递归构造每个频繁项的条件模式树,节约了时间和内存空间,算法性能在一定程度上得到了提高。 展开更多
关键词 频繁项集 FP-TREE 频繁子孙集 频繁前缀 关联规则
下载PDF
分布环境中的并行频繁模式挖掘算法 被引量:3
3
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第25期1-3,22,共4页
频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP-tree。由于两者的固有局限性,而且在计算过程中需要多次同步,因而具有较低的性能。文章提出了一种基于分布数据库的并行挖掘算法... 频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP-tree。由于两者的固有局限性,而且在计算过程中需要多次同步,因而具有较低的性能。文章提出了一种基于分布数据库的并行挖掘算法。该算法尽可能地让每个处理器独立地挖掘,每个处理器基于前缀树采用深度优先搜索的策略挖掘局部频繁模式集,并通过相关性质尽量减少候选全局频繁模式的规模,减少网络的通信量和同步次数以提高挖掘效率。 展开更多
关键词 频繁模式 并行算法 前缀树 全局频繁模式
下载PDF
支持告警序列差分隐私保护的网络入侵关联方法 被引量:8
4
作者 李洪成 吴晓平 《计算机工程》 CAS CSCD 北大核心 2018年第5期128-132,共5页
在网络入侵情报协同分析过程中,告警数据的共享使被攻击者面临隐私泄露的风险。针对现有告警信息隐私保护方法无法应对背景知识下恶意分析的问题,提出一种新的网络告警关联分析方法。以原始告警序列数据集作为输入,利用Laplace机制构建... 在网络入侵情报协同分析过程中,告警数据的共享使被攻击者面临隐私泄露的风险。针对现有告警信息隐私保护方法无法应对背景知识下恶意分析的问题,提出一种新的网络告警关联分析方法。以原始告警序列数据集作为输入,利用Laplace机制构建支持差分隐私保护的噪声告警序列前缀树。在此基础上,通过遍历噪声前缀树生成泛化告警序列数据集,使用频繁序列挖掘算法实现告警关联。从理论角度证明该方法支持ε-差分隐私保护,并在典型多步攻击场景LLDoS1.0 inside数据集上进行验证。实验结果表明,该方法在保护告警序列隐私的同时,能够提高告警关联准确性。 展开更多
关键词 入侵检测 告警关联 差分隐私保护 频繁序列挖掘 前缀树
下载PDF
一种改进的LIPI数据挖掘算法的仿真分析 被引量:2
5
作者 蔡坤 杨扬 《计算机仿真》 CSCD 北大核心 2014年第8期268-272,共5页
在传统LIPI数据挖掘算法中,需要反复扫描投影数据库寻找局部频繁项并重复构造大量重复投影,造成数据挖掘耗时,效率低下的不足。为了提高算法的计算速度,提出改进的LIPI数据挖掘算法。算法借助连接2-序列位置信息表(LIPI)找到序列模式的... 在传统LIPI数据挖掘算法中,需要反复扫描投影数据库寻找局部频繁项并重复构造大量重复投影,造成数据挖掘耗时,效率低下的不足。为了提高算法的计算速度,提出改进的LIPI数据挖掘算法。算法借助连接2-序列位置信息表(LIPI)找到序列模式的下一项,完成K-1序列位置信息与2-序列位置信息的连接,实现序列模式放缩式增长,得出K-序列与K-序列相应的位置信息数据,避免对投影数据库反复扫描;引入了BIDE算法的前后向剪枝策略,检查相同末项序列位置信息表进行前向剪枝,消除大量重复投影的构建,提高挖掘算法的效率。实验结果表明,改进后的算法能快速的寻找到局部频繁项,有效提高了数据挖掘的效率。 展开更多
关键词 放缩式增长 序列模式挖掘 位置信息 投影数据库 频繁前缀
下载PDF
最大频繁模式的快速挖掘与更新算法 被引量:3
6
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第24期23-26,143,共5页
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文... 挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文章提出了一种最大频繁模式的快速挖掘算法DMFP及更新算法IUMFP。DMFP算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。算法IUMFP充分利用以前的挖掘结果减少发现更新数据中新的最大频繁模式的代价。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
下载PDF
一种基于前缀广义表的关联规则增量式更新算法 被引量:23
7
作者 杨明 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1318-1325,共8页
关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG ... 关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG List,并提出了基于PG List的关联规则挖掘 (MARBPGL)与增量式更新算法(IUABPGL) .算法MARBPGL仅须扫描数据库两遍 ,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍 ,扫描新增数据库两遍 ,且两个算法均无须生成候选项目集 ,避免了产生“知识的组合爆炸” ,提高了挖掘和维护的效率 .理论分析和实验结果表明该文提出的算法是有效可行的 . 展开更多
关键词 关联规则 增量式更新算法 前缀广义表 数据挖掘 频繁模式树 数据库 APRIORI算法
下载PDF
一种最大频繁模式的快速挖掘算法 被引量:3
8
作者 王运鹏 胡修林 阮幼林 《计算机应用研究》 CSCD 北大核心 2006年第10期86-88,共3页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
下载PDF
基于前缀树的高效频繁项集挖掘算法 被引量:5
9
作者 才科扎西 黄景廉 《计算机工程》 CAS CSCD 北大核心 2010年第4期42-44,共3页
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引编号,保证前缀树中事务顺序的一致性,根据索引编号等信息创建紧凑的前缀树,采用自底向上的挖掘与投影... 针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引编号,保证前缀树中事务顺序的一致性,根据索引编号等信息创建紧凑的前缀树,采用自底向上的挖掘与投影的方式挖掘出频繁项集。实验结果表明,该算法挖掘效率高、占用空间少。 展开更多
关键词 频繁项集 数据挖掘 前缀树
下载PDF
基于相邻模式段组合的生物序列模式挖掘算法 被引量:1
10
作者 王淼 尚学群 薛贺 《计算机工程与应用》 CSCD 北大核心 2008年第2期190-193,共4页
传统的序列模式挖掘算法应用在生物序列上有其局限性,根据生物序列的特点,提出了基于相邻频繁模式段的模式挖掘算法-JPS。首先产生相邻频繁模式段,然后对这些频繁模式段进行组合,产生新的频繁模式。通过实验分析,该方法在相似性很强的... 传统的序列模式挖掘算法应用在生物序列上有其局限性,根据生物序列的特点,提出了基于相邻频繁模式段的模式挖掘算法-JPS。首先产生相邻频繁模式段,然后对这些频繁模式段进行组合,产生新的频繁模式。通过实验分析,该方法在相似性很强的序列数据库中比传统的PrefixSpan算法效率高。通过对真实的蛋白质序列家族库的处理,证明该算法能有效处理生物序列数据。 展开更多
关键词 前缀 频繁集 相邻频繁模式段 模式组合
下载PDF
基于覆盖模式的频繁子树挖掘方法 被引量:2
11
作者 夏英 李洪旭 《计算机应用》 CSCD 北大核心 2017年第9期2439-2442,2483,共5页
无序树常用于半结构化数据建模,对其进行频繁子树挖掘有利于发现隐藏的知识。传统的频繁子树挖掘方法常常输出大规模且带有冗余信息的频繁子树,这样的输出结果会降低后续操作的效率。针对传统方法的不足,提出了一种用于挖掘覆盖模式(MC... 无序树常用于半结构化数据建模,对其进行频繁子树挖掘有利于发现隐藏的知识。传统的频繁子树挖掘方法常常输出大规模且带有冗余信息的频繁子树,这样的输出结果会降低后续操作的效率。针对传统方法的不足,提出了一种用于挖掘覆盖模式(MCRP)算法。首先,采用宽度孩子数编码对树进行编码;然后,通过基于最大前缀编码序列的边扩展方式生成所有的候选子树;最后,在频繁子树集和δ'-覆盖概念的基础上输出覆盖模式集。与传统的挖掘频繁闭树模式和极大频繁树模式的算法相比,该算法能够在保留所有频繁子树信息的情况下输出更少的频繁子树,并且将处理效率提高15%到25%。实验结果表明,所提算法能有效减小输出频繁子树的规模,减少冗余信息,在实际操作中具有较高的可行性。 展开更多
关键词 无序树 频繁子树 最大前缀编码 边扩展 覆盖模式
下载PDF
基于FP-Tree的共享前缀频繁项集挖掘算法 被引量:4
12
作者 胡中栋 罗会兰 曾珽 《计算机工程与应用》 CSCD 北大核心 2009年第27期137-139,共3页
在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,... 在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,无需递归构造条件模式树,算法性能有明显的提高。 展开更多
关键词 频繁项集 高频繁模式树(FP-Tree) 共享前缀 基于FP-tree的共享前缀频繁项集挖掘算法(FP-SPMA)
下载PDF
大数据环境下基于前缀树的频繁项集挖掘 被引量:1
13
作者 黄彩娟 刘卓华 +1 位作者 所辉 杨滨 《控制工程》 CSCD 北大核心 2019年第11期2136-2140,共5页
针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修... 针对大数据环境下频繁项查找效率低和可扩展性问题,提出了一种基于MapReduce框架运行的新分布式FIM算法。首先,使用前缀序列树来构建候选序列子集,避免了昂贵的扫描过程。接着,使用宽幅支持度的方法产生频繁项集,每个MapReduce迭代将修剪掉非频繁项集,显著地压缩内存消耗,以及每一个MapReduce作业的迭代时间。最后,在不同事务规模和支持度下,与不同算法进行实验对比。实验结果表明,提出的序列增长算法获得了良好的效率和可扩展性,特别是在处理大数据集和长项集方面。 展开更多
关键词 频繁项集挖掘 MAPREDUCE 前缀序列树 模糊支持度 大数据
下载PDF
最大频繁模式的挖掘算法 被引量:6
14
作者 徐欣 阮幼林 《舰船电子工程》 2009年第3期102-106,共5页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,既不需要生成候选也不需要创建条件模式树,提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-Tree前缀树
下载PDF
差分隐私下的一种频繁序列模式挖掘方法 被引量:7
15
作者 卢国庆 张啸剑 +2 位作者 丁丽萍 李彦峰 廖鑫 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2789-2801,共13页
频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私... 频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential privacy,DP)作为一种新出现的隐私保护技术,定义了一个相当严格的攻击模型,通过添加噪音使数据失真达到隐私保护的目的.由于序列数据内在序列性和高维度的特点,给差分隐私应用于频繁序列模式挖掘带来了挑战.对此提出了一种基于交互式差分隐私保护框架的频繁序列模式挖掘算法Diff-FSPM(differential-privacy frequent sequential pattern mining).该算法利用指数机制获取最优序列长度,并采用一种维规约策略获得原始序列数据集的规约表示,有效降低序列维度的影响;应用前缀树压缩频繁序列模式,利用拉普拉斯机制产生的噪音扰动频繁模式的真实支持度计数,同时采用闭频繁序列模式和Markov假设,有效分配隐私预算,并利用一致性约束后置处理,增强输出模式的可用性.理论角度证明算法满足ε-差分隐私,实验结果验证算法具有较好的可用性. 展开更多
关键词 频繁序列模式 数据挖掘 差分隐私 隐私保护 前缀树
下载PDF
一种优化FP-growth的支持度相同项的排序算法 被引量:1
16
作者 武丽芬 《网络新媒体技术》 2012年第4期53-56,共4页
Han等人提出了频繁模式增长FP-growth算法,该算法在第一次扫描数据库后,得到频繁项集合和每个频繁项的支持度,并按支持度降序排列,但没有对支持度相同项的排列做进一步说明。本文依据"越是频繁出现,越可能被共享"的建树原则,... Han等人提出了频繁模式增长FP-growth算法,该算法在第一次扫描数据库后,得到频繁项集合和每个频繁项的支持度,并按支持度降序排列,但没有对支持度相同项的排列做进一步说明。本文依据"越是频繁出现,越可能被共享"的建树原则,提出了通过比较该项与前后项项集的支持度,较大者先排列的方法,使后续构建的FP-tree比任意排序构建的FP-tree更优。 展开更多
关键词 FP—growth算法 频繁项 项前缀子树 最小支持度
下载PDF
一种基于前缀节点的频繁子图挖掘算法
17
作者 李海波 王元珍 《计算机应用研究》 CSCD 北大核心 2010年第7期2476-2478,2482,共4页
基于频繁子树挖掘算法中的前缀节点思想,将模式图分为图核—分支—连接向量三个部分,提出了CBE算法。对在分支上扩展得到的候选模式图,CBE算法能够在常数时间内完成规范化判定。通过实验证明CBE算法的子图挖掘效率有显著提高。
关键词 数据挖掘 频繁子图 同构类 规范化形式 前缀节点
下载PDF
基于前缀共享树的频繁情节挖掘算法
18
作者 丁勇 朱辉生 高广银 《科学技术与工程》 北大核心 2014年第28期231-234,246,共5页
经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁... 经典的频繁情节挖掘算法NONEPI及其改进算法NONEPI+存在时空复杂度高、"重复计算"等问题,基于最小且非重叠发生的支持度定义,提出一个基于前缀共享树的频繁情节挖掘算法PST_NONEPI,该算法采用深度优先搜索策略,将发现的频繁情节压缩到前缀共享树中,通过动态维护前缀共享树来发现所有的频繁情节。该算法只需扫描事件序列一次,大大提高了频繁情节挖掘的效率。实验证明,PST_NONEPI算法能有效地挖掘频繁情节。 展开更多
关键词 事件序列 频繁情节 最小且非重叠发生 前缀共享树
下载PDF
基于前缀投影技术的大规模轨迹预测模型 被引量:6
19
作者 乔少杰 韩楠 +4 位作者 李天瑞 李荣华 李斌勇 王晓腾 Louis Alberto GUTIERREZ 《软件学报》 EI CSCD 北大核心 2017年第11期3043-3057,共15页
智能手机、车载GPS终端、可穿戴设备产生了海量的轨迹数据,这些数据不仅描述了移动对象的历史轨迹,而且精确地反映出移动对象的运动特点.已有轨迹预测方法的不足在于:不能同时兼具预测的准确性和时效性,有效的轨迹预测受限于路网等局部... 智能手机、车载GPS终端、可穿戴设备产生了海量的轨迹数据,这些数据不仅描述了移动对象的历史轨迹,而且精确地反映出移动对象的运动特点.已有轨迹预测方法的不足在于:不能同时兼具预测的准确性和时效性,有效的轨迹预测受限于路网等局部空间范围,无法处理复杂、大规模位置数据.为了解决上述问题,针对海量移动对象轨迹数据,结合频繁序列模式发现的思想,提出了基于前缀投影技术的轨迹预测模型PPTP(prefix projection based trajectory prediction model),包含两个关键步骤:(1)挖掘频繁轨迹模式,构造投影数据库并递归挖掘频繁前序轨迹模式;(2)轨迹匹配,以不同频繁序列模式作为前缀增量式扩展生成频繁后序轨迹,将大于最小支持度阈值的最长连续轨迹作为结果输出.算法的优势在于:可以通过较短的频繁序列模式,增量式生成长轨迹模式;不会产生无用的候选轨迹,弥补频繁模式挖掘计算代价较高的不足.利用真实大规模轨迹数据进行多角度实验,表明PPTP轨迹预测算法具有较高的预测准确性,相对于1阶马尔可夫链预测算法,其平均预测准确率可以提升39.8%.基于所提出的轨迹预测模型,开发了一个通用的轨迹预测系统,能够可视化输出完整的轨迹路线,为用户路径规划提供辅助决策支持. 展开更多
关键词 轨迹预测 前缀投影 频繁序列模式 轨迹匹配 马尔可夫链
下载PDF
一种改进的PrefixSpan应用层特征自动提取算法
20
作者 彭大芹 杨彩敏 黄德玲 《信息通信》 2017年第1期18-20,共3页
针对基于DPI的网络流量识别中的指纹特征提取困难问题,文章提出了改进的基于Prefix Span算法的连续序列模式挖掘算法来提取应用层指纹特征。首先,改进的算法在挖掘应用层特征时加入了属性约束。其次,在进行频繁序列投影前,又引入剪枝策... 针对基于DPI的网络流量识别中的指纹特征提取困难问题,文章提出了改进的基于Prefix Span算法的连续序列模式挖掘算法来提取应用层指纹特征。首先,改进的算法在挖掘应用层特征时加入了属性约束。其次,在进行频繁序列投影前,又引入剪枝策略。最后,通过实验表明该改进的算法在挖掘应用层指纹特征方面大大提高了效率,提取出来的特征可有效地应用于网络流量识别技术中。 展开更多
关键词 网络流量识别 数据挖掘 指纹特征 PREFIX Span算法 频繁序列
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部