期刊文献+
共找到321篇文章
< 1 2 17 >
每页显示 20 50 100
基于FP-tree的新能源汽车产业国际竞争力影响因素关联挖掘算法
1
作者 邱璜 《湖北理工学院学报》 2024年第4期54-57,80,共5页
为充分挖掘新能源汽车产业国际竞争力影响因素、探究价值增长点,提出了基于FP-tree的影响因素关联挖掘算法。通过构建国际竞争力各指标影响因素的关联规则,分析任意事务数据集中的关联数据,利用最小支持度参数minsup按照从上到下的方式... 为充分挖掘新能源汽车产业国际竞争力影响因素、探究价值增长点,提出了基于FP-tree的影响因素关联挖掘算法。通过构建国际竞争力各指标影响因素的关联规则,分析任意事务数据集中的关联数据,利用最小支持度参数minsup按照从上到下的方式搜索,确定最长的频繁项目集,采用FP-tree关联频繁项目集,设定分支关联性挖掘标准,实现了新能源汽车产业国际竞争力影响因素的挖掘。测试结果表明,设计算法的最小支持度和数据关联挖掘时间较短,置信度分析具有较高的稳定性。 展开更多
关键词 FP-TREE 新能源汽车产业 国际竞争力 影响因素 关联规则
下载PDF
基于关联分析FP-Tree算法的企业风险信息数据在线挖掘方法
2
作者 庞泰 翁巍 +2 位作者 孟灿 赵蕾 牛红伟 《无线互联科技》 2024年第11期75-77,共3页
现阶段的数据挖掘方法缺少对数据关联分析的过程,挖掘效果较差,故文章提出基于关联分析频繁模式树(FrequentPattern Tree, FP-Tree)算法的企业风险信息数据在线挖掘方法。选取与企业风险相关的信息指标,收集有关数据并进行预处理操作后... 现阶段的数据挖掘方法缺少对数据关联分析的过程,挖掘效果较差,故文章提出基于关联分析频繁模式树(FrequentPattern Tree, FP-Tree)算法的企业风险信息数据在线挖掘方法。选取与企业风险相关的信息指标,收集有关数据并进行预处理操作后,设计一种考虑关联分析的FP-Tree算法,生成FP-Tree节点的条件模式树挖掘频繁项集,计算满足最小置信度的频繁项集,实现企业风险信息数据在线挖掘。实验结果表明,所用方法挖掘量和挖掘效率较高。 展开更多
关键词 关联分析FP-Tree算法 企业风险信息数据 在线挖掘方法 数据挖掘
下载PDF
基于FP-tree和MapReduce的集合相似度自连接算法 被引量:1
3
作者 冯禹洪 吴坤汉 +4 位作者 黄志鸿 冯洋洲 陈欢欢 白鉴聪 明仲 《计算机研究与发展》 EI CSCD 北大核心 2023年第12期2890-2906,共17页
利用集合相似度自连接算法找出一个集合集中所有相似度大于给定阈值的集合对有着广泛的应用.基于过滤-验证框架和并行分布式计算框架MapReduce的集合相似度连接是近年来的研究热点.但现有算法在阈值低时产生较大规模的候选集,导致性能... 利用集合相似度自连接算法找出一个集合集中所有相似度大于给定阈值的集合对有着广泛的应用.基于过滤-验证框架和并行分布式计算框架MapReduce的集合相似度连接是近年来的研究热点.但现有算法在阈值低时产生较大规模的候选集,导致性能不理想.针对这一问题,提出采用频繁模式树FP-tree及其派生结构FP-tree*将数据压缩在内存中计算集合相似度自连接以减小候选集规模.首先设计并讨论基于现有FP-tree*的集合相似度连接计算及其优缺点,提出遍历效率更高的线性频繁模式树结构模型TELP-tree及基于它的算法TELP-SJ(TELP-tree self join),其包括分别面向构建树和遍历树的2阶段过滤算法,这些算法可以减小树规模和减少树遍历.然后,设计基于MapReduce的并行分布式算法FastTELP-SJ.最后,基于4组真实应用数据集进行3组性能比较实验.实验结果表明FastTELP-SJ算法面向高维大规模集合相似度自连接计算时,包括执行时间、内存占用率、磁盘使用量和可扩展性的运行效率最好. 展开更多
关键词 相似度连接 FP树 MAPREDUCE框架 Jaccard函数 集合
下载PDF
MAXFP-Miner:利用FP-tree快速挖掘最大频繁项集 被引量:4
4
作者 陈慧萍 王建东 叶飞跃 《控制与决策》 EI CSCD 北大核心 2005年第8期887-891,共5页
为提高频繁项集的挖掘效率,提出了最大频繁项集树的概念和基于FP-tree的最大频繁项集挖掘算法MAXFP-Miner.首先建立了FP-tree,在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法... 为提高频繁项集的挖掘效率,提出了最大频繁项集树的概念和基于FP-tree的最大频繁项集挖掘算法MAXFP-Miner.首先建立了FP-tree,在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率.算法分析和实验表明,该算法特别适合于挖掘稠密型及具有长频繁项集的数据集. 展开更多
关键词 数据挖掘 FP-TREE 频繁项集 MAXFP-tree
下载PDF
基于FP-Tree的共享前缀频繁项集挖掘算法 被引量:4
5
作者 胡中栋 罗会兰 曾珽 《计算机工程与应用》 CSCD 北大核心 2009年第27期137-139,共3页
在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,... 在数据挖掘中发现关联规则是一个基本问题,而发现频繁项集是关联规则挖掘中最基本、最重要的问题。提出了基于FP-Tree的共享前缀频繁项集挖掘算法-FP-SPMA算法。构造FP-Tree来压缩事务数据库,通过共享前缀和前瞻剪枝快速减小候选项集,无需递归构造条件模式树,算法性能有明显的提高。 展开更多
关键词 频繁项集 高频繁模式树(FP-Tree) 共享前缀 基于FP-tree的共享前缀频繁项集挖掘算法(FP-SPMA)
下载PDF
基于FP-tree和支持度数组的最大频繁项集挖掘算法 被引量:2
6
作者 陈慧萍 王建东 +1 位作者 叶飞跃 王煜 《系统工程与电子技术》 EI CSCD 北大核心 2005年第9期1631-1635,共5页
提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效... 提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。 展开更多
关键词 数据挖掘 FP-TREE MAXFP-tree 支持度数组 最大频繁项集
下载PDF
基于磁盘表存储FP-TREE的关联规则挖掘算法 被引量:14
7
作者 申彦 宋顺林 朱玉全 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1313-1322,共10页
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据... 随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法. 展开更多
关键词 FP-TREE 关联规则 磁盘存储 频繁项目集 DTRFP-GROWTH算法 FP-GROWTH算法 数据挖掘
下载PDF
基于FP-Tree模型的频繁轨迹模式挖掘方法 被引量:8
8
作者 牛新征 牛嘉郡 +1 位作者 苏大壮 佘堃 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期86-90,134,共6页
通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列... 通过对经典频繁模式数据结构FP-tree的扩展与改进,提出了一种适用于处理轨迹数据的灵活高效的FP-tree轨迹挖掘方法(NFTM)。首先运用二维筛选和GPS格式过滤的方法对轨迹进行预处理,然后将有效数据经一次扫描后,生成按照真实轨迹顺序排列且具备时空属性的改进型FP-tree,使用动态数组存储模式挖掘过程中得到的候选集,根据用户的输入针对性输出相应时间和频率范围的频繁轨迹。最后通过与GSP算法、Prefixspan算法的对比测试表明,该算法具有更短执行时间和更优性能。 展开更多
关键词 FP-TREE 频繁轨迹模式 模式挖掘 时空属性
下载PDF
基于邻接矩阵的FP-tree构造算法 被引量:8
9
作者 刘应东 冷明伟 陈晓云 《计算机工程与应用》 CSCD 北大核心 2011年第7期153-155,共3页
提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少... 提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少、遍历时间缩短。最后使用标准数据集进行验证测试并和其他算法的比较,实验结果表明,该算法在保证结果的同时有效地提高频繁项集挖掘的效率。 展开更多
关键词 数据挖掘 频繁项集 FP-TREE算法 邻接矩阵
下载PDF
基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响 被引量:25
10
作者 陆楠 王喆 周春光 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第2期180-185,共6页
通过对两个有代表性的算法Apriori和FP-Growth的剖析,说明频集模式挖掘的过程,比较有候选项集产生和无候选项集产生算法的特点,并给出FP-tree结构的构造方法以及对挖掘关联规则的影响,提出了对算法的改进方法.
关键词 数据挖掘 关联规则 频繁项集 无候选项集 FP-tree频集模式 FP-GROWTH算法
下载PDF
用有序FP-tree挖掘最大频繁项集 被引量:7
11
作者 于红 王秀坤 孟军 《控制与决策》 EI CSCD 北大核心 2007年第5期520-524,共5页
提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径... 提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径对挖掘算法进行优化.实验结果表明,该算法对于浓密数据集中挖掘长模式具有较好的性能. 展开更多
关键词 最大频繁项集 有序FP-tree数据挖掘 MFIM算法
下载PDF
基于有序FP-tree的最大频繁项集挖掘算法 被引量:5
12
作者 李少华 吕志旺 +1 位作者 车德勇 周宁 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析... 通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理. 展开更多
关键词 数据挖掘 FP-TREE 最大频繁项集 关联规则
下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
13
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 FP-TREE 条件模式树
下载PDF
在单向FP-tree上挖掘频繁闭项集 被引量:4
14
作者 王现君 宋晶晶 姜保庆 《计算机工程与应用》 CSCD 北大核心 2008年第10期150-153,237,共5页
频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数... 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。 展开更多
关键词 数据挖掘 频繁项集 频繁闭项集 单向FP-tree 被约束子树
下载PDF
基于FP-Tree快速挖掘频繁项集 被引量:2
15
作者 姜晗 范建淑 贾泂 《计算机应用与软件》 CSCD 2010年第10期36-37,130,共3页
发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前... 发现频繁项集是关联规则挖掘中最基本、最重要的问题。目前已有两类频繁项集挖掘算法,然而由于其内在的复杂性,这一问题并未完全解决。提出了一种基于FP-Tree的频繁项集挖掘算法,该算法通过计算FP-Tree中非叶子节点的频繁子孙集和频繁前缀,组合生成频繁项集,无需递归构造每个频繁项的条件模式树,节约了时间和内存空间,算法性能在一定程度上得到了提高。 展开更多
关键词 频繁项集 FP-TREE 频繁子孙集 频繁前缀 关联规则
下载PDF
改进的FP-tree算法在动车组故障诊断中的应用研究 被引量:3
16
作者 钟雁 马海漫 +1 位作者 张春 赵怀昕 《交通运输系统工程与信息》 EI CSCD 北大核心 2013年第6期105-111,共7页
从利用动车组海量运维数据获取故障诊断知识的角度出发,通过对数据挖掘中关联规则——FP-tree算法的研究,结合动车组故障诊断和提高动车组运营安全的要求,在生成树和搜索频繁项两个阶段对FP-tree算法进行改进,提出了一种改进算法——整... 从利用动车组海量运维数据获取故障诊断知识的角度出发,通过对数据挖掘中关联规则——FP-tree算法的研究,结合动车组故障诊断和提高动车组运营安全的要求,在生成树和搜索频繁项两个阶段对FP-tree算法进行改进,提出了一种改进算法——整枝FP-tree算法.改进算法在生成树阶段将故障信息置于顶层,在搜索频繁项阶段将所有的搜索都搜索到树的顶层.最后,将整枝FP-tree算法应用到动车组故障信息和状态信息的关联规则的抽取中,通过对改进算法的具体分析以及实际测试,表明该算法输出结果满足要求,并且对故障诊断知识获取的时间消耗和空间消耗有较大的降低. 展开更多
关键词 智能交通 故障诊断 FP-TREE算法 动车组 关联规则
下载PDF
基于FP-Tree的频繁闭合项目集挖掘算法的研究 被引量:3
17
作者 陈俊杰 崔晓红 《计算机工程与应用》 CSCD 北大核心 2006年第34期169-171,共3页
目前频繁闭合项目集挖掘算法有很多,例如CLOSET[1]。CLOSET以FP-Growth为基础,采用FP-Tree来表示模式支持集,通过深度优先搜索来挖掘频繁闭合模式。其困难是,递归构造“条件FP-Tree”的CPU开销和存储开销很大。为解决上面的问题,论文提... 目前频繁闭合项目集挖掘算法有很多,例如CLOSET[1]。CLOSET以FP-Growth为基础,采用FP-Tree来表示模式支持集,通过深度优先搜索来挖掘频繁闭合模式。其困难是,递归构造“条件FP-Tree”的CPU开销和存储开销很大。为解决上面的问题,论文提出一种基于FP-Tree和COFI-Tree的频繁闭合项目集挖掘算法,在该算法中引用了COFI-Tree结构,COFI-Tree无需递归地构造“条件FP-Tree”,并且某一时刻只有一个频繁项的COFI-Tree在内存,所以大大减少了内存消耗。通过实验证明:当挖掘大型数据库时,在执行时间方面,该算法比其它算法更有效。 展开更多
关键词 频繁闭合项目集 FP-TREE COFI-Tree
下载PDF
对FP-Tree头表节点数据结构的改进 被引量:3
18
作者 邓砚谷 王丽珍 《计算机工程与应用》 CSCD 北大核心 2004年第25期176-178,共3页
关联数据挖掘中的FP-growth算法是不产生候选集的代表,可是当在FP-tree中找到与头表(HeaderTable)有相同的项(Item)时,必须回到头表中,一个一个找出最后一个Node_link所指的项,再将其加入。这样就降低了算法的效率。该文通过在频繁模式... 关联数据挖掘中的FP-growth算法是不产生候选集的代表,可是当在FP-tree中找到与头表(HeaderTable)有相同的项(Item)时,必须回到头表中,一个一个找出最后一个Node_link所指的项,再将其加入。这样就降低了算法的效率。该文通过在频繁模式树(FP-Tree)头表的数据结构中增加一个tail链域,这样就不需要每次都从头查找,而只须直接找tail域即可。实验证明改进后的算法比FP-growth算法的性能有很大提高。 展开更多
关键词 数据挖掘 关联规则 FP-TREE
下载PDF
基于FP-tree与云变换的围岩稳定性评价指标体系研究 被引量:3
19
作者 薛黎明 李长明 +3 位作者 郑志学 孟硕 王恩 王豪杰 《铁道标准设计》 北大核心 2019年第7期102-107,共6页
针对围岩稳定性指标体系暂无统一的标准,且现阶段地下工程呈现大型化和密集化的趋势,所以现有的围岩稳定性体系难以适用于围岩准确分级。对此,将现有的分级标准及文献中分级体系进行汇总建立指标数据库,通过FP-tree进行关联挖掘得到围... 针对围岩稳定性指标体系暂无统一的标准,且现阶段地下工程呈现大型化和密集化的趋势,所以现有的围岩稳定性体系难以适用于围岩准确分级。对此,将现有的分级标准及文献中分级体系进行汇总建立指标数据库,通过FP-tree进行关联挖掘得到围岩稳定性的分级指标,并采用变异系数法验证体系的稳定性。运用云变换得到该体系中各指标的等级云图,对各指标进行分级,实现等级的软划分,考虑等级阈值的模糊性,使分级标准更符合思维逻辑和工程实际。将该体系应用于工程实际中,评价结果与工程实际相吻合,证明该体系的科学性与合理性,为围岩稳定性评价提供一套简洁适用的体系,为构建评价指标体系提供一种科学合理的方法。 展开更多
关键词 围岩稳定性 指标体系 FP-TREE 云变换 阈值
下载PDF
基于FP-Growth算法构造批量增量的FP-tree 被引量:3
20
作者 韩天鹏 王峰 王浩 《嘉应学院学报》 2017年第8期21-25,共5页
提出了一种利用FP树表示增量数据库,然后进行增量挖掘的方法,即IA_FP-Growth算法.算法重构和合并两个小的时间上连续的FP树,以获得由FP-Growth算法生成的FP树.与其他从数据库读取事务的顺序增量算法不同,IA_FP-Growth算法使用原FP-tree... 提出了一种利用FP树表示增量数据库,然后进行增量挖掘的方法,即IA_FP-Growth算法.算法重构和合并两个小的时间上连续的FP树,以获得由FP-Growth算法生成的FP树.与其他从数据库读取事务的顺序增量算法不同,IA_FP-Growth算法使用原FP-tree作为预处理数据库来获取项目集,因此其花费较少的时间来构建新的增量FP-tree项目.实验结果表明,随着数据库大小的增加,IA_FP-Growth的运行时间的增加要少得多,而且与其他算法比较也是最少的. 展开更多
关键词 数据挖掘 增量挖掘 频繁模式 FP-TREE FP-GROWTH
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部