期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
Accurate querying of frequent subgraphs in power grid graph data 被引量:2
1
作者 Aihua Zhou Lipeng Zhu +1 位作者 Xinxin Wu Hongbin Qiu 《Global Energy Interconnection》 2019年第1期78-84,共7页
With the development of information technology, the amount of power grid topology data has gradually increased. Therefore, accurate querying of this data has become particularly important. Several researchers have cho... With the development of information technology, the amount of power grid topology data has gradually increased. Therefore, accurate querying of this data has become particularly important. Several researchers have chosen different indexing methods in the filtering stage to obtain more optimized query results because currently there is no uniform and efficient indexing mechanism that achieves good query results. In the traditional algorithm, the hash table for index storage is prone to "collision" problems, which decrease the index construction efficiency. Aiming at the problem of quick index entry, based on the construction of frequent subgraph indexes, a method of serialized storage optimization based on multiple hash tables is proposed. This method mainly uses the exploration sequence to make the keywords evenly distributed; it avoids conflicts of the stored procedure and performs a quick search of the index. The proposed algorithm mainly adopts the "filterverify" mechanism; in the filtering stage, the index is first established offline, and then the frequent subgraphs are found using the "contains logic" rule to obtain the candidate set. Experimental results show that this method can reduce the time and scale of candidate set generation and improve query efficiency. 展开更多
关键词 POWER grid GRAPH database GRAPH computing Multi-Hash TABLE frequent subgraphS
下载PDF
High Performance Frequent Subgraph Mining on Transaction Datasets: A Survey and Performance Comparison 被引量:3
2
作者 Bismita S.Jena Cynthia Khan Rajshekhar Sunderraman 《Big Data Mining and Analytics》 2019年第3期159-180,共22页
Graph data mining has been a crucial as well as inevitable area of research.Large amounts of graph data are produced in many areas,such as Bioinformatics,Cheminformatics,Social Networks,etc.Scalable graph data mining ... Graph data mining has been a crucial as well as inevitable area of research.Large amounts of graph data are produced in many areas,such as Bioinformatics,Cheminformatics,Social Networks,etc.Scalable graph data mining methods are getting increasingly popular and necessary due to increased graph complexities.Frequent subgraph mining is one such area where the task is to find overly recurring patterns/subgraphs.To tackle this problem,many main memory-based methods were proposed,which proved to be inefficient as the data size grew exponentially over time.In the past few years,several research groups have attempted to handle the Frequent Subgraph Mining(FSM)problem in multiple ways.Many authors have tried to achieve better performance using Graphic Processing Units(GPUs)which has multi-fold improvement over in-memory while dealing with large datasets.Later,Google’s MapReduce model with the Hadoop framework proved to be a major breakthrough in high performance large batch processing.Although MapReduce came with many benefits,its disk I/O and noniterative style model could not help much for FSM domain since subgraph mining process is an iterative approach.In recent years,Spark has emerged to be the De Facto industry standard with its distributed in-memory computing capability.This is a right fit solution for iterative style of programming as well.In this survey,we cover how high-performance computing has helped in improving the performance tremendously in the transactional directed and undirected aspect of graphs and performance comparisons of various FSM techniques are done based on experimental results. 展开更多
关键词 frequent subgraphS ISOMORPHISM SPARK
原文传递
航班延误特征可视分析方法
3
作者 贺怀清 韩丽旸 +3 位作者 周钢 宋淼 刘浩翰 惠康华 《计算机工程与设计》 北大核心 2024年第10期3161-3169,共9页
为分析航班延误发生规律,提出一种数学模型联合多视图协同的可视分析方法。对SEIR传染病传播模型进行调整,建立航班延误传播模型分析延误的传播特征,在此基础上,运用频繁子图挖掘算法提取延误频繁模式;设计基于中点分割的地图网络图、... 为分析航班延误发生规律,提出一种数学模型联合多视图协同的可视分析方法。对SEIR传染病传播模型进行调整,建立航班延误传播模型分析延误的传播特征,在此基础上,运用频繁子图挖掘算法提取延误频繁模式;设计基于中点分割的地图网络图、矩阵热力图和时序图,分析延误的时空分布特征;设计VA-FDC系统用于方法验证。实验结果表明,VA-FDC能够有效分析航班延误时空分布特征,依据航班延误传播模型准确描述延误传播特征,为相关部门有效措施的制定提供借鉴。 展开更多
关键词 航班延误 时空分布特征 延误传播模型 频繁子图挖掘 延误传播路径 延误频繁模式 多视图协同
下载PDF
极大频繁模式挖掘算法
4
作者 唐德权 刘绪崇 姚婷婷 《计算机工程与设计》 北大核心 2023年第6期1758-1764,共7页
为从半结构化和结构化数据集中避免挖掘大量冗余候选模式,提高在大型图数据集中挖掘完整频繁子图的效率,提出基于极大频繁子树挖掘的算法。挖掘图数据集中所有极大频繁子树,在此基础上添加频繁边,进一步扩展操作得到所有极大频繁子图。... 为从半结构化和结构化数据集中避免挖掘大量冗余候选模式,提高在大型图数据集中挖掘完整频繁子图的效率,提出基于极大频繁子树挖掘的算法。挖掘图数据集中所有极大频繁子树,在此基础上添加频繁边,进一步扩展操作得到所有极大频繁子图。提出定理证明极大频繁子图挖掘算法的正确性,并证明其时间复杂度优于同类挖掘算法。通过化学分子数据集、模拟数据集和大型数据集的实验验证了该算法的正确性和有效性。 展开更多
关键词 图数据集 冗余子图 候选模式 频繁子图 极大频繁子树 扩展操作 极大频繁子图
下载PDF
一种基于最大频繁子图基因的模糊图神经网络检测模型
5
作者 周显春 肖衡 +1 位作者 焦萍萍 邹琴琴 《计算机时代》 2023年第9期14-18,共5页
针对恶意软件检测的准确性和时间效率问题,提出一种基于最大频繁子图基因的模糊图神经网络检测模型。首先利用SFFSM-SPIN-MGM方法挖掘恶意软件函数调用图的最大频繁子图,然后利用模糊图神经网络完成恶意软件同源性检测。实验结果表明,... 针对恶意软件检测的准确性和时间效率问题,提出一种基于最大频繁子图基因的模糊图神经网络检测模型。首先利用SFFSM-SPIN-MGM方法挖掘恶意软件函数调用图的最大频繁子图,然后利用模糊图神经网络完成恶意软件同源性检测。实验结果表明,该方法具有较强的泛化能力,能够有效地检测现有恶意软件的变种测试集,平均准确率92.1%,平均误报率4.3%、平均漏报率1.4%。 展开更多
关键词 恶意软件 动态函数调用图 最大频繁子图基因 模糊图神经网络
下载PDF
基于Spark平台的恶意软件最大频繁子图挖掘方法
6
作者 周显春 肖衡 +1 位作者 焦萍萍 邹琴琴 《现代计算机》 2023年第14期57-61,共5页
为了解决传统子图挖掘算法时效性差的问题,设计了一种基于Spark平台的恶意软件最大频繁子图挖掘方法。该方法在保证挖掘信息完整的前提下,避免了挖掘所有频繁子图,采用了改进的FSMBUS方法来挖掘恶意软件的最大频繁子图,利用分布式架构Sp... 为了解决传统子图挖掘算法时效性差的问题,设计了一种基于Spark平台的恶意软件最大频繁子图挖掘方法。该方法在保证挖掘信息完整的前提下,避免了挖掘所有频繁子图,采用了改进的FSMBUS方法来挖掘恶意软件的最大频繁子图,利用分布式架构Spark迭代计算优势,提高了挖掘效率。此外,改进算法还被应用于恶意软件同源性判定,改善了恶意软件检测效果。最后,通过对比实验结果,论证了该方法的高效性和可行性。 展开更多
关键词 恶意软件 最大频繁子图 任务并行化 SPARK
下载PDF
一种高效频繁子图挖掘算法 被引量:35
7
作者 李先通 李建中 高宏 《软件学报》 EI CSCD 北大核心 2007年第10期2469-2480,共12页
由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,... 由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,避免了图挖掘过程中高代价的计算过程.目前最好的频繁子图挖掘算法的时间复杂性是O(n3·2n),其中,n是图集中的频繁边数.提出算法的时间复杂性是O[2n·n2.5/logn],性能提高了O((1/2)n·logn)倍.实验结果也证实了这一理论分析. 展开更多
关键词 频繁模式挖掘 子图同构 子树同构 频繁子树 生成树
下载PDF
从不确定图中挖掘频繁子图模式 被引量:32
8
作者 邹兆年 李建中 +1 位作者 高宏 张硕 《软件学报》 EI CSCD 北大核心 2009年第11期2965-2976,共12页
研究不确定图数据的挖掘,主要解决不确定图数据的频繁子图模式挖掘问题.介绍了一种数据模型来表示图的不确定性,以及一种期望支持度来评价子图模式的重要性.利用期望支持度的Apriori性质,给出了一种基于深度优先搜索策略的挖掘算法.该... 研究不确定图数据的挖掘,主要解决不确定图数据的频繁子图模式挖掘问题.介绍了一种数据模型来表示图的不确定性,以及一种期望支持度来评价子图模式的重要性.利用期望支持度的Apriori性质,给出了一种基于深度优先搜索策略的挖掘算法.该算法使用高效的期望支持度计算方法和搜索空间裁剪技术,使得计算子图模式的期望支持度所需的子图同构测试的数量从指数级降低到线性级.实验结果表明,该算法比简单的深度优先搜索算法快3-5个数量级,有很高的效率和可扩展性. 展开更多
关键词 不确定图 图挖掘 频繁子图模式
下载PDF
从图数据库中挖掘频繁跳跃模式 被引量:10
9
作者 刘勇 李建中 高宏 《软件学报》 EI CSCD 北大核心 2010年第10期2477-2493,共17页
很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保... 很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保留在挖掘结果中.此外,跳跃模式还具有抗噪声干扰能力强等优点.然而,由于跳跃模式不具有反单调性质,挖掘它们非常具有挑战性.通过研究跳跃模式自身的特性,提出了两种新的裁剪技术:基于内扩展的裁剪和基于外扩展的裁剪.在此基础上又给出了一种高效的挖掘算法GraphJP(an algorithm for mining jump patterns from graph databases).另外,还严格证明了裁剪技术和算法GraphJP的正确性.实验结果表明,所提出的裁剪技术能够有效地裁剪图模式搜索空间,算法GraphJP是高效、可扩展的. 展开更多
关键词 数据挖掘 图挖掘 图数据库 频繁子图 跳跃模式
下载PDF
加权最大频繁子图挖掘算法的研究 被引量:8
10
作者 王映龙 杨珺 +1 位作者 周法国 唐建军 《计算机工程与应用》 CSCD 北大核心 2009年第20期31-34,38,共5页
如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一。传统的频繁子图挖掘方法对满足最小支持度阈值的子图同等对待,但在真实数据库中不同的子图往往具有不同的重要程度。为解决上述问题,提出了一种深度优... 如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一。传统的频繁子图挖掘方法对满足最小支持度阈值的子图同等对待,但在真实数据库中不同的子图往往具有不同的重要程度。为解决上述问题,提出了一种深度优先的挖掘加权最大频繁子图的新算法。首先给出了一种新的用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可以加速子图规范编码匹配的速度。其次,给出了加权最大频繁子图的定义,不仅可以找出较为重要的最大频繁子图,而且可以使挖掘结果同样具有反单调性,从而可加速剪枝。实验结果表明,提出的算法不仅可以有效地减少挖掘结果的数量,而且具有较高的效率。 展开更多
关键词 数据挖掘 最大加权频繁子图 邻接矩阵 规范编码
下载PDF
图数据中频繁模式挖掘算法研究综述 被引量:9
11
作者 高琳 覃桂敏 周晓峰 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1603-1609,共7页
本文对图数据中的频繁模式挖掘算法进行了综述.依据算法的特性和数学基础对算法进行了分类,主要集中于算法的求解思想和不同算法之间的关系的比较,并对一些著名的算法进行了详细的分析和讨论.基于算法的特性,比较了各种算法适用的范围... 本文对图数据中的频繁模式挖掘算法进行了综述.依据算法的特性和数学基础对算法进行了分类,主要集中于算法的求解思想和不同算法之间的关系的比较,并对一些著名的算法进行了详细的分析和讨论.基于算法的特性,比较了各种算法适用的范围以及应用领域.最后,讨论了频繁模式挖掘的最新进展及未来的研究方向. 展开更多
关键词 频繁子图 频繁模式挖掘 图的匹配 图的同构
下载PDF
现代物流系统中基于频繁子图的RFID路径挖掘算法 被引量:6
12
作者 胡孔法 孙艳 +1 位作者 陈崚 宋爱波 《计算机集成制造系统》 EI CSCD 北大核心 2010年第11期2490-2494,共5页
为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘... 为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘。实验结果与算法分析都表明,基于射频识别数据的频繁子图挖掘算法能够快速有效地挖掘物流频繁子图集。 展开更多
关键词 射频识别 物流 频繁路径 联机分析处理 频繁子图 数据挖掘 算法
下载PDF
利用MapReduce平台实现高效并行的频繁子图挖掘 被引量:4
13
作者 孙鹤立 陈强 +2 位作者 刘玮 黄健斌 邹建华 《计算机科学与探索》 CSCD 2014年第7期790-801,共12页
频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已... 频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已经挖掘出的k-1阶的频繁子图生成k阶的频繁子图。同时,检查是否存在待扩展生成的子图,设定生成的频繁子图表示规则,保证了频繁子图信息的唯一性。较同类算法相比,该算法在挖掘频繁子图时更具通用性,并且在扩展边时避免产生大量的复制图,从而使得算法的正确性得以保证,且运行效率显著提高。 展开更多
关键词 频繁子图挖掘 MAPREDUCE HADOOP平台
下载PDF
基于gSpan算法的未知化合物毒性预测 被引量:4
14
作者 谢莹 吴建国 +1 位作者 李炜 许荣斌 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第10期1278-1280,共3页
gSpan算法是一种基于频繁图的挖掘算法。该算法基于无候选人产生的频繁子图,在图中建立字典序标号,将每个图映射为最小DFS code,再采用深度优先搜索策略挖掘频繁连接子图。与前人算法相比,该算法在生成候选子图时,冗余子图的产生量大大... gSpan算法是一种基于频繁图的挖掘算法。该算法基于无候选人产生的频繁子图,在图中建立字典序标号,将每个图映射为最小DFS code,再采用深度优先搜索策略挖掘频繁连接子图。与前人算法相比,该算法在生成候选子图时,冗余子图的产生量大大减少;在计算候选子图支持度时避免了大量重复扫描数据库,性能卓越。该文的贡献是将gSpan算法应用在挖掘与已知毒性化合物具有相同子结构的化合物研究工作中,进行未知化合物的毒性预测,对相关领域应用发展具有重要意义。 展开更多
关键词 频繁子图 毒性预测 化合物
下载PDF
频繁子图挖掘算法研究 被引量:9
15
作者 唐德权 朱林立 《计算机工程》 CAS CSCD 北大核心 2009年第9期52-54,共3页
图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁... 图像能表达丰富语义,但增加了数据结构的复杂性和感兴趣子结构的挖掘难度。综合应用图论知识和数据挖掘的各种技术,对图像进行规范化编码,通过连接和扩展操作产生所有候选子图,引用嵌入集概念,计算候选子图的支持度和频繁度。提出频繁子图挖掘算法FSubgraphM,能从图数据库中挖掘频繁导出子图。 展开更多
关键词 数据挖掘 子图同构 规范化编码 嵌入集 频繁子图挖掘
下载PDF
一种新的图聚类算法研究 被引量:5
16
作者 唐德权 吴绍兵 凌志刚 《计算机应用与软件》 CSCD 北大核心 2014年第6期18-20,58,共4页
图聚类是基于各种标准如结点标号、边标号、公共子图等条件将图数据集实例划分不同类集群,这将对结构化图空间及增强对图数据的理解有着重要作用。针对此问题提出基于结构化的图聚类算法。与目前有关的算法相比,该算法不产生新图或原图... 图聚类是基于各种标准如结点标号、边标号、公共子图等条件将图数据集实例划分不同类集群,这将对结构化图空间及增强对图数据的理解有着重要作用。针对此问题提出基于结构化的图聚类算法。与目前有关的算法相比,该算法不产生新图或原图分解成零碎子图,也不依赖计算最大共同子图的相关操作。实验结果表明,这种方法在现实分子图数据集上对结构聚类可行、有效。 展开更多
关键词 集群 结构聚类 图数据集 频繁子图挖掘
下载PDF
一种挖掘最大频繁子图的新算法 被引量:3
17
作者 王映龙 杨炳儒 +2 位作者 宋泽峰 陈卓 李琳娜 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第18期4872-4877,共6页
如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一.由于其内在的计算复杂性,挖掘全部频繁子图非常困难,且得到的频繁子图过多,影响着结果的理解和应用.解决方案之一是挖掘最大频繁子图.在经典的Apriori... 如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一.由于其内在的计算复杂性,挖掘全部频繁子图非常困难,且得到的频繁子图过多,影响着结果的理解和应用.解决方案之一是挖掘最大频繁子图.在经典的Apriori算法的基础上,提出了一种挖掘最大频繁子图的新算法Apriori-MaxGraph.首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可以加速子图规范编码序列匹配的速度.其次,针对最大频繁子图,对候选子图的生成进行了规范.最后,采用双向搜索与剪枝策略,大大减小了搜索空间,提高了算法的效率.实验结果表明,Apriori-MaxGraph算法具有较高的挖掘效率. 展开更多
关键词 数据挖掘 最大频繁子图 邻接矩阵 规范编码
下载PDF
一种用于生物网络数据的频繁模式挖掘算法 被引量:6
18
作者 赵建邦 董安国 高琳 《电子学报》 EI CAS CSCD 北大核心 2010年第8期1803-1807,共5页
频繁模式挖掘是生物网络数据分析中的一个核心问题,对于研究生物网络的组织结构和功能模块具有重要意义.本文提出了子图环分布的概念并构造了子图搜索算法,提高了搜索效率.其次设计了动态抽样算法计算子图频率,用于提高非穷举搜索的精度... 频繁模式挖掘是生物网络数据分析中的一个核心问题,对于研究生物网络的组织结构和功能模块具有重要意义.本文提出了子图环分布的概念并构造了子图搜索算法,提高了搜索效率.其次设计了动态抽样算法计算子图频率,用于提高非穷举搜索的精度.利用4个真实生物网络数据进行仿真实验研究,验证了本文算法在效率和精度上相对于现有算法的优势. 展开更多
关键词 生物网络 频繁模式 子图搜索
下载PDF
基于联合意义度量的Top-K图模式挖掘 被引量:3
19
作者 刘勇 高宏 李建中 《计算机学报》 EI CSCD 北大核心 2010年第2期215-230,共16页
提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后... 提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后按增量贪心方式选择K个图模式.Cluster-TopK先挖掘频繁子图的一个代表模式集合,然后从代表模式中按增量贪心方式选择K个图模式.当意义度量满足submodular性质时,Greedy-TopK能提供近似比保证.Cluster-TopK没有近似比保证,但比Greedy-TopK更高效.实验结果显示,在结果可用性方面,文中提出的Top-K挖掘优于传统的Top-K挖掘.Cluster-TopK比Greedy-TopK快至少一个数量级.而且,在质量和可用性方面,Cluster-TopK的挖掘结果非常类似于Greedy-TopK的挖掘结果. 展开更多
关键词 图挖掘 图数据库 频繁子图 代表模式 联合熵 信息增益
下载PDF
一种基于Apriori思想的频繁子图发现算法 被引量:5
20
作者 李玉华 罗汉果 孙小林 《计算机工程与科学》 CSCD 2007年第4期84-87,共4页
如今,关联规则技术应用在许多非传统领域,许多已有的频繁项集搜索方法已经不适用了。一种解决的方法就是用图的形式表示这些领域的事务,然后利用基于图论的数据挖掘技术发现频繁子图。本文提出了一种基于Aproiri思想的频繁子图发现算法S... 如今,关联规则技术应用在许多非传统领域,许多已有的频繁项集搜索方法已经不适用了。一种解决的方法就是用图的形式表示这些领域的事务,然后利用基于图论的数据挖掘技术发现频繁子图。本文提出了一种基于Aproiri思想的频繁子图发现算法SLAGM,它可以有效地挖掘简单图中的频繁子图。实验证明,该算法在性能上优于另一种子图挖掘算法AGM。 展开更多
关键词 图论 频繁子图 数据挖掘
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部