期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
改进PrefixSpan的行为轨迹数据挖掘算法
1
作者 陈万志 赵帅 +1 位作者 方圆 王天元 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2023年第4期506-512,共7页
针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用... 针对用户行为轨迹数据挖掘PrefixSpan算法构造投影数据库过程中重复扫描而造成时空开销过大的问题,提出一种改进的序列模式挖掘算法TDM-PrefixSpan(trajectory data mining based on prefixSpan algorithm)。依据时间序列分布特征,采用具有轨迹数据预处理的SMM(statistical mobility model)算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在大量pingpong效应的问题。采用频繁项集逆序挖掘序列模式,通过已挖掘序列模式集迭代去除冗余项集得到待挖掘序列模式集,缩短扫描候选数据库时间。数据集测试结果表明:SMM算法预处理后,原始数据库数据规模减小;通过对比可知,TDM-PrefixSpan算法能够有效降低时间复杂度,提升挖掘效率。 展开更多
关键词 轨迹模型 prefixspan算法 pingpong效应 序列模式 投影数据库
下载PDF
基于改进PrefixSpan的序列模式挖掘算法 被引量:12
2
作者 公伟 刘培玉 贾娴 《计算机应用》 CSCD 北大核心 2011年第9期2405-2407,共3页
针对PrefixSpan算法构造投影数据库开销大的问题,提出一种基于改进PrefixSpan的序列模式挖掘算法SPMIP。该方法通过添加剪枝步和减少某些特定序列模式生成过程的扫描,来减少投影数据库的规模及扫描投影数据库的时间,提高算法效率,并最... 针对PrefixSpan算法构造投影数据库开销大的问题,提出一种基于改进PrefixSpan的序列模式挖掘算法SPMIP。该方法通过添加剪枝步和减少某些特定序列模式生成过程的扫描,来减少投影数据库的规模及扫描投影数据库的时间,提高算法效率,并最终得到需要的序列模式。实验结果证明在获得序列模式不受影响情况下,SPMIP算法比PrefixSpan算法效率更高。 展开更多
关键词 prefixspan 序列模式 投影数据库 剪枝 扫描
下载PDF
基于PrefixSpan的序列模式挖掘改进算法 被引量:13
3
作者 汪林林 范军 《计算机工程》 CAS CSCD 北大核心 2009年第23期56-58,61,共4页
针对序列模式挖掘算法PrefixSpan在挖掘过程中需要构造大量投影数据库的不足,提出IPMSP算法,在递归挖掘过程中,通过检查序列数据库关于前缀的前缀,避免对同一频繁前缀模式构造重复投影数据库,同时舍弃对非频繁项的存储并在投影序列数小... 针对序列模式挖掘算法PrefixSpan在挖掘过程中需要构造大量投影数据库的不足,提出IPMSP算法,在递归挖掘过程中,通过检查序列数据库关于前缀的前缀,避免对同一频繁前缀模式构造重复投影数据库,同时舍弃对非频繁项的存储并在投影序列数小于最小支持度时停止扫描投影数据库,从而提高PrefixSpan算法的时空性能。实验结果证明,IPMSP算法在时间和空间性能上优于PrefixSpan算法。 展开更多
关键词 序列模式 prefixspan算法 投影数据库
下载PDF
PrefixSpan算法与CloSpan算法的分析与研究 被引量:6
4
作者 李锡娟 刘锋 +2 位作者 闫娜娜 徐杰 耿波 《计算机技术与发展》 2008年第1期70-73,76,共5页
数据挖掘领域的一个活跃分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。介绍序列模式挖掘的基本概念,然后对序列模式中的经典算法PrefixSpan算法和基于PrefixSpan框架的闭合序列模式CloSpan算法进行了描述,并对它们的... 数据挖掘领域的一个活跃分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。介绍序列模式挖掘的基本概念,然后对序列模式中的经典算法PrefixSpan算法和基于PrefixSpan框架的闭合序列模式CloSpan算法进行了描述,并对它们的执行过程及其特点进行了分析与比较,总结了各自的优缺点,指出PrefixSpan算法适用于短序列方面挖掘,而CloSpan算法在长序列或者阈值较低时胜过PrefixSpan算法且CloSpan算法挖掘大型的数据库有更好的性能,得出的结果对序列模式挖掘的设计有重要的参考价值。 展开更多
关键词 序列模式挖掘 prefixspan算法 CloSpan算法
下载PDF
GSP与PrefixSpan算法的比较与分析 被引量:4
5
作者 刘立军 崔杰 梅红岩 《辽宁工学院学报》 2006年第5期300-302,共3页
针对序列模式挖掘中的两种经典算法GSP算法与PrefixSpan算法执行过程及其特点进行了比较,并对这两种算法的时空执行效率进行了定性分析比较,指出了两种算法各自的适用范围,得出的结果对序列模式挖掘系统的设计有重要的参考价值。
关键词 序列模式挖掘 GSP算法 prefixspan算法
下载PDF
视频目标轨迹分析的改进PrefixSpan方法 被引量:2
6
作者 袁和金 《计算机工程与应用》 CSCD 北大核心 2011年第32期7-10,58,共5页
从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用... 从序列模式挖掘的角度对视频目标运动轨迹的分析和应用问题进行了研究,提出了一种基于改进PrefixSpan的频繁轨迹模式挖掘算法,并给出了基于所挖掘的频繁模式进行在线目标运动异常检测的方法。该方法对目标的运动轨迹进行量化编码,采用改进的PrefixSpan算法挖掘其中连续出现的频繁模式,通过字符串近似匹配的方法来检测当前运动轨迹所表示的目标行为是否异常。由于不需要计算两两轨迹之间的相似性,该方法可以应用于规模较大、分布模式数目难以确定场合下的视频目标轨迹分析问题。对仿真和真实场景的实验验证了该方法的有效性。 展开更多
关键词 轨迹模式 序列模式挖掘 prefixspan算法
下载PDF
基于改进的Prefixspan算法的中文文本新词提取方法研究 被引量:2
7
作者 李博涵 蔡永香 +1 位作者 邓舒颖 王督 《电脑知识与技术》 2018年第3Z期160-163,共4页
该文尝试将序列模式挖掘算法Prefixspan应用于中文文本新词提取中,针对Prefixspan算法挖掘出的序列模式不连续、挖掘出的序列模式项相互间存在包含关系等问题,对算法进行改进,采用语义特征与统计相结合的方法,实现了从中文语料中有效提... 该文尝试将序列模式挖掘算法Prefixspan应用于中文文本新词提取中,针对Prefixspan算法挖掘出的序列模式不连续、挖掘出的序列模式项相互间存在包含关系等问题,对算法进行改进,采用语义特征与统计相结合的方法,实现了从中文语料中有效提取新词。实验结果表明,该方法对于专业领域新词的识别具有较高的准确性。 展开更多
关键词 prefixspan 序列模式挖掘 新词提取 投影数据库 新词发现
下载PDF
PrefixSpan算法在多维序列模式挖掘中的应用 被引量:3
8
作者 栾东庆 徐素琴 《微机发展》 2003年第8期83-86,89,共5页
多维序列模式挖掘是在序列模式挖掘的基础上发展起来的,文章阐述了有关概念,介绍了两种序列模式挖掘算法:GSP算法和PrefixSpan算法,在对两类算法进行比较分析的基础上形成了挖掘多维序列模式的UniSeq算法、Dim-Seq算法和Seq-Dim算法。... 多维序列模式挖掘是在序列模式挖掘的基础上发展起来的,文章阐述了有关概念,介绍了两种序列模式挖掘算法:GSP算法和PrefixSpan算法,在对两类算法进行比较分析的基础上形成了挖掘多维序列模式的UniSeq算法、Dim-Seq算法和Seq-Dim算法。针对不同维度的模式,各种算法特点不同。 展开更多
关键词 数据挖掘 prefixspan算法 多维序列模式挖掘 序列数据库
下载PDF
基于改进PrefixSpan算法的移动Web序列模式挖掘
9
作者 王素凤 邓玫 《商场现代化》 北大核心 2007年第08Z期66-67,共2页
随着移动商务的迅速发展,移动用户面临的带宽限制和信息贫乏问题也日益凸显。Web使用挖掘通过对用户访问Web时在服务器留下的访问记录进行挖掘,在海量Web日志数据中自动、快速地发现用户访问序列模式。通过模式分析向移动用户推荐其感... 随着移动商务的迅速发展,移动用户面临的带宽限制和信息贫乏问题也日益凸显。Web使用挖掘通过对用户访问Web时在服务器留下的访问记录进行挖掘,在海量Web日志数据中自动、快速地发现用户访问序列模式。通过模式分析向移动用户推荐其感兴趣的内容。论文在比较几种常用序列模式挖掘算法的基础上,着重对PrefixSpan算法进行了研究和优化。 展开更多
关键词 移动商务 WEB使用挖掘 prefixspan算法 序列模式
下载PDF
恶意代码检测中的PrefixSpan算法应用 被引量:3
10
作者 王丽娜 谭小彬 +1 位作者 潘剑锋 奚宏生 《计算机工程》 CAS CSCD 北大核心 2010年第7期119-121,共3页
结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码... 结合数据挖掘和专家系统技术解决主机恶意代码检测问题,提出一个基于行为的恶意代码检测系统。数据挖掘算法采用改进的序列模式挖据算法——PrefixSpan,该算法用简约投影数据库代替原PrefixSpan算法的投影数据库。PrefixSpan从恶意代码行为序列库中挖掘关联规则,专家系统将获取的主机行为与规则匹配,从而达到检测恶意行为的目的。实验结果证明了该算法的正确性和有效性。 展开更多
关键词 恶意代码检测 基于行为检测 序列模式挖掘 prefixspan算法 投影数据库
下载PDF
基于PrefixSpan序列模式挖掘的改进算法 被引量:6
11
作者 王斌 黄晓芳 袁平 《西南科技大学学报》 CAS 2016年第4期68-72,共5页
针对PrefixSpan算法在构建投影数据库时时间开销过多和随着支持度增加效率下降的问题,提出了一种基于PrefixSpan算法的改进算法AP(AprioriAll-Prefix Span),该算法可以减少构建投影数据库的时间开销和降低支持度增加对算法效率的影响。... 针对PrefixSpan算法在构建投影数据库时时间开销过多和随着支持度增加效率下降的问题,提出了一种基于PrefixSpan算法的改进算法AP(AprioriAll-Prefix Span),该算法可以减少构建投影数据库的时间开销和降低支持度增加对算法效率的影响。改进思想是在第一次划分生成投影数据库时,按投影数据库中项集的个数从小到大排序,在第二次划分的时候,从已挖掘序列模式中直接生成所需序列模式,从而减少数据库的构建。实验结果显示AP算法效率高于PrefixSpan算法。 展开更多
关键词 prefixspan 序列模式 投影数据库 生成序列 二次划分
下载PDF
基于PrefixSpan算法的计算机入侵检测 被引量:1
12
作者 张胜斌 奚宏生 王卫平 《计算机工程》 CAS CSCD 北大核心 2003年第18期125-126,150,共3页
采用了一种快速的数据挖掘算法进行计算机的入侵检测。针对入侵检测的环境,提出了一种改进的PrefixSpan算法,降低了计算量和内存消耗,并通过增量学习实现对大数据库的训练,进一步提高了挖掘性能。通过检测一个网络审计记录的实验,... 采用了一种快速的数据挖掘算法进行计算机的入侵检测。针对入侵检测的环境,提出了一种改进的PrefixSpan算法,降低了计算量和内存消耗,并通过增量学习实现对大数据库的训练,进一步提高了挖掘性能。通过检测一个网络审计记录的实验,给出这种方法的具体应用和结果分析。 展开更多
关键词 数据挖掘 入侵检测 异常检测 误用检测 频繁序列 prefixspan算法
下载PDF
一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用 被引量:6
13
作者 姬浩博 王俊红 《计算机科学》 CSCD 北大核心 2016年第1期25-29,共5页
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接... 序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。 展开更多
关键词 序列模式挖掘 WEB日志挖掘 prefixspan算法
下载PDF
改进的PrefixSpan算法在Web挖掘中的应用 被引量:2
14
作者 谢清森 杨天奇 《科学技术与工程》 2009年第23期7176-7179,共4页
针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在... 针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。 展开更多
关键词 WEB挖掘 prefixspan算法 序列模式
下载PDF
改进的PrefixSpan算法及其在序列模式挖掘中的应用 被引量:11
15
作者 张巍 刘峰 滕少华 《广东工业大学学报》 CAS 2013年第4期49-54,共6页
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法... 由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(Prefix of First Position on BitMap)表用于记录序列中的每个项在位图中第1次出现的位置.实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更好地挖掘出序列模式. 展开更多
关键词 序列模式 前缀投影序列模式挖掘 序列模式挖掘 位图 数据挖掘
下载PDF
基于PrefixSpan思想的增量时序模式挖掘算法 被引量:1
16
作者 熊学栋 肖建华 《湖南第一师范学报》 2007年第2期158-160,共3页
基于PrefixSpan思想的序列模式增量挖掘算法,对更新数据库的频繁模式分三类进行挖掘,利用了原频繁模式基的信息,对局部新增数据进行挖掘,只在候选集的处理中对更新数据库扫描一次。实验表明,该方法与直接用PrefixSpan算法对更新数据库... 基于PrefixSpan思想的序列模式增量挖掘算法,对更新数据库的频繁模式分三类进行挖掘,利用了原频繁模式基的信息,对局部新增数据进行挖掘,只在候选集的处理中对更新数据库扫描一次。实验表明,该方法与直接用PrefixSpan算法对更新数据库挖掘相比,性能上有较大的提高。 展开更多
关键词 增量挖掘 prefixspan 投影数据 序列模式
下载PDF
改进的PrefixSpan算法在旅游热门路线上的应用 被引量:2
17
作者 胡冰冰 芦俊丽 郑承宇 《云南民族大学学报(自然科学版)》 CAS 2022年第1期94-102,共9页
PrefixSpan算法是目前比较经典且较为高效的挖掘频繁序列模式的算法,而应用在旅游热门路线的搜索上,仍存在着连续性不足的问题.为了改善该算法的连续性,从改变频繁序列模式的生成过程方面对算法进行了改进优化.实验结果表明,改进的Prefi... PrefixSpan算法是目前比较经典且较为高效的挖掘频繁序列模式的算法,而应用在旅游热门路线的搜索上,仍存在着连续性不足的问题.为了改善该算法的连续性,从改变频繁序列模式的生成过程方面对算法进行了改进优化.实验结果表明,改进的PrefixSpan算法在旅游热门路线的搜索上具有更好的连续性,且比原算法效率更高,更适用于旅游热门路线的搜索. 展开更多
关键词 prefixspan算法 旅游路线推荐 数据挖掘 频繁序列模式
下载PDF
基于属性相关和时间约束的PrefixSpan算法 被引量:1
18
作者 李春媚 蔡平良 《计算机工程》 CAS CSCD 北大核心 2008年第23期176-177,180,共3页
针对计算机入侵检测中网络安全审计数据的特点,提出一个改进的PrefixSpan算法,引入时间约束和属性相关的特征指导挖掘,应用M矩阵和Apriori特性减少投影数据库的数量,并缩减投影数据库规模,提高了序列模式挖掘的效率和有用性。通过检测... 针对计算机入侵检测中网络安全审计数据的特点,提出一个改进的PrefixSpan算法,引入时间约束和属性相关的特征指导挖掘,应用M矩阵和Apriori特性减少投影数据库的数量,并缩减投影数据库规模,提高了序列模式挖掘的效率和有用性。通过检测一个网络审计记录的实验,进行结果分析。 展开更多
关键词 序列模式挖掘 prefixspan算法 入侵检测
下载PDF
改进的PrefixSpan算法在客流计数中的应用
19
作者 王争 李晋宏 《计算机时代》 2013年第6期50-52,共3页
序列模式挖掘是基于关联规则的频繁项集的挖掘,其实质是在关联模型中加入时间属性。利用改进的PrefixSpan算法对客流计数系统中不同时段的数据进行挖掘分析,给出不同时段的客流高峰的频繁序列模式,对于提高客流计数系统的精度,给管理决... 序列模式挖掘是基于关联规则的频繁项集的挖掘,其实质是在关联模型中加入时间属性。利用改进的PrefixSpan算法对客流计数系统中不同时段的数据进行挖掘分析,给出不同时段的客流高峰的频繁序列模式,对于提高客流计数系统的精度,给管理决策者调配人力,物力,财力提供技术支持,对于最大限度地发掘购物中心的潜力,提高利润,具有重要的经济意义。 展开更多
关键词 序列模式挖掘 关联模型 prefixspan算法 客流计数
下载PDF
基于动态最小支持度的增量频繁序列挖掘
20
作者 贺帆 刘漫丹 钟超 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期257-263,共7页
在轨迹数据集有新增数据且最小支持度变更情况下,为了实现频繁轨迹集能够快速更新以及解决轨迹数据库占用大量存储空间的问题,提出基于动态最小支持度的增量频繁序列挖掘算法。该算法能够充分利用频繁轨迹集信息,在有新增轨迹数据加入... 在轨迹数据集有新增数据且最小支持度变更情况下,为了实现频繁轨迹集能够快速更新以及解决轨迹数据库占用大量存储空间的问题,提出基于动态最小支持度的增量频繁序列挖掘算法。该算法能够充分利用频繁轨迹集信息,在有新增轨迹数据加入原始轨迹数据集且最小支持度变更时,通过频繁轨迹序列与频繁1序列相连接生成候选序列,利用非频繁轨迹后缀子序列置信度来估计非频繁轨迹支持度,实现动态更新频繁项集,并且在挖掘频繁轨迹后不再需要保存原始轨迹数据。通过轨迹数据集的挖掘实验,验证了本文算法支持度估计的精度和算法的有效性。 展开更多
关键词 频繁轨迹 动态数据 最小支持度 prefixspan 内存开销
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部