期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
界标窗口下数据流最大规范模式挖掘算法研究 被引量:4
1
作者 闻英友 王少鹏 赵宏 《计算机研究与发展》 EI CSCD 北大核心 2017年第1期94-110,共17页
首次对界标窗口下数据流最大规范模式挖掘问题进行了研究.为了克服na6ve算法在处理该问题时不具有增量计算的缺点,提出了一种基于边界界标窗口技术的数据流最大规范模式挖掘(data stream maximal regular patterns mining based on boun... 首次对界标窗口下数据流最大规范模式挖掘问题进行了研究.为了克服na6ve算法在处理该问题时不具有增量计算的缺点,提出了一种基于边界界标窗口技术的数据流最大规范模式挖掘(data stream maximal regular patterns mining based on boundary landmark window,DSMRM-BLW)算法.该算法将数据流上的第1个待处理窗口定义为边界界标窗口,使用na6ve算法对其进行处理;之后每个窗口上的最大规范模式都可以基于前一个窗口上的最大规范模式集合增量获得,可以克服na6ve算法的缺点.实验结果表明:DSMRM-BLW算法是处理界标窗口下数据流最大规范模式挖掘的有效方法,与na6ve算法相比,具有相同的执行结果,但时间与空间效率得到了很大的提高. 展开更多
关键词 数据流 界标窗口 最大规范模式 增量计算 边界界标窗口技术
下载PDF
挖掘数据流界标窗口Top-K频繁项集 被引量:6
2
作者 杨蓓 黄厚宽 《计算机研究与发展》 EI CSCD 北大核心 2010年第3期463-473,共11页
数据流频繁项集挖掘是目前数据挖掘与知识发现领域的热点研究课题,在许多领域有重要应用.然而支持度阈值的设定需要一定的领域知识,设置不当会给后续的分析处理带来很多困难和不必要的负担,因此挖掘数据流top-K频繁项集有重要意义.提出... 数据流频繁项集挖掘是目前数据挖掘与知识发现领域的热点研究课题,在许多领域有重要应用.然而支持度阈值的设定需要一定的领域知识,设置不当会给后续的分析处理带来很多困难和不必要的负担,因此挖掘数据流top-K频繁项集有重要意义.提出一个挖掘数据流界标窗口top-K频繁项集的动态增量近似算法TOPSIL-Miner,为此设计了存储流数据摘要信息的概要结构TOPSIL-Tree以及动态记录挖掘相关信息的树层最大支持度表MaxSL、项目序表OIL,TOPSET和最小支持度表MinSL等,并分析了与这些概要结构相关的挖掘特性.在此基础上研究算法的3种优化措施:1)剪枝当前数据流的平凡项集;2)挖掘过程中启发式自适应提升挖掘阈值;3)动态提升剪枝阈值.对算法的误差上界进行了分析研究.最后通过实验验证了算法的可行性、精确性和时空高效性. 展开更多
关键词 数据挖掘 数据流 界标窗口 频繁项集 概要数据结构
下载PDF
界标窗口中数据流频繁模式挖掘算法研究 被引量:2
3
作者 张广路 雷景生 吴兴惠 《计算机工程》 CAS CSCD 2012年第1期55-58,61,共5页
数据流的流量太大会无法被整个存储,或被多次扫描。为此,在研究已有挖掘算法的基础上,提出一种界标窗口中数据流频繁模式挖掘算法DSMFP_LW。利用扩展前缀模式树存储全局临界频繁模式,实现单遍扫描数据流和数据增量更新。实验结果表明,与... 数据流的流量太大会无法被整个存储,或被多次扫描。为此,在研究已有挖掘算法的基础上,提出一种界标窗口中数据流频繁模式挖掘算法DSMFP_LW。利用扩展前缀模式树存储全局临界频繁模式,实现单遍扫描数据流和数据增量更新。实验结果表明,与Lossy Counting算法相比,DSMFP_LW算法具有更好的时空效率。 展开更多
关键词 界标窗口 频繁模式 数据流 DSMFP_LW算法 滑动窗口
下载PDF
基于界标窗口的数据流频繁项集挖掘算法的改进 被引量:1
4
作者 吴媚 高玲 《山东师范大学学报(自然科学版)》 CAS 2014年第3期21-25,29,共6页
挖掘数据流中频繁项集的技术是当前研究的热点之一.笔者借鉴数据模型FP-tree的结构,提出改进的适应挖掘数据流完全频繁项集的方法:FP-NEW.算法预处理阶段保存生成的潜在频繁项并作为构造NFP-tree中的记录输入,用户可以通过设置时... 挖掘数据流中频繁项集的技术是当前研究的热点之一.笔者借鉴数据模型FP-tree的结构,提出改进的适应挖掘数据流完全频繁项集的方法:FP-NEW.算法预处理阶段保存生成的潜在频繁项并作为构造NFP-tree中的记录输入,用户可以通过设置时间权重等策略对存储结果进行剪枝处理,最终经过迭代挖掘界标窗口中的完全频繁项集.实验证明算法能够适应数据流频繁项集的挖掘,并且在时空效率以及挖掘准确性上有一定优势. 展开更多
关键词 数据挖掘 数据流 界标窗口 FP—tree 时间权重
下载PDF
一种有效的数据流最大频繁模式挖掘算法 被引量:1
5
作者 毛伊敏 杨路明 +2 位作者 李宏 陈志刚 刘立新 《高技术通讯》 EI CAS CSCD 北大核心 2010年第3期246-252,共7页
针对频繁项集挖掘存在数据和模式冗余的问题,对数据流最大频繁项集挖掘算法进行了研究。针对目前典型的数据流最大频繁模式挖掘算法DSM-MFI存在消耗大量存储空间及执行效率低等问题,提出了一种挖掘数据流界标窗口内最大频繁项集的算法MM... 针对频繁项集挖掘存在数据和模式冗余的问题,对数据流最大频繁项集挖掘算法进行了研究。针对目前典型的数据流最大频繁模式挖掘算法DSM-MFI存在消耗大量存储空间及执行效率低等问题,提出了一种挖掘数据流界标窗口内最大频繁项集的算法MMFI-DS,该算法首先采用SEFI-tree存储包含在不断增长的数据流中相关最大频繁项集的重要信息,同时删除SEFI-tree中大量不频繁项目,然后使用自顶向下和自底向上双向搜索策略挖掘界标窗口中一系列的最大频繁项集。理论分析与实验表明,该算法比DSM-MFI算法具有更高的效率,并能节省存储空间。 展开更多
关键词 数据挖掘 数据流 界标窗口 频繁项集 最大频繁项集
下载PDF
基于合并-分裂策略的近似等深直方图增量维护 被引量:1
6
作者 张龙波 李战怀 王勇 《计算机科学》 CSCD 北大核心 2009年第8期182-184,共3页
直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-... 直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-分裂策略进行了比较和讨论;最后对该算法框架和三种不同的桶合并-分裂策略进行了实验分析。 展开更多
关键词 数据流 界标窗口模型 概要数据结构 直方图
下载PDF
一种改进的数据流最大频繁项集挖掘算法 被引量:4
7
作者 胡健 吴毛毛 《计算机工程与科学》 CSCD 北大核心 2014年第5期963-970,共8页
提出了一种基于DSM-MFI算法的改进算法DSMMFI-DS算法,它首先将事务数据按一定的全序关系存入DSFI-list列表中;然后按排序后的顺序存储到类似概要数据结构的树中;接着删除树中和DSFI-list列表中的非频繁项,同时删除窗口衰退支持数大的事... 提出了一种基于DSM-MFI算法的改进算法DSMMFI-DS算法,它首先将事务数据按一定的全序关系存入DSFI-list列表中;然后按排序后的顺序存储到类似概要数据结构的树中;接着删除树中和DSFI-list列表中的非频繁项,同时删除窗口衰退支持数大的事务项;最后采用自顶向下和自底向上的双向搜索策略来挖掘数据流的最大频繁项集。通过用例分析和实验表明,该算法比DSM-MFI算法具有更好的执行效率。 展开更多
关键词 数据挖掘 数据流 界标窗口 最大频繁项集 窗口衰减支持数
下载PDF
一种基于VFDT算法的同构XML流分类方法
8
作者 闫红 迟呈英 李付学 《辽宁科技大学学报》 CAS 2015年第3期192-195,共4页
为了对动态XML文档流进行分类,以VFDT算法为核心,提出了一种针对相同结构的XML文档流分类算法,该算法将XML流中文档解析并用来动态地构造分类器。实验表明,该方法在XML流上数分类的精确度能够达到XML文档静态分类的水平。
关键词 XML数据流 分类算法 界标窗口
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部