期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于滑动窗口的数据流频繁项集挖掘算法 被引量:11
1
作者 寇香霞 任永功 宋奎勇 《计算机应用与软件》 CSCD 北大核心 2013年第1期143-146,共4页
数据流的流动性与连续性,使得数据流所蕴含的知识会随着时间的推移而发生变化。挖掘数据流中的频繁项集是一项意义重大且具有挑战性的工作。提出一种基于滑动窗口数据流的频繁项集挖掘——FIUT-Stream算法,FIUT-Stream算法分块挖掘数据... 数据流的流动性与连续性,使得数据流所蕴含的知识会随着时间的推移而发生变化。挖掘数据流中的频繁项集是一项意义重大且具有挑战性的工作。提出一种基于滑动窗口数据流的频繁项集挖掘——FIUT-Stream算法,FIUT-Stream算法分块挖掘数据流,在内存中维持一个滑动窗口数据的概要结构,随着窗口滑动动态更新该存储结构,利用FIUT算法进行频繁项集挖掘。实验表明,该算法能节省内存空间、精确获得频繁项集。 展开更多
关键词 数据流 频繁项集 FIUT—Stream 算法
下载PDF
基于FIUT结构增量式频繁项集挖掘 被引量:1
2
作者 寇香霞 任永功 宋奎勇 《计算机应用与软件》 CSCD 北大核心 2012年第7期105-108,共4页
增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频... 增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频繁超度量树叶子结点的支持度确定频繁项集,并与次频繁项集概念相结合进行增量式频繁项集挖掘。实验表明,Pre-FIUT算法能快速扫描和更新数据,合理利用内存,精确获得频繁项集。 展开更多
关键词 FIUT 数据挖掘 频繁项集 次频繁项集 Pre-FIUT算法
下载PDF
一种结合散列与位表挖掘频繁项目集算法 被引量:1
3
作者 任永功 宋奎勇 寇香霞 《计算机科学》 CSCD 北大核心 2010年第12期145-148,共4页
在频繁项集的挖掘中,很多算法都是基于Apriori的。这些算法有两个共同的问题:一是把整个数据库装入内存,占用大量的空间;二是在产生候选项集和计算支持度时花费了大量的时间。为了提高效率,提出了一种基于位表挖掘频繁项目集的算法Hash-... 在频繁项集的挖掘中,很多算法都是基于Apriori的。这些算法有两个共同的问题:一是把整个数据库装入内存,占用大量的空间;二是在产生候选项集和计算支持度时花费了大量的时间。为了提高效率,提出了一种基于位表挖掘频繁项目集的算法Hash-BFI。按照水平和垂直的方向把数据库压缩到位表内,以大大节省内存空间。引入散列函数计算频繁二项集,完全通过AND,OR运算得到候选项集和计算候选项集支持度,并进行剪枝,从而提高了算法效率。 展开更多
关键词 APRIORI 频繁项集 位表 散列
下载PDF
均衡时空挖掘数据流中频繁项集 被引量:1
4
作者 宋奎勇 任永功 寇香霞 《计算机科学》 CSCD 北大核心 2011年第12期187-190,共4页
数据流具有流动性、连续性以及项分布不均衡性等特点,挖掘数据流中频繁项集是一项意义重大且具有挑战性的工作。提出一种均衡时空挖掘数据流中频繁项集算法——Bala_Tree,Bala_Tree实现一遍扫描数据流、快速簇更新、周期树结构重构以及... 数据流具有流动性、连续性以及项分布不均衡性等特点,挖掘数据流中频繁项集是一项意义重大且具有挑战性的工作。提出一种均衡时空挖掘数据流中频繁项集算法——Bala_Tree,Bala_Tree实现一遍扫描数据流、快速簇更新、周期树结构重构以及基于经典算法挖掘频繁项集。实验表明,此算法能快速扫描和更新数据,合理利用内存以及精确获得频繁项集,Bala_Tree算法优于其他同类算法。 展开更多
关键词 数据流 频繁项集 均衡 Bala_Tree
下载PDF
结合最近邻与闭模式子空间聚类方法 被引量:3
5
作者 宋奎勇 王念滨 +1 位作者 王红滨 寇香霞 《计算机工程与应用》 CSCD 北大核心 2017年第16期134-137,198,共5页
针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNN_SC),按照维把数据集转变为多个最近邻事务数据库,挖掘事务数据库中最大共现对象集,即一维上聚类。在一维聚类集上进一步挖掘闭频繁项集,包含闭频繁... 针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNN_SC),按照维把数据集转变为多个最近邻事务数据库,挖掘事务数据库中最大共现对象集,即一维上聚类。在一维聚类集上进一步挖掘闭频繁项集,包含闭频繁项集的维是子空间,闭频繁项集是子空间上聚类。实验对比结果表明,SNN_SC能够更准确定位子空间,并在子空间上产生完整聚类。 展开更多
关键词 高维 共享最近邻 子空间聚类 闭频繁项集
下载PDF
离群点检测概述
6
作者 宋奎勇 寇香霞 《信息系统工程》 2017年第5期113-113,共1页
离群点检测是当前大数据挖掘的研究热点。离群点检测在信用卡欺诈、入侵检测、医疗诊断、工业损毁检测等领域有着重要应用。
关键词 离群点检测 大数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部