-
题名一种基于规则表达式约束的序列模式增量式挖掘算法
被引量:1
- 1
-
-
作者
任家东
宗俊省
-
机构
燕山大学信息科学与工程学院
-
出处
《燕山大学学报》
CAS
2007年第5期402-409,共8页
-
基金
河北省博士基金(No.B200322)
-
文摘
序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。
-
关键词
数据挖掘
序列模式
增量式挖掘
规则表达式
-
Keywords
data mining
sequential pattern
incremental mining
regular expression
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种实现偏序约束条件下的序列模式挖掘算法
- 2
-
-
作者
任家东
宗俊省
李志国
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机工程与科学》
CSCD
2007年第5期86-89,共4页
-
基金
河北省博士基金资助项目(B2003226)
-
文摘
在序列模式挖掘应用中,约束是非常重要的。本文提出了一种新的约束-偏序约束,允许事务之间的间隔可以是无穷大。但是,本文间隔约束中事务之间的间隔只能是整数,所以可以把偏序约束看成是间隔约束的扩展。针对这个问题,提出了一种新颖的算法SPM(Sequential Pattern Maintenance,简称SPM)算法来解决偏序约束,采用含蓄分割技术把不满足偏序约束的数据序列分割出去,充分利用已挖掘出来的信息来解决由于数据序列数目变小使得支持度值变小的复杂情况。实验表明,SPM算法能够快速可扩展地挖掘出所有满足约束的频繁序列模式。
-
关键词
数据挖掘
约束序列模式挖掘
偏序约束
含蓄分割
-
Keywords
data mining
constraint sequential pattern mining
partial-order constraint
implicit segmentation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-