-
题名CBC-DS:基于频繁闭模式的数据流分类算法
被引量:3
- 1
-
-
作者
敖富江
王涛
刘宝宏
黄柯棣
-
机构
国防科学技术大学机电工程与自动化学院
国防科学技术大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第5期779-786,共8页
-
基金
国家自然科学基金项目(60573057
60704038)~~
-
文摘
基于关联规则的分类算法通常根据频繁模式生成类关联规则,但频繁模式挖掘易遭受组合爆炸问题,影响算法效率.并且数据流的出现也对分类算法提出了新的挑战.相对于频繁模式,频繁闭模式的数目较少,挖掘频繁闭模式的算法通常具有较高的效率.为此,提出了一种高效的基于频繁闭模式的数据流分类算法—CBC-DS.主要贡献在于:1)提出了一种基于逆文法顺序FP-Tree的频繁闭项集单遍挖掘过程,用于挖掘类关联规则,该过程采用了一种混合项顺序搜索策略以满足数据流挖掘的单遍性需求,并采用位图技术提高效率;2)提出了"自支持度"概念,用于筛选规则以提高算法分类精度.实验表明,位图技术能够提高算法速度2倍以上,利用自支持度能够提高算法平均精度0.5%左右;最终CBC-DS算法的平均分类精度比经典算法CMAR高1%左右,并且CBC-DS算法的规则挖掘速度远快于CMAR算法.
-
关键词
数据流
分类
关联规则
频繁闭模式
自支持度
-
Keywords
data stream
classification
association rule
closed frequent pattern
self-support
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-